AWS ParallelCluster のセットアップ

ParallelCluster のインストール

  • Python のパッケージマネージャであるpipコマンドを使用して、AWS ParallelCluster を Cloud9 上にインストールします。ここでは、ハンズオンのために、version 2.10.1 を指定してインストールしています。
pip3 install aws-parallelcluster==2.10.3 --user
  • 以下のコマンドで ParallelCluster のバージョンを確認できます。
pcluster version

ParallelCluster の初期設定

SGE 編または、Slurm 編のいずれかを、ハンズオンオーナーの指示に従って実施してください。

  • ParallelCluster の初期設定
pcluster configure

出力は次のようになります。 逐次入力を求められます。

  • リージョンは ap-northeast-1 と入力してください(先程キーペアを作成した東京リージョンが ap-northeast-1 に対応しています)。
ParallelClusterの初期設定 (Slurm編)
ParallelClusterの初期設定 (SGE編)
  • ParallelCluster の config ファイルを確認してみます
cat ~/.parallelcluster/config
config ファイルの例 (Slurm編)
config ファイルの例 (SGE編)
  • OS やインスタンスタイプが指定通りになっているか確認してください。
  • このファイルに追加のオプションを記述することでクラスタのカスタマイズができます。

(オプション)NICE-DCV 設定の追加

この項目は、ハンズオンオーナーの指示がある場合に実施してください

~/.parallelcluster/ にある config ファイルをエディタで開きます。エディタには Vim や Emacs などお好きなエディタを使える他、Cloud9 の IDE 上で編集することも可能です。

Vim での開き方
Emacs での開き方
Cloud9 の IDE による開き方

[cluster default]の下に以下の行を追加し、

dcv_settings = dcv1

ヘッドノードのインスタンスタイプを t2.micro から g4dn.xlarge に変更します。

master_instance_type = g4dn.xlarge

さらにファイル末尾に以下の 2 行を追加します。

[dcv dcv1]
enable = master

編集後のconfigファイル例は以下の様になります。

[aws]
aws_region_name = ap-northeast-1

[aliases]
ssh = ssh {CFN_USER}@{MASTER_IP} {ARGS}

[global]
cluster_template = default
update_check = true
sanity_check = true

[cluster default]
key_name = guest01-key
scheduler = slurm
master_instance_type = g4dn.xlarge
base_os = centos7
vpc_settings = default
queue_settings = compute
dcv_settings = dcv1

[vpc default]
vpc_id = vpc-013d88bd2bd044a13
master_subnet_id = subnet-0dbe2e984a7c50a1c
compute_subnet_id = subnet-0d2e8694f577c481e
use_public_ips = false

[queue compute]
enable_efa = false
enable_efa_gdr = false
compute_resource_settings = default

[compute_resource default]
instance_type = c5.xlarge

[dcv dcv1]
enable = master

これらの設定により、クラスタ作成時に、ヘッドノードでリモートデスクトップソフトウェアである NICE-DCV がセットアップされます。