TSUBAME3.0利用の手引き - PDF Free Download

第 22 版 2018 年 12 月 3 日

目次 1. TSUBAME3.0 概要 1 1.1. システム概念 1 1.2. 計算ノードの構成 2 1.3. ソフトウェア構成 3 1.4. ストレージ構成 3 2. システム利用環境 4 2.1. アカウントの取得 4 2.2. ログイン方法 4 2.3. パスワード管理 5 2.4. ログインシェルの変更 5 2.5. TSUBAME ポイントの確認 6 2.6. ストレージサービス (CIFS) 6 3. ユーザ利用環境 7 3.1. 利用環境の切換え方法 7 3.1.1. 利用可能な module 環境の表示 7 3.1.2. module 環境の設定情報表示 7 3.1.3. module 環境のロード 7 3.1.4. module 環境の表示 7 3.1.5. module 環境のアンロード 8 3.1.6. module 環境の初期化 8 3.2. バッチスクリプト内での利用 8 3.3. Intel コンパイラ 9 3.3.1. コンパイルの主なオプション 9 3.3.2. コンパイルの推奨最適化オプション 10 3.3.3. Intel 64 アーキテクチャーのメモリモデル指定 11 3.4. 並列化 11 3.4.1. スレッド並列 (OpenMP と自動並列化 ) 11 3.4.2. プロセス並列 (MPI) 12 3.5. GPU 環境 13 3.5.1. インタラクティブバッチキューへのジョブ投入 13 3.5.2. 対応アプリケーション 13 3.5.3. CUDA 対応の MPI 13 3.5.4. NVIDIA GPUDirect 14 3.5.5. GPUDirect RDMA 15 i

3.5.6. GPU の COMPUTE MODE の変更 16 4. ジョブスケジューリングシステム 17 4.1. 利用可能な資源タイプ 17 4.2. ジョブの投入 18 4.2.1. バッチジョブの流れ 18 4.2.2. ジョブスクリプト 18 4.2.3. ジョブスクリプトの記述例シングルジョブ /GPU ジョブ 20 4.2.4. ジョブスクリプトの記述例 SMP 並列 21 4.2.5. ジョブスクリプトの記述例 MPI 並列 22 4.2.6. ジョブスクリプトの記述例プロセス並列 / スレッド並列 ( ハイブリッド ) 24 4.2.7. ジョブの投入 25 4.2.8. ジョブの状態確認 25 4.2.9. ジョブの削除 26 4.2.10. ジョブの結果確認 27 4.2.11. アレイジョブ 27 4.3. インタラクティブジョブの投入 27 4.3.1. インタラクティブノードを利用した X 転送 28 4.4. シグナル通知 / チェックポイント 29 4.5. 予約実行 31 4.6. ストレージの利用 32 4.6.1. Home ディレクトリ 32 4.6.2. 高速ストレージ領域 32 4.6.3. ローカルスクラッチ領域 33 4.6.4. 共有スクラッチ領域 33 4.7. SSH ログイン 35 5. ISV アプリケーション 37 5.1. ANSYS 38 5.2. Fluent 40 5.3. ABAQUS 43 5.4. ABAQUS CAE 44 5.5. Marc & Mentat / Dytran 45 5.5.1. Marc & Mentat / Dytran の概要 45 5.5.2. Marc & Mentat / Dytran のマニュアル 45 5.5.3. Marc の使用方法 45 5.5.4. Mentat の使用方法 45 5.6. Nastran 47 5.7. Patran 48 ii

5.8. Gaussian 49 5.9. GaussView 51 5.10. AMBER 53 5.10.1. AMBER の概要 53 5.10.2. AMBER の使用方法 53 5.11. Materials Studio 56 5.11.1. ライセンス接続設定方法 56 5.11.2. ライセンス利用状況の確認方法 57 5.11.3. Materials Studio の起動方法 58 5.12. Discovery Studio 59 5.12.1. ライセンス接続設定方法 59 5.12.2. ライセンス利用状況の確認方法 60 5.12.3. Discovery Studio の起動方法 61 5.13. Mathematica 62 5.14. Maple 64 5.15. AVS/Express 66 5.16. AVS/Express PCE 67 5.17. LS-DYNA 68 5.17.1. LS-DYNA の概要 68 5.17.2. LS-DYNA の使用方法 68 5.18. LS-PrePost 72 5.18.1. LS-PrePost の概要 72 5.18.2. LS-PrePost の使用方法 72 5.19. COMSOL 74 5.20. Schrodinger 75 5.21. MATLAB 76 5.22. Arm Forge 77 6. フリーウェア 78 6.1. 量子化学 /MD 関連ソフトウェア 79 6.1.1. GAMESS 79 6.1.2. Tinker 79 6.1.3. GROMACS 80 6.1.4. LAMMPS 81 6.1.5. NAMD 81 6.1.6. CP2K 82 6.2. CFD 関連ソフトウェア 83 6.2.1. OpenFOAM 83 6.3. 機械学習ビックデータ解析関連ソフトウェア 84 iii

6.3.1. CuDNN 84 6.3.2. NCCL 84 6.3.3. Caffe 84 6.3.4. Chainer 84 6.3.5. TensorFlow 85 6.3.6. R 85 6.3.7. Apache Hadoop 85 6.4. 可視化関連ソフトウェア 87 6.4.1. POV-Ray 87 6.4.2. ParaView 87 6.4.3. VisIt 87 6.5. その他フリーウェア 88 6.5.1. gimp 88 6.5.2. gnuplot 88 6.5.3. tgif 88 6.5.4. ImageMagick 88 6.5.5. platex2e 89 6.5.6. Java SDK 89 6.5.7. PETSc 89 6.5.8. fftw 90 6.5.9. singularity 90 改定履歴 92 iv

1. TSUBAME3.0 概要 1.1. システム概念本システムは東京工業大学における種々の研究開発部門から利用可能な共有計算機です本システムの倍精度総理論演算性能は 12.15PFLOPS 総主記憶容量は 135TiB 磁気ディスク容量は 15.9PB です各計算ノード及びストレージシステムは Omni-Path による高速ネットワークに接続されまた現在は 10Gbps の速度でインターネットに接続将来的には SINET5 を経由し 10Gbps の速度でインターネットに接続されます (2017 年 8 月時点 ) TSUBAME3.0 の全体概念を以下に示します図 1-1 TSUBAME3.0 の概念図 1

1.2. 計算ノードの構成本システムの計算ノードは SGI ICE XA 540 ノードで構成されたブレード型大規模クラスタシステムです 1 台の計算ノードには Intel Xeon E5-2680 v4(2.4ghz 14core) を 2 基搭載し総コア数は 15,120 コアとなりますまた主記憶容量は計算ノードあたり 256GiB を搭載し総主記憶容量は 135TiB となります各計算ノードは Intel Omni-Path インタフェースを 4 ポート有しており Omni-Path スイッチによりファットツリーで接続されます図 1-2 SGI ICE XA TSUBAME3.0 のマシンの基本スペックは次の通りです. 表 1-1 計算ノードの構成演算部名計算ノード 540 台 CPU Intel Xeon E5-2680 v4 2.4GHz 2CPU ノード構成 (1 台あたり ) コア数 / スレッド 14 コア / 28 スレッド 2CPU メモリ 256GiB GPU NVIDIA TESLA P100 for NVlink-Optimized Servers 4 SSD インターコネクト Intel Omni-Path HFI 100Gbps 4 2TB 2

1.3. ソフトウェア構成本システムのオペレーティングシステム (OS) は下記の環境を有しています SUSE Linux Enterprise Server 12 SP2 OS 構成はサービス実行形態に応じて動的に変更されますまた本システムで利用可能なアプリケーションソフトウェアに関しては 6. ISV アプリケーション 7. フリーウェアを参照ください 1.4. ストレージ構成本システムでは様々なシミュレーション結果を保存するための高速大容量のストレージを備えています計算ノードでは高速ストレージ領域として Lustre ファイルシステムにより Home ディレクトリは GPFS+cNFS によりファイル共有されていますまた各計算ノードにローカルスクラッチ領域として 2TB の SSD が搭載されています本システムで利用可能な各ファイルシステムの一覧を以下に示します表 1-2 TSUBAME3.0 のファイルシステム用途マウント容量ファイルシステム備考 Home ディレクトリ /home 共有アプリケーション配備 /apps 40TB GPFS+cNFS 高速ストレージ領域 1 /gs/hs0 4.8PB Lustre 高速ストレージ領域 2 /gs/hs1 4.8PB Lustre 高速ストレージ領域 3 /gs/hs2 4.8PB Lustre ローカルスクラッチ領域 /scr 各ノード 1.9TB xfs(ssd) 3

2. システム利用環境 2.1. アカウントの取得本システムを利用するには予め利用申請を行いユーザ ID を取得する必要があります学外利用者学内利用者臨時利用者の場合で新規利用申請の方法が異なりますそれぞれの利用者区分についての操作は TSUBAME3.0 ポータル利用説明書を参照ください 2.2. ログイン方法ログインノードにアクセスするためにはログインに使う SSH 公開鍵をアップロードする必要があります公開鍵の登録の操作は TSUBAME3.0 ポータル利用説明書を参照ください本システムを利用するにはまずログインノードにログインする必要がありますログインノードへのログインはロードバランサによる自動振り分けが行われます利用イメージを以下に示しますユーザログインログイン処理ジョブ投入バッチジョブ実行ロードバランサによる振り分けログイン用アドレスにアクセス login.t3.gsic.titech.ac.jp ログイン処理部 ( ログインノード ) login0.t3.gsic.titech.ac.jp login1.t3.gsic.titech.ac.jp 計算ノード計算ノード図 2-1 計算機の利用イメージログイン先には SSH で接続しますまたファイル転送は SFTP で接続します login.t3.gsic.titech.ac.jp 任意のログインノードにログインしたい場合は以下のホスト名 (FQDN) を指定してください login0.t3.gsic.titech.ac.jp login1.t3.gsic.titech.ac.jp 4

Linux/Mac/Windows(Cygwin) から X 転送オプションを有効にして接続するには以下の例のようになります例 ) アカウント名が gsic_user 秘密鍵が ~/.ssh/t3-key の場合 $ ssh gsic_user@login.t3.gsic.titech.ac.jp -i ~/.ssh/t3-key -YC 最初にログインする際クライアントの設定によっては以下のようなメッセージが出ることが有りますその場合は yes と入力してください The authenticity of host ' login0.t3.gsic.titech.ac.jp (131.112.3.21)' can't be established. ECDSA key fingerprint is SHA256:RImxLoC4tBjIYQljwIImCKshjef4w7Pshjef4wtBj Are you sure you want to continue connecting (yes/no)? ログインノードにはプロセスあたり 4GB のメモリ制限がありますプログラムの実行はジョブスケジューラを経由して実行してくださいジョブスケジューラに関しては 4. ジョブスケジューリングシステムを参照ください 2.3. パスワード管理本システムのユーザアカウントは LDAP サーバで管理されシステム内の認証は SSH の鍵認証で行っていますこのため計算ノードの利用にあたってパスワードを意識する必要はありませんが学内から高速ストレージへのアクセスなどパスワードが必要になるケースがありますパスワードの変更が必要になる場合は TSUBAME3.0 利用ポータルから行ってくださいパスワードのルールについては TSUBAME3.0 利用ポータルのパスワード設定のページをご覧ください 2.4. ログインシェルの変更ユーザ登録の時点で各ユーザアカウントのログインシェルは bash となっていますデフォルトのログインシェルを変更するには chsh コマンドを利用ください利用可能なログインシェルは bash,csh,ksh,tcsh,zsh となります引数なしの chsh コマンドで利用可能なログインシェルを確認することができます $ chsh Usage: chsh shell(/bin/bash /bin/csh /bin/sh /bin/ksh /bin/tcsh /bin/zsh). 以下はログインシェルを tcsh に変更する例です $ chsh /bin/tcsh Please input Web Portal Password(not SSH Passphrase) Enter LDAP Password: xxxxxx <-- パスワードを入力してください Changing shell succeded!! 5

2.5. TSUBAME ポイントの確認コマンドでの TSUBAME ポイントの確認は t3-user-info group point コマンドにて確認できます以下は TESTGROUP の TSUBAME ポイントを確認する例です $ t3-user-info group point -g TESTGROUP gid group_name point ----------------------------------------------- xxxx TESTGROUP 800000000 参加している TESTGROUP の TUBAME ポイントが 800000000 ポイントある状況が確認できます 2.6. ストレージサービス (CIFS) TSUBAME3.0 では高速ストレージ領域に対して学内の Windows/Mac 端末から CIFS によるアクセスが可能です以下のアドレスでアクセスすることができます \\gshs.t3.gsic.titech.ac.jp アカウントは TSUBAME3.0 のアカウントパスワードはポータルで設定したパスワードになります Windows からアクセスする際には以下のように TSUBAME ドメインを指定してくださいユーザー名 TSUBAME\<TSUBAME3.0 アカウント名 > パスワード <TSUBAME3.0 アカウントのパスワード > /gs/hs0 /gs/hs1 /gs/hs2 に対応して T3_HS0 T3_HS1 T3_HS2 となっていますグループディスクとして購入したディレクトリへアクセスしてください 6

3. ユーザ利用環境 3.1. 利用環境の切換え方法本システムでは module コマンドを使用することでコンパイラやアプリケーション利用環境の切り替えを行うことができます 3.1.1. 利用可能な module 環境の表示利用可能な module 環境は module avail または module ava で確認できます $ module avail 読み込めるバージョンについては TSUBAME 計算サービス Web ページのシステム構成 > アプリケーションソフトウェアをご確認下さい [ アプリケーションソフトウェア ]http:/www.t3.gsic.titech.ac.jp/applications 3.1.2.module 環境の設定情報表示 module 環境の設定情報を確認したい場合 module whatis モジュール名を実行します $ module whatis intel/17.0.4.196 intel/17.0.4.196 : Intel Compiler version 17.0.4.196 (parallel_studio_xe_2017) and MKL 3.1.3.module 環境のロード module 環境をロードしたい場合 module load モジュール名を実行します $ module load intel/17.0.4.196 バッチスクリプトにおいてロードする module はコンパイル時と同様のものをロードしてください 3.1.4.module 環境の表示現在使用している module 環境を確認したい場合 module list を実行します $ module list Currently Loaded Modulefiles: 1) intel/17.0.4.196 2) cuda/8.0.61 7

3.1.5.module 環境のアンロードロードした module 環境をアンロードしたい場合 module unload モジュール名を実行します $ module list Currently Loaded Modulefiles: 1) intel/17.0.4.196 2) cuda/8.0.61 $ module unload cuda $ module list Currently Loaded Modulefiles: 1) intel/17.0.4.196 3.1.6.module 環境の初期化ロードした module 環境を初期化したい場合 module purge を実行します $ module list Currently Loaded Modulefiles: 1) intel/17.0.4.196 2) cuda/8.0.61 $ module purge $ module list No Modulefiles Currently Loaded. 3.2. バッチスクリプト内での利用バッチスクリプト内で module コマンドを実行する場合以下のとおりバッチスクリプト内で module コマンドの初期設定を行う必要があります実行シェルが sh, bash の場合. /etc/profile.d/modules.sh module load intel/17.0.4.196 実行シェルが csh, tcsh の場合 source /etc/profile.d/modules.csh module load intel/17.0.4.196 8

3.3. Intel コンパイラ本システムではコンパイラとして Intel コンパイラ PGI コンパイラおよび GNU コンパイラが利用できます Intel コンパイラの各コマンドは以下のとおりです表 3-1 コマンド名とコマンド形式コマンド言語コマンド形式 ifort Fortran 77/90/95 $ ifort [ オプション ] source_file icc C $ icc [ オプション ] source_file icpc C++ $ icpc [ オプション ] source_file 利用する際は module コマンドで intel を読み込んでください --help オプションを指定して頂くとコンパイラオプションの一覧が表示されます 3.3.1. コンパイルの主なオプションコンパイルの最適化オプションを以下に示します表 3-2 コンパイラの主なオプションオプション説明 -O0 すべての最適化を無効にします -O1 最適化を有効にしますコードサイズを大きくするだけで高速化に影響を与えるような一部の最適化を無効にします -O2 最適化を有効にします一般的に推奨される最適化レベルですベクトル化は O2 以上のレベルで有効になります O オプションを指定しない場合デフォルトでこちらが指定されます -O3 O2 よりも積極的に最適化を行い融合アンロールとジャムのブロック IF 文の折りたたみなどより強力なループ変換を有効にします -xcore-avx2 Intel プロセッサー向けの Intel アドバンストベクトルエクステンション 2 (Intel AVX2) Intel AVX SSE4.2 SSE4.1 SSSE3 SSE3 SSE2 SSE 命令を生成します Intel AVX2 命令セット対応の Intel プロセッサー向けに最適化します -xsse4.2 Intel プロセッサー向けの Intel SSE4 高効率および高速な文字列処理命令 Intel SSE4 ベクトル化コンパイラ命令およびメディアアクセラレーター命令および Intel SSSE3 SSE3 SSE2 SSE 命令を生成します Intel SSE4.2 命令セット対応の Intel プロセッサー向けに最適化します -xssse3 Intel プロセッサー向けの Intel SSSE3 SSE3 SSE2 SSE 命令を生成します Intel 9

-qopt-report=n -fp-model precise -g -traceback SSSE3 命令セット対応の Intel プロセッサー向けに最適化します x オプションを指定しない場合デフォルトでこちらが指定されます最適化レポートを生成しますデフォルトではレポートは.optrpt 拡張子を持つファイルに出力されます nには 0 ( レポートなし ) から5 ( 最も詳しい ) の詳細レベルを指定しますデフォルトは 2 です浮動小数点演算のセマンティクスを制御します浮動小数点データの精度に影響する最適化を無効にし中間結果をソースで定義された精度まで丸めます -g オプションはオブジェクトファイルのサイズを大きくするシンボリックデバッグ情報をオブジェクトファイルに生成するようにコンパイラに指示しますこのオプションはランタイム時に致命的なエラーが発生したときソースファイルのトレースバック情報を表示できるようにオブジェクトファイル内に補足情報を生成するようにコンパイラに指示します致命的なエラーが発生するとコールスタックの 16 進アドレス ( プログラムカウンタートレース ) とともにソースファイルルーチン名および行番号の相関情報が表示されますマップファイルとエラーが発生したときに表示されるスタックの 16 進アドレスを使用することでエラーの原因を特定できますこのオプションを指定すると実行プログラムのサイズが増えます 3.3.2. コンパイルの推奨最適化オプションコンパイルの推奨最適化オプションを以下に示します本システムに搭載している Intel Xeon E5-2680 v4 は Intel AVX2 命令セットに対応していますので -xcore-avx2 オプションを指定することができます -xcore-avx2 を指定するとコンパイラがソースコードを解析し最適な AVX2 AVX SSE 命令を生成します推奨最適化オプションは積極的な最適化を行いかつ安全なオプションです最適化のために計算の順序を変更する可能性があり結果に誤差が生じる場合があります表 3-3 推奨最適化オプションオプション説明 -O3 O2 最適化を行い融合アンロールとジャムのブロック IF 文の折りたたみなどより強力なループ変換を有効にします -xcore-avx2 Intel プロセッサー向けの Intel アドバンストベクトルエクステンション 2 (Intel AVX2) Intel AVX SSE4.2 SSE4.1 SSSE3 SSE3 SSE2 SSE 命令を生成します Intel AVX2 命令セット対応の Intel プロセッサー向けに最適化します 10

上記のオプションを使用することによりプログラムの性能が悪化した場合最適化のレベルを -O2 に下げるかベクトル化のオプションを変更してくださいまた結果が一致していない場合浮動小数点のオプションも試してみてください 3.3.3.Intel 64 アーキテクチャーのメモリモデル指定次のいずれかのメモリモデルを使用して実行バイナリを作成します表 3-4 メモリモデルメモリモデル small (-mcmodel=small) medium (-mcmodel=medium) large (-mcmodel=large) 説明コードとデータのすべてのアクセスが命令ポインター (IP) 相対アドレス指定で行われるようにコードとデータはアドレス空間の最初の 2GB までに制限されます -mcmodel オプションを指定しない場合デフォルトでこちらが指定されますコードはアドレス空間の最初の 2GB までに制限されますがデータは制限されませんコードは IP 相対アドレス指定でアクセスできますがデータのアクセスは絶対アドレス指定を使用する必要がありますコードもデータも制限されませんコードもデータもアクセスは絶対アドレス指定を使用します IP 相対アドレス指定は 32 ビットのみ必要ですが絶対アドレス指定は 64 ビット必要ですこれはコードサイズとパフォーマンスに影響します (IP 相対アドレス指定の方が多少速くアクセスできます ) プログラム内の共通ブロックグローバルデータ静的データの合計が 2GB を越えるときリンク時に次のエラーメッセージが出力されます <some lib.a library>(some.o): In Function <function>: : relocation truncated to fit: R_X86_64_PC32 <some symbol> : relocation truncated to fit: R_X86_64_PC32 <some symbol> この場合は -mcmodel=medium と -shared-intel を指定してコンパイル / リンクして下さい medium メモリモデルまたは large メモリモデルを指定した場合 Intel のランタイムライブラリの適切なダイナミックバージョンが使用されるように -shared-intel コンパイラオプションも指定する必要があります 3.4. 並列化 3.4.1. スレッド並列 (OpenMP と自動並列化 ) OpenMP 自動並列化によるスレッド並列によりプログラムの高速化ができます 11

OpenMP 自動並列化を使用する場合のコマンド形式を以下に示します表 3-5 コマンド形式 (OpenMP/ 自動並列化 ) 言語コマンド形式 OpenMP Fortran 77/90/95 $ ifort -qopenmp [ オプション ] source_file C $ icc -qopenmp [ オプション ] source_file C++ $ icpc -qopenmp [ オプション ] source_file 自動並列化 Fortran 77/90/95 $ ifort -parallel [ オプション ] source_file C $ icc -parallel [ オプション ] source_file C++ $ icpc -parallel [ オプション ] source_file -qopt-report-phase=openmp オプションを使用することで OpenMP 最適化フェーズのレポートを作成することができます -qopt-report-phase=par オプションを使用することで自動並列化フェーズのレポートを作成することができます 3.4.2. プロセス並列 (MPI) Fortran/C/C++ プログラムに MPI ライブラリをリンクしプロセス並列プログラムを作成 / 実行することができます MPI を使用する場合のコマンド形式を以下に示します利用する際は module コマンドで各 MPI を読み込んでください表 3-6 コマンド形式 (MPI) MPI ライブラリ言語コマンド形式 Intel MPI Fortran 77/90/95 $ mpiifort [ オプション ] source_file C $ mpiicc [ オプション ] source_file C++ $ mpiicpc [ オプション ] source_file Open MPI Fortran 77/90/95 $ mpifort [ オプション ] source_file C $ mpicc [ オプション ] source_file C++ $ mpicxx [ オプション ] source_file SGI MPT Fortran 77/90/95 $ mpif90 [ オプション ] source_file C $ mpicc [ オプション ] source_file C++ $ mpicxx [ オプション ] source_file 12

3.5. GPU 環境本システムでは GPU(NVIDIA TESLA P100) の利用環境を提供しております 3.5.1. インタラクティブバッチキューへのジョブ投入ログインノード (login0,1) には GPU を搭載しておらずコンパイルリンクのみ実行可能ですインタラクティブでの実行デバックについてはバッチシステムを使用して実行可能です詳細については 4. ジョブスケジューリングシステムを参照ください 3.5.2. 対応アプリケーション現在の GPU 対応アプリケーションは次の通りです (2017.12.18 現在 ) ABAQUS 2017 --- ABAQUS 利用の手引 ( 別冊 ) を参照ください NASTRAN 2017.1 --- NASTRAN 利用の手引 ( 別冊 ) を参照ください ANSYS 18 --- ANSYS 利用の手引 ( 別冊 ) を参照ください AMBER 16 --- AMBER 利用の手引 ( 別冊 ) を参照ください Maple 2016 --- Maple 利用の手引 ( 別冊 ) を参照ください Mathematica 11.2 --- Mathematica 利用の手引 ( 別冊 ) を参照ください MATLAB --- MATLAB 利用の手引 ( 別冊 ) を参照ください Allinea Forge --- Allinea Forge 利用の手引 ( 別冊 ) を参照ください PGI Compiler --- PGI コンパイラ利用の手引 ( 別冊 ) を参照ください他のアプリケーションにつきまても順次展開してまいります 3.5.3.CUDA 対応の MPI CUDA 版に対応した MPI 環境を用意しております OpenMPI + gcc 環境 # CUDA Open MPI 環境の読込 (gcc はデフォルトで設定されています ) module load cuda openmpi/2.1.2 OpenMPI + pgi 環境 # CUDA PGI 環境の読込 ( 最初にコンパイラ環境を読み込みます ) module load cuda pgi 13

# Open MPI 環境の読込 ( コンパイラに応じた OpenMPI の環境が設定されます ) module load openmpi/2.1.2 OpenMPI + pgi 環境 (PGI バンドル版 ) # CUDA PGI 環境の読込 ( 最初にコンパイラ環境を読み込みます ) module load cuda pgi # Open MPI 環境の読込 module load openmpi/2.1.2-pgi2017 PGI バンドル版においてはバッチシステムからとの連携がない為実行時にホストリストを指定する必要があります以下にジョブスクリプト例を示します #!/bin/sh #$ -cwd #$ -l f_node=10 #$ -l h_rt=1:00:00 #$ -N test. /etc/profile.d/modules.sh module load cuda pgi module load openmpi/2.1.2-pgi2017 grep ^r $PE_HOSTFILE awk '{print $1,$2}' >./hostlist mpirun --hostfile./hostlist --mca oob_tcp_if_include ib0 --mca btl_tcp_if_include ib0 -npernode 4 -n 40 -x LD_LIBRARY_PATH -x PATH./a.out OpenMPI + Intel 環境 # CUDA Intel 環境の読込 ( 最初にコンパイラ環境を読み込みます ) module load cuda intel # Open MPI 環境の読込 ( コンパイラに応じた OpenMPI の環境が設定されます ) module load openmpi/2.1.2 3.5.4.NVIDIA GPUDirect 現在 NVIDIA GPUDirect (GPUDIRECT FAMILY) としては 4 つの機能 (GPUDIRECT SHARED GPU SYSMEM GPUDIRECT P2P GPUDIRECT RDMA GPUDIRECT ASYNC) があります (2017.12.18 現在 ) このうち TSUBAME3.0 では GPUDIRECT SHARED GPU SYSMEM GPUDIRECT P2P GPUDIRECT RDMA をサポートしております 14

GPUDIRECT SHARED GPU SYSMEM(Version1) MPI の送受信バッファに CUDA pinned メモリやデバイスメモリのアドレスを直接指定することができる機能ですデバイスメモリのアドレスを指定した場合には実際にはデータがホストメモリ上のバッファを経由して転送されます GPUDIRECT P2P(Version2) PCI-Express NVLink を経由した GPU 間の直接データ転送 (P2P) の機能です TSUBAME 3.0 ではノードあたり 4GPU を搭載しておりますが 1 つの CPU あたり PLX switch を介して 2 つの GPU に接続しております 4GPU 間は高速な NVLink で接続されています GPUDIRECT RDMA(Version3) ホストメモリを介することなく GPU とインターコネクト間 (TSUBAME3.0 では Intel Omni-Path) で直接データ転送 (RDMA) をすることにより異なるノードの GPU 間の高速なデータ転送を実現する機能です GPUDIRECT ASYNC ホストメモリを介することなく GPU とインターコネクト間で非同期通信する機能です現在 TSUBAME3.0 のの Intel Omni-Path では未対応です参考 ) http://on-demand.gputechconf.com/gtc/2017/presentation/s7128-davide-rossetti-how-to-enable.pdf GPUDirect については以下の URL も参照ください https://developer.nvidia.com/gpudirect http://docs.nvidia.com/cuda/gpudirect-rdma 3.5.5.GPUDirect RDMA す OpenMPI での GPUDirect RDMA の実行方法を以下に示します以下 2 ノード MPI 2 での実行例になりま # mpirun -mca pml cm -mca mtl psm2 -np 2 -npernode 1 -bind-to core -cpu-set 0 -x CUDA_VISIBLE_DEVICES=0 -x PSM2_CUDA=1 -x PSM2_GPUDIRECT=1 -x LD_LIBRARY_PATH -x PATH [ プログラム ] CUDA_VISIBLE_DEVICES --- GPU の指定 PSM2_CUDA --- Omni-Path での CUDA 有効 PSM2_GPUDIRECT --- GPUDirect RDMA 有効 15

3.5.6.GPU の COMPUTE MODE の変更資源タイプ F の f_node を利用した場合 GPU の COMPUTE MODE を変更することが出来ます GPU の COMPUTE MODE を変更するにはジョブスクリプトの中で f_node を指定した上で #$ -v GPU_COMPUTE_MODE=< 利用するモード > を指定してください利用可能なモードは以下の 3 つですモード説明 0 DEFAULT モード 1 つの GPU を複数のプロセスから同時に利用できる 1 EXCLUSIVE_PROCESS モード 1 つの GPU を 1 プロセスのみが利用できる 1 プロセスから複数スレッドの利用は可能 2 PROHIBITED モード GPU へのプロセス割り当てを禁止する以下はスクリプトの例となります #!/bin/sh #$ -cwd #$ -l f_node=1 #$ -l h_rt=1:00:00 #$ -N gpumode #$ -v GPU_COMPUTE_MODE=1 /usr/bin/nvidia-smi インタラクティブで利用する場合 qrsh は以下のような形となります $ qrsh -g [TSUBAME3 グループ ] -l f_node=1 -l h_rt=0:10:00 -pty yes -v TERM v GPU_COMPUTE_MODE=1 /bin/bash 16

4. ジョブスケジューリングシステム本システムのジョブスケジューリングにはシングルジョブ並列ジョブを優先度や必要なリソースに従い効率的にスケジューリングする UNIVA Grid Engine を採用しています 4.1. 利用可能な資源タイプ本システムでは計算ノードを論理的に分割した資源タイプを利用してシステムリソースを確保しますジョブ投入の際には資源タイプをいくつ使うかを指定します ( 例 :-l f_node=2) 利用できる資源タイプの一覧を以下に示します表 4-1TSUBAME3 の資源タイプ一覧使用物理資源タイプ資源タイプ名メモリ (GB) GPU 数 CPU コア数 F f_node 28 240 4 H h_node 14 120 2 Q q_node 7 60 1 C1 s_core 1 7.5 0 C4 q_core 4 30 0 G1 s_gpu 2 15 1 使用物理 CPU コア数メモリ (GB) GPU 数は各資源タイプ 1 つあたりの使用可能な量です [ 資源タイプ名 ] =[ 個数 ] で同じ資源タイプを複数指定できます資源タイプの組み合わせはできません実行可能時間の最大値は 24 時間です TSUBAME3 では同時に実行可能なジョブ数や実行可能な総スロット数など各種制限値があります ( スロット = 資源タイプ毎に設定されている物理 CPU コア数 x 利用ノード数 (qstat コマンドの slots と同等 )) 現在の制限値の一覧は以下の URL で確認できます http://www.t3.gsic.titech.ac.jp/resource-limit 利用状況に応じて随時変更する可能性がありますのでご注意ください 17

4.2. ジョブの投入本システムでジョブを実行するにはログインノードへログインして qsub コマンドを実行します 4.2.1. バッチジョブの流れジョブを投入するためにはジョブスクリプトを作成し投入しますまたはコマンドラインにキュー名などを指定してジョブを投入することもできます投入コマンドは qsub です表 4-2 バッチジョブの流れ順序説明 1 ジョブスクリプトの作成 2 qsub を使用しジョブを投入 3 qstat などを使用しジョブの状態確認 4 必要に応じて qdel を使用しジョブのキャンセル 5 ジョブの結果確認 qsub コマンドは課金情報 (TSUBAME3 ポイント ) を確認しジョブを受け付けます. 4.2.2. ジョブスクリプトジョブスクリプトの記述方法を以下に示します #!/bin/sh #$ -cwd #$ -l [ 資源タイプ名 ] =[ 個数 ] #$ -l h_rt=[ 経過時間 ] #$ -p [ プライオリティ ] [module の初期化 ] [ プログラミング環境のロード ] [ プログラム実行 ] 資源タイプの指定などはコマンドラインで指定するかまたはスクリプトファイルの最初のコメントブロック (#$) に記述することで有効になります資源タイプ実行時間は必須項目になるため必ず指定するようにしてください 18

qsub コマンドの主なオプションを以下に示します表 4-3qsub コマンドの主なオプションオプション説明 -l [ 資源タイプ名 ] =[ 個数 ] 資源タイプを指定します ( 必須 ) -l h_rt=[ 経過時間 ] Wall time( 経過時間 ) を指定します [[HH:]MM:]SS で指定することができま ( 必須 ) す HH:MM:S や MM:SS や SS のように指定することができます -N ジョブ名を指定します ( 指定しない場合はスクリプトファイル名 ) -o 標準出力ファイル名を指定します -e 標準エラー出力ファイル名を指定します -j y 標準エラー出力を標準出力ファイルに統合します -m ジョブについての情報をメールで送信する条件を指定します a バッチシステムによりジョブが中止された場合 b ジョブの実行が開始された場合 e ジョブの実行が終了した場合 abe のように組み合わせることも可能です -M 送信先メールアドレスを指定します -p ジョブの実行優先度を指定します -3,-4 を指定すると通常よりも高い課金 ( プレミアムオプション ) 係数が適用されます設定値の-5,-4,-3 は課金規則の優先度 0,1,2 に対応します -5 : 標準の実行優先度です. ( デフォルト ) -4 : 実行優先度は-5 より高く,-3 より低くなります. -3 : 最高の実行優先度となります. -t タスク ID の範囲を指定します開始番号 - 終了番号 [: ステップサイズ ] で指定することができます -hold_jid 依存関係にあるジョブ ID を指定します指定された依存ジョブが終了しなければ発行ジョブは実行されません -ar 予約ノードを利用する際に予約 AR ID を指定します本システムではジョブ投入環境の環境変数渡しの -V オプションは利用できませんご注意ください 19

4.2.3. ジョブスクリプトの記述例シングルジョブ /GPU ジョブシングルジョブ ( 並列化されていないジョブ ) を実行する時に作成するバッチスクリプトの例を以下に示します GPU を使用するジョブも利用する GPU で利用する module の読み込み以外はシングルジョブと同様になります 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 #!/bin/sh # カレントディレクトリでジョブを実行する場合に指定 #$ -cwd #$ -l f_node=1 # 実行時間を指定 #$ -l h_rt=1:00:00 #$ -N serial # Module コマンドの初期化. /etc/profile.d/modules.sh # CUDA 環境の読込 module load cuda # Intel Compiler 環境の読込 module load intel./a.out 20

4.2.4. ジョブスクリプトの記述例 SMP 並列 SMP 並列ジョブを実行する時に作成するバッチスクリプトの例を以下に示します計算ノードはハイパースレッディングが有効になっています使用するスレッド数につきましては, 明示的に指定してください 1 2 3 4 5 6 7 8 9 10 11 12 #!/bin/sh #$ -cwd # 資源タイプ F 1 ノードを使用 #$ -l f_node=1 #$ -l h_rt=1:00:00 #$ -N openmp. /etc/profile.d/modules.sh module load cuda module load intel # ノード内に 28 スレッドを配置 export OMP_NUM_THREADS=28./a.out 21

4.2.5. ジョブスクリプトの記述例 MPI 並列 MPI 並列ジョブを実行する時に作成するバッチスクリプトの例を以下に示します使用する MPI 環境により使い分けをお願いします OpenMPI でスレーブノードにライブラリ環境変数を渡たすには -x LD_LIBRARY_PATH を利用する必要があります Intel MPI 環境 1 2 3 4 5 6 7 8 9 10 11 12 13 #!/bin/sh #$ -cwd # 資源タイプ F 4 ノードを使用 #$ -l f_node=4 #$ -l h_rt=1:00:00 #$ -N flatmpi. /etc/profile.d/modules.sh module load cuda module load intel # Intel MPI 環境の読込 module load intel-mpi # ノードあたり 8 プロセス MPI 全 32 プロセスを使用 mpiexec.hydra -ppn 8 -n 32./a.out OpenMPI 環境 1 2 3 4 5 6 7 8 9 10 11 12 13 #!/bin/sh #$ -cwd # 資源タイプ F 4 ノードを使用 #$ -l f_node=4 #$ -l h_rt=1:00:00 #$ -N flatmpi. /etc/profile.d/modules.sh module load cuda module load intel # Open MPI 環境の読込 module load openmpi # ノードあたり 8 プロセス MPI 全 32 プロセスを使用 mpirun -npernode 8 -n 32 -x LD_LIBRARY_PATH./a.out 22

SGI MPT 環境 1 2 3 4 5 6 7 8 9 10 11 12 13 14 #!/bin/sh #$ -cwd # 資源タイプ F 4 ノードを使用 #$ -l f_node=4 #$ -l h_rt=1:00:00 #$ -N flatmpi. /etc/profile.d/modules.sh module load cuda module load intel # SGI MPT 環境の読込 module load mpt # ノードあたり 8 プロセス MPI 全 32 プロセスを使用 mpiexec_mpt -ppn 8 -n 32./a.out 投入したジョブに対して割り当てられているノードリストは $PE_HOSTFILE にファイルが格納されます $ echo $PE_HOSTFILE /var/spool/uge/r6i0n4/active_jobs/4564.1/pe_hostfile $ cat /var/spool/uge/r6i0n4/active_jobs/4564.1/pe_hostfile r6i0n4 28 all.q@r6i0n4 <NULL> r6i3n5 28 all.q@r6i3n5 <NULL> 23

4.2.6. ジョブスクリプトの記述例プロセス並列 / スレッド並列 ( ハイブリッド ) プロセス並列 / スレッド並列 ( ハイブリッド ) のジョブを実行する時に作成するバッチスクリプトの例を以下に示します使用する MPI 環境により使い分けをお願いします OpenMPI でスレーブノードにライブラリ環境変数を渡たすには -x LD_LIBRARY_PATH を利用する必要があります Intel MPI 環境 1 2 3 4 5 6 7 8 9 10 11 12 13 14 #!/bin/sh #$ -cwd # 資源タイプ F 4 ノードを使用 #$ -l f_node=4 #$ -l h_rt=1:00:00 #$ -N hybrid. /etc/profile.d/modules.sh module load cuda module load intel module load intel-mpi # ノード内に 28 スレッドを配置 export OMP_NUM_THREADS=28 # ノードあたり MPI 1 プロセス全 4 プロセスを使用 mpiexec.hydra -npernode 1 -n 4./a.out OpenMPI 環境 1 2 3 4 5 6 7 8 9 10 11 12 13 14 #!/bin/sh #$ -cwd # 資源タイプ F 4 ノードを使用 #$ -l f_node=4 #$ -l h_rt=1:00:00 #$ -N hybrid. /etc/profile.d/modules.sh module load cuda module load intel module load openmpi # ノード内に 28 スレッドを配置 export OMP_NUM_THREADS=28 # ノードあたり MPI 1 プロセス全 4 プロセスを使用 mpirun -ppn 1 -n 4 -x LD_LIBRARY_PATH./a.out 24

4.2.7. ジョブの投入ジョブを実行するためにバッチリクエストを事前に作成する必要があります qsub コマンドにジョブ投入スクリプトを指定することでジョブがキューイングされ実行されます qsub コマンドを使用してジョブを投入する例を以下に示します $ qsub -g [TSUBAME3 グループ ] スクリプト名表 4-4 ジョブ投入時のオプションオプション説明 -g TSUBAME3 グループ名を指定しますスクリプトの中ではなく qsub コマンドのオプションとしてつけてくださいグループ指定が未指定の場合は資源タイプ 2 つまで経過時間 10 分間まで優先度 -5 のお試し実行となります 4.2.8. ジョブの状態確認 qstat コマンドはジョブ状態表示コマンドです $ qstat [ オプション ] qstat コマンドの主なオプションを以下に示します表 4-5 qstat コマンドのオプションオプション説明 -r ジョブのリソース情報を表示します -j [ ジョブ ID] ジョブに関する追加情報を表示します qstat コマンドの実行結果を以下に示します $ qstat job-idprior nameuser statesubmit/start at queuejclass slotsja-task-id ---------------------------------------------------------------------------------- 307 0.55500 sample.sh testuser r 02/12/2015 17:48:10 all.q@r8i6n1a.default32 省略 25

qstat コマンドの表示内容を以下に示します表 4-6 qstat コマンドの表示内容表示項目 Job-ID prior name user state submit/start at queue jclass slots ja-task-id 説明ジョブ ID を表示します優先度を表示しますジョブ名を表示しますジョブのオーナーを表示しますジョブのステータスを表示します r 実行中 qw 待機中 h ホールド中 d 削除中 t 移動中 s サスペンド状態一時停止 S サスペンド状態キューのサスペンド状態 T サスペンド状態制限超過によるサスペンド E エラー状態投入 / 開始日時を表示しますキュー名を表示しますジョブクラス名を表示します利用しているスロット数を表示します ( スロット = 資源タイプ毎に設定されている物理 CPU コア数 x 利用ノード数 ) アレイジョブに関してタスク ID を表示します 4.2.9. ジョブの削除バッチジョブを削除する場合には qdel コマンドを使用します $ qdel [ ジョブ ID] 以下にジョブを qdel した結果を示します $ qstat job-idprior nameuser statesubmit/start at queuejclass slotsja-task-id ---------------------------------------------------------------------------------- 307 0.55500 sample.sh testuser r 02/12/2015 17:48:10 all.q@r8i6n1a.default32 $ qdel 307 testuser has registered the job 307 for deletion 26

$ qstat job-idprior nameuser statesubmit/start at queuejclass slotsja-task-id ---------------------------------------------------------------------------------- 4.2.10. ジョブの結果確認 UGE のジョブの標準出力はジョブを実行したディレクトリのスクリプトファイル名.o ジョブ ID というファイルに保管されますまた標準エラー出力はスクリプトファイル名.e ジョブ ID です 4.2.11. アレイジョブジョブスクリプト内に含まれる操作をパラメータ化して繰り返し実行する機能としてアレイジョブ機能がありますアレイジョブで実行される各ジョブをタスクと呼びタスク ID によって管理されますまたタスク ID を指定しないジョブ ID はタスク ID 全部を範囲としますタスク番号の指定は qsub コマンドのオプションもしくはジョブスクリプト内で定義します投入オプションは -t 開始番号 - 終了番号 : ステップサイズとして指定しますステップサイズが 1 の場合は省略可能です以下に例を示します # ジョブスクリプト内にて以下を指定 #$ t 2-10:2 上記例 (2-10:2) では開始番号 2 終了番号 10 ステップサイズ 2 (1 つ飛ばしのインデックス ) が指定されタスク番号 2 4 6 8 10 の 5 つのタスクによって構成されます各タスクのタスク番号は $SGE_TASK_ID という環境変数に設定されるためこの環境変数をジョブスクリプト内で利用することでパラメータスタディが可能となります結果ファイルはジョブ名の後ろにタスク ID が付いた形で出力されますまた実行前 / 実行中に特定のタスク ID を削除したい場合には以下のように qdel の-t オプションを使用します $ qdel[ ジョブ ID] t [ タスク ID] 4.3. インタラクティブジョブの投入本システムのジョブスケジューラではインタラクティブにプログラムやシェルスクリプトを実行する機能を有していますインタラクティブジョブを実行するためには qrsh コマンドを使用し -l で資源タイプ経過時間を指定します qrsh でジョブ投入後ジョブがディスパッチされるとコマンドプロンプトが返って 27

きます exit にてインタラクティブジョブを終了しますインタラクティブジョブの使用方法を以下に示します $ qrsh -g [TSUBAME3 グループ ] -l [ 資源タイプ ]=[ 個数 ] -l h_rt=[ 経過時間 ] -g オプションのグループ指定が未指定の場合は資源タイプ 2 つまで経過時間 10 分間まで優先度 -5 のお試し実行となります資源タイプ F 1 ノード数経過時間 10 分を指定した例 $ qrsh -g [TSUBAME3 グループ ] -l f_node=1 -l h_rt=0:10:00 Directory: /home/4/t3-test00 Mon Jul 24 02:51:18 JST 2017 4.3.1. インタラクティブノードを利用した X 転送 qrsh で接続したノードから直接 X 転送を行う場合は下記の手順にて接続ください (1) X 転送を有効にしてログインノードに ssh (2) X 転送を有効にして qrsh コマンドの実行コマンド実行例例では 2 時間接続で割り当てノードとして r0i0n0 が割り当てられた場合を想定しております割り当てノードはコマンド実行時に空いているノードですので明示的にノードを指定することはできません #qrsh の実行 $ qrsh -g [TSUBAME3 グループ ] -l s_core=1 -l h_rt=2:0:0 -pty yes -display $DISPLAY -v TERM /bin/bash Thu Sep 21 08:17:19 JST 2017 r0i0n0:~> module load < 読み込みたいアプリケーション > r0i0n0:~> < 実行したいアプリケーションの実行コマンド > 28

4.4. シグナル通知 / チェックポイントジョブが -notify オプションとともにサブミットされた場合サスペンド (SIGSTOP)/ 終了 (SIGKILL) の停止信号が送られる前に警告シグナル (SIGUSR1 SIGUSR2) をジョブに送信することができます本システムでは遅延時間は 60 秒に設定されています # ジョブスクリプト内にて以下を指定 #$ notify 以下の例ではジョブスケジューラからの SIGKILL が来た際に再キューイング (exit 99) を行い計算プログラムから再実行を行います #!/bin/sh # 他の指定については記載を省略 #$ -notify # SIGUSR2 シグナルをトラップ trap 'exit 99' SIGUSR2 # リスタートの場合処理をスキップ if [ $RESTARTED = 0 ]; then # 前処理プログラムの実行./preprogram.exe fi # 計算プログラムの実行./mainprogram.exe ジョブが-ckpt オプションとともにサブミットされた場合はチェックポインティングに対応したアプリケーションではジョブの状態を保存しジョブが休止または中断した際にこの時点から再開する処理をすることができます # ジョブスクリプト内にて以下を指定 #$ ckpt user c オプション qsub コマンドの関連オプションを以下に示しますオプション説明 -ckpt user チェックポイント環境の名前 -c ジョブのチェックポイントがトリガされる状態遷移を指定します s ジョブホストの実行デーモンが停止した場合にチェックポイントを設定します m キューで定義された min_cpu_interval の間隔でチェックポイントを 29

設定します現在の設定は 5 分です x ジョブがサスペンドされた場合にチェックポイントを設定します sx のように組み合わせることも可能です以下の例ではジョブホストの停止ジョブのサスペンドジョブホストの不明状態の際に再キューイングを行い計算プログラムから再実行を行います #!/bin/sh # 他の指定については記載を省略 #$ -ckpt user #$ -c sx # 1 回目の実行 / リスタートの場合の処理を記載 if [ $RESTARTED = 0 ]; then./preprogram.exe # 前処理プログラムの実行 fi./mainprogram.exe # 計算プログラムの実行また DMTCP を使用した場合は以下の例のようになります #!/bin/sh # 他の指定については記載を省略 #$ -ckpt user #$ -c sx module load dmtcp export DMTCP_CHECKPOINT_DIR=< イメージの保存先 > export DMTCP_COORD_HOST=`hostname` export DMTCP_CHECKPOINT_INTERVAL=< チェックポイント取得間隔 > dmtcp_coordinator --quiet --exit-on-last --daemon 2>&1 # DMTCP の実行 # 1 回目の実行 / リスタートの場合の処理を記載 if [ $RESTARTED = 0 ]; then dmtcp_launch./a.out # DMTCP 経由でプログラムの実行 else $DMTCP_CHECKPOINT_DIR/dmtcp_restart_script.sh # イメージからのリスタート fi DMTCP については以下のページを参照ください http://dmtcp.sourceforge.net/ 30

4.5. 予約実行計算ノードを予約することにより 24 時間を越えるジョブの実行が可能です 72 ノードを超えるジョブに関しては TSUBAME3 における各種制限値の制約を受けるため大規模ジョブを投入の場合はお問い合わせください http://www.t3.gsic.titech.ac.jp/contact-t3 予約実行の流れは以下のようになります表 4-7 予約実行の流れ順序説明 1 TSUBAME ポータルから予約の実行 2 TSUBAME ポータルから予約状況の確認キャンセル 3 予約ノードに対して qsub を使用しジョブを投入 4 必要に応じて qdel を使用しジョブのキャンセル 5 ジョブの結果確認ポータルからの予約の実行予約状況の確認予約のキャンセルに関して TSUBAME3.0 ポータル利用説明書をご参照ください予約時間になりましたら予約グループのアカウントでジョブの実行ができるようになります予約 ID である AR ID を指定したジョブ投入の例を以下に示します $ qsub -g [TSUBAME3 グループ ] ar [AR ID] スクリプト名予約実行で利用できる資源タイプは f_node,h_node,q_node になります q_core,s_core,s_gpu は利用できませんジョブ投入後のジョブの状態確認は qstat コマンドジョブの削除は qdel コマンドを使用しますまたスクリプトの書式は通常実行時のものと同じになります 31

4.6. ストレージの利用本システムでは Home ディレクトリ以外にも高速ストレージ領域の Lustre ファイルシステムローカルスクラッチ領域の SSD 領域 SSD をまとめて作成する共有スクラッチ領域の BeeGFS On Demand といった様々な並列ファイルシステムを利用することができます. 4.6.1.Home ディレクトリ HOME ディレクトリはユーザあたり 25GiB を利用できます使用容量は t3-user-info disk home コマンドにて確認できます以下は TESTUSER の HOME ディレクトリの容量を確認する例です $ t3-user-info disk home uid name b_size(gb) b_quota(gb) i_files i_quota ------------------------------------------------------------------- xxxx TESTUSER 7 25 101446 2000000 25GB のクォータ制限のうち 7GB 利用し inode 制限については 200 万のクォータ制限のうち約 10 万利用している状況が確認できます 4.6.2. 高速ストレージ領域高速ストレージ領域は Lustre ファイルシステムで構成されグループディスクとして購入することで利用することができますグループディスクの購入方法は TSUBAME3.0 ポータル利用説明書をご参照くださいグループディスクの使用容量は t3-user-info disk group コマンドにて確認できます以下は TESTGROUP のグループディスクの容量を確認する例です $ t3-user-info disk group g TESTGROUP /gs/hs0 /gs/hs1 /gs/hs2 gid group_name size(tb) quota(tb) file(m) quota(m) size(tb) quota(tb) file(m) quota(m) size(tb) quota(tb) file(m) quota(m) ------------------------------------------------------------------------------------------------ xxxx TESTGROUP 0.00 0 0.00 0 59.78 100 7.50 200 0.00 0 0.00 0 指定した TESTGROUP グループでは /gs/hs1 のみ購入し 100TB のクォータ制限のうち約 60TB 利用し inode 制限については 2 億のクォータ制限のうち 750 万利用している状況が確認できます 32

4.6.3. ローカルスクラッチ領域 SSD をローカルスクラッチ領域として使用することができます利用する際には $TMPDIR にローカルスクラッチ領域のパスが設定されますジョブスクリプトの中で作業領域のパスを指定することにより参照可能ですローカルスクラッチ領域は各計算ノードの個別領域となり共有されていないためジョブスクリプト内からのインとアウトをローカルホストにステージングする必要があります下記の例では使用する計算ノードが 1 ノードの場合にホームディレクトリからローカルスクラッチ領域にインプットデータセットをコピーし結果をホームディレクトリに返します ( 複数ノードは対応していません ) #!/bin/sh # 計算に必要な入力ファイルのコピー cp rp $HOME/datasets $TMPDIR/ # 入力出力を指定する計算プログラムの実行./a.out $TMPDIR/datasets $TMPDIR/results # 必要な結果ファイルのコピー cp rp $TMPDIR/results $HOME/results 4.6.4. 共有スクラッチ領域資源タイプ F の f_node を利用したバッチスクリプトの場合のみ確保した複数の計算ノードの SSD をオンデマンドに共有ファイルシステムとして作成する BeeGFS On Demand を利用できます BeeGFS On Demand を有効にするにはジョブスクリプトの中で f_node を指定した上で #$ -v USE_BEEOND=1 を指定してください BeeGFS On Demand は計算ノード上の /beeond にマウントされます以下はスクリプトの例となります #!/bin/sh #$ -cwd #$ -l f_node=4 #$ -l h_rt=1:00:00 #$ -N flatmpi #$ -v USE_BEEOND=1. /etc/profile.d/modules.sh module load cuda module load intel module load intel-mpi mpiexec.hydra -ppn 8 -n 32./a.out 33

インタラクティブで利用する場合 qrsh は以下のような形となります利用しない場合と比べディスクのマウント処理に少し時間を要します $ qrsh -g [TSUBAME3 グループ ] -l f_node=2 -l h_rt=0:10:00 -pty yes -v TERM v USE_BEEOND=1 /bin/bash BeeGFS On Demand 共有スクラッチ領域はジョブで確保されたタイミングで作成されるためジョブスクリプト内からのインとアウトを /beeond にステージングする必要があります下記の例ではホームディレクトリから BeeGFS On Demand 共有スクラッチ領域にインプットデータセットをコピーし結果をホームディレクトリに返します #!/bin/sh # 計算に必要な入力ファイルのコピー cp rp $HOME/datasets /beeond/ # 入力出力を指定する計算プログラムの実行./a.out $TMPDIR/datasets /beeond/results # 必要な結果ファイルのコピー cp rp /beeond/results $HOME/results 34

4.7. SSH ログイン資源タイプ f_node でジョブを行ったノードには直接 ssh でログインできます確保したノードは以下の手順により確認することができます t3-test00@login0:~> qstat -j 1463 ============================================================== job_number: 1463 jclass: NONE exec_file: job_scripts/1463 submission_time: 07/29/2017 14:15:26.580 owner: t3-test00 uid: 1804 group: tsubame-users0 gid: 1800 supplementary group: tsubame-users0, t3-test-group00 sge_o_home: /home/4/t3-test00 sge_o_log_name: t3-test00 sge_o_path: /apps/t3/sles12sp2/uge/latest/bin/lx-amd64:/apps/t3/sles12sp2/uge/latest/bin/lx-amd64:/home/4/t3 -test00/bin:/usr/local/bin:/usr/bin:/bin:/usr/bin/x11:/usr/games sge_o_shell: /bin/bash sge_o_workdir: /home/4/t3-test00/koshino sge_o_host: login0 account: 2 0 0 0 0 0 600 0 0 1804 1800 cwd: /home/4/t3-test00 hard resource_list: h_rt=600,f_node=1,gpu=4 mail_list: t3-test00@login0 notify: FALSE job_name: flatmpi priority: 0 jobshare: 0 env_list: RGST_PARAM_01=0,RGST_PARAM_02=1804,RGST_PARAM_03=1800,RGST_PARAM_04=2,RGST_PARAM_05=0,RGST_PARAM _06=0,RGST_PARAM_07=0,RGST_PARAM_08=0,RGST_PARAM_09=0,RGST_PARAM_10=600,RGST_PARAM_11=0 script_file: flatmpi.sh parallel environment: mpi_f_node range: 56 35

department: defaultdepartment binding: NONE mbind: NONE submit_cmd: qsub flatmpi.sh start_time 1: 07/29/2017 14:15:26.684 job_state 1: r exec_host_list 1: r8i6n3:28, r8i6n4:28 <-- 確保したノード r8i6n3 r8i6n4 granted_req. 1: f_node=1, gpu=4 usage 1: wallclock=00:00:00, cpu=00:00:00, mem=0.00000 GBs, io=0.00000 GB, iow=0.000 s, ioops=0, vmem=n/a, maxvmem=n/a binding 1: r8i6n3=0,0:0,1:0,2:0,3:0,4:0,5:0,6:0,7:0,8:0,9:0,10:0,11:0,12:0,13:1,0:1,1:1,2:1,3:1,4:1,5:1,6:1,7:1,8:1,9:1,10:1,11:1,12:1,13, r8i6n4=0,0:0,1:0,2:0,3:0,4:0,5:0,6:0,7:0,8:0,9:0,10:0,11:0,12:0,13:1,0:1,1:1,2:1,3:1,4:1,5:1,6:1,7:1,8:1,9:1,10:1,11:1,12:1,13 resource map 1: f_node=r8i6n3=(0), f_node=r8i6n4=(0), gpu=r8i6n3=(0 1 2 3), gpu=r8i6n4=(0 1 2 3) scheduling info: (Collecting of scheduler job information is turned off) 36

5. ISV アプリケーションライセンス契約上 ISV アプリケーションを利用できる利用者は限られます東工大に所属する 1. 学生証職員証以外の利用者は以下に挙げるアプリケーション以外の ISV アプリケーションを利用できません 1. Gaussian/Gauss View 2. AMBER 3. Intel Compiler 4. PGI Compiler 5. Arm Forge ISV アプリケーションの一覧表を以下に示しますソフトウェア名 ANSYS Fluent ABAQUS ABACUS CAE Marc & Mentant / Dytran Nastran Patran Gaussian GaussView AMBER Materials Studio Discovery Studio Mathematica Maple AVS/Express AVS/Express PCE LS-DYNA LS-PrePost COMSOL Schrodinger MATLAB Arm Forge Intel Compiler PGI Compiler 概要解析ソフトウェア解析ソフトウェア解析ソフトウェア解析ソフトウェア解析ソフトウェア解析ソフトウェア解析ソフトウェア量子化学計算プログラム量子化学計算プログラムプリポストツール分子動力学計算プログラム化学シミュレーションソフトウェア化学シミュレーションソフトウェア数式処理ソフトウェア数式処理ソフトウェア可視化ソフトウェア可視化ソフトウェア解析ソフトウェア解析ソフトウェアプリポストツール解析ソフトウェア化学シミュレーションソフトウェア数値計算ソフトウェアデバッガコンパイラコンパイラ 37

5.1. ANSYS GUI での利用手順を以下に示します $ module load ansys $ launcher CLI での利用手順を以下に示します $ module load ansys $ mapdl mapdl コマンドの代わりに以下のコマンドも使用できます (ANSYS18.2 の場合バージョンによって異なります ) $ ansys182 exit と入力すると終了します入力ファイルを指定すると非対話的に実行されます実行例 1 $ mapdl [options] < inputfile > outputfile 実行例 2 $ mapdl [options] -i inputfile -o outputfile 38

バッチキューシステムを使用する場合はシェルスクリプトを作成し CLI で以下のように実行します sample.sh を使用する場合 $ qsub sample.sh スクリプト例 :MPI 並列処理 #!/bin/bash #$ -cwd #$ -V #$ -l f_node=2 #$ -l h_rt=0:10:0. /etc/profile.d/modules.sh module load ansys mapdl -b -dis -np 56 < inputfile > outputfile スクリプト例 :GPU 使用 #!/bin/bash #$ -cwd #$ -V #$ -l f_node=1 #$ -l h_rt=0:10:0. /etc/profile.d/modules.sh module load ansys mapdl -b -dis -np 28 -acc nvidia -na 4 < inputfile > outputfile ANSYS のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S ansyslmd -c 27001@lice0:27001@remote:27001@t3ldap1 39

5.2. Fluent Fluent は熱流体解析アプリケーションです利用手順を以下に示します GUI での起動手順を以下に示します $ module load ansys $ fluent 40

CLI での起動手順を以下に示します $ module load ansys $ fluent -g exit と入力すると終了します journal ファイルを使用してインタラクティブに実行する場合は以下のようにコマンドを実行します journal ファイル名が fluentbench.jou 3D の場合 $fluent 3d -g -i fluentbench.jou バッチキューシステムを使用する場合はシェルスクリプトを作成し CLI で以下のように実行します sample.sh を利用する場合 $ qsub sample.sh 41

スクリプト例 :MPI 並列処理 (f_node 利用時 ) #!/bin/bash #$ -cwd #$ -V #$ -l f_node=2 #$ -l h_rt=0:10:0. /etc/profile.d/modules.sh module load ansys JOURNAL=journalfile OUTPUT=outputfile VERSION=3d fluent -mpi=intel -g ${VERSION} -cnf=${pe_hostfile} -i ${JOURNAL} > ${OUTPUT} 2>&1 スクリプト例 :MPI 並列処理 (h_node 利用時 ) #!/bin/bash #$ -cwd #$ -V #$ -l h_node=1 #$ -l h_rt=0:10:0. /etc/profile.d/modules.sh module load ansys JOURNAL=journalfile OUTPUT=outputfile VERSION=3d fluent -ncheck -mpi=intel -g ${VERSION} -cnf=${pe_hostfile} -i ${JOURNAL} > ${OUTPUT} 2>&1 f_node 以外の利用では資源をまたぐ設定ができないため #$ -l { 資源名 }=1 ( 例えば h_node では #$ -l h_node=1) としコマンド中に -ncheck オプションを入れてください Fluent のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S ansyslmd -c 27001@lice0:27001@remote:27001@t3ldap1 42

5.3. ABAQUS インタラクティブでの利用手順を以下に示します $ module load abaqus $ abaqus job=inputfile [options] バッチキューシステムを使用する場合はシェルスクリプトを作成し CLI で以下のように実行します sample.sh を利用する場合 $ qsub sample.sh スクリプト例 :MPI 並列処理 #!/bin/bash #$ -cwd #$ -V #$ -l q_core=1 #$ -l h_rt=0:10:0. /etc/profile.d/modules.sh module load abaqus # ABAQUS settings. INPUT=s2a ABAQUS_VER=2017 ABAQUS_CMD=abq${ABAQUS_VER} SCRATCH=${TMPDIR} NCPUS=4 ${ABAQUS_CMD} interactive \ job=${input} \ cpus=${ncpus} \ scratch=${scratch} \ mp_mode=mpi > ${INPUT}.`date '+%Y%m%d%H%M%S'`log 2>&1 43

5.4. ABAQUS CAE ABAQUS CAE の利用手順を以下に示します $ module load abaqus $ abaqus cae メニューバーの File > Exit をクリックすると終了します 44

5.5. Marc & Mentat / Dytran 5.5.1.Marc & Mentat / Dytran の概要各製品の概要はエムエスシーソフトウェア株式会社の Web サイトをご参照ください Marc: http://www.mscsoftware.com/ja/product/marc Dytran: http://www.mscsoftware.com/ja/product/dytran 5.5.2.Marc & Mentat / Dytran のマニュアル下記ドキュメントをご参照ください Marc & Mentat Docs (mscsoftware.com) Dytran Docs (mscsoftware.com) 5.5.3.Marc の使用方法インタラクティブでの利用手順を以下に示します使用したいバージョンに適宜読み替えてご実行ください $ module load intel intel-mpi cuda marc_mentat/2017 サンプルファイル (e2x1.dat) の場合 $ cp /apps/t3/sles12sp2/isv/msc/marc/marc2017/demo/e2x1.dat./ $ marc -jid e2x1 5.5.4.Mentat の使用方法 Mentat の起動手順を以下に示します使用したいバージョンに適宜読み替えてご実行ください $ module load intel intel-mpi cuda marc_mentat/2017 $ mentat 45

メニューバーの File > Exit をクリックすると終了します Mentat のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S MSC -c 27004@lice0:27004@remote:27004@t3ldap1 46

5.6. Nastran 使用したいバージョンに適宜読み替えてご実行ください Nastran の起動手順を以下に示します $ module load nastran/2017.1 サンプルファイル (um24.dat) の場合 $ cp /apps/t3/sles12sp2/isv/msc/msc_nastran/20171/msc20171/nast/demo/um24.dat./ $ nast20171 um24 Nastran のバッチ投入手順を以下に示しますサンプルファイル (parallel.sh) の場合 $ qsub parallel.sh スクリプト例 :CPU 並列処理 #!/bin/bash #$ -cwd #$ -l q_core=1 #$ -l h_rt=0:10:00 #$ -V export NSLOTS=4. /etc/profile.d/modules.sh module load cuda openmpi nastran/2017.1 mpirun -np $NSLOTS \ nast20171 parallel=$nslots um24 Nastran のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S MSC -c 27004@lice0:27004@remote:27004@t3ldap1 47

5.7. Patran Patran の起動手順を以下に示します使用したいバージョンに適宜読み替えてご実行ください $ module load patran/2017.0.2 $ pat2017 終了する際は File>EXIT Patran のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S MSC -c 27004@lice0:27004@remote:27004@t3ldap1 48

5.8. Gaussian インタラクティブな利用手順を以下に示します GPU を利用するモジュールを読み込む場合 ( 環境変数 GAUSS_CDEF 及び GAUSS_GDEF を自動設定します ) $ module load gaussian16/revision_gpu $ g16 inputfile revision には使用するリビジョンを指定してください Gaussian16 Rev.B01 の場合は以下の通りです $ module load gaussian16/b01_gpu デフォルトモジュールを読み込む場合 ( 環境変数 GAUSS_CDEF/GAUSS_GDEF は設定されません ) H30 年 9 月現時点のデフォルトモジュールは GPU 向け環境変数を自動設定しない B01 ですが次回のメンテナンス時にはデフォルトモジュールを GPU 向けの B01_gpu に変更予定です $ module load gaussian16 $ g16 inputfile Linda 並列版モジュールを読み込む場合 $ module load gaussian16_linda $ g16 inputfile バッチキューシステムを使用する場合はシェルスクリプトを作成し CLI で以下のように実行します sample.sh を使用する場合 $ qsub sample.sh スクリプト例 : ノード内並列処理 Glycine の構造最適化および振動解析 (IR+ ラマン強度 ) を計算する場合のサンプルスクリプトです下記の glycine.sh glycine.gjf を同一ディレクトリ上に配置し下記コマンドを実行することで計算ができます計算後に glycine.log glycine.chk が生成されます解析結果の確認については GaussView にてご説明します $ qsub glycine.sh glycine.sh #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -V 49

. /etc/profile.d/modules.sh module load gaussian16 g16 glycine.gjf glycine.gjf %chk=glycine.chk %cpu=0-27 環境変数 GAUSS_CDEF/GAUSS_GDEF を自動設定するモジュールを読み込んだ場合は不要 %gpucpu=0-3=0,1,2,3 GPU を使用しない場合や環境変数を自動設定するモジュールを読み込んだ場合は不要 %mem=120gb #P opt=(calcfc,tight,rfo) freq=(raman) glycine Test Job 0 2 N 0-2.15739574-1.69517043-0.01896033 H H 0-1.15783574-1.72483643-0.01896033 H C 0-2.84434974-0.41935843-0.01896033 H C 0-1.83982674 0.72406557-0.01896033 H H 0-3.46918274-0.34255543-0.90878333 H H 0-3.46918274-0.34255543 0.87086267 H O 0-0.63259574 0.49377357-0.01896033 H O 0-2.22368674 1.89158057-0.01896033 H H 0-2.68286796-2.54598119-0.01896033 H 1 2 1.0 3 1.0 9 1.0 2 3 4 1.0 5 1.0 6 1.0 4 7 1.5 8 1.5 5 6 7 8 9 50

5.9. GaussView GaussView は Gaussian の結果を可視化するアプリケーションです GaussView の利用手順を以下に示します $ module load gaussian16 gaussview $ gview.exe メニューバーから File > Exit をクリックすると終了します解析例 :glycine.log Gaussian の項にてサンプルとして例示しているスクリプトを実行した結果ファイルの解析を例にご説明します $ module load gaussian16 gaussview $ gview.exe glycine.log 51

Result から解析結果の確認が可能です Result>Summary にて計算の概要 Result>ChageDistribution で電荷情報 Vibration から振動解析の結果を確認できますサンプルでは振動解析を行っているので Vibration ダイアログの StartAnimation から振動の様子を確認できます 52

5.10. AMBER 5.10.1.AMBER の概要 AMBER は本来タンパク質核酸の分子動力学計算のために開発されたプログラムですが最近では糖用のパラメータも開発され化学生物系の研究のために益々有用なツールとなってきましたご自分の研究で利用する場合はマニュアルや関連する論文等の使用例をよく調べて AMBER が採用しているモデルや理論の限界応用範囲等を把握しておくことが必要です現在 AMBER はソースコードを無制限にコピーすることはできませんが東工大内部で利用することは可能なのでこれを基にさらに発展した手法を取り込むことも可能です 5.10.2.AMBER の使用方法使用したいバージョンに適宜読み替えてご実行ください (1) インタラクティブでの逐次処理の場合の利用手順を以下に示します $ module load amber/16 $ sander [-O A] -i mdin -o mdout -p prmtop -c inpcrd -r restrt (2) インタラクティブでの並列処理 (sander.mpi) の場合の利用手順を以下に示します $ module load amber/16 $ mpirun -np -[ 並列数 ] sander.mpi [-O A] -i mdin -o mdout -p prmtop -c inpcrd -r restrt (3) インタラクティブでの GPU 逐次処理 (pmemd.cuda) の場合の利用手順を以下に示します $ module load amber/16_cuda $ pmemd.cuda [-O] -i mdin -o mdout -p prmtop -c inpcrd -r restrt (4) インタラクティブでの GPU 並列処理 (pmemd.cuda.mpi) の場合の利用手順を以下に示します $ module load amber/16_cuda $ mpirun -np -[ 並列数 ] pmemd.cuda.mpi [-O] -i mdin -o mdout -p prmtop -c inpcrd -r restrt (5) バッチキューシステムの場合の利用手順を以下に示します parallel.sh を利用する場合 $ qsub parallel.sh スクリプト例 :CPU 並列処理 #!/bin/bash #$ -cwd #$ -l f_node=2 53

#$ -l h_rt=0:10:00 #$ -V export NSLOTS=56 in=./mdin out=./mdout_para inpcrd=./inpcrd top=./top cat <<eof > $in Relaxtion of trip cage using &cntrl imin=1,maxcyc=5000,irest=0, ntx=1, nstlim=10, dt=0.001, ntc=1, ntf=1, ioutfm=1 ntt=9, tautp=0.5, tempi=298.0, temp0=298.0, ntpr=1, ntwx=20, ntb=0, igb=8, nkija=3, gamma_ln=0.01, cut=999.0,rgbmax=999.0, idistr=0 / eof. /etc/profile.d/modules.sh module load amber/16 mpirun -np $NSLOTS \ sander.mpi -O -i $in -c $inpcrd -p $top -o $out < /dev/null /bin/rm -f $in restrt スクリプト例 :GPU 並列処理 #!/bin/bash #$ -cwd #$ -l f_node=2 #$ -l h_rt=0:10:0 54

#$ -V export NSLOTS=56 in=./mdin out=./mdout inpcrd=./inpcrd top=./top cat <<eof > $in FIX (active) full dynamics ( constraint dynamics: constant volume) &cntrl ntx = 7, irest = 1, ntpr = 100, ntwx = 0, ntwr = 0, ntf = 2, ntc = 2, tol = 0.000001, cut = 8.0, nstlim = 500, dt = 0.00150, nscm = 250, ntt = 0, lastist = 4000000, lastrst = 6000000, / eof. /etc/profile.d/modules.sh module load amber/16_cuda mpirun -np $NSLOTS \ pmemd.cuda.mpi -O -i $in -c $inpcrd -p $top -o $out < /dev/null /bin/rm -f $in restrt 55

5.11. Materials Studio 5.11.1. ライセンス接続設定方法スタートメニューからすべてのプログラム > BIOVIA > Licensing > License Administrator 7.6.14 を管理者として実行します [Connections] を開き [Set] をクリックして Set License Server ダイアログを開きます Redundant servers にチェックを入れホスト名とポート番号を下図のように入力し [OK] をクリックします 56

Server Status が Connected と表示されれば設定完了です Materials Studio を利用するためには 2 ホスト以上のライセンスサーバーへの接続が確立している必要があります 5.11.2. ライセンス利用状況の確認方法 (1) Windows での確認方法スタートメニューからすべてのプログラム > BIOVIA > Licensing > License Administrator 7.6.14 > Utilities (FLEXlm LMTOOLs) を実行します [Service/License File] タブを開き [Configulation using License File] を選択します MSI_LICENSE_FILE と表示されていることを確認します 57

[Server Status] タブを開き [Perform Status Enqurity] をクリックするとライセンスの利用状況が表示されます特定のライセンスのみを表示したい場合は [Individual Feature] に表示したいライセンス名を入力して [Perform Status Enqurity] を実行します (2) ログインノード上での確認方法以下のコマンドを実行すると利用状況が表示されます $ lmutil lmstat -S msi -c 27005@lice0,27005@remote,27005@t3ldap1 5.11.3.Materials Studio の起動方法 Materials Studio がインストールされた Windows 環境においてスタートメニューを表示し BIOVIA > Materials Studio 2017 R2 をクリックして起動します 58

5.12. Discovery Studio 5.12.1. ライセンス接続設定方法スタートメニューからすべてのプログラム > BIOVIA > Licensing > License Administrator 7.6.14 を管理者として実行します [Connections] を開き [Set] をクリックして Set License Server ダイアログを開きます Redundant servers にチェックを入れホスト名とポート番号を下図のように入力し [OK] をクリックします 59

Server Status が Connected と表示されれば設定完了です Discovery Studio を利用するためには 2 ホスト以上のライセンスサーバーへの接続が確立している必要があります 5.12.2. ライセンス利用状況の確認方法 (1) Windows での確認方法スタートメニューからすべてのプログラム > BIOVIA > Licensing > License Administrator 7.6.14 > Utilities (FLEXlm LMTOOLs) を実行します [Service/License File] タブを開き [Configulation using License File] を選択します MSI_LICENSE_FILE と表示されていることを確認します 60

[Server Status] タブを開き [Perform Status Enqurity] をクリックするとライセンスの利用状況が表示されます特定のライセンスのみを表示したい場合は [Individual Feature] に表示したいライセンス名を入力して [Perform Status Enqurity] を実行します (2) ログインノード上での確認方法以下のコマンドを実行すると利用状況が表示されます $ lmutil lmstat -S msi -c 27005@lice0,27005@remote,27005@t3ldap1 5.12.3.Discovery Studio の起動方法 Discovery Studio がインストールされた Windows 環境においてスタートメニューを表示し BIOVIA > Discovery Studio 2017 R2 64-bit Client をクリックして起動します 61

5.13. Mathematica CLI での起動手順を示します $ module load mathematica $ math Mathematica 11.1.1 Kernel for Linux x86 (64-bit) Copyright 1988-2017 Wolfram Research, Inc. In[1]:= Quit と入力すると終了します GUI での起動手順を以下に示します $ module load mathematica $ Mathematica 終了する場合はノートブックのメニューバーから [File] を選択し Exit をクリックします 62

5.14. Maple Maple は数式処理数値計算アプリケーションです Maple の利用方法の例を以下に示します使用したいバージョンに適宜読み替えてご実行ください CLI での起動手順を以下に示します $ module load maple/2016.2 $ maple \^/ Maple 2016 (X86 64 LINUX)._ \ / _. Copyright (c) Maplesoft, a division of Waterloo Maple Inc. 2016 \ MAPLE / All rights reserved. Maple is a trademark of < > Waterloo Maple Inc. Type? for help. > quit と入力すると終了します GUI での起動手順を以下に示します $ module load maple/2016.2 $ xmaple 64

メニューバーの File > Exit をクリックすると終了します Maple のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S maplelmg -c 27007@lice0:27007@remote:27007@t3ldap1 65

5.15. AVS/Express AVS/Express の利用手順を以下に示します $ module load avs/8.4 $ xp ハードウェアアクセラレーションを無効にして起動する場合は-nohw オプションを付けて実行してくださいメニューバーの File > Exit をクリックすると終了します以下のコマンドでライセンス利用状況を確認できます $ w3m http://lice0:33333/status 66

5.16. AVS/Express PCE AVS/Express PCE の利用手順を以下に示します $ module load avs/8.4 $ para_start メニューバーの File > Exit をクリックすると終了します以下のコマンドでライセンス利用状況を確認できます $ w3m http://lice0:33333/status 67

5.17. LS-DYNA 5.17.1.LS-DYNA の概要 LS-DYNA は陽解法により構造物の大変形挙動を時刻履歴で解析するプログラムで衝突 / 衝撃解析落下解析塑性加工解析貫通 / 亀裂 / 破壊解析などに威力を発揮しこれらの分野では世界有数の導入実績を誇る信頼性の高いプログラムです 5.17.2.LS-DYNA の使用方法 LS-DYNA はバッチジョブで利用します利用手順を以下に示します使用したいバージョンに適宜読み替えてご実行ください SMP 単精度版 run_smps_r9.1.0.sh を実行する場合 $ qsub run_smps_r9.1.0.sh SMP 倍精度版 run_smpd_r9.1.0.sh を実行する場合 $ qsub run_smpd_r9.1.0.sh MPP 単精度版 run_mpps_r9.1.0-1node-avx2.sh を実行する場合 $ qsub run_mpps_r9.1.0-1node-avx2.sh MPP 倍精度版 run_mppd_r9.1.0-1node-avx2.sh を実行する場合 $ qsub run_mppd_r9.1.0-1node-avx2.sh スクリプト例 :SMP 単精度版 #!/bin/bash #$ -cwd #$ -V #$ -l h_node=1 #$ -l h_rt=0:10:0 68

. /etc/profile.d/modules.sh module load cuda/8.0.44 module load lsdyna/r9.1.0 export exe=smpdynas export NCPUS=4 export OMP_NUM_THREADS=${NCPUS} export INPUT=airbag_deploy.k ${exe} i=${input} ncpus=${ncpus} スクリプト例 :SMP 倍精度版 #!/bin/bash #$ -cwd #$ -V #$ -l h_node=1 #$ -l h_rt=0:10:0. /etc/profile.d/modules.sh module load cuda/8.0.44 module load lsdyna/r9.1.0 export exe=smpdynad export NCPUS=4 export OMP_NUM_THREADS=${NCPUS} export INPUT=airbag_deploy.k ${exe} i=${input} ncpus=${ncpus} スクリプト例 :MPP 単精度版 #!/bin/bash #$ -cwd #$ -V #$ -l h_node=1 #$ -l h_rt=0:10:0 69

. /etc/profile.d/modules.sh module load cuda/8.0.44 module load lsdyna/r9.1.0 mpt/2.16 export exe=mppdynas_avx2 export dbo=l2as_avx2 export NCPUS=4 export OMP_NUM_THREADS=1 export INPUT=airbag_deploy.k export MPI_BUFS_PER_PROC=512 export MPI_REMSH=ssh mpiexec_mpt -v -np 4 dplace -s1 ${exe} i=${input} ncpus=${ncpus} ${dbo} binout* スクリプト例 :MPP 倍精度版 #!/bin/bash #$ -cwd #$ -V #$ -l h_node=1 #$ -l h_rt=0:30:0. /etc/profile.d/modules.sh module load cuda/8.0.44 module load lsdyna/r9.1.0 mpt/2.16 export exe=mppdynad_avx2 export dbo=l2ad_avx2 export NCPUS=4 export OMP_NUM_THREADS=1 export INPUT=airbag_deploy.k export MPI_BUFS_PER_PROC=512 export MPI_REMSH=ssh 70

mpiexec_mpt -v -np 4 dplace -s1 ${exe} i=${input} ncpus=${ncpus} ${dbo} binout* スクリプトは利用者の環境に合わせて変更してください上記スクリプト例ではインプットファイルはシェルスクリプト内で INPUT=inputfile として指定しています LS-DYNA のライセンス利用状況は以下のコマンドで確認できます $ lstc_qrun 71

5.18. LS-PrePost 5.18.1.LS-PrePost の概要 LS-PrePost は LS-DYNA と合わせて無償提供されている先進的なプリポストツールになりますユーザインターフェースは効率的かつ直感的に扱えるようにデザインされています LS-PrePost は高速なレンダリングと XY プロットを実現するために OpenGL グラフィックスを利用します 5.18.2.LS-PrePost の使用方法 LS-PrePost の起動手順を以下に示します $ module load lsprepost/4.3 $ lsprepost Livermore Software Technology Corporation L S - P R E P O S T Advanced Pre- and Post-Processor for LS-DYNA LS-PrePost(R) V4.3.11-04Jul2017 LSTC Copyright (C) 1999-2014 All Rights Reserved OpenGL version 3.0 Mesa 11.2.1 72

メニューバーの File>Exit をクリックすると終了します 73

5.19. COMSOL COMSOL の利用手順を以下に示します $ module load comsol $ comsol メニューバーの File > Exit をクリックすると終了します COMSOL のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S LMCOMSOL -c 27009@lice0:27009@remote:27009@t3ldap1 74

5.20. Schrodinger Schrodinger の利用手順を以下に示します Ligprep の CLI 実行例 : $ module load schrodinger/feb-17 SMILES 形式の入力ファイルを使用し,MAE 形式で出力する場合 $ ligprep -ismiinputfile -omaeoutputfile GUI で利用する場合は Maestro を起動します $ module load schrodinger/feb-17 $ maestro メニューバーの File > Exit をクリックすると終了します Schrodinger のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S SCHROD -c 27010@lice0:27010@remote:27010@t3ldap1 75

5.21. MATLAB MATLAB は行列計算などの数値計算やデータの可視化をすることのできるアプリケーションです MATLAB の利用方法の例を以下に示します $ module load matlab $ matlab CLI での使用手順について $ module load matlab $ matlab -nodisplay 終了するには exit を入力します MATLAB のライセンス利用状況を以下のコマンドで確認できます $ lmutil lmstat -S MLM -c 27014@lice0:27014@remote:27014@t3ldap1 76

5.22. Arm Forge Arm Forge の利用方法を以下に示します $ module load forge $ forge メニューバーの File > Exit をクリックすると終了します 77

6. フリーウェアフリーウェアの一覧表を以下に示します表 6-1 フリーウェア一覧ソフトウェア名概要 GAMESS ソルバシミュレータ Tinker ソルバシミュレータ GROMACS ソルバシミュレータ LAMMPS ソルバシミュレータ NAMMD ソルバシミュレータ CP2K ソルバシミュレータ OpenFOAM ソルバシミュレータ可視化 CuDNN GPU ライブラリ NCCL GPU ライブラリ Caffe DeepLearning フレームワーク Chainer DeepLearning フレームワーク TensorFlow DeepLearning フレームワーク R インタプリタ (Rmpi,rpud に対応 ) Apache Hadoop 分散データ処理ツール POV-Ray 可視化 ParaView 可視化 VisIt 可視化 Gimp ツール ( 可視化 ) Gnuplot 可視化 Tgif 描画ツール ImageMagick 画像処理ツール TeX Live TeX ディストリビューション java SDK 開発環境 PETSc リニアシステムソルバライブラリ Fftw 高速フーリエ変換ライブラリ 78

6.1. 量子化学 /MD 関連ソフトウェア 6.1.1.GAMESS GAMESS はオープンソースの第一原理分子量子化学計算アプリケーションですバッチキューシステムを利用した GAMESS の利用方法の例を以下に示します #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N gamess. /etc/profile.d/modules.sh module load intel intel-mpi gamess cat $PE_HOSTFILE awk '{print $1}' > $TMPDIR/machines cd $GAMESS_DIR./rungms exam08 mpi 4 4 詳細な説明は以下に記載されています http://www.msg.ameslab.gov/gamess/index.html 6.1.2.Tinker Tinker はバイオポリマーの為の特別な機能を備えた分子動力学の為のモデリングソフトウェアですバッチキューシステムを利用した Tinker の利用方法の例を以下に示します #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N tinker. /etc/profile.d/modules.sh module load intel tinker cp -rp $TINKER_DIR/example $TMPDIR cd $TMPDIR/example dynamic waterbox.xyz -k waterbox.key 100 1 1 2 300 cp -rp $TMPDIR/example $HOME 79

詳細な説明は以下に記載されています https://dasher.wustl.edu/tinker/ 6.1.3.GROMACS GROMACS は分子動力学しミュレーションとエネルギー最小化を行う為のエンジンですバッチキューシステムを利用した GROMACS の利用方法の例を以下に示します #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N gromacs. /etc/profile.d/modules.sh module load cuda intel-mpi gromacs cp -rp $GROMACS_DIR/examples/water_GMX50_bare.tar.gz $TMPDIR cd $TMPDIR tar xf water_gmx50_bare.tar.gz cd water-cut1.0_gmx50_bare/3072 gmx_mpi grompp -f pme.mdp OMP_NUM_THREADS=2 mpirun -np 4 gmx_mpi mdrun cp -rp $TMPDIR/water-cut1.0_GMX50_bare $HOME 詳細な説明は以下に記載されています http://www.gromacs.org/ 80

6.1.4.LAMMPS LAMMPS は液状固体状気体状の粒子の集団をモデル化する古典分子動力学コードですバッチキューシステムを利用した LAMMPS の利用方法の例を以下に記します #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N lammps. /etc/profile.d/modules.sh module load intel cuda openmpi lammps cp -rp $LAMMPS_DIR/bench $TMPDIR cd $TMPDIR/bench mpirun -np 4 lmp_gpu -sf gpu -in in.lj -pk gpu 4 cp -rp $TMPDIR/bench $HOME 詳細な説明は以下に記載されています http://lammps.sandia.gov/doc/section_intro.html 6.1.5.NAMD NAMD は大規模な生体分子システムの高性能シミュレーション用にデザインされたオブジェクト指向の並列分子動力学コードですバッチキューシステムを利用した NAMD の利用方法の例を以下に記します #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N namd. /etc/profile.d/modules.sh module load cuda intel namd cp -rp $NAMD_DIR/examples/stmv.tar.gz $TMPDIR cd $TMPDIR tar xf stmv.tar.gz 81

cd stmv namd2 +idlepoll +p4 +devices 0,1 stmv.namd cp -rp $TMPDIR/stmv $HOME 詳細な説明は以下に記載されています http://www.ks.uiuc.edu/research/namd/2.12/ug/ 6.1.6.CP2K CP2K は固体液体分子周期的物質結晶生物系の原子シミュレーションを実行できる量子化学固体物理ソフトウェアパッケージですバッチキューシステムを利用した CP2K の利用方法の例を以下に記します #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N cp2k. /etc/profile.d/modules.sh module load intel intel-mpi cp2k cp -rp $CP2K_DIR/tests/QS/benchmark $TMPDIR cd $TMPDIR/benchmark mpirun -np 8 cp2k.popt -i H2O-32.inp -o H2O-32.out cp -rp $TMPDIR/benchmark $HOME 詳細な説明は以下に記載されています https://www.cp2k.org/ 82

6.2. CFD 関連ソフトウェア 6.2.1.OpenFOAM OpenFOAM はオープンソースの流体 / 連続体シミュレーションコードですバッチキューシステムを利用した OpenFOAM の利用方法の例を以下に記します #!/bin/bash #$ -cwd #$ -l f_node=1 #$ -l h_rt=0:10:0 #$ -N openform. /etc/profile.d/modules.sh module load cuda openmpi openfoam mkdir -p $TMPDIR/$FOAM_RUN cd $TMPDIR/$FOAM_RUN cp -rp $FOAM_TUTORIALS. cd tutorials/incompressible/icofoam/cavity/cavity blockmesh icofoam parafoam 詳細な説明は以下に記載されています http://www.openfoam.com/documentation/ 83

6.3. 機械学習ビックデータ解析関連ソフトウェア 6.3.1.CuDNN CuDNN は GPU を用いた Deep Neural Network の為のライブラリです CuDNN の利用方法を以下に記します $ module load cuda cudnn 6.3.2.NCCL NCCL は複数 GPU の為の集団通信ライブラリです NCCL の利用方法の例を以下に記します $ module load cuda nccl 6.3.3.Caffe Caffe はオープンソースの DeepLearning フレームワークです Caffe の利用方法の例を以下に記します $ module load cuda nccl cudnn/6.0 intel caffe/1.0 詳細な説明は以下に記載されています http://caffe.berkeleyvision.org/ MKL を利用する際はコードの前段に #define USE_MKL を追記し $ MKLROOT 以下にある計算ライブラリを呼び出してください 6.3.4.Chainer Chainer はフレキシブルなニューラルネットワークのフレームワークです Chainer の利用方法の例を以下に記します $ module load intel cuda nccl/2.2.13 cudnn/7.1 openmpi/2.1.2 chainer/4.3.0 詳細な説明は以下に記載されています https://docs.chainer.org/en/stable/ 84

6.3.5.TensorFlow TensorFlow はデータフローグラフを用いた機械学習 AI のオープンソースのライブラリです TensorFlow の利用方法の例を以下に記します #python2.7 の場合 $ module load python-extension #python3.4 の場合 $ module load intel cuda/9.0.176 nccl/2.2.13 cudnn/7.1 tensorflow/1.9.0 詳細な説明は以下に記載されています https://www.tensorflow.org/ 6.3.6.R R はデータ解析とグラフィックスの為のインタプリタ型プログラミング言語です並列処理用に Rmpi GPU 用に rpud がインストールされています R の利用方法の例を以下に記します $ module load intel cuda openmpi r $ mpirun -stdin all -np 2 R --slave --vanilla < test.r 6.3.7.Apache Hadoop Apache Hadoop ソフトウェアライブラリは単純なプログラミングモデルを用いて大きなデータセットを分散処理する為のフレームワークです Apache Hadoop の利用方法の例を以下に記します $ module load jdk hadoop $ mkdir input $ cp -p $HADOOP_HOME/etc/hadoop/*.xml input $ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.0.jar grep input output 'dfs[a-z.]+' $ cat output/part-r-00000 1 dfsadmin バッチキューシステムの場合の利用手順を以下に示します #!/bin/bash #$ -cwd #$ -l f_node=1 85

#$ -l h_rt=0:10:0 #$ -N hadoop. /etc/profile.d/modules.sh module load jdk hadoop cd $TMPDIR mkdir input cp -p $HADOOP_HOME/etc/hadoop/*.xml input hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.0.jar grep input output 'dfs[a-z.]+' cp -rp output $HOME 86

6.4. 可視化関連ソフトウェア 6.4.1.POV-Ray POV-Ray はフリーの光線追跡ソフトです POV-Ray の利用方法の例を以下に記します $ module load pov-ray $ povray -benchmark 詳細な説明は以下に記載されています http://www.povray.org/ 6.4.2.ParaView ParaView はオープンソースマルチプラットフォームのデータ解析と可視化アプリケーションです ParaView の利用方法の例をを以下に記します $ module load cuda openmpi paraview $ paraview 詳細な説明は以下に記載されています https://www.paraview.org/ 6.4.3.VisIt VisIt はオープンソースの可視化アプリケーションです VisIt の利用方法の例を以下に記します $ module load cuda openmpi vtk visit $ visit 詳細な説明は以下に記載されています https://wci.llnl.gov/simulation/computer-codes/visit/ 87

6.5. その他フリーウェア 6.5.1.gimp gimp はオープンソースの画像操作プログラムです gimp の利用方法の例を以下に記します $ module load gimp $ gimp 6.5.2.gnuplot gnuplot はコマンドラインのインタラクティブなグラフ描画プログラムです標準機能に加え X11 latex PDFlib-lite Qt4 に対応するようにビルドされています gnuplot の利用方法の例を以下に記します $ module load gnuplot $ gnuplot 6.5.3.tgif tgif はオープンソースの描画ツールです tgif の利用方法を以下に記します $ module load tgif $ tgif Cannot open the Default(Msg) Font '-*-courier-medium-r-normal-*-14-*-*-*-*-*-iso8859-1'. というエラーが出て起動しない場合は ~/.Xdefaults に以下の行を追加して下さい Tgif.DefFixedWidthFont: Tgif.DefFixedWidthRulerFont: Tgif.MenuFont: Tgif.BoldMsgFont: Tgif.MsgFont: -*-fixed-medium-r-semicondensed--13-*-*-*-*-*-*-* -*-fixed-medium-r-semicondensed--13-*-*-*-*-*-*-* -*-fixed-medium-r-semicondensed--13-*-*-*-*-*-*-* -*-fixed-medium-r-semicondensed--13-*-*-*-*-*-*-* -*-fixed-medium-r-semicondensed--13-*-*-*-*-*-*-* 6.5.4.ImageMagick ImageMagick は画像処理ツールです 88

標準機能に加え X11 HDRI libwmf jpeg に対応するようにビルドされています ImageMagick の利用方法の例を以下に記します $ module load imagemagick $ convert -size 48x1024 -colorspace RGB 'gradient:#000000-#ffffff' -rotate 90 -gamma 0.5 -gamma 2.0 result.jpg 6.5.5.pLaTeX2e platex2e は日本語化された LaTex2e の一つです platex2e の利用方法の例を以下に記します $ module load texlive $ platex test.tex $ dvipdfmx test.dvi pdf の作成には dvipdfmx をご利用ください dvipdf では日本語が正常に変換されません 6.5.6.Java SDK Java SDK として Oracle JDK 1.8 がインストールされています Java SDK の利用方法の例を以下に記します $ module load jdk $ javac Test.java $ java Test 6.5.7.PETSc PETSc はオープンソースの並列数値計算ライブラリです線型方程式の求解等を行うことができます実数用複素数用の 2 種類がインストールされています PETSc の利用方法の例を以下に記します $ module load intel intel-mpi $ module load petsc/3.7.6/real <-- 実数用又は $ module load petsc/3.7.6/complex <-- 複素数用 $ mpiifort test.f -lpetsc 89

6.5.8.fftw fftw はオープンソースの高速フーリエ変換用ライブラリです fftw 2x 系列と 3x 系列は非互換な為バージョン 2 系と 3 系の 2 種類がインストールされております fftw の利用方法の例を以下に記します $ module load intel intel-mpi fftw <-- Intel MPI の場合又は $ module load intel cuda openmpi fftw <-- Open MPI の場合 $ ifort test.f90 -lfftw3 6.5.9. singularity singularity は HPC 向け Linux コンテナです Singularity の使い方の例を以下に記します qrsh でノードを確保した後に実行して下さいシェルを起動する場合 $ module load singularity $ cp p $SINGULARITY_DIR/image_samples/centos/centos-7-opa.simg. $ singularity shell --nv B /gs B /apps B /scr centos-7-opa.simg コンテナ内のコマンドを実行する場合 $ module load singularity $ cp p $SINGULARITY_DIR/image_samples/centos/centos-7-opa.simg. $ singularity shell --nv B /gs B /apps B /scr centos-7-opa.simg < コマンド > MPI を実行する場合 $ module load singularity cuda openmpi $ cp p $SINGULARITY_DIR/image_samples/centos/centos-7-opa.simg. $ mpirun -x LD_LIBRARY_PATH -x SINGULARITYENV_LD_LIBRARY_PATH=$LD_LIBRARY_PATH -x SINGULARITYENV_PATH=$PATH -x < 環境変数 > -npernode < プロセス数 / ノード > -np < プロセス数 > singularity exec --nv -B /apps -B /gs -B /scr/ centos-7-opa.simg <MPI 実行バイナリ > コンテナイメージに CUDA 版 OPA ドライバライブラリをインストールする方法 (centos7 の場合 ) 各自の PC 等 root 権限を所有するマシンで行って下さい https://downloadcenter.intel.com/download/27673/intel-omni-path-software-including-intel-omni-pa th-host-fabric-interface-driver-?product=92003 から対応する OS の OPA のインストーラをダウンロード s $ cp p < ダウンロードしたインストーラ > ~ $ singularity pull docker://centos $ singularity image.create -s 8192 centos-7.img $ singularity build -w centos-7.img centos.simg $ singularity shell w centos-7.img 90

$$ tar xf < ダウンロードしたインストーラ > $$ cd < ダウンロードしたインストーラ >/RPMS/<OS バージョン >/CUDA $$ yum install y numactl-libs hwloc-libs libfabric libibverbs infinipath-psm $$ rpm ivh libpsm2-*.rpm $$ exit $ singularity build centos-7.simg centos-7.img 詳細な説明は以下に記載されています https://www.sylabs.io/docs/ 91

改定履歴改定番号改定日付け内容 V1 7/31/2017 初版 V2 8/17/2017 改定第 2 版 V3 9/6/2017 改定第 3 版 V4 9/11/2017 2.2 ログイン方法にログインノードの制限を加筆 2.4 ストレージサービス (CIFS) に CIFS ボリューム表示を加筆 4.4.4 共有スクラッチ領域のアクセス方法の追記 V5 9/14/2017 2.4 ストレージサービス (CIFS) に CIFS ボリューム表示を加筆 V6 9/25/2017 4.3.1. インタラクティブノードを利用した X 転送を追記 V7 10/5/2017 6.3.3.Caffe に MKL の利用方法について追記 V8 10/26/2017 5.12.4 ユーザー認証についてを削除 V9 12/18/2017 3.1.1. 利用可能な module 環境の表示を追記 3.5 GPU 環境を加筆 V10 12/28/2017 4.2 ジョブ投入にアレイジョブの項目を加筆 4.4 シグナル通知 / チェックポイントを追記 4.5 ストレージの利用を加筆 V11 1/12/2018 2.2 ログイン方法を加筆 4.3.1. インタラクティブノードを利用した X 転送を加筆 V12 1/13/2018 4.5 予約実行を追記 V13 2/7/2018 2.4 ログインシェルの変更を追記 4.2.2 ジョブスクリプトの優先度オプションを加筆 V14 12/3/2018 4.2.5 ジョブスクリプトの記述例 MPI 並列 4.2.5 ジョブスクリプトの記述例プロセス並列 / スレッド並列 ( ハイブリッド ) の OpenMPI 項にライブラリの環境変数を加筆 V15 5/9/2018 3.1.1 利用可能な module 環境の表示からモジュール一覧を削除 web ページへのリンクを追加 V16 5/25/2018 2.5 TSUBAME ポイントの確認を追記 4.6.1 Home ディレクトリ, 4.6.2 高速ストレージの容量確認方法を加筆 V17 7/27/2018 5.8 Gaussian 5.9 GaussView の利用手順を修正 V18 8/23/2018 6.3 Caffe,Chainer,Tensorflow の利用手順を修正 V19 9/6/2018 6.5.9 singularity を追加 V20 9/19/2018 5. ISV アプリケーションを 2018 年 9 月時点の環境に合うように修正 V21 10/26/2018 4.1. 利用可能な資源タイプの制限値についての記述を修正 V22 12/3/2018 3.5.6.GPU の COMPUTE MODE の変更を追記 4.6.4. 共有スクラッチ領域を加筆 92