Torqueユーザーマニュアル

Similar documents
Microsoft Word - TORQUE利用の手引きver1.1.doc

GridEngineユーザーマニュアル

Gromacsユーザーマニュアル

pbs-new.dvi

LSF・Lavaユーザーマニュアル

APC UPSユーザーマニュアル

VT SoftWare Users Guide

WIEN2kユーザーマニュアル

Gaussian09ユーザーマニュアル

Linux管理クイックスタートガイド

Gaussian09,16ユーザーマニュアル

Q-Chem 5.2 Linux OS へのオンラインインストール 2019 年 6 月 24 日 Q-Chem 5.2 のインストール Linux OS へのオンラインインストール ( 推奨 ) ( 株 ) アフィニティサイエンス 概要 :Linux OS へのインストールには, オンラインインス

目次 LS-DYNA 利用の手引き 1 1. はじめに 利用できるバージョン 概要 1 2. TSUBAME での利用方法 使用可能な LS-DYNA の実行 4 (1) TSUBAMEにログイン 4 (2) バージョンの切り替え 4 (3) インタラ

ハピタス のコピー.pages

Copyright 2008 All Rights Reserved 2

相続支払い対策ポイント

150423HC相続資産圧縮対策のポイント

$ cmake --version $ make --version $ gcc --version 環境が無いあるいはバージョンが古い場合は yum などを用いて導入 最新化を行う 4. 圧縮ファイルを解凍する $ tar xzvf gromacs tar.gz 5. cmake を用

ESMPRO/JMSS Ver6.0

和佐田 裕昭P indd

任意の間隔での FTP 画像送信イベントの設定方法 はじめに 本ドキュメントでは AXIS ネットワークカメラ / ビデオエンコーダにおいて任意の間隔で画像を FTP サー バーへ送信するイベントの設定手順を説明します 設定手順手順 1:AXIS ネットワークカメラ / ビデオエンコーダの設定ページ

最も一般的な手法: ファイアウォールによってノード間の MPI 通信がブロックされた場合の対応方法

Hyper-V 仮想マシンの設定

Systemwalker IT Service Management Systemwalker IT Service Management V11.0L10 IT Service Management - Centric Manager Windows

CLUSTERPRO MC StorageSaver istorage M シリーズ使用時の設定手順 (HP-UX 版 Linux 版 Windows 版 ) 2013(Apr) NEC Corporation istorage M シリーズを使用する場合の StorageSaver 設定手順 (H


NEC Express5800 シリーズ N /158 Fibre Channel コントローラ ドライバインストール手順書 A

OpenMP¤òÍѤ¤¤¿ÊÂÎó·×»»¡Ê£±¡Ë

はじめに このドキュメントではftServerに関する障害調査を行う際に 必要となるログ データの取得方法を説明しています ログ データの取得には 初期解析用のデータの取得方法と 詳細な調査を行うときのデータ取得方法があります 特別な理由でOS 側のログが必要となった場合には RHELログの取得につ

ユーザーマニュアル開発環境編

Microsoft Word - D JP.docx

DocuWide 2051/2051MF 補足説明書

初心者にもできるアメブロカスタマイズ新2016.pages

<48554C46545F F A5490E08E9197BF2E786C73>

- 2 Copyright (C) All Rights Reserved.

OpenMP¤òÍѤ¤¤¿ÊÂÎó·×»»¡Ê£±¡Ë

スライド 1

Cleaner XL 1.5 クイックインストールガイド

ロードバランサー配下のシボレス IdP 環境設定に関する検証実験 2009 年 12 月 22 日国立情報学研究所学術ネットワーク研究開発センター山地一禎, 中村素典

syspro-0405.ppt

Upload path ファイル送信先ディレクトリのパスを指定します ホームディレクトリに画像を送信する場合は空白のまま サブディレクトリに画像を送信する場合はディレクトリ名を指定します さらに下位のディレクトリを指定する場合は \ マークを利用します 例 ) ホームディレクトリ以下の camera

UCS M シリーズ サーバでの Redhat/CentOS オペレーティング システムのインストール

Copyright All Rights Reserved. -2 -!

<Documents Title Here>

サイバーメディアセンター 大規模計算機システムの利用

CUCM と VCS 間のセキュア SIP トランクの設定例

Microsoft Word - 最終版 バックせどりismマニュアル .docx

HULFT8 for Windows/UNIX/Linux/zLinux の機能で発生する不具合について

Intel MPI Library Linux

2D/3D CAD データ管理導入手法実践セミナー Autodesk Vault 最新バージョン情報 Presenter Name 2013 年 4 月 2013 Autodesk

SLAMD導入手順

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド

Copyright 2006 KDDI Corporation. All Rights Reserved page1

Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for

コードワードについて

LS-DYNA 利用の手引 第 1 版 東京工業大学学術国際情報センター 2017 年 9 月 25 日

Reedbush 利用の手引き 2 ノートパソコンの設定 : 公開鍵の生成 登録 ネットワーク環境に接続してから行ってください

アプリケーションサーバ JBoss超入門

2. Save をクリックします 3. System Options - Network - TCP/IP - Advanced を開き Primary DNS server と Secondary DNS Server に AXIS ネットワークカメラ / ビデオエンコーダが参照できる DNS サ

Linux管理クイックスタートガイド

Copyright 2009, SofTek Systems, Inc. All rights reserved.

Microsoft Word - nvsi_080188jp_r1_netvault_oracle_rac_backup_complemental_guide_j_174x217.doc

untitled

Red Hat Enterprise Linuxのcron(8)デーモンにデフォルト定義されたtmpwatch命令の動作による、WebOTXのトラブル対処方法

Copyright Qetic Inc. All Rights Reserved. 2

Releases080909

TSUBAME利用講習会

目次 1. はじめに 本文書の目的 前提条件 略語 事前準備 ホスト名の名前解決 Linux 版パッケージ システム要件 ソフトウェア要件 パッケージ構成

PowerPoint プレゼンテーション

InfoPrint 5577/5579 ネットワーク設定ガイド(第5章 UNIX/Linux環境で使用する)

Oracle Calendar Oracle Collaboration Suite 2(9.0.4) Creation Date: Jun 04, 2003 Last Update: Nov 18, 2003 Version:

Anaconda (2019/7/3)

PRIMEQUEST 1000 シリーズ IO 製品 版数の確認方法

1. 検証概要 目的及びテスト方法 1.1 検証概要 既に Red Hat Enterprise Linux 5.5 for x86-64 で動作保証されている Micro Focus Server Express 5.1 J を Red Hat Enterprise Linux 6.1 for x

AW-PCS認証設定手順1805

Slide 1

Microsoft Word - 電源制御コマンドの設定について_UNIX_.doc

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows 日本語版 : インストール・ガイド

DHCPサーバのクラスタ化

file://\\Nc31\nabedata\website-internal\manual\netvault.html

Transcription:

目次 1 インストール概要... 2 2 コマンド例... 3 3 出荷設定... 6 4 ジョブの投入例... 8 5 ドキュメント... 11 付録 A... 12 A.1 HPC システムズお問い合わせ先... 12 Copyright HPC SYSTEMS Inc. All Rights Reserved. 1

1 インストール概要 (1) パッケージ http://www.adaptive.computing.com より配布されている Torque のソースファイルをビルドしてインストールしています スケジューラーは Torque 標準のものでセットアップしていますが 機能を追加した maui や moab のスケジューラーに変更することもできます (2) インストールディレクトリ /usr/local/torque-"version" (3) デーモン OS 起動時に自動でデーモンが動作します /etc/init.d/pbs_server Torque クラスタのヘッドノードで動作します /etc/init.d/pbs_sched Torque クラスタのヘッドノードで動作します /etc/init.d/pbs_mom Torque クラスタの全ノードで動作します (4) 環境設定ファイル Torque の環境設定は各ユーザーのホームディレクトリのファイルで行われています root ユーザーの場合は tcsh をご使用の場合は ~/.cshrc ファイル bash をご使用の場合は ~/.bashrc ファイル内で Torque の環境をセットします 一般ユーザーは ~/.cshrc ファイルまたは ~/.bashrc ファイル内で /home/.common 以下に用意した Torque 環境設定スクリプトを実行します Copyright HPC SYSTEMS Inc. All Rights Reserved. 2

2 コマンド例 ユーザーが Torque バッチシステムを使用する際のコマンドを概説します (1) pbsnodes クラスタの全ノードの状態を表示します [hpc@hpcs01 ~]$ pbsnodes hpcs01 state = free np = 8 ntype = cluster status = rectime=1340945062,varattr=,jobs=,state=free,netload=8069588502, gres=,loadave=0.04,ncpus=4,physmem=8057520kb,availmem=10796176kb, totmem=12057512kb,idletime=233,nusers=4,nsessions=22,sessions=1927 2150 2334 2214 2445 2455 2523 2571 2574 2593 2599 2865 2912 4966 14414 11532 12168 12236 12268 12269 12291 12356,uname=Linux hpcs01.localhost 2.6.32-220.7.1.el6.x86_64 1 SMP Fri Feb 10 15:22:22 EST 2012 x86_64,opsys=linux gpus = 0 (2) qsub Torque バッチシステム上にジョブを投入します ジョブが投入されるとジョブ ID が表示されます 指定されるジョブはスクリプト形式である必要があるのでご注意下さい スクリプトの作成については 4 章ジョブの投入例をご参考下さい [hpc@hpcs01 ~]$ qsub./test.sh. 101.hpcs01.localhost (3) qdel 指定したジョブ ID のジョブを中断します [hpc@hpcs01 ~]$ qdel 101 Copyright HPC SYSTEMS Inc. All Rights Reserved. 3

(4) qstat Torque バッチシステムのステータスを表示します [hpc@hpcs01 ~] qstat -a Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time -------------------------------------------------------------------------------- ------------------------------------ 11.hpcs01.localh hpc normal test.sh 4272 -- -- -- -- R 03:51 12.hpcs01.localh hpc normal test.sh 11901 1 1 -- -- R 00:15 13.hpcs01.localh hpc normal test.sh 11985 2 4 -- -- R 00:14 14.hpcs01.localh hpc normal test.sh 18881 1 4 -- -- R 00:14 15.hpcs01.localh hpc normal test.sh -- 4 16 -- -- Q -- qstat -a の表示内容は以下の通りです Job ID: ジョブ ID とジョブを投入したノード Name: 投入したジョブ User: ジョブを投入したユーザー SessID: ジョブのセッション ID NDS: ジョブ投入時に要求したノード数 TSK: ジョブ投入時に要求した CPU コア数 Req d Memory: ジョブ投入時に要求したメモリ量 Req d Time: ジョブ投入時に要求した経過時間 S: ジョブの現在のステータス R= 実行中 Q= キュー待機中 H= 保留中 E= 終了 T= 移行中 W= 待機中 Elap Time: ジョブの実行時間 なお 以下オプションにより qstat で表示される情報が変わります -a: 各ジョブの詳細の表示 -q: キューの状態を表示 -Q: キューの状態の表示 -B:PBS Server の内容の表示 -f: 表示する内容の詳細の表示 それぞれのオプションと合わせての使用が可能 Copyright HPC SYSTEMS Inc. All Rights Reserved. 4

(5) tracejob ジョブの詳細を表示します [hpc@hpcs01 ~]$ tracejob 102 Job: 102.hpcs01.localhost 06/29/2012 13:53:55 S enqueuing into normal, state 1 hop 1 06/29/2012 13:53:55 S Job Queued at request of hpc@hpcs01.localhost, owner = hpc@hpcs01.localhost, job name = test.sh, queue = normal 06/29/2012 13:53:55 A queue=normal 06/29/2012 13:53:56 S Job Run at request of root@hpcs01.localhost 06/29/2012 13:53:56 S Not sending email: User does not want mail of this type. 06/29/2012 13:53:56 A user=hpc group=users jobname=test.sh queue= normal ctime=1340945635 qtime=1340945635 etime=1340945635 start= 1340945636 owner=hpc@hpcs01.localhost exec_host=hpcs03/0 (6) qmgr Torque バッチシステムの設定内容の表示などができます root であれば Torque の設定変更を行うことができます [hpc@hpcs01 ~]$qmgr -c "print queue " Create queues and set their attributes. Create and define queue normal create queue normal set queue normal queue_type = Execution set queue normal enabled = True set queue normal started = True 使用例 qmgr -c "print queue queuename" 指定したキューの情報を表示します qmgr -c "print node nodename" 指定したノードの情報を表示します qmgr -c "print server" Torque バッチシステムの設定情報を表示します Copyright HPC SYSTEMS Inc. All Rights Reserved. 5

3 出荷設定 (1) server 設定出荷時の Torque server の設定は以下の通りです デフォルトではジョブが投入できるように normal キューを作成しています [root@hpcs01 ~] qmgr -c "print server" Create queues and set their attributes. Create and define queue normal create queue normal set queue normal queue_type = Execution set queue normal enabled = True set queue normal started = True Set server attributes. set server scheduling = True set server acl_hosts = hpcs01.localhost set server default_queue = normal set server log_events = 511 set server mail_from = adm set server scheduler_iteration = 600 set server node_check_rate = 150 set server tcp_timeout = 6 set server mom_job_sync = True set server keep_completed = 10 set server next_job_number = 12 Copyright HPC SYSTEMS Inc. All Rights Reserved. 6

(2) ノード設定ホストマシンの /var/spool/torque/server_priv/nodes に記述しています このファイルで設定した内容は pbsnodes コマンドで表示されます np, gpu, properties などの値の変更等を行う際はこのファイルを変更してください [root@hpcs01 ~] cat /var/spool/torque/server_priv/nodes This is the TORQUE server "nodes" file. To add a node, enter its hostname, optional processor count (np=), and optional feature names. Example: host01 np=8 featurea featureb host02 np=8 featurea featureb for more information, please visit: http://www.clusterresources.com/torquedocs/nodeconfig.shtml hpcs01 np=8 hpcs02 np=8 hpcs03 np=8 hpcs04 np=8 Copyright HPC SYSTEMS Inc. All Rights Reserved. 7

4 ジョブの投入例 以下はジョブスクリプトの例です (1) 通常のジョブ!/bin/tcsh PBS -j oe stdout と stderr を同一ファイルにする PBS -o logfile stdout のファイル名を指定する PBS -q normal キューの指定 cd $PBS_O_WORKDIR./a.out カレントディレクトリにある実行ファイルを使用する場合は カレントディレクトリ $PBS_O_WORKDIR へ cd で移動してから実行してください (2) SMP ジョブ!/bin/tcsh PBS -l nodes=1:ppn=8 1 ノードを使用 8CPU コアを使用する cd $PBS_O_WORKDIR./a.out (3) OpenMPI ジョブ!/bin/tcsh PBS -l nodes=4:ppn=8 4 ノード使用 それぞれ 8 コアを使用する cd $PBS_O_WORKDIR mpirun -np 32./a.out OpenMPI パッケージ内に Torque 用コンポーネント tm がある場合 machinefile は不要です 以下コマンドで OpenMPI に tm モジュールがあることをご確認下さい [hpc@hpcs01 ~] ompi_info grep tm MCA pls: tm (MCA v1.0, API v1.0, Component v1.0) MCA ras: tm (MCA v1.0, API v1.0, Component v1.0) Copyright HPC SYSTEMS Inc. All Rights Reserved. 8

OpenMPI パッケージ内に Torque 用コンポーネント tm がない場合は 以下のようにして machinefile を作成して実行します!/bin/tcsh PBS -l nodes=4:ppn=8 4 ノード使用 それぞれ 8 コアを使用する cd $PBS_O_WORKDIR uniq -c $PBS_NODEFILE awk { print($2, slots= $1)} > hostsfile mpirun -machinefile hostsfile -np 32./a.out (4) ジョブを実行するノードの指定 ノードのホスト名で指定する場合!/bin/tcsh PBS -l nodes=hpcs01:ppn=8+hpcs02:ppn=8 cd $PBS_O_WORKDIR mpirun -np 16./a.out properties でノードを指定する場合!/bin/tcsh PBS -l nodes=2:ppn=8:group1 cd $PBS_O_WORKDIR mpirun -np 16./a.out 上記例は properties で group1 と指定されているノードのどれかにジョブが投入されます properties を使用するためには /var/spool/torque/server_priv/nodes ファイルで設定を行い スケジューラー上で認識している必要があります Copyright HPC SYSTEMS Inc. All Rights Reserved. 9

(5) ジョブスクリプト内で使用できる変数の例 Variable PBS_JOBNAME PBS_O_WORKDIR PBS_TASKNUM PBS_O_HOME PBS_MOMPORT PBS_O_LOGNAME PBS_NODENUM PBS_O_SHELL PBS_O_JOBID PBS_O_HOST PBS_QUEUE PBS_NODEFILE PBS_O_PATH Description User specified jobname Job s submission directory Number of tasks requested Home directory of submitting user Active port for mom daemon name of submitting user Node offset number Script shell Unique pbs job id Host on which job script is currently running Job queue File containg line delimted list on nodes allocated to the job Path variable used to locate executables within job script Copyright HPC SYSTEMS Inc. All Rights Reserved. 10

5 ドキュメント Torque Maui はホームページ上で公式マニュアルを公開しています 詳細については 以下をご覧下さい Adaptive Computing Documentation http://www.adaptivecomputing.com/resources/docs/ http://www.adaptivecomputing.com/support/documentation/ Copyright HPC SYSTEMS Inc. All Rights Reserved. 11

付録 A A.1 HPC システムズお問い合わせ先 弊社ホームページ http://www.hpc.co.jp/support_index.html サポート案内やお問い合わせの多い内容など様々な情報を掲載しております 是非ご活用ください HPC システムズ株式会社 108-0022 東京都港区海岸 3-9-15 LOOP-X 8 階 HPC 事業部 営業 03-5446-5531 サポート 03-5446-5532 お電話によるサポート受付は祝日 弊社指定休日を除く月曜日から金曜日の 9:30~17:30 とさせて頂きます FAX 03-5446-5550 電子メール hpcs_support@hpc.co.jp Copyright HPC SYSTEMS Inc. All Rights Reserved. 12