JPARC 実験データの共通計算機システムへの転送 八代茂夫 高エネルギー加速器研究機構共通基盤研究施設計算科学センター 概要 KEKCC のストレージシステム HPSS にアクセスするために用意されている各種のインターフェイスとそれぞれの特徴を述べる 次に HPSS への KEK 内からのアクセス

Similar documents
KEKCC のストレージ 2009 年 4 月 24 日 KEK 共通基盤研究施設計算科学センター 八代茂夫 2009/4/24 1/23

untitled

PowerPoint プレゼンテーション

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

本仕様はプロダクトバージョン Ver 以降に準じています

Microsoft Word - gori_web原稿:TrusSPSにおけるNAS OSのパフォーマンス評価.docx

i Ceph

e-サイエンス基盤としての 計算機センターPOP(Point-of-Presence) 連携

Microsoft Word - nvsi_100222jp_oracle_exadata.doc

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(6\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\).ppt)

PRIMERGY TX1310 M1 未サポートOS動作検証確認情報

PRIMERGY TX100 S1 未サポートOS動作検証確認情報

PRIMERGY TX100 S3 未サポートOS動作検証確認情報

PRIMERGY TX140 S1 未サポートOS動作検証確認情報

PRIMERGY TX100 S3 未サポートOS動作検証確認情報

PRIMERGY RX300 S6 SAS コントローラカード <RAID 5> フリーOS 動作確認情報

富士通PCサーバ「PRIMERGY RX2530 M4」における「TeraStation TS5010 / TS3010」シリーズ動作検証報告

Microsoft Word - nvsi_080177jp_trendmicro_bakbone.doc

システムソリューションのご紹介

PRIMERGY CX250 S2 未サポートOS動作検証確認情報

VNX ファイル ストレージの管理

Microsoft Word - qtsi_120246jp_rhev.doc

PRIMERGY TX1320 M3 未サポートOS動作検証確認情報

PRIMERGY TX150 S7 SAS アレイコントローラカード <RAID 5> フリーOS 動作確認情報

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

2013年『STSSスキルコミュニティ』 テーマ別Kickoff資料

PRIMERGY TX1330 M3 未サポートOS動作検証確認情報

EMC Celerra NS-480システム(4ブレード)インストール ガイド

VNX ファイル ストレージの管理

Microsoft Word - appendix_b_srft.doc

Maser - User Operation Manual

<4D F736F F F696E74202D204E505F8E9F90A291E E815B CFC82AF B838B B838B C5E B8D5C91A E E4E41532E7

Microsoft Word - nvsi_090192jp_r2_DELL_NX4.doc

本仕様はプロダクトバージョン Ver 以降に準じています

PowerPoint プレゼンテーション

Microsoft PowerPoint - ShadowProtectIT手順書_ ppt

BMR for NVBU NIC bnx2.ko SVR/CLNT 上での SCSI megaraid_sas.ko 自動認識デバイス Partition 構成 (RHEL6.0 uefi/lvm 構成の場合 ) Partition1 /boot/efi EFI 200MB Partition2 /

PRIMERGY TX1310 M3 未サポートOS動作検証確認情報

PRIMERGY RX200 S8/RX350 S7とETERNUS LT40でのAcronis Backup & Recovery 11.5 Advanced Serverによるイメージバックアップ動作検証

TFTP serverの実装

新製品 Arcserve Backup r17.5 のご紹介 (SP1 対応版 ) Arcserve Japan Rev. 1.4

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(5\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\201j.ppt)

本仕様はプロダクトバージョン Ver 以降に準じています

MAGNIA Storage Server Configuration Guide

HPE Moonshot System ~ビッグデータ分析&モバイルワークプレイスを新たなステージへ~

内蔵LTO5 ユニット

提案書

PRIMERGY TX1320 M1 未サポートOS動作検証確認情報

「BladeSymphony」「HA8000 シリーズ」において最新OS Windows Server 2008 プレインストールモデルを販売開始

富士通PCサーバ「PRIMERGY TX1320 M3/RX1330 M3」における「NetStor」シリーズ動作検証

目次 1. はじめに 用語説明 対象アダプタ P HBA/2P HBAで異なる性能 付録 ( 性能測定環境 ) P HBAでの性能測定環境 P HBAでの性能測定環境 本書の

― ANSYS Mechanical ―Distributed ANSYS(領域分割法)ベンチマーク測定結果要約

Microsoft Word - nvsi_060132jp_datadomain_restoreDRAFT4.doc

Arcserve Backup r16 新機能 テープブロックサイズの拡張 効果実測 Arcserve Japan 1.5 版

以 前 の 環 境 1.ハードウェア 構 成 新 機 器 導 入 前 の 構 成 を 示 す No 機 器 CPU メモリ ハードディスク 用 途 1 ノートPC 01 Pentium M 1.60 GHz 2 GB 60 GB 普 段 使 い 用 (ネット 動 画 再 生 等 ) 2 PC A P

Arcserve Unified Data Protection サーバ構成とスペック見積もり方法 2018 年 10 月 Arcserve Japan Ver

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

iStorage NSシリーズ管理者ガイド(詳細編)

PRIMERGY BX924 S4 未サポートOS動作検証確認情報

PowerPoint プレゼンテーション

memcached 方式 (No Replication) 認証情報は ログインした tomcat と設定された各 memcached サーバーに認証情報を分割し振り分けて保管する memcached の方系がダウンした場合は ログインしたことのあるサーバーへのアクセスでは tomcat に認証情報

FUJITSU Server PRIMERGY / FUJITSU Storage ETERNUS NR1000 F2240とSophos Anti-Virus for NetAppの連携におけるウイルス検知の動作検証

FTP 共有を有効にする あらかじめ作成済みの共有フォルダーを FTP 共有可能にする設定を説明します 共有フォルダーの作成方法は 画面で見るマニュアル をご覧ください ファイル数の多い共有フォルダーを変更すると 変更が完了するまでに時間がかかる場合があります また 変更が完了するまで共有フォルダー

PRIMERGY RX2540 M1 未サポートOS動作検証確認情報

Corp ENT 3C PPT Template Title

Transcription:

JPARC 実験データの共通計算機システムへの転送 八代茂夫 高エネルギー加速器研究機構共通基盤研究施設計算科学センター 概要 KEKCC のストレージシステム HPSS にアクセスするために用意されている各種のインターフェイスとそれぞれの特徴を述べる 次に HPSS への KEK 内からのアクセスおよび約 70km 離れた JPARC 実験施設からのアクセスの性能の測定結果を報告し HPSS を利用するにあたってのインターフェイス選択の目安を示す 1 はじめに 高エネルギー加速器研究機構 (KEK) で行われる実験のデータを解析することを目的とするシステムである共通計算機システム (KEKCC)[1] は 2009 年 3 月に更新された 今回導入されたシステムでは従来からのプロジェクトの利用に加えて 新しいプロジェクトである JPARC 実験により生成されるデータの保管および解析を主目的の 1 つとしている KEKCC はつくば地区に設置されており JPARC の実験施設は直線距離で約 70km 離れた東海地区にあるので この間でデータ転送をおこなう KEKCC のストレージへのデータ転送にあたっては高速かつ安定的に転送することが課題である データ転送に利用する可能性のあるアクセスインターフェイスを検討し その転送性能の測定を行なったでの報告する 共通計算機システム 計算サーバ 84 IBM System x3550 Intel Xeon-QX 5460 x2 メモリ 16GB/ ノード API/VFS HPSSデータサーバ IBM TS3500(3PB) IBM 3592 テープ装置 IBM DS4800(10TB) API/FTP CIFS/NFSv4 GPFS GPFS/API/VFS LSF Storages LSF GPFS API/VFS GPFS ワークサーバ磁気ディスクシステム 4 x3550 並列サーバ IBM DS4800(205TB) Xeon-QX 5460 x2 LTO4テープ装置 4 x3550 メモリ 16GB/ ノード Xeon-QX 5460 x2 メモリ 32GB/ ノード CIFS/NFSv4 SSH SSH FW GRID システム LCG システム Naregiシステム irodsシステム 東海地区 J-PARC FW KEK 内 KEK-FW SINET3 KEK 内クライアント 図 1. 共通計算機システムの概略図

2 大容量ストレージシステム HPSS 2.1 共通計算機システムの概要計算サーバ ワークサーバ 並列サーバ GRID システム 磁気ディスクシステム および実験データを蓄積する大容量ストレージシステム (HPSS データサーバ ) からなる 大容量ストレージシステムは 磁気テープライブラリ キャッシュディスク サーバ群により構成され ソフトウエア High Performance Storage System (HPSS)[2] で管理される 図 1はシステムの構成図である 2.2 HPSS アクセスのインターフェイス HPSS により管理される大容量ストレージシステムは最大容量 10PB の磁気テープライブラリ装置 10TB のキャッシュディスク装置 サーバ群により構成されている 図 2 はシステムの概略図である HPSS でのデータの書き込みは 先ずキャシュディスクに対して行われ 一定時間経過後に磁気テープに転送される 読み出し時はキャシュディスクにデータがある場合には そのデータがクライアントに送られる 磁気テープにある場合には キャシュディスクに転送された後に送られる KEKCC ではキャシュディスクへの転送が始まると同時にクライアントに送られる設定にしている データ転送は HPSS の core サーバ mover サーバや VFS サーバあるいはワークサーバや IRODS サーバを通じて行なわれる KEKCC でサポートしている HPSS アクセスのインターフェイスを表 1に示す POSIX 準拠 I/O 関数 (API) Parallel FTP(pftp) Kerberos ftp(kftp) およびファイルシステムインターフェイスの VFS が HPSS により用意されている KEKCC では更に VFS を経由して SSH, i Rule Oriented Data Systems(iRODS)[3], gridftp, および CIFS でアクセスできる環境を構築した SSH によるファイル転送には scp, sftp, SSHfs[4], WinSCP などが利用できる また API によるアプリケーションである hpsscat や hpssput などのファイル転送ができる機能も用意されている API pftp や hssput/hpsscat の利用には HPSS パッケージの導入が必要である kftp は Linux のディストリビューションに含まれる Kerberos の設定を行なえば利用できる irods の利用にはクライアントパッケージ Tape library: TS3500 3000vols, max. 3PetaBytes Cache disk 10TB Tape drives: 10 3592E06 1TB/vol, 160MB/s irods server (VFS server) 5 movers Core server 2 VFS servers 2 SMB/NFS servers Work servers (VFS server) API, pftp kftp CIFS SCP iput/iget 図 2. 大容量ストレージシステム HPSS

の導入が必要である 利用者はクライアントのおかれて いる環境に合わせて最適な方法を選 表 1. HPSS アクセスのインターフェイス 択して利用できる ファイアウオールを通過するか NAT を経由するか 高速な転送を求めるか ネットワークの遅延の程度 ユーザインターフェイスの好みなどを考慮して選択する 表 1に示した FW との相性 難あり は 通過させる必要のあるポートが相当数になるインターフェイスである 通過させるには FW の運用方針の確認が必要である API および pftp は core server にな インターフェイス POSIX 準拠 I/O 関数 hssput/hpsscat Parallel FTP(pftp) Kerberos ftp(kftp) VFS SSH irods gridftp CIFS 特徴 C の関数ファイル転送ファイル転送ファイル転送ファイルシステム FW 相性難あり難あり難あり良良難あり良 NAT 経由不可不可不可可可可可 された要求に対して mover からデータが転送されるので 一般的に高速な転送が可能である しかし第 3 者 転送を行なうので NAT 経由では処理できない 2.3 インターフェイスの使用例それぞれのインターフェイスについて 使用例を簡単に示す Hpsscat/hpssput によるファイル転送 $ hpssput /hpss/ce_g/cc/yashiro/test/outfile local_file $ hpsscat /hpss/ce_g/cc/yashiro/test/remote_file > outfile Parallel FTP によるファイル転送 $ /opt/hpss/bin/pftp_client -v hco01.cc.kek.jp 4021 cd /hpss/ce_g/cc/yashiro/test/ ftp> put local_file ftp> get remote_file bye Kerberos ftp によるファイル転送 $ kftp ftp> put local_file ftp> get remote_file bye Scp によるファイル転送 $ scp local_file hpss.cc.kek.jp: /hpss/ce_g/cc/yashiro/test/outfile $ scp hpss.cc.kek.jp: /hpss/ce_g/cc/yashiro/test/remote_file outfile Sftp によるファイル転送 $ /usr/bin/sftp -v hpss.cc.kek.jp cd /hpss/ce_g/cc/yashiro/test/ ftp> put local_file

ftp> get remote_file bye SSHfs マウントとファイル転送 $ sshfs hpss.cc.kek.jp: /hpss/ce_g/cc/yashiro/test/ ~/mnt $ cp local_file ~/mnt/outfile $ cp ~/mnt/remote_file outfile irods によるファイル転送 $ iput -f local_file outfile $ iget -f remote_file 3 転送性能 3.1 測定条件つくば地区の KEK LAN から KEKCC の HPSS にアクセスする場合の転送性能と 東海地区の JLAN からアクセスする場合の転送性能を測定した RTT はそれぞれ約 0.9ms 10ms であった クライアント計算機の CPU は XEON X5450 を2CPU メモリーを 4GB 搭載した計算機で OS は CentOS5.3, kernel 2.6.18 である 利用者が実際に使用することを前提に測定するので 特別なチューニング等を行わないことにした HPSS は運用中に測定した HPSS のバージョンは 6.2.2, core サーバは IBM p550 (POWER6 3.5GHz 4Core 2CPU, 8GB) で OS は AIX5.3 mover サーバは IBM p5 520 (POWER5+ 1.65GHz 4Core 2CPU, 2GB) で OS は AIX5.3 VFS サーバは IBM x3650 (Intel Xeon-QX5460 3.16GHz 4Core, 8GB) で OS は RHEL4 IRODS サーバは IBM x3650 で OS は RHEL5 ワークサーバは IBM x3550 (Intel Xeon-QX5460 3.16GHz 4Core 2CPU, 16GB) で OS は RHEL5 である HPSS ではキャシュディスク容量やマイグレーションポリシーを適切に設定することにより キャシュディスク領域が不足せず 利用者のアクセス中に磁気テープへのアクセスの発生が最少になるよう調整できる この状況で利用することが推奨されている この場合には クライアントとキャシュディスクとの間のデータ転送になり その転送性能が重要になる これを今回の性能測定の対象とした 測定したインターフェイスは kftp pftp hpssput/hpsscat irods scp である 測定に使用したのは 907MB の圧縮の効かないファイルである 3.2 転送性能と LAN アダプタの関係表 2 に転送性能の測定結果を示す iput および iget は irods のファイル転送のコマンドである つくば地区の計算機は Intel 80003ES2LAN Gigabit Ethernet Controller およびプラネックスコニュニケーションズ ( 株 ) の GN-1200TW2 で測定した 表では前者を GbE1 後者を GbE2 と表わしている Planex は Intel より性能が劣った 送信の場合には高性能の pftp および hpssput の性能が 64MB/s あたりで抑えられている 受信の場合にはインターフェイスによっては 3 分 1 以下との非常に悪い 東海地区の計算機は Planex で測定した Intel に代えると性能が向上する可能性がある 可能性を検討するためにつくば地区の Intel を搭載した計算機で iproute パッケージの tc コマンドで 10ms の遅延を加えて測定した結果が表 2 の GbE1+ の値である この値を東海地区の Planex での値と比較すると 特に scp での HPSS からの読

み出しは大きな性能向上を期待できる 表 2. HPSS の転送性能 (MB/s) GbE1 は Intel 80003ES2LAN アダプタ GbE1+ は同アダプタで 10ms の遅延を付加 GbE2 は Planex GN-1200TW2 アダプタ 3.3 性能の比較検討 つくば地区からのアクセスでは HPSS によって提供される pftp hpssput kftp の性能が 64MB/s~97 MB/s と非常に良い インターフェイス kftp-put GbE1 64.0 つくば GbE2 63.0 GbE1+ 10.0 東海 GbE2 11.0 pftp-put 97.3 64.3 18.1 26.6 高速な転送を求めるなら これらのイン HPSS への書ターフェイルが好ましい hpssput 89.5 61.3 15.9 19.7 き込み一方 東海地区からのアクセスになる iput 23.5 23.0 24.0 23.2 と pftp hpssput kftp の高性能が期待できなくなる HPSS にファイルを送る scp kftp-get 32.4 83.0 28.4 26.0 25.2 18.0 31.3 20.0 場合には scp irods pftp の性能が良 pftp-get 86.5 38.7 14.6 17.0 HPSS からのい NAT 下のクライアントの場合には hpsscat 85.2 24.5 14.1 16.6 読み出し pftp は使えないので scp あるいは irods になる HPSS からファイルを受け取る場合には irods あるいは kftp の性能が良い iget scp 16.1 31.3 18.3 22.7 21.1 13.0 17.6 3.8 なお irods については飯田好美氏の報告 [5] が予定されている 4 最後に 今回は利用者が余分な負担なく使いながら ある程度の性能を得ることのできるインターフェイスを探ることを目的とした そのためにパラメータのチューニングも行なわず 標準値を用いた 例えば SSH はデータの暗号化を選択できて データの性質と暗号方式の組み合わせにより性能が大きく変わる 暗号方式を適切に選択すればより良い性能が得られる可能性がある irods では通信の並列度を変更できるが 標準的な設定に任せた Pftp の get では setpb 4MB オプションで性能が向上する可能性がある 東海地区からのファイル送信に更なる転送速度を求めるならチューニングを検討する余地がある 計算機の性能 LAN アダプタによっても結果が大きく変わる 今後東海地区の計算機の LAN アダプタを変更して再測定をする予定である また 計算機の性能による影響度を それぞれのインターフェイスについて調査したい HPSS をファイルシステムで扱うには VFS CIFS NFS がある それぞれ一長一短がある しかし SSHfs を利用すればサーバ側の設定なしに利用できる 通信には sftp を使っているので インターネット越しの利用もセキュアにできる ファイルシステムでのアクセスを希望する場合には検討の価値がある 5 謝辞 HPSS 環境の構築に関して計算科学センターの佐々木節氏 飯田好美氏 および日本 IBM の伊藤義彦氏 玉井千恵子氏 山本智実氏をはじめとする方々に感謝します J-PARC との接続について計算科学センターの真鍋篤氏 鈴木聡氏 鈴木次郎氏の多大なる協力に感謝します SSHfs および tc についてヒントを下さった日本原子力研究開発機構 J-PARC センターの石川弘之氏に感謝します

参考文献 [1] KEKCC, http://kekcc.kek.jp/ [2] HPSS, http://www.hpss-collaboration.org/ [3] irods, https://www.irods.org/ [4] SSHfs, http://fuse.sourceforge.net/sshfs.html [5] 飯田好美 irods を用いたデータ管理システムの導入 第 5 分科会 5-007