Slide 1 - PDF Free Download

マイクロプロセッサと並列処理期待と現実の狭間で考えることスケーラブルシステムズ株式会社

説明概要はじめに並列処理技術の動向 Peta-ScaleコンピューティングとCommodity コンピューティング Commodityコンピューティングでの課題マイクロプロセッサと並列処理並列処理での重要なポイントマイクロプロセッサの進化スケーラブルCommodityコンピューティングクラスタOpenMP ハイブリッド並列処理 SMP 仮想化まとめとして一部配布資料にIDF2009の資料を追加致しましたスケーラブルシステムズ株式会社

ユビキタス並列処理プログラミング現在の状況全てのプロセッサはマルチコアプロセッサコンピュータは様々な並列処理により性能向上を図っているコンパイラやコンピュータ自身が並列処理の適用を行う場合もあるが本質的な並列プログラミングはユーザが行う必要がある課題並列プログラミングの専門家が並列化プログラミングを行いより高速実行を目指すことは容易より広範囲なユーザが並列処理を行いその効果を実現出来ることが課題

なぜ並列処理は容易でないのか? 1. 並列化について学ぶ 2. 並列化手法の正しい選択 3. スレッドについて考えるのではなくタスクでのプログラムを考える 4. 並列実行をオフに出来るようにプログラムをデザインする 5. ロック( 同期 ) 処理などは可能な限り行わない 6. 良い並列支援ツールを使う 7. メモリアロケーションに注意する 8. ワークロードに合わせてスケーリング出来るデザインとする http://www.ddj.com/hpc-high-performancecomputing/201804248 マルチコアでのプログラミングでのルール:これら8つのルール全てを理解してプログラミングに取り組む必要があるスケーラブルシステムズ株式会社

なぜ並列処理は容易でないのか? 不規則なオペレーション複雑なデータ構造アルゴリズム上の問題マルチコア上での並列処理の難しさ継続的なプロセッサコア数の増加ベクトル処理の強化メモリシステムの強化キャッシュシステムの改善

システムとユーザの尺度システムの尺度ユーザの尺度 Flop/s 計算終了までの時間メモリサイズ(GB) モデルのサイズと計算結果プロセッサ数ワークロードでの同時実行ジョブ数データ長計算精度システム構成 (クラスタ) 導入コストと運用コストスケーラビリティ評価対象での尺度ユーザの尺度での性能 (Performance)は時間当たりにどれだけの仕事を処理出来るか( 仕事量 / 時間 ) Flopsでの評価は実際には意味がないまた問題の規模 (small, medium, large) という評価も難しいスケーラビリティは対象を明確に規定する必要がある

Peta-Scaleコンピューティングと Commodityコンピューティング並列処理技術の動向

コンピューティングのギャップ Peta-Scale コンピューティング独自のアプリケーション開発複雑なシステム構成新しいAPIの提案ギャップの広がり Pleiades Supercomputer Photo Credit: NASA Ames Research Center コンパクトでより多くのプロセッサコアを搭載したサーバ製品スケーラブル Commodity コンピューティング商用 HW/SW オープンソース商用アプリケーションマルチスレッドマルチコアマルチプロセッサクラスタシステムの利用の拡大と広範囲なユーザ環境 2Uサイズ 32コア搭載サーバ 1Uサイズ CPU+GPU Hybridサーバ

MPI OpenMP threads C++ Fortran Chapel UPC Co-array hybrid C HPF X10 Fortress Java Titanium posix threads スケーラブルシステムズ株式会社 First Petascale Book 検索 700 600 500 400 300 200 100 0 Petascale Computing: Algorithms and Applications (Chapman & Hall/Crc Computational Science Series) Scalable OpenMP Programming Dieter an Mey RWTH Aachen Universityより抜粋

マルチスレッドアプリケーション Intel Software Product Conference:Parallel Programming AdoptionMarket Situation and Outlook presentations from Multicore Days 2008, 11-12 September / James Reinders, Intel

プログラミングのギャップ Peta-Scale コンピューティング独自のアプリケーション開発複雑なシステム構成新しいAPIの提案 MPIなどが主流 Commodity コンピューティング商用 HW/SW オープンソース商用アプリケーションマルチスレッド OpenMPやライブラリなどの活用

プログラミングのギャップ数ヶ月 - 数年プロダクションシュミレーションスケーラブルな性能のアプリケーションの開発プロトタイプ開発並列プログラミング C/C++,MPI OpenMP テストと性能向上のための作業プロトタイプ開発デスクトップテストと性能向上のための作業

マイクロプロセッサの進化と並列処理への貢献マイクロプロセッサと並列処理

Performance スケーラブルシステムズ株式会社アプリケーションの性能向上ギャップの広がり GHz Era Multi-core Era 並列処理は誰でも利用可能 ( 利用のメリット) より少ないコスト( 低価格なシステム)でより効率の良い処理が可能 ( 対費用効果 ) より短時間でシュミレーションを完了 ( 開発サイクルの短縮によるコスト削減 ) Time

アプリケーション実行階層仮想マシン OS OS OS オペレーティングシステム App App App アプリケーション Threads Threads Threads スレッド Code Fragment Code Fragment Code Fragment

プログラミング階層クラスタプログラミング(MPI) マルチノードクラスタマルチスレッド(OpenMP) プロセッサ最適化キャッシュ複数命令実行 SIMD 命令 (ベクトル化 ) シングルノード(SMP) シングルプロセッサシングルコア do izone = 1, nzone. do j = 1, jmax. do i = 1, imax. ノード内ノード間並列化ノード内でのマルチスレッド並列化プロセッサリソースの並列利用スケーラブルシステムズ株式会社

プログラミング階層 do izone = 1, nzone ノード内ノード間並列化. MPIやCluster OpenMPなどの利用 do j = 1, jmax ノード内でのマルチスレッド並列化. OpenMPやスレッドプログラミング do i = 1, imax プロセッサリソースの並列利用. ベクトル化.. スーパースカラ実行パイプライン処理 end do キャッシュ最適化など最適化と並列化の適用作業プログラマーコンパイラ

時間時間時間時間スケーラブルシステムズ株式会社並列性 (Parallelism)の利用パイプライン処理データレベル並列処理 (DLP) スレッドレベル並列処理 (TLP) 命令レベル並列処理 (ILP)

ループのベクトル化処理プログラム例 : for (I=0;I<=MAX;I++) C[I]=A[I]+B[I]; 利用方法 : (Linux) (Windows) -[a]xn, -[a]xb, -[a]xp, -[a]xt -Q[a]xN, -Q[a]xB, -Q[a]xP, -Q[a]xT A[3] A[2] + + B[3] B[2] A[1] A[0] + + B[1] 128-bit Registers B[0] C[3] C[2] C[1] C[0]

インテルプロセッサでのSIMD 処理 Source SSE/2/3 Dest Intel Core Microarchitecture NetBurst CLOCK CYCLE 1 CLOCK CYCLE 2 X4 X3 X2 X1 Y4 Y3 Y2 Y1 X4opY 4 X4opY 4 SSE Operation CLOCK CYCLE 1 X3opY 3 X3opY 3 X2opY 2 X2opY 2 X1opY 1 X1opY 1 各 MMX/SSE 演算は 128ビットの演算をシングルサイクルで実行可能となる MMX/SSE 演算器は2セットあり同時実行が可能となる従って単精度では 8 浮動小数点演算倍精度では 4 浮動小数点演算を1クロックで実行することが出来るスケーラブルシステムズ株式会社

並列処理での重要なポイント並列化最適な並列化アルゴリズムの選択プロセッサ数や問題の規模に対応可能な並列化実装コア数やプロセッサ数に依存しないことメモリの局所性メモリ階層を効率的に利用頻繁にアクセスするデータをよりコアの近傍に配置

Performance / core Intel マイクロアーキテクチャ新マイクロアーキテクチャ新製造プロセス次世代マイクロアーキテクチャ(Nehalem) メモリバンド幅とレイテンシの改善マイクロアーキテクチャの改善 Intelマイクロアーキテクチャ (Westmere) 32nm 製造プロセス 6コア SSE 4.2 新マイクロアーキテクチャ(Sandy Bridge) Intel AVX ベクトル演算 ( 浮動小数点演算性能 x2) Core Core Memory Controller 3 DDR3 channels Core Core 12M Shared Cache Core Link Controller Core 2 Intel QuickPath interconnect links 2008 2009 2010 >2010 Intel AVX (Advanced Vector Extensions) スケーラブルシステムズ株式会社

SpeedUp スケーラブルシステムズ株式会社並列処理スケーラビリティ 8 7 Linpack Stream スケーラビリティの向上 6 5 4 3 ロードバランスの改善メモリ階層の効率的な活用 (メモリアクセスの低減 ) 高速なメモリシステムの採用 (Xeon 5500) テスト事例 2 1 0 1 2 3 4 5 6 7 8 N プロセッサコア

MFLOPS/s Speedup スケーラブルシステムズ株式会社並列処理スケーラビリティ 30000 10 27000 Xeon 5400(MFLOPS/s) Xeon 5400(Speedup) Xeon 5500(MFLOPS/s) Xeon 5500(Speedup) 9 24000 8 システムアーキテクチャの進化 21000 18000 7 6 シングル( 逐次処理 ) 性能の向上スケーラビリティの向上 15000 5 12000 4 9000 3 6000 2 3000 0 1 4 8 16 N プロセッサコア 1 0 効率的な並列処理にはプラットフォームが重要 Himeno Benchmark http://w3cic.riken.go.jp/hpc/himenobmt/index.html

ピーク性能 (GFLOPS/sec) バンド幅 (MB/sec) プロセッサ性能向上比率 120 Quad-Core Intel Xeon 5570 メモリコントローラ内蔵 QPIインターコネクト 80 100 ピーク性能バンド幅 1.35 倍 3.6 倍 70 60 80 60 1.5 倍 50 40 40 3.3 倍 30 20 20 3.3 倍 10 0 2005 年 2006 年 2007 年 2008 年 2009 年 0 64-bit Intel Xeon 3.6GHz 2M Dual-Core Intel Xeon 5160 デュアルコア Quad-Core Intel Xeon 5355 クァッドコア 4 浮動小数点演算 /クロックデュアルFSBバス Quad-Core Intel Xeon460 45nm 製造プロセス動作クロックスケーラブルシステムズ株式会社

ピーク性能 (GFLOPS/sec) バンド幅 (MB/sec) プロセッサ性能向上比率 120 Quad-Core Intel Xeon 5570 メモリコントローラ内蔵 QPIインターコネクト 80 ピーク性能 100 ベクトル 80 処理 60 40 3.3 倍バンド幅 1.5 倍 1.35 倍 3.6 倍 70 60 50 NUMA 40 Non-Uniform 30 Memory Architecture 20 20 3.3 倍 10 0 2005 年 2006 年 2007 年 2008 年 2009 年 0 64-bit Intel Xeon 3.6GHz 2M Dual-Core Intel Xeon 5160 デュアルコア Quad-Core Intel Xeon 5355 クァッドコア 4 浮動小数点演算 /クロックデュアルFSBバス Quad-Core Intel Xeon460 45nm 製造プロセス動作クロックスケーラブルシステムズ株式会社

メモリ性能とスケーラビリティ Core 2 Extreme QX6700 Nehalem Core 0 Core 2 Core 0 Core 2 Core 0 Core 2 Core 0 Core 2 4MB shared L2 Cache Bus I/F 4MB shared L2 Cache Bus I/F Memory Controller 4MB shared L2 Cache Link Controller MCH FSB 3x DDR3 channels 2x Intel QuickPath interconnect

スケーラビリティ(シングルスレッドに対する相対性能比 ) スケーラブルシステムズ株式会社 NPB OpenMP スケーラビリティ 4.0 Core2Quad Core i7 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 BT CG EP FT IS LU MG SP

相対性能 (Core 2 Extreme QX6700 =1) スケーラブルシステムズ株式会社 NPB OpenMP 相対性能 8.0 7.0 QX6700/1 QX6700/4 Core i7/1 Core i7/4 シングルコアでの性能差 << マルチスレッドでの性能差 6.0 5.0 4.0 3.0 2.0 1.0 0.0 BT CG EP FT IS LU MG SP

MB/sec スケーラブルシステムズ株式会社メモリ階層ベンチマーク 70000 60000 50000 Double read/modify/write Cache Test Opteron 2.8GHz Core2Quad 2.6GHz Core i7 2.6GHz 40000 30000 20000 10000 0 100 400 1600 6400 25600 102400 409600 1638400 6553600 26214400 104857600 C Size (bytes)

性能向上比率 (Baseline = 1) スケーラブルシステムズ株式会社ベクトル化マルチスレッド 30 25 20 15 Intel Xeon W5580 (2 sockets x 4 cores)3.2ghz 27.5 Baseline - Compile with Intel compiler Vectorized with Intel compiler Vectorized with Intel compiler - threading 17.6 Vectorized / ベクトル化コンパイラ指示行の追加コードのアンローリングループの分割 Threading/ 自動並列化 OpenMP 指示行の追加 10 5 0 2.40 1.82 1.80 1.00 1.00 1.00 Black-Sholes Monte Carlo Covertible Bonds コンパイラの自動ベクトル化と自動並列化にユーザの最適化作業でより高い性能を実現 Money Tree Optimizing FSI Benchmarkswith Intel Software Tools for Multicore & Manycore Intel Developer Forum

スケーラブルCommodityコンピューティング並列処理の課題と挑戦

Many core CPU 2012(?)に想定される計算ノード 1) Node : 960 GFLOPS/CPU Many core CPU, 48 cores, 2.5GHz, 共有キャッシュシンプルな実行コア(in-orderでSMT 機能付き) メモリバンド幅を最大限に活用するアーキテクチャ SIMDベクトルユニット... 8 FLOP / cycle / core 複数の計算ノードがNUMA 構成で接続複数の計算サーバブレードでクラスタ構成効率の良い並列化が求められる 1) 仮定として想定したプロセッサに基づく推察

並列プログラミングで留意点十分な計算量 (Amdahl s Law) 計算粒度データの局所性ロードバランス分散と同期処理並列処理階層での最適化逐次処理 (シングルスレッド)アプリケーションと比較しても検討課題が多いことが並列処理をより困難にしています

Speedup スケーラブルシステムズ株式会社並列プログラミングで留意点十分な計算量計算粒度データの局所性ロードバランス分散と同期処理並列処理階層での最適化ロードバランスデータ配置による低下同期処理データ競合などによるオーバーヘッド Nプロセッサコア

S スケーラブルシステムズ株式会社アムダールの法則並列処理での性能向上の上限値 (スケーリング) T parallel = (S+ P/n) T serial + O T serial S P P/n n = number of processors Speedup = T serial / T parallel = 1 / (S + P/n) プログラムの逐次処理部分 ( 非並列処理 ) 部分の排除が必要例えば n=, P = 0.5 の場合 Speedup = 1.0 / (0.5 + 0) = 2.0

グスタフソンの法則 T serial = (S + n x P) T parallel アムダールの法則作業負荷や問題の規模が一定であることを仮定グスタフソンの法則 ( Gustafson-Barsis law) 並列処理では問題の規模や作業負荷がプロセッサコア数に比例して大きくなりその負荷増加は逐次処理部分に影響しないことを仮定 Speedup = T serial / T parallel = (S + n x P) 例えば n=16, P = 0.5 の場合 Speedup = 0.5 + 16 x 0.5 = 8.5 アムダールの法則の限界から並列処理を救い出すことが可能? 適用出来る問題と利用環境に大きな制限がある T parallel = {S + P/n} T serial + O Speedup = T serial / T parallel = 1 / (S + P/n)

Speedup Speedup スケーラブルシステムズ株式会社スケーラビリティ 64 56 Gustafson's Law(5%) 48 40 32 Gustafson's Law(50%) 16 14 12 24 10 8 16 Amdahl's Law(5%) 6 4 8 0 Amdahl's Law(50%) 0 8 16 24 32 40 48 56 64 2 0 0 2 4 6 8 10 12 14 16 Nプロセッサ N プロセッサコア

NASAによる流体解析コード Virtual Flight on High-Performance Architectures M. J. Aftosmis, S. M. Murman, M. Nemec, NASA Ames SC2004,Pittsburgh, PA, Nov. 6-12, 2004 Graphics courtesy of NASA Ames 並列性能 496プロセッサで405 倍の性能向上が可能 540 GFLOP/s CPUあたりの性能 :1.33 GFLOP/s 短時間でのシュミレーションを可能とし問題への緊急的な対応を可能となりますスケーラブルシステムズ株式会社

計算粒度スケーラブルシステムズ株式会社並列化よりハイレベルでの並列化全体処理の把握とその並列化の検討大困難複雑より上位 ( 領域範囲対象 )での並列化小容易処理の末端での並列化個々の処理の並列化の検討コンパイラによる並列化 (ベクトル化や自動並列化 ) は一般にはこのレベルでの並列化

Vertical Scaling スケーラブルシステムズ株式会社シングルAPIでの並列処理 MPI OpenMP OpenMP MPI ノード内ノード間??? Horizontal Scaling MPI OpenMP????

OpenMPの価値シュミレーションでのソフトウエア開発大規模なシュミレーションを行うアプリケーションは C++ C Fortranで記述されているソフトウエア開発と利用は数十年単位で継続して行われるクラスタやスーパーコンピュータ MPIを利用した大規模並列処理が一般的 MPI 利用の限界と課題全てのアプリケーションに適用出来る訳ではないスケーラビリティは様々な制限を受ける many cores への対応がMPIタイプのAPIでは非常に難しい OpenMPはこのようなMPIに対する他の選択肢の提供と同時にMPIを補完する役割を担う(MPI + OpenMP)

インテルクラスタOpenMP 共用データ分散仮想共有メモリ DVSM マルチスレッド化されたプログラム...

一般的 OpenMPの課題 OpenMP 版のコンパイル時の問題 OpenMP 構文に基づく並列化によってマイクりプロセッサ向け最適化が阻害される実行時ライブラリでのオーバヘッド頻繁なライブラリ呼び出しの悪影響アルゴリズムの変更のオーバヘッドプログラム並列化のためのコードの冗長化やコードの追加同期処理 Fork-Join モデルによる過大な同期処理負荷分散メモリ階層の有効活用キャッシュローカルメモリリモートメモリの参照頻度

OpenMPの課題ハードウエアの動向今後は複数ソケットの製品はすべてNUMAアーキテクチャ OpenMP 3.0リリース NUMA 対応の拡張無しアフィニティ問題データの配置及び利用とスレッド実行の管理 OpenMP 3.0: The World is still flat, no support for cc-numa (yet)! http://terboven.wordpress.com/category/openmp/

ハイブリッド: 現代のトレンド? ハイブリッドカー内燃機関動力 (ガソリンエンジンやディーゼルエンジン)と蓄電池ハイブリッドコンピューティング GPU+CPUによるハイパフォーマンスコンピューティングハイブリッド並列プログラミングスレッドプログラング+MPI

MPI/OpenMPハイブリッドモデル MPIでは領域分割などの疎粒度での並列処理を行う OpenMPは各 MPIタスク内でループの並列化などのより細粒度での並列化を担う計算はタスク-スレッドの階層構造を持つ MPIタスク高性能インターコネクト Memory Memory Memory Memory P P P P P P P P P P P P P P P P OpenMPスレッドスケーラブルシステムズ株式会社

MPI/OpenMPハイブリッドコード MPIで並列化されたアプリケーションにOpenMPでの並列化を追加 MPI 通信とOpenMPでのワークシェアを利用して効率良い並列処理の実現 include mpif.h program hybsimp Fortran #include <mpi.h> int main(int argc, char **argv){ int rank, size, ierr, i; C/C++ call MPI_Init(ierr) call MPI_Comm_rank (...,irank,ierr) call MPI_Comm_size (...,isize,ierr)! Setup shared mem, comp. & Comm!$OMP parallel do do i=1,n <work> enddo! compute & communicate call MPI_Finalize(ierr) end ierr= MPI_Init(&argc,&argv[]); ierr= MPI_Comm_rank (...,&rank); ierr= MPI_Comm_size (...,&size); //Setup shared mem, compute & Comm #pragma omp parallel for for(i=0; i<n; i++){ <work> } // compute & communicate ierr= MPI_Finalize();

OpenMP/MPIハイブリッドモデル MPIは実績のある高性能な通信ライブラリ計算と通信を非同期に実行することも可能通信はマスタースレッドシングルスレッド全スレッドで実行することが可能 MPIタスク高性能インターコネクト Memory Memory Memory Memory P P P P P P P P P P P P P P P P OpenMPスレッドスケーラブルシステムズ株式会社

OpenMP/MPIハイブリッドコード OpenMPのプログラムにMPI 通信を追加既存のOpenMPプログラムの拡張やスレッドプログラムの新規開発時のオプションとして選択 MPIは非常に高速また最適化されたデータ通信ライブラリ include mpif.h program hybmas Fortran #include <mpi.h> int main(int argc, char **argv){ int rank, size, ierr, i; C/C++!$OMP parallel!$omp barrier!$omp master call MPI_<Whatever>(,ierr)!$OMP end master!$omp barrier!$omp end parallel end #pragma omp parallel { #pragma omp barrier #pragma omp master { ierr=mpi_<whatever>( ) } #pragma omp barrier }

ハイエンド仮想化複数の仮想マシンサーバ( 仮想化なし) 仮想化ソフトウエアアプリケーションオペレーティングシステム一台の仮想マシンアプリケーションアプリケーションアプリケーションアプリケーションアプリケーションオペレーティングシステム仮想化ソフトウエア

ScaleMP vsmpアーキテクチャアプリケーションについては他のx86システムと 100%のバイナリ互換を実現 OSは通常のLinuxディストリビューションが利用可能 Hardwareは一般のx86チップセットと標準インターコネクトでシステムの構築が可能 vsmp Foundation でのシステムのSMP 拡張を実現スケーラブルシステムズ株式会社

OpenMPスレッド数 SpeedUP OpenMP/MPI/ハイブリッド Hybrid OpenMP MPI Benchmarkproject ("homb") This is the Hybrid OpenMP MPI Benchmarkproject ("homb") This project was registered on SourceForge.net on May 16, 2009, and is described by the project team as follows: HOMB is a simple benchmark based on a parallel iterative Laplace solver aimed at comparing the performance of MPI, OpenMP, and hybrid codes on SMP and multi-core based machines. 32 28 24 20 16 12 8 4 0 1 2 4 8 MPIタスク数 Xeon 5550 (2.66GHz) vsmp Foundation 16 32 1 16 32 8 4 2 スケーラブルシステムズ株式会社

MFLOPS/S スケーラブルシステムズ株式会社 OpenMPベンチマーク NAS Parallel Benchmark (Multi-Zone) z y x 45000 40000 35000 30000 25000 SP-MZ 20000 x-zones 15000 10000 5000 0 2 4 8 16 32 OpenMPスレッド数 /N プロセッサコア著名な公開ベンチマークツールである NAS Parallel Benchmark (NPB) の一つであるNPB-MZ (NPB Multi-Zone)はより粒度の大きな並列化の提供を行っています NPB-MZではハイブリッド型の並列処理やネストしたOpenMPのテストが可能ですここでの結果は OpenMPだけでの並列処理の性能を評価しています Xeon 5550 (2.66GHz) vsmp Foundation

Nehalem-EX トポロジ 4プロセッサトポロジ 32プロセッサコア 8プロセッサトポロジ 64プロセッサコアスケーラブルシステムズ株式会社

ユビキタス並列処理プログラミングまとめとして

並列処理はITの根幹 pnfs 10GbE InfiniBand クラスタリングストレージクラスタ SSE マルチコアコンパイラベクトル化最適化ライブラリマルチスレッド OpenMP 開発環境ハイブリッドクラスタ GPU マルチプロセッサ MPI 開発環境アプリケーション

まとめとして( 並列処理 ) 並列処理技術の課題 Peta-ScaleコンピューティングとCommodity コンピューティングでのギャップの克服マイクロプロセッサと並列処理マイクロプロセッサでの並列実行ユニットの増加ベクトル演算 (x8) プロセッサコア(+6 以上 ) プロセッサ内部での並列処理の重要性スケーラブルCommodityコンピューティング今後の技術的な課題と幾つかの提案試行クラスタOpenMP ハイブリッド並列処理 SMP 仮想化

まとめとして(マルチスレッド) 継続的なプロセッサコア数の増加ベクトル処理の強化メモリシステムの強化キャッシュシステムの改善マルチコア上での並列処理低価格 ( 低い導入コスト)でのスケーラブルなプラットフォームマルチスレッドプログラムの可能性

この資料についてここに掲載した資料は弊社の調査と見解に基くものであり資料の中で示されている製品やサービスを提供している各社の公式な見解でもまたマーケティング戦略に基くものではありませんあくまで弊社としての意見だということにご注意ください本資料は情報提供のみを目的として作成されたものであり商品の勧誘を目的としたものではありませんまた本資料は弊社が信頼できると判断した各種データに基づき作成されておりますがその正確性確実性を保証するものではありません本資料に記載された内容は予告なしに変更されることもありますこれらの資料の無断での引用転載を禁じます社名製品名などは一般に各社の商標または登録商標ですなお本文中では特に TMマークは明記しておりません In general, the name of the company and the product name, etc. are the trademarks or, registered trademarks of each company. Copyright Scalable Systems Co., Ltd., 2009. Unauthorized use is strictly forbidden. 2009 年 9 月