工学院大学建築系学科近藤研究室2000年度卒業論文梗概
|
|
|
- えつと そや
- 6 years ago
- Views:
Transcription
1 耐災害性の高い通信システムにおけるサーバ計算機の性能と消費電力に関する考察 耐障害性, 消費電力, 低消費電力サーバ 山口実靖 *. はじめに 性能と表皮電力の関係について調査し, 考察を行う 災害においては, 減災活動が極めて重要である すなわち 災害が発生した後に適切に災害に対処することにより, その被害を大きく軽減できる. 適切な災害対策を行うには災害対策を行う拠点が正常に運営されていることが必要不可欠であり, 災害対策拠点が被災により正常に機能しなくなることは避けなくてはならない. 災害対策拠点の可用性 ( 正常に運営されていること ) を向上させるには, 災害対策拠点を分散化し一部の災害対策が被災しても災害対策拠点群全体として機能を失わない様に設計することが効果的である. 本研究では, 被災しても機能し続ける高い耐障害性を有する通信システムを実現し, これにより災害.GPU GPU は 3D グラフィックスなどの描画処理を高速に行うためのプロセッサであり, グラフィックボードに搭載された形で PC に組み込まれたり, スーパーコンピュータや家庭用ゲーム機等にも搭載されたりしている.GPU のピーク性能は CPU の性能を大きく上回り, GPU を描画以外の目的に使用する GPGPU などの研究の盛んに行われている. しかしその消費電力も高く,[w] を超える消費電力の GPU も多い. 以下, 本稿で使用した CUDA GPU に焦点を絞って解説を行う.CUDA GPU は NVIDIA 社が提供している GPU で, 現在主流の GPU の 個である. 対策拠点の分散化を支援することを最終的な目標としている. 本稿では, 高い耐障害性を有する通信システムを実現する構成要素の一つであるサーバコン VRAM ピュータシステムに着目し, 被災時の少ない電力源 でも高い性能で快適に稼働し続けるサーバコンピュータシステムの実現手法について考察を行う. 具体 的には GPU(Graphic Processing Unit) の性能と消費 電力の関係について考察を行う. 図 CUDA GPU の構造 近年の計算機では GUI(Graphical User Interface) が採用されており,GUI は GPU と呼ばれる専用のハードウェアで処理されている.GPU は計算機の構成要素の中でもっとも省電力が高いか, あるいはトップクラスの消費電力の多さであり, 計算機システムの省電力化を行う上で極めて重要な部品である. また, 消費電力が高いが得られる性能はそれを上回る程度で高く, 結果として GPU は単位性能あたりの消費電量が CPU よりも低い. よって, 災害対策のために複雑な処理を少ない消費電力で行うには GPU を計算に使用することが適切である. この様に計算機の省電力化, 低消費電力での高性能計算を目指すには GPU の消費電力に関する考察が極めて重要となる. 本稿では 各種使用方法における GPU の CUDA GPU は, 図 の様な構成をしている, すなわち,GPU 内に複数の が存在し, 各 内に Streaming Processor( 以下,) が存在 (GeForce 88GT では 8 個,GTX 46 では 3 個 ) している. これらの が処理装置の単位となる. メモリとしては主に VRAM と が存在し,VRAM は全ての からアクセスが可能であり, は 内に存在し各 内からのみアクセス可能である.VRAM は Shared Memory より容量が多い ( 数百 MB~ 数 GB 程度 ) が, と比較しアクセスに要する時間が長い. は からの高速アクセスが可能であるが, 容量が少なく (GeForce 88GT では6KB, GTX 46 では 48KB), キャッシュとして使用されるこ * : 工学院大学工学部情報通信工学科
2 とが多い. VRAM 図 VRAM へのメモリアクセス アクセス要求 Without bank conflict bank With bank conflict 図 4 のバンク衝突とバンク衝突 回避 VRAM 図 3 VRAM から へのメモリアクセス図 に VRAM から VRAM にメモリコピーを行なう時の動作例を示し, 図 3に VRAM から Shared Memory にコピーし, をキャッシュの様に扱う動作例を示す. また, アクセス性能の低下原因にバンク衝突があり, 性能向上手法としてバンク衝突の回避がある. 図 4に,Shared Memory におけるバンク衝突とバンク衝突回避の動作例を示す. 図 の様に,GPU と物理的に遠い箇所に搭載されている VRAM にデータが格納されている場合, メモリアクセスが非常に遅くなる. しかし, 図 3の様に, VRAM から読み込んだデータを にコピーし次回以降は からデータを読み込むことにより, 毎回 VRAM からデータを読み込む手法と比べ高速なデータアクセスが可能となる. の特性を生かして高速化を実現するには CPU などのキャッシュと同様に同一データへの 回以上のアクセスが必要であり, 回目以降のアクセスが高速化されることとなる. GPU の は図 4の様に,6 個のバンクにより構成されており, 各バンクは独立に動作可能である. よって, 最大 6 個のバンクを並列に使用して スレッドアクセス時 ( バンク使用時 ) の 6 倍の性能を得ることが可能となる. 逆に多数のスレッドが並列に へのアクセスを行ったとしても, 複数のスレッドが同一バンクに対してアクセス要求を発行したときはそれらの要求は該当バンクにより順次処理され, 同時並列的には処理されない. よって, アクセスバンクが衝突すると Shared Memory アクセス性能は低下してしまう. 各スレッドからは異なるバンクのデータへアクセス要求が発行される様にプログラムを作成することが好ましい. 3.GPU の消費電力 3. GPU の電力供給方法本章にて, 本稿で行った GPU 消費電力測定の測定環境について説明する. 本実験では,GPU をコンピューターに拡張ボードとして組み込み, 消費電力計測を行った. 消費電力測定を行う場合,GPU への電力供給方法を把握する必要がある. 通常コンピューターに電力供給を行う場合, ATX 電源を通した電力を用いる.ATX 電源からマザーボードに供給される電圧は,±V,±5V,3.3V である. この中で, 通常 GPU と直接接触し, データ転送及び電力供給を行うマザーボードに搭載されている PCI-Express スロットに供給される電圧は,±V, 3.3V である. 他に, 高性能 GPU を用いる場合, PCI-Express スロット以外に, 拡張ボード用 6pin 電源コネクタ (V) を用いて電力供給がされている. つ
3 まり,GPU ボードへの電力供給は図 5 の様に 種類 の方法で行われる. GPU の消費電力を測定するに は, これら つの供給電力を測定する必要がある. 外部電源 ATX 電源 GPU ボード PCI-Express スロット 6pin 電源コネクタ 電源コネクタ Mother Board 図 5 GPU ボードの電力供給 外部電源 ATX 電源 PCI-Express 6 コネクタと拡張カード接続側のコ ネクタを繋げたものである. このライザーカードを 用いることにより, マザーボードと GPU 間に電線が 存在することになる. この電線の中にマザーボード が GPU に電力供給を行う V 線と 3.3V 線があり, 供給電力を測定するには別々に計測を行う必要があ る. クランプメーターは, 回路に流れる電流の量を 測定する装置である. 従来の電気テスターの様に直 接回路に端子を接続させる必要はなく, 電線をクラ ンプメーターで挟み込むだけで安全に電流を計測す ることが可能である. クランプメーターは, 電線に 電流を流すときに発生する磁場を測定することによ り, その強さから電流を算出すると測定方法である. 次に, 拡張ボード用 6pin 電源コネクタを通じて GPU に電力供給される電力は,ATX 電源から電力を 供給するのではなく外部電源から電力を供給させワ ットチェッカーを用いて計測を行う. クランプメーター ライザーカード GPU ボード ワットチェッカー PCI-Express スロット 6pin 電源コネクタ 電源コネクタ Mother Board 図 6 GPU ボードへの供給電力の測定環境 ( 模式図 ) clamp meter riser card GPU 図 7 GPU ボードへの供給電力の測定環境 ( 写真 ) 3. GPU の電力供給方法 本研究では図 6, 図 7 の様な実験環境を構築し供 給電力を測定した. まず,PCI-Express スロット通じて GPU に供給さ れる電力は,GPU とマザーボード間にライザーカー ドを挟み, ライザーカードに流れる電流をクランプ メーターで測定することにより, 計測した. 本実験 で用いたライザーカードは, マザーボード接続側の 4.GPU における性能と消費電力の関係の調査 4. ホストメモリとデバイスメモリ GPU には VRAM と と異なる種類のメモリが搭載されている. また,VRAM アクセス手法には通常のアクセスとコアレスアクセスがあり, アクセス手法にはバンクコンフリクトが発生する手法としない手法がある. 本章では, 各種メモリへのアクセス時の性能と消費電力, 各種手法でのメモリアクセス時の性能と消費電力について述べる. 最初に, ホストメモリからデバイスメモリへのデータ転送処理およびデバイスメモリからホストメモリへのデータ転送処理の性能と消費電力を示す. 本測定では, ホストメモリまたはデバイスメモリから整数データ (4 バイト ) を読み込み, それをデバイスメモリまたはホストメモリに書きこむ処理を繰り返すことにより性能と消費電力量を測定した. 測定結果を図 8に示す. 本測定は, GeForce 88GT を用いて行った.
4 性能 / 電力 [GB/W Sec] 転送速度 [GB/Sec] 転送速度 [GB/sec] HostToDevice DeviceToHost 図 8 ホストメモリとデバイスメモリ 転送速度消費電力 これらの性能を単位消費電力あたりの性能に換算 したものを図 に示す. 同図からも, 性能と消費電 力の両側面から考えたときもコアレスアクセスと の使用が有効な手法であることが確 認された. 本実験では Warp により並列にメモリアクセスを 行った. 多数のスレッド, 多数の Warp にて並列ア クセスを行った場合は, メモリ待ち時間中に他の Warp の処理を行いメモリアクセス遅延時間を隠蔽 できる..5 7 同図より, ホストからデバイスへのデータ転送速 転送速度 消費電力 度の方がデバイスからホストへの転送速度より速い.5 6 (.3 倍 ) にもかかわらず消費電力はほぼ等しい (. 倍 ) ことが分かった VRAM と 本節では, メモリアクセス処理の性能と消費電力について述べる. 最初に,VRAM から VRAM へのデータ転送処理および から VRAM へのデータ転送処理の性能と消費電力を示す. 本測定では,VRAM または から整数データ (4 バイト ) を読み込み, それを VRAM に書き込む処理を繰り返すことにより性能と消費電量を測定した. 本節の測定も GeForce 88GT を用いて行った. メモリアクセスは Warp(3 スレッド ) により並列に行った. 測定結果を図 9に示す. 本測定では,VRAM から VRAM へのデータ転送処理の性能と消費電力を基準とし, 各種メモリアクセス方法, 各種読み込み元メモリを用いた場合と比較する. VRAM アクセス方法をコアレスアクセスにすることにより, 消費電力を減少させ (.95 倍 ) メモリアクセス性能のみを向上 (.36 倍 ) させることが可能であることが確認された. また, 読み込み元を VRAM から に変更することにより, 消費電力を変えず (. 倍 ) にメモリアクセス性能を向上 (.6 倍 ) させることが可能であることも確認された. 読み込み元を にし,VRAM へのメモリアクセスをコアレスアクセスで行なった場合, データ転送は大幅に向上 (5. 倍 ) し, 消費電力はほぼ等しい (. 倍 ) ことが分かった. ただし, 本測定では 使用時も書き込みは VRAM に対して行っているため, 本測定結果は のみを用いた場合の性能ではない. 4 VRAM -> VRAM VRAM -> VRAM Shared -> VRAM Shared -> VRAM 図 9 メモリコピーの転送速度と消費電力.6 7 性能 / 電力消費電力 VRAM -> VRAM VRAM -> VRAM Shared -> VRAM Shared -> VRAM 図 メモリコピーにおける単位消費電力あたりの転送速度 4.3 次に, から へのデータ転送処理にて得られた性能と消費電力の関係を図 に示す. 本節の測定も GeForce 88GT を用いて行った. アクセスは,Warp で並列に行った. 横軸の使用バンク数は並列に使用したバンクの数である. 使用バンク数が少ないときは 3 個のスレッドのアクセスが少数のバンクに集中しておりバンク衝突が多く発生している状況である. 使用バンク数が多いときは多くのバンクが並列に動作し, バンク衝突も少ない状況である. 同図の結果より, バンク衝突を回避させることにより消費電力を増加させず (. 倍 ) に性能を大きく向上 (.96 倍 ~.3 倍 ) させることが可能であることが確認された
5 転送速度 [GB/Sec] 9 8 転送速度消費電力 block = block = block = block = 4 block = 5 block = 7 block = 4 block = 7 block = 4 使用バンク数 図 間データ転送時の性能と消費 電力 4, 4, 6, 8,,,,,,4,,6,,8, 演算性能 [ 発生乱数 / 処理時間 ] 図 演算処理における性能と消費電力 4.4 プロセッサ演算 使用スレッド数と使用ブロック数を変化させて, プロセッサ演算時の性能と消費電力の関係を調査した. 行った処理は Monte Carlo シミュレーションである. 辺の長さが の正方形の中からランダムに座標を選択し, その点が扇形の内部に入る確率を求め円周率を求めた. 乱数は発生済みの状態で行い, 発生処理は Monte Carlo シミュレーションに含めていない. ブロック数は,,8,4,5,7,4,7,4 と変更させ, ブロックあたりのスレッド数は から 5 まで変化させた. 本節の測定も GeForce 88GT を用いて行った. ブロック数, スレッド数, 性能, 消費電力の関係を図 に示す. 同図より, 性能と消費電力には強い相関があり, 性能が増えると消費電力は増加する傾向が非常に強いことが確認された. 本実験で使用した GPU は 4 個の を持っているが, ブロック数を から 数まで増加させていくと性能が向上 (7.9 倍 ~8. 倍 ) するとともに消費電力も増加 (.3~.47 倍 ) していき, 更にブロック数を 数以上に増加させていくと性能がなだらかに向上すると共に消費電力も増加していくが, ブロック数を 4 以上で用いた場合, 性能はほぼ変化せず, 消費電力のみ減少することが確認できた. 同一性能で比較した場合, 最大 7% 減少した. すなわち, 多くのブロックを用いた方が消費電力が低くなる傾向があり, 性能を低下させずに消費電力のみを低下させるにはブロック数を増加させることが好ましいことが分かった. また, 前節の結果と比較することにより によ 5. 関連研究 GPU の消費電力に関する研究として, 長坂らによる GPU の性能と消費電力の相関性の解析の研究がある). この研究では, 様々な演算プログラムを実行させ, 実行プログラム毎に GPU における消費電力が大きく異なることに注目し, その関係について調査している. この結果, 命令スループットの高いプログラムでは消費電力が大きいとしている. 消費電力予測では, 結果誤差は平均して 7% 程度としている. また,GPU 処理では実行プログラム毎に消費電力が大きく異なることに着目し,GPU の消費電力における電圧と動作周波数の関係の解析の研究が長坂らによりされている). この研究では,DVFS に着目し,GPU での消費電力は実行プログラムに関する電力と, 実行プログラムに関係しないそれ以外の電力という電力をつに分けて考察されている. そして, そのつの電力が消費電力とどのような関係にあるかが調査されている. この結果, 実行プログラムに関する電力は電圧値の 乗と動作周波数に比例し, 実行プログラムに関係しない電力は電圧値に比例しているとしている. GPU におけるメモリアクセスや演算処理の消費電力に関する研究として,Callange らによる異なる NVIDIA GPU におけるよるメモリ読み込みや演算命令と消費電力の関係について研究がある 3). この結果により,DRAM を用いる場合よりもテクスチャーキャッシュを用いる方がメモリ要求あたりの消費エネルギーは抑えられるとしている. る演算処理の方がメモリアクセス処理よりも多くの 電力を消費することが分かった. 6. おわりに 本稿では災害対策拠点の分散化を支援するため の耐災害性の高い通信システムを想定し, 同システ
6 ムおけるサーバ計算機の性能と消費電力に関する考 察を行った. 具体的には, サーバ計算機の構成要素 の中で非常に消費電力の大きな要素である GPU に着 目し, その性能と消費電力の関係について考察した. 調査の結果, メモリアクセスをコアレス化し,Shared Memory を使用することにより, 性能と消費電力の両 側面において改善がみられることが確認された. ま た, ブロック数とスレッド数に関する調査を行った 結果, ブロック数を増加させることにより性能を保 ったまま低消費電力化を行えることが確認できた. 参考文献 ) 長坂仁, 丸山直也, 額田彰, 遠藤敏夫, 松岡聡, "GPU に おける性能と消費電力の相関性の解析 ", 情報処理学 会研究報,Vol.9-HPC-,No.7,pp.-5(9) ) 長坂仁, 丸山直也, 額田彰, 遠藤敏夫, 松岡聡, "GPU におけるモデルに基づいた電力効率の最適化 ", 研究報告ハイパフォーマンスコンピューティング ",Vol.-HPC-8,No.,pp.-6() 3) S.Collange,D.Defour,and A.Tisserand,"Power Consumption of GPUs from a Software Perspective ", in Workshop on Using Emerging Parallel Architectures for Computational,Vol.44,ch.9, pp.94-93(9)
熊本大学学術リポジトリ Kumamoto University Repositor Title GPGPU による高速演算について Author(s) 榎本, 昌一 Citation Issue date Type URL Presentation
熊本大学学術リポジトリ Kumamoto University Repositor Title GPGPU による高速演算について Author(s) 榎本, 昌一 Citation Issue date 2011-03-17 Type URL Presentation http://hdl.handle.net/2298/23539 Right GPGPU による高速演算について 榎本昌一 東京大学大学院工学系研究科システム創成学専攻
GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1
GPU 4 2010 8 28 1 GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1 Register & Shared Memory ( ) CPU CPU(Intel Core i7 965) GPU(Tesla
システムソリューションのご紹介
HP 2 C 製品 :VXPRO/VXSMP サーバ 製品アップデート 製品アップデート VXPRO と VXSMP での製品オプションの追加 8 ポート InfiniBand スイッチ Netlist HyperCloud メモリ VXPRO R2284 GPU サーバ 製品アップデート 8 ポート InfiniBand スイッチ IS5022 8 ポート 40G InfiniBand スイッチ
Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc
Article ID: NVSI-050110JP Created: 2005/10/19 Revised: - NetVault 仮想テープ ライブラリのパフォーマンス検証 : dothill SANnetⅡSATA 編 1. 検証の目的 ドットヒルシステムズ株式会社の SANnetll SATA は 安価な SATA ドライブを使用した大容量ストレージで ディスクへのバックアップを行う際の対象デバイスとして最適と言えます
iphone GPGPU GPU OpenCL Mac OS X Snow LeopardOpenCL iphone OpenCL OpenCL NVIDIA GPU CUDA GPU GPU GPU 15 GPU GPU CPU GPU iii OpenMP MPI CPU OpenCL CUDA OpenCL CPU OpenCL GPU NVIDIA Fermi GPU Fermi GPU GPU
EnSightのご紹介
オープン CAE シンポジウム 2014 汎用ポストプロセッサー EnSight の大規模データ対応 CEI ソフトウェア株式会社代表取締役吉川慈人 http://www.ceisoftware.co.jp/ 内容 大規模データで時間のかかる処理 クライアント サーバー機能 マルチスレッドによる並列処理 サーバーの分散処理 クライアントの分散処理 ( 分散レンダリング ) EnSightのOpenFOAMインターフェース
1. GPU コンピューティング GPU コンピューティング GPUによる 汎用コンピューティング GPU = Graphics Processing Unit CUDA Compute Unified Device Architecture NVIDIA の GPU コンピューティング環境 Lin
Windows で始める CUDA 入門 GTC 2013 チュートリアル エヌビディアジャパン CUDA エンジニア森野慎也 1. GPU コンピューティング GPU コンピューティング GPUによる 汎用コンピューティング GPU = Graphics Processing Unit CUDA Compute Unified Device Architecture NVIDIA の GPU コンピューティング環境
Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments
計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];
情報解禁日時 :12 月 20 日 ( 木 )11:00 以降 株式会社マウスコンピューター News Release MousePro 第 9 世代インテル CPU 搭載ビジネス向けデスクトップパソコンを 12 月 20 日 ( 木 ) 販売開始! ビジネス向けデスクトップパソコン MousePr
情報解禁日時 :12 月 20 日 ( 木 )11:00 以降 株式会社マウスコンピューター News Release MousePro 第 9 世代インテル CPU 搭載ビジネス向けデスクトップパソコンを 12 月 20 日 ( 木 ) 販売開始! ビジネス向けデスクトップパソコン MousePro T310 シリーズ 画像はイメージです 液晶ディスプレイはオプションです 株式会社マウスコンピューター
GPGPUクラスタの性能評価
2008 年度理研 HPC シンポジウム第 3 世代 PC クラスタ GPGPU クラスタの性能評価 2009 年 3 月 12 日 富士通研究所成瀬彰 発表の概要 背景 GPGPU による高速化 CUDA の概要 GPU のメモリアクセス特性調査 姫野 BMT の高速化 GPGPU クラスタによる高速化 GPU Host 間のデータ転送 GPU-to-GPU の通信性能 GPGPU クラスタ上での姫野
富士通セミコンダクタープレスリリース 2009/05/19
[ デバイス ] 2009 年 5 月 19 日富士通マイクロエレクトロニクス株式会社 世界初!125 動作の SiP 向け低消費電力メモリを新発売 ~ メモリの耐熱性向上により 消費電力の大きな高性能デジタル家電に最適 ~ 富士通マイクロエレクトロニクス株式会社 ( 注 1) は DDR SDRAM インターフェースを持つメモリでは世界で初めて動作温度範囲を 125 まで拡張したコンシューマ FCRAM(
-2 外からみたプロセッサ GND VCC CLK A0 A1 A2 A3 A4 A A6 A7 A8 A9 A10 A11 A12 A13 A14 A1 A16 A17 A18 A19 D0 D1 D2 D3 D4 D D6 D7 D8 D9 D10 D11 D12 D13 D14 D1 MEMR
第 回マイクロプロセッサのしくみ マイクロプロセッサの基本的なしくみについて解説する. -1 マイクロプロセッサと周辺回路の接続 制御バス プロセッサ データ バス アドレス バス メモリ 周辺インタフェース バスの基本構成 Fig.-1 バスによる相互接続は, 現在のコンピュータシステムのハードウェアを特徴づけている. バス (Bus): 複数のユニットで共有される信号線システム内の データの通り道
CELSIUSカタログ(2012年5月版)
CELSIUS PC "MADE IN JAPAN" 2012.5 New W520 ハイエンドの過酷な要求に応えるパワフルなデュアルと高信頼を搭載 トを搭載 RAID構成 選択可能 New グラフィックス/GPUカード 500GB 1TB 500GB 2 RAID1 Quadro 5000 Quadro 4000 Quadro 2000 Quadro 600 4 Quadro 4000 TeslaTM
CELSIUSカタログ(2012年7月版)
CELSIUS PC "MADE IN JAPAN" 2012.7 W520 ハイエンドの過酷な要求に応えるパワフルなデュアルと高信頼を搭載 RAID構成 選択可能 富士通がお勧めする Windows 7. ミニタワーエントリーモデル より速く より強力に 最新の技術をフル投入 スピードとパワー 安定性を提供 RAID構成 選択可能 Windows 7 Professional 32bit版 正規版
23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h
23 FPGA CUDA Performance Comparison of FPGA Array with CUDA on Poisson Equation ([email protected]), ([email protected]), ([email protected]), ([email protected]),
NEC 製PC サーバ『Express5800 R120f-1E』とSanDisk『ioMemory SX /SX 』検証報告書
NEC 製 PC サーバ Express5800 R120f-1E と SanDisk iomemory SX300-1600/SX350-1600 検証報告書 Windows Server 2012 R2 Standard 2015/08/07 文書名称 NEC 製 PC サーバ Express5800 R120f-1E と SanDisk iomemory-sx300-1600/sx350-1600
<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8
Web キャンパス資料 超音波シミュレーションの基礎 ~ 第 4 回 ComWAVEによる超高速超音波解析 ~ 科学システム開発部 Copyright (c)2006 ITOCHU Techno-Solutions Corporation 本日の説明内容 ComWAVEの概要および特徴 GPGPUとは GPGPUによる解析事例 CAE POWER 超音波研究会開催 (10 月 3 日 ) のご紹介
PowerPoint プレゼンテーション
コンピュータアーキテクチャ 第 13 週 割込みアーキテクチャ 2013 年 12 月 18 日 金岡晃 授業計画 第 1 週 (9/25) 第 2 週 (10/2) 第 3 週 (10/9) 第 4 週 (10/16) 第 5 週 (10/23) 第 6 週 (10/30) 第 7 週 (11/6) 授業概要 2 進数表現 論理回路の復習 2 進演算 ( 数の表現 ) 演算アーキテクチャ ( 演算アルゴリズムと回路
GPUを用いたN体計算
単精度 190Tflops GPU クラスタ ( 長崎大 ) の紹介 長崎大学工学部超高速メニーコアコンピューティングセンターテニュアトラック助教濱田剛 1 概要 GPU (Graphics Processing Unit) について簡単に説明します. GPU クラスタが得意とする応用問題を議論し 長崎大学での GPU クラスタによる 取組方針 N 体計算の高速化に関する研究内容 を紹介します. まとめ
Microsoft Word - Dolphin Expressによる10Gbpソケット通信.docx
Dolphin Express による 10Gbps ソケット通信 Dolphin Express は 標準的な低価格のサーバを用いて 強力なクラスタリングシステムが構築できる ハードウェアとソフトウェアによる通信用アーキテクチャです 本資料では Dolphin Express 製品の概要と 実際にどの程度の性能が出るのか市販 PC での実験結果をご紹介します Dolphin Express 製品体系
スライド タイトルなし
2019. 7.18 Ibaraki Univ. Dept of Electrical & Electronic Eng. Keiichi MIYAJIMA 今後の予定 7 月 18 日メモリアーキテクチャ1 7 月 22 日メモリアーキテクチャ2 7 月 29 日まとめと 期末テストについて 8 月 5 日期末試験 メモリアーキテクチャ - メモリ装置とメモリアーキテクチャ - メモリアーキテクチャメモリ装置とは?
LANカード(PG-2871) 取扱説明書
B7FY-2821-01 Z0-00 PG-2871 はじめに このたびは 弊社の LAN カード (PG-2871) をお買い上げいただき 誠にありがとうございます 本書は LAN カード ( 以降 本製品 ) の仕様について説明します LAN ドライバの詳細設定については 最新の LAN ドライバのマニュアルを参照してください 2010 年 8 月 目次 1 LANカードの仕様........................................
世界の技術を日本の品質で すべてはお客様の ベストパートナーであるために 1 2 納入分野 斬 新な 企画 展開力 高 品質 ダックスが持つ つの特長 3 交通機器 金融機器 医療機器 製造機器 工作機器 あらゆる分野へ 高信頼性 3 最 新 最適な 技術と開発 主な開発 生産製品 ダックスは産業用
Products Line-up 2018 VOL.1.0 222-0033 3-25-3 TEL045-470-1610045-470-1613 FAX045-470-1617URLhttp://www.dux.jp 450-0002 3-12-3 4F TEL052-569-5370FAX052-569-5372 534-0025 2-2-40 6F TEL06-6354-7851FAX06-6354-7852
Pervasive PSQL v11 のベンチマーク パフォーマンスの結果
Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7
main.dvi
PC 1 1 [1][2] [3][4] ( ) GPU(Graphics Processing Unit) GPU PC GPU PC ( 2 GPU ) GPU Harris Corner Detector[5] CPU ( ) ( ) CPU GPU 2 3 GPU 4 5 6 7 1 [email protected] 45 2 ( ) CPU ( ) ( ) () 2.1
Microsoft Word LenovoSystemx.docx
Lenovo System x シリーズ データベースサーバー移行時の ハードウェア選定のポイント 2015 年 5 月作成 1 目次 1) 本ガイドの目的... 3 2) System x3550 M3 と x3550 M5 の比較ポイント... 3 CPU コア数の増加... 4 仮想化支援技術の性能向上... 4 メモリモジュールの大容量化... 5 低消費電力化... 5 ストレージの大容量化と搭載可能数の増加...
RLC 共振回路 概要 RLC 回路は, ラジオや通信工学, 発信器などに広く使われる. この回路の目的は, 特定の周波数のときに大きな電流を得ることである. 使い方には, 周波数を設定し外へ発する, 外部からの周波数に合わせて同調する, がある. このように, 周波数を扱うことから, 交流を考える
共振回路 概要 回路は ラジオや通信工学 などに広く使われる この回路の目的は 特定の周波数のときに大きな電流を得ることである 使い方には 周波数を設定し外へ発する 外部からの周波数に合わせて同調する がある このように 周波数を扱うことから 交流を考える 特に ( キャパシタ ) と ( インダクタ ) のそれぞれが 周波数によってインピーダンス *) が変わることが回路解釈の鍵になることに注目する
2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹
ネットワークシステム B- 6-164 DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹 早稲田大学基幹理工学研究科情報理工学専攻 1 研究の背景 n インターネットトラフィックが増大 世界の IP トラフィックは 2012
ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015
ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ 本セッションの目的 本セッションでは ERDAS IMAGINEにおける処理速度向上を目的として機器 (SSD 等 ) 及び並列処理の比較 検討を行った 1.SSD 及び RAMDISK を利用した処理速度の検証 2.Condorによる複数 PCを用いた並列処理 2.1 分散並列処理による高速化試験 (ERDAS IMAGINEのCondorを使用した試験
038_h01.pdf
04 12Gb/ & PCIe Gen3 RAID P.09 P.16 P.12 P.13 P.10 P.14 P.12 P.12 P.16 P.08 P.09 P.10 P.14 P.16 P.09 12Gb/ & PCIe Gen3 RAID 05 12Gb/秒 & PCIe Gen3 6Gb/秒 & PCIe Gen3 6Gb/秒 & PCIe Gen3 Adaptec 7シリーズRAIDアダプタファミリ
Microsoft Word - vga
VGA Card Product name: ZH77A-G43 BIOS ver.: 1.0 搭配 SandyBridge CPU 測試 PCI Express VGA Card ATi GPU MSI V212-08S Radeon HD5450 512MB/GDDR3 Gen2,x16 012.017.000.000 MSI V234-07S Radeon HD5450 1024MB/GDDR3
[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP
InfiniBand ACP 1,5,a) 1,5,b) 2,5 1,5 4,5 3,5 2,5 ACE (Advanced Communication for Exa) ACP (Advanced Communication Primitives) HPC InfiniBand ACP InfiniBand ACP ACP InfiniBand Open MPI 20% InfiniBand Implementation
Avago( 旧 LSI) 3108 チップ搭載 RAID カードでの RAID1/RAID10 この RAID カードの RAID1 と RAID10 の設定方法によるメリット / デメリットについて お問い合わせをいただきました お問い合わせ : SuperMicroのサーバに当該チップ使用のR
Avago( 旧 LSI) 3108 チップ搭載 RAID カードでの RAID1/RAID10 この RAID カードの RAID1 と RAID10 の設定方法によるメリット / デメリットについて お問い合わせをいただきました お問い合わせ : SuperMicroのサーバに当該チップ使用のRAIDカードが搭載されています 利用 HDDは20 以上です HDDはRAIDを組んで使用しますが RAID
(速報) Xeon E 系モデル 新プロセッサ性能について
( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690
Microsoft Word - vga
VGA Card Product name: Z77A-G43 BIOS ver.: 2.0 搭配 SandyBridge CPU 測試 PCI Express VGA Card ATi GPU MSI V212-08S Radeon HD5450 512MB/GDDR3 Gen2,x16 012.017.000.000 MSI V234-07S Radeon HD5450 1024MB/GDDR3
テクニカルガイド 増設メモリ
(2012/09/19) 1. 機能仕様 型番 製品名 備考 N8102-513 32GB ボード N8102-512 16GB ボード N8102-511 8GB ボード (1x8GB/R) N8102-510 4GB ボード (1x4GB/U) N8102-509 2GB ボード DDR3L-1600(PC3L-12800) SDRAM ECC 付 Unbufferred (1x2GB/U) N8102-508
富士通PCサーバ「PRIMERGY RX2530 M4」における「TeraStation TS5010 / TS3010」シリーズ動作検証報告
富士通 PC サーバ PRIMERGY RX2530 M4 における TeraStation TS5010 / TS3010 シリーズ動作検証報告 検証日 : 平成 29 年 12 月 11 日 ~12 月 22 日 検証場所 : 株式会社バッファロー本社 1 目次 1. 本動作検証の目的... 3 2. 本動作検証の環境について... 3 2.1 検証環境... 3 2.2 NAS の構成...
PowerPoint プレゼンテーション
電気 電子計測 第 3 回 第 8 章ディジタル計測制御システムの基礎 http://cobayasi.com/keisoku/3th/3th.pdf 今日の学習の要点 ( テキスト P85~P94). 計算機の基本的なしくみを学ぼう 2. 外部機器とのデータのやりとりについて知ろう 3. 計算機によるディジタル計測制御システムの構成法 物理量. 計算機の基本的なしくみを学ぼう ディジタル計測制御システムセンサから得た情報を
1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU
GPGPU (I) GPU GPGPU 1 GPU(Graphics Processing Unit) GPU GPGPU(General-Purpose computing on GPUs) GPU GPGPU GPU ( PC ) PC PC GPU PC PC GPU GPU 2008 TSUBAME NVIDIA GPU(Tesla S1070) TOP500 29 [1] 2009 AMD
増設メモリ 1. 機能仕様 型番 製品名 備考 N GB 増設メモリボード DDR3-1333(PC ) SDRAM, Unbuffered N GB 増設メモリボード DDR3-1333(PC ) SDRAM, Unbuffered N8
(2011/06/17) 増設メモリ 1. 機能仕様 型番 製品名 備考 N8102-342 1GB 増設メモリボード DDR3-1333(PC3-10600) SDRAM, Unbuffered N8102-343 2GB 増設メモリボード DDR3-1333(PC3-10600) SDRAM, Unbuffered N8102-344 4GB 増設メモリボード DDR3-1333(PC3-10600)
bitvisor_summit.pptx
BitVisor 内蔵の lwip で Alkanet ログの送信を試みる 命館 学システムソフトウェア研究室 下雄也, 明 修平, 瀧本栄, 利公 1 はじめに (1/4) 近年, マルウェアが増加しており, マルウェアの脅威が問題となっている マルウェアの脅威に対抗するためには, 多数のマルウェアを迅速に解析する必要がある システムコールトレーサ Alkanet Windows 上で動作するマルウェアを対象とし,
スライド 1
GPU クラスタによる格子 QCD 計算 広大理尾崎裕介 石川健一 1.1 Introduction Graphic Processing Units 1 チップに数百個の演算器 多数の演算器による並列計算 ~TFLOPS ( 単精度 ) CPU 数十 GFLOPS バンド幅 ~100GB/s コストパフォーマンス ~$400 GPU の開発環境 NVIDIA CUDA http://www.nvidia.co.jp/object/cuda_home_new_jp.html
GPGPU
GPGPU 2013 1008 2015 1 23 Abstract In recent years, with the advance of microscope technology, the alive cells have been able to observe. On the other hand, from the standpoint of image processing, the
GPUコンピューティング講習会パート1
GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の
BIOSセットアップメニュー 一覧
B6FH-A613-01 Z0-00 STYLISTIC Q572/G BIOS セットアップメニュー一覧 その他の各製品名は 各社の商標 または登録商標です その他の各製品は 各社の著作物です その他のすべての商標は それぞれの所有者に帰属します Copyright FUJITSU LIMITED 2013 BIOS セットアップメニュー詳細 BIOS セットアップのメニューについて説明しています
リソース制約下における組込みソフトウェアの性能検証および最適化方法
リソース制約下における組込みソフト ウェアの性能検証および最適化方法 広島市立大学 大学院情報科学研究科システム工学専攻 中田明夫倉田和哉百々太市 1 提案技術の概要 組込みシステムの開発 厳しいリソース制約 (CPU, ネットワークなど ) 非機能要求 ( リアルタイム性など ) の達成 開発プロセスにおける設計段階 性能問題を発見することが困難 実装段階で性能問題が発覚 設計の手戻りが発生 設計段階での性能検証手法
ic3_cf_p1-70_1018.indd
章オペレーティングシステム()の基いソフトウェアで 基本ソフトウェア とも呼ばれます 第礎第 章 オペレーティングシステム () の基礎 - の役割と動作 ここでは コンピューターの基本的な構成やオペレーティングシステムの基本的な役割と操作を学習します -- コンピューターの基本構成 現代社会では さまざまな種類のコンピューター機器が各分野で利用されています 身近なものでは パソコン タブレット スマートフォンなどがありますが
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 0 Copyright 2017 FUJITSU AD
Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 [email protected] 0 背景 リアルタイム性が必要な分野への適用 5G( 低遅延 ) による新たなサービス展開 ゲーム VoIP 動画医療金融車載 遅延がサービス品質に直結 End-to-End
報道機関各位 平成 30 年 5 月 14 日 東北大学国際集積エレクトロニクス研究開発センター 株式会社アドバンテスト アドバンテスト社製メモリテスターを用いて 磁気ランダムアクセスメモリ (STT-MRAM) の歩留まり率の向上と高性能化を実証 300mm ウェハ全面における平均値で歩留まり率の
報道機関各位 平成 30 年 5 月 1 日 東北大学国際集積エレクトロニクス研究開発センター 株式会社アドバンテスト アドバンテスト社製メモリテスターを用いて 磁気ランダムアクセスメモリ (STT-MRAM) の歩留まり率の向上と高性能化を実証 300mm ウェハ全面における平均値で歩留まり率の向上 (91% から 97%) と 高速動作特性の向上を実証する実験に成功 標記について 別添のとおりプレスリリースいたしますので
GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 理化学研究所 共通コードプロジェクト
GPU チュートリアル :OpenACC 篇 Himeno benchmark を例題として 高エネルギー加速器研究機構 (KEK) 松古栄夫 (Hideo Matsufuru) 1 December 2018 HPC-Phys 勉強会 @ 理化学研究所 共通コードプロジェクト Contents Hands On 環境について Introduction to GPU computing Introduction
160311_icm2015-muramatsu-v2.pptx
Linux におけるパケット処理機構の 性能評価に基づいた NFV 導 の 検討 村松真, 川島 太, 中 裕貴, 林經正, 松尾啓志 名古屋 業 学 学院 株式会社ボスコ テクノロジーズ ICM 研究会 2016/03/11 研究 的 VM 仮想 NIC バックエンド機構 仮想化環境 仮想スイッチ パケット処理機構 物理環境 性能要因を考察 汎 IA サーバ NFV 環境に適したサーバ構成を検討
評価用システム DELL Precision T7810 CPU Xeon E v3 x2 64GB Samsung SSD SM84/WDC WD10EZEX-75M 搭載容量 - PCI-E 本数 6pin x2 BI 動作 メーカー ELSA ELSA ZOTAC ZOTAC ZO
評価用システム CPU 搭載容量 PCI-E 本数 DELL Precision T7910 Xeon E5-2630 v3 x2 64GB Samsung SSD SM84/WDC WD10EZEX-75M 1300W 6pin x2 8pin x1 メーカー NVIDIA ELSA ELSA ELSA ELSA ELSA ZOTAC ZOTAC ZOTAC ZOTAC ZOTAC ZOTAC ZOTAC
Microsoft Word - 2_0421
電気工学講義資料 直流回路計算の基礎 ( オームの法則 抵抗の直並列接続 キルヒホッフの法則 テブナンの定理 ) オームの法則 ( 復習 ) 図 に示すような物体に電圧 V (V) の直流電源を接続すると物体には電流が流れる 物体を流れる電流 (A) は 物体に加えられる電圧の大きさに比例し 次式のように表すことができる V () これをオームの法則 ( 実験式 ) といい このときの は比例定数であり
