Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Save this PDF as:
 WORD  PNG  TXT  JPG

Size: px
Start display at page:

Download "Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc"

Transcription

1 2.3. アプリ性能 Intel クアッドコア CPU でのベンチマーク 東京海洋大学吉岡諭 1. はじめにこの数年でマルチコア CPU の普及が進んできた x86 系の CPU でも Intel と AD がデュアルコア クアッドコアの CPU を次々と市場に送り出していて それらが PC クラスタの CPU として採用され HPC に活用されている ここでは Intel クアッドコア CPU を搭載した PC 単体で浮動小数点を中心としたベンチマークプログラムを実行し CPU 及びコンパイラの並列性能を調べた結果を報告する 並列化には コンパイラの自動並列化機能を用いた 2. ベンチマーク 今回ベンチマークプログラムとしては姫野ベンチマークを採用した 姫野ベンチマークがマルチコア CPU の性能を測定する最良のベンチマークということでは必ずしもないが これまで日本で浮動小数点演算の実効性能を測定するベンチマークとして広く利用されてきたことを考慮し採用した 姫野ベンチマークは 3 次元格子でポアッソン方程式をヤコビの反復法で解く場合に主要となるループの処理速度を計るものである その主要ループは以下の通りである gosa=. do k=2,kmax-1 do j=2,jmax-1 do i=2,imax-1 s=a(i,j,k,1)*p(i+1,j,k) & +a(i,j,k,2)*p(i,j+1,k) & +a(i,j,k,3)*p(i,j,k+1) & +b(i,j,k,1)*(p(i+1,j+1,k)-p(i+1,j-1,k) & -p(i-1,j+1,k)+p(i-1,j-1,k)) & +b(i,j,k,2)*(p(i,j+1,k+1)-p(i,j-1,k+1) & -p(i,j+1,k-1)+p(i,j-1,k-1)) & +b(i,j,k,3)*(p(i+1,j,k+1)-p(i-1,j,k+1) & -p(i+1,j,k-1)+p(i-1,j,k-1)) & +c(i,j,k,1)*p(i-1,j,k) & +c(i,j,k,2)*p(i,j-1,k) & +c(i,j,k,3)*p(i,j,k-1)+wrk1(i,j,k) ss=(s*a(i,j,k,4)-p(i,j,k))*bnd(i,j,k) gosa=gosa+ss*ss wrk2(i,j,k)=p(i,j,k)+omega *ss enddo enddo 測定に用いたプラットホームは以下のものである (1) Intel Core 2 Extreme QX67 (4 コア ) model name : Intel(R) Core2 Quad CPU (Kentsfield) 2.66GHz 2 cache size : 496 KB 2 FB : 166Hz O : CentO 5. for Intel64 (2) Intel Xeon E5462 2CPU (4x2 コア ) model name : Intel(R) Xeon E5462 Quad CPU (Harpertown) 2.8GHz 2 cache size : 6B 2/cpu FB : 16Hz O : Fedora 8 for Intel64

2 (3) Intel Core i7 94 (4コア) model name : Intel(R) Core i7 Quad CPU (Nehalem ) 2.93GHz 2 cache size : 256kB/core 3 cache size : 8B ( 共有 ) QPI : 4.8GHz O : Cent O 5.2 for Intel64 なお TREA ベンチマークを用いて測定した両システムのメモリバンド幅は以下の通りである (1) QX67 :1 コアでは 4.6GB/s 4.7GB/s 4 コア (openmp) でも 4.6GB/s 4.7GB/s (2) E5462 :1 コアでは 4.7GB/s 5.5GB/s 8 コア (openmp) では 8.1GB/s 8.8GB/s (3) Core i7 94:1 コアでは 5.7GB/s 1GB/s 4 コア (openmp) では 11GB/s 16GB/s 測定に用いたコンパイラは以下のものである A) Fujitsu Fortran Version 3. B) Intel Fortran Compliler (Core i7 94 だけ ) C) GNU 測定結果ベンチマークの測定は 4 つの格子で行った X (64x32x32) (128x64x64) (256x128x128) (512x256x256) 利用する配列の総バイト数は X では 3.6B では 29B では 235B では 1.9GB になる 測定結果を以下に示す 3.1 スカラー性能コンパイラオプションは以下の通りである -O3 (GNU) -O3 (Intel) -Kfast (Fujitsu) 測定結果を図 1 に示す どのシステムとも格子が大きくなるに従って 性能が落ちている 特に X と の間で性能差が大きい X では全配列が 2 キャッシュにおさまるのに対して 以上の格子では配列が 2 キャッシュから溢れていることが原因と考えられる また Core i7 94 (Nehalem) のスカラー性能が高いことが目立つ QX67 i 図 1. スカラー性能

3 3.2 自動並列化 GNU は自動並列化機能を持っていない スカラー版のベンチマークコードはそのままでは Intel コンパイラ ver1. 及び ver11.1 では自動並列化されなかった そのため わずかなコードの変更とコンパイルオプションの追加を行うことによって 自動並列化を行った コンパイラオプションは以下の通りである -O3 -parallel -par-threshold99 (Intel) -Kfast,parallel (Fujitsu) QX67 i 図 2. 自動並列化性能 測定結果を図 2 に示す ここでも各システムとも格子が大きくなるに従って 性能が落ちている スカラー計算に対する性能向上率は富士通コンパイラでは QX67 で 1.35 倍 ( ) から 3.78 倍 (X ) E5462 で 2.52 倍 ( ) から 6.85 倍 (X ) i7 94 で 2.7 倍 ( ) から 3.51 倍 (X ) となっている 格子 X では性能向上率がかなり高く 2 キャッシュにデータがおさまっている場合には マルチコアの威力が発揮できているようである Core i7 94 はが 4 つであるのに その倍のの E5462x2 と同等以上の性能を示している 3.3 コンパイラオプションは以下の通りである -O3 -fopenmp (GNU) -O3 -openmp (Intel) -Kfast,OP (Fujitsu) 測定結果を図 3 に示す ここでも各システムとも格子が大きくなるに従って 性能が落ちている GNU コンパイラの 性能はかなり低いこともわかる スカラー計算に対する性能向上率は富士通コンパイラでは QX67 で 1.36 倍 ( ) から 3.85 倍 (X ) E5462 で 2.4 倍 ( ) から 6.66 倍 (X ) i7 94 で 2.6 倍 ( ) から 3.5 倍 (X ) となっている 自動並列化と同様に 格子 X では性能向上率がかなり高い 自動並列の場合と同様に Core i7 94 は E5462x2 と同等以上の性能を示している

4 QX67 i 図 3. 性能 3.4 ライブラリは Open を用いた 1 次元方向の領域分割を用いて並列化をしている コンパイラオプションは以下の通りである -O3 (GNU) -O3 (Intel) -Kfast (Fujitsu) 測定結果を図 4 に示す 各システムとも格子が大ききなるに従って 性能が落ちている スカラー計算に対する性能向上率は富士通コンパイラでは QX67 で 1.33 倍 ( ) から 2.79 倍 (X ) E5462 で 2. 倍 ( ) から 6.42 倍 (X ) i7 94 で 2.23 倍 ( ) から 3.51 倍 (X ) となっている 性能向上率は他の並列計算に比べてわずかに小さい QX67 i 図 4. 性能 なお すべての並列計算で QX67 では ~ で同等の結果なのに対して E5462 では の性能が の性能を大きく上回っている その理由として 利用できる 2 キャッシュの総量が QX67 では 8B なのに対して E5462 では 24B あり これは の計算が必要とするメモリ量にほぼ匹敵し ある程度 2 キャッシュを利用した計算ができているためと考えられる Core i7 94 は の計算で E5462x2 の倍の性能を示している 3.5 と並列性能 E5462 で富士通コンパイラを用いて 利用する ( スレッド数 ) に対する性能測定を自動並列

5 それぞれに対して測定した結果を図 5 に示す 基本的には利用するが増すにつれて性能は上がっているが では 8 コアの性能が 4 コアの性能を下回る場合がある 4. 考察 4.1 コンパイラスカラ性能は富士通コンパイラとインテルコンパイラ ver1.&ver11.1 が高い 並列計算した場合ではコンパイラによる性能差はあまりない マルチコアで計算したからといって分計算が速くなる訳ではない ベンチマークのが大きい場合には コンパイラの自動並列化機能 いずれの並列化を適用した場合にも性能はあまり変わらない そういう意味ではコンパイラの自動並列化機能は健闘していると言える 4.2 メモリバンド幅とキャッシュシングルコアの CPU では キャッシュを活用した計算が出来るかどうかが性能を左右していた その状況はマルチコア CPU でも変わらない マルチコア化によって CPU 全体としての演算性能が上がったため メモリバンド幅に対する要求が大きくなっていて 結果としてキャッシュを活用できるかどうかが性能に大きく影響を与えている 特にここで測定した姫野ベンチマークのように 浮動小数点演算数に対する メモリへのアクセス数の比率が高い場合には その影響が大きい ただし マルチコア化によって 結果的に1CPU あたりで利用できるキャッシュの量が増えたため シングルコアではキャッシュに載らなかった計算がマルチコアではキャッシュにおさまるようになり 性能が上がるということもある と自動並列性能 と 性能 X X 2 2 と 性能 ( 分割 : 最外側ループ ) と 性能 ( 分割 : 最内側ループ ) X X 2 2 図 5. と並列性能 以上

6 補足資料 QX67 のベンチマーク結果 : と 値 ( スカラー以外は 4 コア ) スカラー自動並列 X X X X でのベンチマーク結果 : と 値 ( スカラー以外は 8 コア ) スカラー自動並列 X X X X

7 Core i7 の 94 ベンチマーク結果 : と 値 ( スカラー以外は 4 コア ) スカラー自動並列 X X X X E5462 x 2 でのベンチマーク結果 : と 値 自動並列 ( 分割は最外側ループ ) ( 分割は最内側ループ ) parallel (X) parallel () parallel () parallel () (X) () () () (X) () () () (X) () () ()

VXPRO R1400® ご提案資料

VXPRO R1400® ご提案資料 Intel Core i7 プロセッサ 920 Preliminary Performance Report ノード性能評価 ノード性能の評価 NAS Parallel Benchmark Class B OpenMP 版での性能評価 実行スレッド数を 4 で固定 ( デュアルソケットでは各プロセッサに 2 スレッド ) 全て 2.66GHz のコアとなるため コアあたりのピーク性能は同じ 評価システム

More information

(速報) Xeon E 系モデル 新プロセッサ性能について

(速報) Xeon E 系モデル 新プロセッサ性能について ( 速報 ) Xeon E5-2600 系モデル新プロセッサ性能について 2012 年 3 月 16 日 富士通株式会社 2012 年 3 月 7 日 インテル社より最新 CPU インテル Xeon E5 ファミリー の発表がありました この最新 CPU について PC クラスタシステムの観点から性能検証を行いましたので 概要を速報いたします プロセッサインテル Xeon プロセッサ E5-2690

More information

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果 Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7

More information

Microsoft PowerPoint - sales2.ppt

Microsoft PowerPoint - sales2.ppt 最適化とは何? CPU アーキテクチャに沿った形で最適な性能を抽出できるようにする技法 ( 性能向上技法 ) コンパイラによるプログラム最適化 コンパイラメーカの技量 経験量に依存 最適化ツールによるプログラム最適化 KAP (Kuck & Associates, Inc. ) 人によるプログラム最適化 アーキテクチャのボトルネックを知ること 3 使用コンパイラによる性能の違い MFLOPS 90

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション vsmp Foundation スケーラブル SMP システム スケーラブル SMP システム 製品コンセプト 2U サイズの 8 ソケット SMP サーバ コンパクトな筐体に多くのコアとメモリを実装し SMP システムとして利用可能 スイッチなし構成でのシステム構築によりラックスペースを無駄にしない構成 将来的な拡張性を保証 8 ソケット以上への拡張も可能 2 システム構成例 ベースシステム 2U

More information

パフォーマンスレポート PRIMERGY TX100 S2

パフォーマンスレポート PRIMERGY TX100 S2 ホワイトペーパー パフォーマンスレポート PRIMERGY TX100 S2 ホワイトペーパー FUJITSU PRIMERGY サーバパフォーマンスレポート PRIMERGY TX100 S2 本書では PRIMERGY TX100 S2 で実行したベンチマークの概要について説明します PRIMERGY TX100 S2 のパフォーマンスデータを 他の PRIMERGY モデルと比較して説明しています

More information

HP ProLiant サーバおよびオプション製品の価格改定

HP ProLiant サーバおよびオプション製品の価格改定 HP ProLiant サーバおよびオプション製品の価格改定 2007 年 9 月 6 日付で HP ProLiant サーバ製品についてサーバ製品 68 製品 オプション製品 55 製品 最大 55% の大規模 な価格改定を実施いたします 今回の価格改定のポイントは下記のとおりです HP はこれまでテクノロジーリーダーとして

More information

PassMark PerformanceTest ™

PassMark PerformanceTest ™ KRONOS S ライン 性能ベンチマーク オーバークロックモニター OCCT OverClock Checking Tool i7z (A better i7 (and now i3, i5) reporting tool for Linux) KRONOS S800 CATIA Benchmark Aerospace - 8/17 passengers Jet - Mid Fuse DELL Precision

More information

TRAVENTY CG V 動作検証報告書

TRAVENTY CG V 動作検証報告書 SHARP 303SH(smartphone) 動作検証報告書 DeviceLock 7.3 (Build 54480) 2014 年 8 月 検証目的 SHARP 303SH スマートフォンと DeviceLock7.3 を組合せた動作を確認する 検証準備検証環境 Windows 7 コンピュータ : Mouse Computer 0707MDV-AD4810X-N CPU : Intel(R)

More information

システム imac 21.5 インチディスプレイ 3.6GHz i5 Dual core / HT 2.8GHz i7 Quad core / HT ATI Radeon 4850 ATI Radeon HD はいいいえいいえはいいいえ ATI はいいいえ

システム imac 21.5 インチディスプレイ 3.6GHz i5 Dual core / HT 2.8GHz i7 Quad core / HT ATI Radeon 4850 ATI Radeon HD はいいいえいいえはいいいえ ATI はいいいえ Composer 6 および Symphony 6 認定 Apple Mac システム システム Mac デスクトップ Mac Pro dual 6-Core 2.66GHz "Westmere" Core 2.66GHz および 2.93GHz "Nehalem" Core 2.26GHz "Nehalem" Core 3.0GHz および 3.2GHz "Harpertown" Geforce

More information

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx シングルコアとマルチコア 長岡技術科学大学電気電子情報工学専攻出川智啓 今回の内容 前々回の授業の復習 CPUの進化 半導体集積率の向上 CPUの動作周波数の向上 + 複雑な処理を実行する回路を構成 ( 前々回の授業 ) マルチコア CPU への進化 均一 不均一なプロセッサ コプロセッサ, アクセラレータ 210 コンピュータの歴史 世界初のデジタルコンピュータ 1944 年ハーバードMark I

More information

ためのオーバーヘッドが課題となりつつある しかしこのオーバーヘッドに関する数値はほとんど公開されていない この論文ではこの cache coherency の時間を Linux カーネルで提供されている atomic_inc 関数を用いて測定する方法を新たに考案し 実測プログラムを作成した 実測はプ

ためのオーバーヘッドが課題となりつつある しかしこのオーバーヘッドに関する数値はほとんど公開されていない この論文ではこの cache coherency の時間を Linux カーネルで提供されている atomic_inc 関数を用いて測定する方法を新たに考案し 実測プログラムを作成した 実測はプ Intel Xeon プロセッサにおける Cache Coherency 時間の測定方法と大規模システムにおける実測結果 Performance Measurement Method of Cache Coherency Effects on a large Intel Xeon Processor System 河辺峻 1 古谷英祐 2 KAWABE Shun, FURUYA Eisuke 要旨現在のプロセッサの構成は,

More information

GPGPU によるアクセラレーション環境について

GPGPU によるアクセラレーション環境について GPGPU によるアクセラレーション環境について 長屋貴量 自然科学研究機構分子科学研究所技術課計算科学技術班 概要 GPGPU とは 単純で画一的なデータを一度に大量に処理することに特化したグラフィックカードの演算資源を 画像処理以外の汎用的な目的に応用する技術の一つである 近年 その演算能力は CPU で通常言われるムーアの法則に則った場合とは異なり 飛躍的に向上しており その演算性能に魅力を感じた各分野での応用が広がってきている

More information

HPC可視化_小野2.pptx

HPC可視化_小野2.pptx 大 小 二 生 高 方 目 大 方 方 方 Rank Site Processors RMax Processor System Model 1 DOE/NNSA/LANL 122400 1026000 PowerXCell 8i BladeCenter QS22 Cluster 2 DOE/NNSA/LLNL 212992 478200 PowerPC 440 BlueGene/L 3 Argonne

More information

PassMark PerformanceTest ™

PassMark PerformanceTest ™ ワークステーション / サーバ KRONOS シリーズ製品概要 プロセッサ動作速度の変遷 Overclock CPU DB: Recording Microprocessor History http://queue.acm.org/detail.cfm?id=2181798 用途向け最適化システム 目的 : ストレスなく大規模なモデルを処理出来るシステムの開発 販売 ターゲットとする用途向けに最適化したシステム

More information

<4D F736F F D20322E332E322E819C94BC8CC AA8E7193AE97CD8A778C768E5A82F A282BD B835E90AB945C82CC91AA92E85F93EC95945F F8D F5F E646F6378>

<4D F736F F D20322E332E322E819C94BC8CC AA8E7193AE97CD8A778C768E5A82F A282BD B835E90AB945C82CC91AA92E85F93EC95945F F8D F5F E646F6378> 2.3.2. 半古典分子動力学計算を用いたコンピュータ性能の測定 上智大学 南部伸孝 1. 概要古典力学を基に分子の運動 ( 粒子の運動 ) を記述する分子動力学シミュレーション (Molecular Dynamics simulation) が生体関連の分野で頻繁に利用され, 最近では分子機械の解明等までも利用されている 特にそこで活躍されている数値計算法として速度ベルレ (Velocity-Verlet)

More information

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並 XcalableMPによる NAS Parallel Benchmarksの実装と評価 中尾 昌広 李 珍泌 朴 泰祐 佐藤 三久 筑波大学 計算科学研究センター 筑波大学大学院 システム情報工学研究科 研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI,

More information

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx)

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx) AICS 村井均 RIKEN AICS HPC Summer School 2012 8/7/2012 1 背景 OpenMP とは OpenMP の基本 OpenMP プログラミングにおける注意点 やや高度な話題 2 共有メモリマルチプロセッサシステムの普及 共有メモリマルチプロセッサシステムのための並列化指示文を共通化する必要性 各社で仕様が異なり 移植性がない そして いまやマルチコア プロセッサが主流となり

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

untitled

untitled A = QΛQ T A n n Λ Q A = XΛX 1 A n n Λ X GPGPU A 3 T Q T AQ = T (Q: ) T u i = λ i u i T {λ i } {u i } QR MR 3 v i = Q u i A {v i } A n = 9000 Quad Core Xeon 2 LAPACK (4/3) n 3 O(n 2 ) O(n 3 ) A {v i }

More information

MDR-DS7100

MDR-DS7100 4-159-915-01(1) デジタルサラウンド ヘッドホンシステム プロダクトインフォメーション MDR-DS7100 2009 Sony Corporation 1...4 1.1....4 1.2....4 1.3. VPT...6 2...11 2.1. 7.1 chvpt... 11 2.2. DSP... 12 2.3. CINEMA... 12 2.4. GAME... 13 2.5....

More information

GPUコンピューティング講習会パート1

GPUコンピューティング講習会パート1 GPU コンピューティング (CUDA) 講習会 GPU と GPU を用いた計算の概要 丸山直也 スケジュール 13:20-13:50 GPU を用いた計算の概要 担当丸山 13:50-14:30 GPU コンピューティングによる HPC アプリケーションの高速化の事例紹介 担当青木 14:30-14:40 休憩 14:40-17:00 CUDA プログラミングの基礎 担当丸山 TSUBAME の

More information

Microsoft Word LenovoSystemx.docx

Microsoft Word LenovoSystemx.docx Lenovo System x シリーズ データベースサーバー移行時の ハードウェア選定のポイント 2015 年 5 月作成 1 目次 1) 本ガイドの目的... 3 2) System x3550 M3 と x3550 M5 の比較ポイント... 3 CPU コア数の増加... 4 仮想化支援技術の性能向上... 4 メモリモジュールの大容量化... 5 低消費電力化... 5 ストレージの大容量化と搭載可能数の増加...

More information

VMware ESXiサポート版数一覧表(PRIMERGY機種別)

VMware ESXiサポート版数一覧表(PRIMERGY機種別) VMware ESXi サポート版数一覧表 ( 機種別 ) 2017 年 12 月 19 日富士通株式会社 本書について富士通がサポートする との組み合わせは 下記一覧のとおりです なお コンポーネントごとの最新のサポート版数状況は 以下 VMware ESXi サポート版数一覧表 (VMware コンポーネント別 ) で確認してください http://jp.fujitsu.com/platform/server/primergy/software/vmware/pdf/esxsvm.pdf

More information

スライド 1

スライド 1 動作検証レポート :HP IceWall SSO + VMware 日本 HP テクノロジーコンサルティング統括本部ソリューションアーキテクト 久保俊彦 1 Copyright 20102011 Hewlett-Packard Development Company, L.P. 目次 はじめに 1. HP IceWall SSOとVMwareのユースケース 1.1 基本構成の統合イメージ 1.2 応用構成の統合イメージ

More information

EASYCOLOR!2 EASYCOLOR!3 EASYCOLOR!2 Mac OS X 版動作確認実施情報 EASYCOLOR!3(Ver 3.0.10.0) 動作確認 PC 環境 CPU GPU OS バージョン MacBook Pro (MB604J/A) Mac Pro (MC560J/A) MacBook Pro (Z0GP00520) Mac mini (MC816J/A)

More information

Title Slide with Picture

Title Slide with Picture 意外と知らない!? オラクル ライセンス見積 ABC -Oracle Database 編 - 本資料は 2016 年 10 月 3 日時点の情報として有効です 以下の事項は 弊社の一般的な製品の方向性に関する概要を説明するものです また 情報提供を唯一の目的とするものであり いかなる契約にも組み込むことはできません 以下の事項は マテリアルやコード 機能を提供することをコミットメント ( 確約 )

More information

Microsoft Word - 編集用_Ensemble2010.2HL7MessagingThroughput.docx

Microsoft Word - 編集用_Ensemble2010.2HL7MessagingThroughput.docx INTERSYSTEMS ENSEMBLE HL7V2 メッセージスループット Ensemble (v 2010.2 ビルド 503) HL7v2 のパフォーマンスと拡張性について (2010 年 12 月 ) プロダクトマネジャ VIK NAGJEE, プロダクトマネジャ DAVID LOVELUCK INTERSYSTEMS ENSEMBLE HL7V2 メッセージスループット 概要 InterSystems

More information

syuryoku

syuryoku 248 24622 24 P.5 EX P.212 2 P271 5. P.534 P.690 P.690 P.690 P.690 P.691 P.691 P.691 P.702 P.702 P.702 P.702 1S 30% 3 1S 3% 1S 30% 3 1S 3% P.702 P.702 P.702 P.702 45 60 P.702 P.702 P.704 H17.12.22 H22.4.1

More information

土壌環境行政の最新動向(環境省 水・大気環境局土壌環境課)

土壌環境行政の最新動向(環境省 水・大気環境局土壌環境課) 201022 1 18801970 19101970 19201960 1970-2 1975 1980 1986 1991 1994 3 1999 20022009 4 5 () () () () ( ( ) () 6 7 Ex Ex Ex 8 25 9 10 11 16619 123 12 13 14 5 18() 15 187 1811 16 17 3,000 2241 18 19 ( 50

More information

処理効率

処理効率 処理効率 処理効率の改善 : 基本関数複数メモリ領域線形代数の並列処理並列ガベージコレクタ多項式演算疎な行列とベクトル Maplesoft は 新しいリリースのたびに数学計算の効率と速度の改善を追求してきました これには 頻繁にコールされるルーチンやアルゴリズムの改善だけでなく ローレベルの基礎構造の改善も含まれます Maple では 複素数を含む数値計算を高速化する新しいアル 17 ゴリズムおよび疎な行列とベクトルをより実用的に結合するためのローレベルルーチンが導入されました

More information

2.1 インテル マイクロアーキテクチャー Haswell インテル マイクロアーキテクチャー Haswell は インテル マイクロアーキテクチャー Sandy Bridge とインテル マイクロアーキテクチャー Ivy Bridge の成功を受けて開発された この新しいマイクロアーキテクチャーの

2.1 インテル マイクロアーキテクチャー Haswell インテル マイクロアーキテクチャー Haswell は インテル マイクロアーキテクチャー Sandy Bridge とインテル マイクロアーキテクチャー Ivy Bridge の成功を受けて開発された この新しいマイクロアーキテクチャーの 2 章インテル 64 プロセッサー アーキテクチャーと IA-32 プロセッサー アーキテクチャー 本章では 最新世代のインテル 64 プロセッサーと IA-32 プロセッサー ( インテル マイクロアーキテクチャー Haswell インテル マイクロアーキテクチャー Ivy Bridge インテル マイクロアーキテクチャー Sandy Bridge ベースのプロセッサーと インテル Core マイクロアーキテクチャー

More information

図3 2からみると 要求希望賃金が就職率に大きな影響を与える たとえば 要求希望 賃金が 1000元以下 の場合 就職率が一番低く 要求希望賃金が 2000 3000元 の場 合 就職率が一番高い 2000 3000元 の範囲を超えると 要求希望賃金が高くなるほ ど 就職率も下がっていく 樋口美雄の就業決定モデルでは 市場賃金が留保賃金12より 高いとき 就業すると指摘している 今回の調査では 延辺大学生の要求希望賃金は

More information

統計数理研究所とスーパーコンピュータ

統計数理研究所とスーパーコンピュータ スーパーコンピュータと統計数理研究所 統計数理研究所 統計科学技術センターセンター長 中野純司 目次 スーパーコンピュータとは いったい何? 本当に スーパー?: ノートパソコンとの比較 どのように使う?: 仕組みとソフトウェア 統計数理研究所の ( スーパー ) コンピュータ 必要性 導入の歴史 現在の統数研スパコン : A, I, C 2/44 目次 スーパーコンピュータとは いったい何? 本当に

More information

ProLiant BL20p Generation 4 システム構成図

ProLiant BL20p Generation 4 システム構成図 HP ProLiant BL p-class Server BL20p Generation 4 2007 11 15 1 OVERVIEW ProLiantBL20p Generation 4 HP BladeSystem p-class Hardware Component BladeSystem p-class BladeSystem p-class BladeSystem p-class ()

More information

( ) ver.2015_01 2

( ) ver.2015_01 2 1 1.1 1.2 1.3 2 ( ) 2.1 2.2 2.3 2.4 3 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 6 6.1 6.2 6.3 7 7.1 7.2 7.3 8 ver.2015_01 2 1 1.1 1.2 1.3 ver.2015_01 3 2 2.1 2.2 2.3 ver.2015_01 4 2.4 ver.2015_01

More information

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5-

12 PowerEdge PowerEdge Xeon E PowerEdge 11 PowerEdge DIMM Xeon E PowerEdge DIMM DIMM 756GB 12 PowerEdge Xeon E5- 12ways-12th Generation PowerEdge Servers improve your IT experience 12 PowerEdge 12 1 6 2 GPU 8 4 PERC RAID I/O Cachecade I/O 5 Dell Express Flash PCIe SSD 6 7 OS 8 85.5% 9 Dell OpenManage PowerCenter

More information

新しい並列プログラミング言語である 分散メモリ環境において OpenMPのようにMPI とは異なるシンプルな言語構文と指示文による並列化を目指している ベース言語は Fortran 言語とC 言語となっており 2011 年 6 月に発足したPC クラスタコンソーシアム XcalableMP 規格部会

新しい並列プログラミング言語である 分散メモリ環境において OpenMPのようにMPI とは異なるシンプルな言語構文と指示文による並列化を目指している ベース言語は Fortran 言語とC 言語となっており 2011 年 6 月に発足したPC クラスタコンソーシアム XcalableMP 規格部会 高性能並列プログラミング言語 XcalableMP の紹介 IntroductionofaPGASparalelprogramminglanguage XcalableMP 一般財団法人高度情報科学技術研究機構原山卓也 井上孝洋 手島正吾国立研究開発法人理化学研究所計算科学研究機構村井均 現在の京を中核とするHPCI におけるスーパーコンピュータやPC クラスタでは CPU に多くの計算コアを搭載している

More information

<4D6963726F736F667420506F776572506F696E74202D20834B8343835F83938358815C8FEE95F183568358836583808A7793C195CA8D758B608252816932303134944E348C8E3893FA816A202D2048502E70707478>

<4D6963726F736F667420506F776572506F696E74202D20834B8343835F83938358815C8FEE95F183568358836583808A7793C195CA8D758B608252816932303134944E348C8E3893FA816A202D2048502E70707478> ガイダンス 東 京 大 学 情 報 基 盤 センター 准 教 授 片 桐 孝 洋 204 年 4 月 8 日 ( 火 )4:40-6:0 ガイダンスの 流 れ. 講 義 の 目 的 2. 講 師 紹 介 3. 講 義 日 程 の 確 認 4. 成 績 の 評 価 方 法 5. イントロダクション(30 分 ) 2 本 講 義 の 目 的 近 年 京 コンピュータに 代 表 される 世 界 トップクラスのスーパーコンピュータが

More information

hpci_

hpci_ モンテカルロ殻模型計算の GPGPU への適用について 富樫智章 A, 清水則孝 A, 宇都野穣 A,B, 阿部喬 C, 大塚孝治 A,C 東大 CNS A, JAEA B, 東大理 C HPCI 戦略プログラム分野 5 物質と宇宙の起源と構造 全体シンポジウム 秋葉原 2014.3.3 背景と目的 モンテカルロ殻模型計算の現状 : 京による大規模計算で 5 主殻計算が行われ 6 主殻計算が行われつつある

More information

講演番号

講演番号 平成 25 年度先端的計算科学研究プロジェクト流体型宇宙プラズマシミュレーションコードの性能チューニング 梅田隆行 ( 名古屋大学太陽地球環境研究所 ) 深沢圭一郎 ( 九州大学情報基盤研究開発センター ) 1. 研究の目的と意義太陽から地球に至るジオスペース環境の変動を理解することは 人類の活動が宇宙へと拡大しつつある今日 極めて重要な課題である 人類の活動に影響を与えるジオスペースの変動現象としては

More information

iphone GPGPU GPU OpenCL Mac OS X Snow LeopardOpenCL iphone OpenCL OpenCL NVIDIA GPU CUDA GPU GPU GPU 15 GPU GPU CPU GPU iii OpenMP MPI CPU OpenCL CUDA OpenCL CPU OpenCL GPU NVIDIA Fermi GPU Fermi GPU GPU

More information

Community Edition日本語インストール ガイド

Community Edition日本語インストール ガイド Community Edition 日本語インストール ガイド ドキュメント番号 : GUIDE-install-21040501 バージョン : 1.0 発行日 : 2014/05/01 目次 1. はじめに... 1 2. インストールする前に必要な環境の確認... 1 2.1. ハードウェア... 1 2.2. インターネットブラウザ... 1 2.3. Java Virtual Machines

More information

パフォーマンスレポート PRIMERGY RX200 S6

パフォーマンスレポート PRIMERGY RX200 S6 ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 ホワイトペーパー FUJITSU PRIMERGY サーバパフォーマンスレポート PRIMERGY RX200 S6 本書では PRIMERGY RX200 S6 で実行したベンチマークの概要について説明します PRIMERGY RX200 S6 のパフォーマンスデータを 他の PRIMERGY モデルと比較して説明しています

More information

製品概要新しい X シリーズ ファミリー X シリーズ ファミリーあらゆるエンスージアストが満足するパフォーマンスがここにあります 新しい X シリーズ ファミリーは 4 コアから 18 コアまでのオプションによりお客様のパフォーマンス要求に合わせて究極のパフォーマンスを発揮し 最新テクノロジーの進

製品概要新しい X シリーズ ファミリー X シリーズ ファミリーあらゆるエンスージアストが満足するパフォーマンスがここにあります 新しい X シリーズ ファミリーは 4 コアから 18 コアまでのオプションによりお客様のパフォーマンス要求に合わせて究極のパフォーマンスを発揮し 最新テクノロジーの進 製品概要新しい X シリーズ ファミリー 新しい X シリーズ ファミリーの紹介 類を見ないスケーラビリティーを誇る究極のプラットフォーム i9 エクストリーム エディション パフォーマンスを未体験の領域へと引き上げる 新次元のデスクトップ向け エクストリーム が登場しました この 18 コア / 36 スレッドに よる処理が可能なは 最新版のインテル ターボ ブースト テクノロジー 3.0 を使用して極限レベルのシングル

More information

imai@eng.kagawa-u.ac.jp No1 No2 OS Wintel Intel x86 CPU No3 No4 8bit=2 8 =256(Byte) 16bit=2 16 =65,536(Byte)=64KB= 6 5 32bit=2 32 =4,294,967,296(Byte)=4GB= 43 64bit=2 64 =18,446,744,073,709,551,615(Byte)=16EB

More information

パフォーマンスレポート PRIMERGY BX922 S2

パフォーマンスレポート PRIMERGY BX922 S2 ホワイトペーパー パフォーマンスレポート PRIMERGY BX922 S2 ホワイトペーパー FUJITSU PRIMERGY サーバパフォーマンスレポート PRIMERGY BX922 S2 本書では PRIMERGY BX922 S2 で実行したベンチマークの概要について説明します PRIMERGY BX922 S2 のパフォーマンスデータを 他の PRIMERGY モデルと比較して説明しています

More information

Microsoft Word - 150604LenovoFileServer (1).docx

Microsoft Word - 150604LenovoFileServer (1).docx Lenovo System x シリーズ ファイルサーバー 移 行 時 の ハードウェア 選 定 のポイント 2015 年 6 月 作 成 1 目 次 1) 本 ガイドの 目 的... 3 2) System x3550 M3 と x3550 M5 の 比 較 ポイント... 3 System x M5 について... 4 CPU コア 数 の 増 加... 4 仮 想 化 支 援 技 術 の 性

More information

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧 SPECint / SPECfp 測定結果一覧 しおり より 測定結果を確認したいモデル名を選択してください 07 年 6 月 8 日更新 分類 モデル名 更新日 前版からの変更 ラックサーバ RX00 S7 (0 年 5 月以降発表モデル ) 0 年 0 月 3 日 RX00 S7 (0 年 6 月発表モデル ) RX00

More information

1. 検証目的 本検証は PowerTerm WebConnect 環境において IVEX Logger が正常に動作し かつ製品仕様通り にログが取得できる事を確認するために実施します 2. 検証環境 本検証を実施するために準備した環境は以下の通りです マシン環境 用途 OS CPU RAM HD

1. 検証目的 本検証は PowerTerm WebConnect 環境において IVEX Logger が正常に動作し かつ製品仕様通り にログが取得できる事を確認するために実施します 2. 検証環境 本検証を実施するために準備した環境は以下の通りです マシン環境 用途 OS CPU RAM HD PowerTerm WebConnect 環境における IVEX Logger 動作検証報告書 アイベクス株式会社 プロダクツ事業部技術部 1. 検証目的 本検証は PowerTerm WebConnect 環境において IVEX Logger が正常に動作し かつ製品仕様通り にログが取得できる事を確認するために実施します 2. 検証環境 本検証を実施するために準備した環境は以下の通りです マシン環境

More information

Version C 1 2 3 4 5 1 2 3 4 5 6 7 8 9 0 A 1 2 1 3 4 5 1 1 2 1 1 1 2 4 5 6 7 8 3 1 2 C a b c d e f g A A B C B a b c d e f g 3 4 4 5 6 7 8 1 2 a b 1 2 a b 1 2 1 2 5 4 1 23 5 6 6 a b 1 2 e c d 3

More information

Microsoft PowerPoint - CAEworkshop_ _01.ver1.3

Microsoft PowerPoint - CAEworkshop_ _01.ver1.3 GPU メニーコアにおける OpenFOAM の高度化支援紹介 第 1 回 CAE ワークショップ 流体 構造解析アプリケーションを中心に 2017 年 12 月 6 日秋葉原 UDX Gallery NEXT 山岸孝輝井上義昭青柳哲雄浅見曉 ( 高度情報科学技術研究機構 ) ver 1.3 1 outline RISTの高度化支援について GPU メニーコアについて OpenFOAMとGPU GPU

More information

はじめに Web アプリケーションの発展と普及の勢いは弱まる兆しがありません 弱まるどころか 加速し続けています これは これまでの ERP CRM Web 2.0 などの Web ベースアプリケーションが提供してきたメリットを考えると 不思議なことではありません Web アプリケーションの爆発的拡

はじめに Web アプリケーションの発展と普及の勢いは弱まる兆しがありません 弱まるどころか 加速し続けています これは これまでの ERP CRM Web 2.0 などの Web ベースアプリケーションが提供してきたメリットを考えると 不思議なことではありません Web アプリケーションの爆発的拡 ncore テクノロジー Web アプリケーションデリバリー性能の飛躍的向上 www.citrix.com はじめに Web アプリケーションの発展と普及の勢いは弱まる兆しがありません 弱まるどころか 加速し続けています これは これまでの ERP CRM Web 2.0 などの Web ベースアプリケーションが提供してきたメリットを考えると 不思議なことではありません Web アプリケーションの爆発的拡大の一方で

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 2 3 Chapter 0 自己紹介 WordPressインテグレーションサービスを提供するプライム ストラテジー株式会社代表取締役 マイコンBASICマガジン時代からプログラミング暦約 30 年です @kengyu_n kengyu.nakamura www.prime-strategy.co.jp 4 5 Chapter 1 本セッションのゴール ( どこまで速くなるか ) どのくらい速くしたいですか?

More information

1.2 パソコンの 内 部 フォームファクタ フォームファクタとは マザーボードの 形 状 のことです フォームファクタによって マザー ボードのサイズや マザーボード 上 のパーツやコネクタやネジ 穴 の 配 置 などが 異 なります そ のため フォームファクタは マザーボードだけなく パソコン

1.2 パソコンの 内 部 フォームファクタ フォームファクタとは マザーボードの 形 状 のことです フォームファクタによって マザー ボードのサイズや マザーボード 上 のパーツやコネクタやネジ 穴 の 配 置 などが 異 なります そ のため フォームファクタは マザーボードだけなく パソコン 第 1 章 パソコンの 基 本 設 定 1.2 パソコンの 内 部 1.2.1 マザーボード マザーボード マザーボードは CPU やメモリなど パソコンの 構 成 要 素 を 実 装 するための 基 盤 です メ インボード と 呼 ばれることもあります 省 略 して M/B と 書 かれることもあります マザーボードには さまざまなパーツを 取 り 付 けるためのスロット ケーブルを 接 続 するため

More information

TopSE並行システム はじめに

TopSE並行システム はじめに はじめに 平成 23 年 9 月 1 日 トップエスイープロジェクト 磯部祥尚 ( 産業技術総合研究所 ) 2 本講座の背景と目標 背景 : マルチコア CPU やクラウドコンピューティング等 並列 / 分散処理環境が身近なものになっている 複数のプロセス ( プログラム ) を同時に実行可能 通信等により複数のプロセスが協調可能 並行システムの構築 並行システム 通信 Proc2 プロセス ( プログラム

More information

2014-11.key

2014-11.key 2014-11 1 2 3 4 5 7 8 9 10 11 12 PC 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 45 46 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68

More information

6 30 2005 10 1 65 2,682 00 21.9 481 1 2,776 21.0 15 1,740 00 5.8 107 13.6 40 2025 24.2-0 - -1 - -2 - -3 - -4 - -5 - -6 - -7 - -8- -9 - - 10 - -11 - - 12 - - 13-10 11 59 4 59 3 10 17 - 14 - - 15 - - 16

More information

「東京こどもネット・ケータイヘルプデスク(こたエール)」平成22年度相談実績の概要

「東京こどもネット・ケータイヘルプデスク(こたエール)」平成22年度相談実績の概要 734, 35% 62, 11% 84, 16% 530, 26% 235, 11% PC) 396, 73% 579, 28% ) (21 ) 2 3 4 5 6 7 8 9 10 11 12 13 200 150 100 22 182 200 150 100 22 50 54 PC 49 52 PC 50 41 14 17 1 1 4 16 3 6 14 180 250 200 150 235

More information

サンプル:OSDL DBT-3によるPostgreSQLの性能評価(SATA HDD&SATA SSD編)

サンプル:OSDL DBT-3によるPostgreSQLの性能評価(SATA HDD&SATA SSD編) ( 第一版 ) OSDL DBT-3 による PostgreSQL の性能評価 (SATA HDD&SATA SSD 編 ) Uptime テクニカルレポート 2012 年 5 月 アップタイム テクノロジーズ合同会社 107-0062 東京都港区南青山 2-11-13 南青山ビル 4F TEL:050-3585-7837 FAX:03-5770-7883 http://www.uptime.jp/

More information

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(5\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\201j.ppt)

(Microsoft PowerPoint - Mirapoint\220\273\225i\221\316\224\344\225\\\(5\203V\203\212\201[\203Y_7\203V\203\212\201[\203Y\201j.ppt) Mirapoint 製品対比表 (5 シリーズ /7 シリーズ ) シーティーシー エスピー株式会社 (C) Copyright 2010 CTCSP Corporation All rights reserved. 1 7-Series ハードウェア 7Series ハードウェアプラットフォーム 新世代 CPU 搭載 : Intel Quad-core Xeon based Nahalem architecture

More information

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧

PRIMERGY 性能情報 SPECint2006 / SPECfp2006 測定結果一覧 SPECint / SPECfp 測定結果一覧 しおり より 測定結果を確認したいモデル名を選択してください 07 年 8 月 30 日更新 分類 モデル名 更新日 前版からの変更 ラックサーバ RX00 S7 (0 年 5 月以降発表モデル ) 0 年 0 月 3 日 RX00 S7 (0 年 6 月発表モデル ) RX00

More information

HP Z200 Intel i5 CPU 3.33GHz Low Profile 仕様 380 LP Assist 2.2 Instinct v3.0 以降 いいえいいえはいいいえ 4GB および 8GB DDR ECC (2 枚構成の DIMM) ISIS へ接続するにはオンボードの

HP Z200 Intel i5 CPU 3.33GHz Low Profile 仕様 380 LP Assist 2.2 Instinct v3.0 以降 いいえいいえはいいいえ 4GB および 8GB DDR ECC (2 枚構成の DIMM) ISIS へ接続するにはオンボードの Composer 6, Symphony 6, NewsCutter 10, Assist 2.5, Instinct 3.5 認定 PC システム システム PC デスクトップ HP Z800 DUal 6- core 2.66GHz (X5650) 3800 5.0.3/9.0.3 はいいいえはいはいはいはい (3 枚構成の DIMM) HP Z800 Dual Quad core 2.93GHz

More information

第一章 本書の概要 ( ア ) はじめにいわゆるサーバ用プロセッサである Xeon と いわゆるデスクトップ用プロセッサである Core i7 の違いを性能の観点からまとめました 性能とは例えば速さなどの数値のことで 機能 ( できること ) の違いについては立ち入りません Xeon の方がなんとな

第一章 本書の概要 ( ア ) はじめにいわゆるサーバ用プロセッサである Xeon と いわゆるデスクトップ用プロセッサである Core i7 の違いを性能の観点からまとめました 性能とは例えば速さなどの数値のことで 機能 ( できること ) の違いについては立ち入りません Xeon の方がなんとな 目次 第一章本書の概要 ( ア ) はじめに ( イ ) 比較早見表 第二章メモリ編 ( ア ) メモリ転送速度 ( 連続アクセス ) ( イ ) メモリレイテンシ ( ランダムアクセス ) ( ウ ) 測定方法 第三章コア編 ( ア ) 1 スレッドあたりの性能 ( イ ) 並列度 1 第一章 本書の概要 ( ア ) はじめにいわゆるサーバ用プロセッサである Xeon と いわゆるデスクトップ用プロセッサである

More information

【添付資料】企業向け「LIFEBOOK」「ESPRIMO」「CELSIUS」の仕様と希望小売価格について

【添付資料】企業向け「LIFEBOOK」「ESPRIMO」「CELSIUS」の仕様と希望小売価格について 添付資料 企業向け ESPRIMO の仕様と希望小売価格について < 新商品の仕様と価格について > 本資料の価格は Windows 7 Professional(32bit) 搭載の標準構成仕様での希望小売価格 ( 税別 ) であり カスタムメイドによる仕様 変更により異なります ( バリューシリーズはオープン価格となります ) Eシリーズ (A4ワイドハイスペック機)

More information

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx 並列計算の概念 ( プロセスとスレッド ) 長岡技術科学大学電気電子情報工学専攻出川智啓 今回の内容 並列計算の分類 並列アーキテクチャ 並列計算機システム 並列処理 プロセスとスレッド スレッド並列化 OpenMP プロセス並列化 MPI 249 CPU の性能の変化 動作クロックを向上させることで性能を向上 http://pc.watch.impress.co.jp/docs/2003/0227/kaigai01.htm

More information

1 2 3 4 5

1 2 3 4 5 28 8 1 2 3 4 5 1 2 3 CPU Xeon E5-2603v4 6C/6T Registered DIMMGB HDD 500GB 3.5 SATA 6Gb/s 7200rpm512 Sector DVD-ROM (700W) 5 8:30 17:30 (5 ) A4 A4 + 2 40 / 40 / 40 / 40 / 6 3 A4 1,200 1,200dpi / 9,600 600dpi

More information

vecrot

vecrot 1. ベクトル ベクトル : 方向を持つ量 ベクトルには 1 方向 2 大きさ ( 長さ ) という 2 つの属性がある ベクトルの例 : 物体の移動速度 移動量電場 磁場の強さ風速力トルクなど 2. ベクトルの表現 2.1 矢印で表現される 矢印の長さ : ベクトルの大きさ 矢印の向き : ベクトルの方向 2.2 2 個の点を用いて表現する 始点 () と終点 () を結ぶ半直線の向き : ベクトルの方向

More information

Microsoft Word - nvsi_090196_r1_vaultdr_offline_rhel_dualpath.doc

Microsoft Word - nvsi_090196_r1_vaultdr_offline_rhel_dualpath.doc Article ID: NVSI-090196JP_R1 Created: 2009/08/17 Revised: 2010/07/9 Multipath 構成の RHEL5.3 での VaultDR Offline 追加復旧手順 1. 概要 Multipath 構成の Red Hat Enterprise Linux 5.3 は OS 内部に LUN 固有の ID を含んでいる場合があります その場合

More information

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10 NVIDIA TESLA V100 CUDA 9 のご紹介 森野慎也, シニアソリューションアーキテクト (GPU-Computing) NVIDIA Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ

More information

2012年度HPCサマーセミナー_多田野.pptx

2012年度HPCサマーセミナー_多田野.pptx ! CCS HPC! I " tadano@cs.tsukuba.ac.jp" " 1 " " " " " " " 2 3 " " Ax = b" " " 4 Ax = b" A = a 11 a 12... a 1n a 21 a 22... a 2n...... a n1 a n2... a nn, x = x 1 x 2. x n, b = b 1 b 2. b n " " 5 Gauss LU

More information

る連続なアクセスができるなどの利点がある. 倍々精度浮動小数は, 符号部 1 bit, 指数部 11 bit, 仮数部 14 (52 2) bit からなる. これは符号部 1bit, 指数部 15 bit, 仮数部 112 bit からなる IEEE754 準拠の 4 倍精度と比 べて指数部が 4

る連続なアクセスができるなどの利点がある. 倍々精度浮動小数は, 符号部 1 bit, 指数部 11 bit, 仮数部 14 (52 2) bit からなる. これは符号部 1bit, 指数部 15 bit, 仮数部 112 bit からなる IEEE754 準拠の 4 倍精度と比 べて指数部が 4 AVX2 を用いた倍々精度反復解法の高速化 1 菱沼利彰 1 藤井昭宏 1 田中輝雄 2 長谷川秀彦 大規模数値シミュレーションの核である Krylov 部分空間法は, 丸め誤差により収束に影響を受ける. 高精度演算を用いれば収束を改善できるが, 計算時間が多くかかる. 我々はこれまで,SIMD 拡張命令 AVX を用いて, 高精度演算の 1 つである倍々精度演算を高速化してきた. その成果として,AVX2

More information

ソフトウェア基礎技術研修

ソフトウェア基礎技術研修 マルチサイクルを用いた実現方式 ( 教科書 5. 節 ) マルチサイクル方式 () 2 つのデータパス実現方式 単一クロックサイクル : 命令を クロックサイクルで処理 マルチクロックサイクル : 命令を複数クロックサイクルで処理 単一クロックサイクル方式は処理効率が悪い. CLK 処理時間 命令命令命令命令命令 時間のかかる命令にクロック サイクル時間をあわさなければならない. 余り時間の発生 クロック

More information

スライド 1

スライド 1 Femtet 2013 新 機 能 / 変 更 点 のご 紹 介 トピックス 機 能 解 析 機 能 概 要 応 力 解 析 : 疲 労 寿 命 評 価 オプション 応 力 解 析 : 座 屈 解 析 機 能 の 追 加 応 力 解 析 : 簡 易 接 触 に 剥 離 を 考 慮 した 解 析 機 能 電 磁 波 解 析 : 平 面 波 入 力 機 能 電 磁 波 解 析 : 高 速 化 電 磁 波

More information

構成例 システム名 : 単独サーバ業務システムユーザ数 : 1 ユーザ マルチコア CPU のサーバ 1 台で開発 運用します ソート機能を使用します COBOL SE Developer COBOL SE Server Runtime SORTKIT/Enterprise for Windows

構成例 システム名 : 単独サーバ業務システムユーザ数 : 1 ユーザ マルチコア CPU のサーバ 1 台で開発 運用します ソート機能を使用します COBOL SE Developer COBOL SE Server Runtime SORTKIT/Enterprise for Windows COBOL Standard Edition V2 COBOL Standard Edition V2 は以下のソフトウェアによって構成されています COBOL Standard Edition Developer V2.0 COBOL コンパイラ 開発環境 ランタイム (COBOL GUI COBOL WEB COBOL SQL アクセスのランタイム含む ) ( 評価用 ) 一式 COBOL Standard

More information

ガイダンス(2016年4月19日)-HP

ガイダンス(2016年4月19日)-HP スパコンプログラミング(), (I) ガイダンス 東 京 大 学 情 報 基 盤 センター 准 教 授 塙 敏 博 206 年 4 月 9 日 ( 火 )0:25-2:0 206/4/9 スパコンプログラミング (), (I) 2 ガイダンスの 流 れ. 講 義 の 目 的 2. 講 師 紹 介 3. 講 義 日 程 の 確 認 4. 成 績 の 評 価 方 法 5. 計 算 機 利 用 申 請 6.

More information

(Microsoft Word - WhitePaper_EvaluationAvanceNVBU__rev2_\203t\203H\201[\203\200\211\374\222\371\224\305_.doc)

(Microsoft Word - WhitePaper_EvaluationAvanceNVBU__rev2_\203t\203H\201[\203\200\211\374\222\371\224\305_.doc) Smart Service ホワイトペーパー Avance 環境における NetVault Backup 基本バックアップバックアップ動作検証 2010 年 10 月 シーティーシー エスピー株式会社事業本部 SZO 推進チーム Copyright 2010 CTCSP Corporation All Rights Reserved. 1 / 10 検証の目的 Avance は, 仮想化技術により

More information

1 2 3 1 4 1 5 6 7 8 9 2 10 11 12 13 2 14 15 16 17 3 18 19 20 3 21 22 23 4 24 25 4 26 27 5 28 29 5 30 31 6 32 33 34 資料 2 35 資料 3 36 37 6 38 39 40 7 41 42 43 7 44 45 46 47 48 8 49 50 51 52 8 53 54 55 9 56

More information

スライド 1

スライド 1 計算科学演習 スーパーコンピュータ & 並列計算 概論 学術情報メディアセンター 情報学研究科 システム科学専攻 中島浩 目次 科目概要 目標 スケジュール スタッフ 講義資料 課題 スーパーコンピュータ概論 一般のスーパーコンピュータ 京大のスーパーコンピュータ スーパーコンピュータの構造 並列計算概論 並列計算の類型 条件 Scaling & Scalability 問題分割 落し穴 プロセス並列

More information

インストーラー 管理番号 内容 対象バージョン 230 HULFT がすでにインストールされているパスに対してサイレントインストールを実行すると インストールされていた HULFT の動作環境が不正な状態になる 7.3.0~7.3.1 ユーティリティ 管理番号 内容 対象バージョン 231 管理情報

インストーラー 管理番号 内容 対象バージョン 230 HULFT がすでにインストールされているパスに対してサイレントインストールを実行すると インストールされていた HULFT の動作環境が不正な状態になる 7.3.0~7.3.1 ユーティリティ 管理番号 内容 対象バージョン 231 管理情報 リビジョンアップ詳細情報 < 製品一覧 > 製品名 バージョン HULFT7 for Windows-EX 7.3.2 HULFT7 for Windows-ENT 7.3.2 HULFT7 for Windows-M 7.3.2 HULFT7 for Windows-L 7.3.2 < 改善一覧 > HULFT 管理番号 内容 対象バージョン説明書参照章 79 履歴削除処理に関する改善 7.0.0~7.3.1-148

More information

Microsoft PowerPoint - ICD-ARCパネル

Microsoft PowerPoint - ICD-ARCパネル ICD-ARC 共 催 研 究 会 パネル 討 論 新 時 代 におけるマルチコア 戦 略 ( 株 ) 東 芝 セミコンダクター 社 2008 年 5 月 13 日 斎 藤 光 男 プロセッサ 周 波 数 の 年 代 別 の 伸 び 10000 CISCプロセッサの 時 代 アウトオブオーダーの 導 入 3.2GHz P4 3.0GHz P4 3.8GHz P4 3.4GHz 3.6GHz P4 P4

More information

Microsoft Word - qpeigen_manual_jp-1.0.doc

Microsoft Word - qpeigen_manual_jp-1.0.doc 4 倍精度固有値計算ライブラリ QPEigen Ver.1.0 ユーザーズマニュアル 2015 年 2 月独立行政法人日本原子力研究開発機構 目次 1 概説... 3 2 行列対角化について... 2 3 4 倍精度化アルゴリズムについて... 2 4 参考文献... 3 5 ディレクトリ構成... 3 6 必要なソフトウェア... 3 7 インストール方法... 4 8 検証用 性能評価用プログラム...

More information