<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

Similar documents
システムソリューションのご紹介

untitled

並列・高速化を実現するための 高速化サービスの概要と事例紹介

untitled

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

(速報) Xeon E 系モデル 新プロセッサ性能について

スライド 1

超音波とは ( 固体 気体中を伝搬する可聴域より高周波の波 ) 超音波デバイス 超音波検査 計測 超音波診断 治療 大腿骨 ヒト大腿部シミュレーション 周波数 :1GHz 100kHz~10MHz 100kHz~10MHz 波長 : 1µm 1mm 10mm 超音波接合 洗浄 可聴域 地震波 1.4

PowerPoint プレゼンテーション

EnSightのご紹介

1 GPU GPGPU GPU CPU 2 GPU 2007 NVIDIA GPGPU CUDA[3] GPGPU CUDA GPGPU CUDA GPGPU GPU GPU GPU Graphics Processing Unit LSI LSI CPU ( ) DRAM GPU LSI GPU

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

PowerPoint プレゼンテーション

本日の説明内容本日の説明内容本日の説明内容本日の説明内容 超音波ソフトウェア 超音波ソフトウェア 超音波ソフトウェア 超音波ソフトウェア ComWAVE ComWAVE ComWAVE ComWAVE 概要紹介概要紹介概要紹介概要紹介 車両用超音波センサ 車両用超音波センサ 車両用超音波センサ 車両

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

VXPRO R1400® ご提案資料

Microsoft Word - HOKUSAI_system_overview_ja.docx

平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には,

PowerPoint プレゼンテーション

CELSIUSカタログ(2012年7月版)

CELSIUSカタログ(2012年5月版)

HP Workstation 総合カタログ

名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL アライアンスパートナー コアテクノロジーパートナー NVIDIA JAPAN ソリュ

27_02.indd

Z8 G4 WorkstationでのANSYS19.1 Mechanical ベンチマーク結果紹介資料(フル版)

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

untitled

GPU n Graphics Processing Unit CG CAD

supercomputer2010.ppt

次 CAE を取り巻く環境と展望 企業がシミュレーションに抱える痛み :3 つの例 クラウド CAE サービス Cistr Cistr のシステム概要 最新版 Cistr でできること Cistr を利 してみる 2

CCS HPCサマーセミナー 並列数値計算アルゴリズム

HPC (pay-as-you-go) HPC Web 2

HP xw9400 Workstation

チューニング講習会 初級編

PowerPoint プレゼンテーション

Presentation Title Arial 28pt Bold Agilent Blue

HP_PPT_Standard_16x9_JP

untitled

Microsoft PowerPoint - GPGPU実践基礎工学(web).pptx

Microsoft Word - Dolphin Expressによる10Gbpソケット通信.docx

Slide 1

インテル アーキテクチャプラットフォーム リーダーシップ 2000 年 12 月 21 日 第 14 回数値流体力学シンポジウム インテル株式会社 ia 技術本部本部長坂野勝美


GPUコンピューティング講習会パート1

Microsoft Word _00_導入編.doc

hpc141_shirahata.pdf

Microsoft PowerPoint - ADS2009_SI._Intro_U.ppt

九州大学がスーパーコンピュータ「高性能アプリケーションサーバシステム」の本格稼働を開始

Microsoft Word - koubo-H26.doc

TopSE並行システム はじめに

HP High Performance Computing(HPC)

マルチコアPCクラスタ環境におけるBDD法のハイブリッド並列実装

HP Workstation Xeon 5600

H1-4

Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10

本文ALL.indd

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

PowerPoint プレゼンテーション

EGunGPU

単位、情報量、デジタルデータ、CPUと高速化 ~ICT用語集~

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

lll

GPUコンピューティング講習会パート1

Microsoft PowerPoint - EMPro_ADS_co_design_draft.ppt [互換モード]

PowerPoint プレゼンテーション

GPGPU

GPGPUクラスタの性能評価

スライド 1

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

増設メモリ (2006/11/20)

卒業研究報告

スライド 1

本日話す内容

10D16.dvi

PowerPoint プレゼンテーション

[4] ACP (Advanced Communication Primitives) [1] ACP ACP [2] ACP Tofu UDP [3] HPC InfiniBand InfiniBand ACP 2 ACP, 3 InfiniBand ACP 4 5 ACP 2. ACP ACP

Microsoft PowerPoint - 11Web.pptx

円筒面で利用可能なARマーカ

HP Workstation 総合カタログ

クラウド基盤向けに処理性能や拡張性を強化した「HA8000シリーズ」の2プロセッサーサーバを販売開始

<4D F736F F D20332E322E332E819C97AC91CC89F090CD82A982E78CA982E9466F E393082CC8D5C91A291CC90AB945C955D89BF5F8D8296D85F F8D F5F E646F63>

国土技術政策総合研究所 研究資料

GPUを用いたN体計算

富士通セミコンダクタープレスリリース 2009/05/19

平成19年度・地球工学研究所の知的財産に関する報告会 - 資料集

Microsoft Word _00_導入編.doc

07-二村幸孝・出口大輔.indd


<4D F736F F F696E74202D F A282BD94BD959C89F A4C E682528D652E707074>

スライド タイトルなし

ITC_H1H4,H2H3_080728_last.indd

GPGPU によるアクセラレーション環境について

about MPI

スライド 1

Microsoft PowerPoint - GPU_computing_2013_01.pptx

PowerPoint プレゼンテーション

熊本大学学術リポジトリ Kumamoto University Repositor Title GPGPU による高速演算について Author(s) 榎本, 昌一 Citation Issue date Type URL Presentation

Transcription:

Web キャンパス資料 超音波シミュレーションの基礎 ~ 第 4 回 ComWAVEによる超高速超音波解析 ~ 科学システム開発部 Copyright (c)2006 ITOCHU Techno-Solutions Corporation

本日の説明内容 ComWAVEの概要および特徴 GPGPUとは GPGPUによる解析事例 CAE POWER 超音波研究会開催 (10 月 3 日 ) のご紹介

超音波シミュレーションソフト ComWAVE TM ComWAVEは 超音波の見える化により 製品 設備 各種構造物の超音波検査 計測の最適化 各種超音波装置の設計 超音波計測ノイズの評価など 様々な超音波現象を評価できます

ComWAVE の特徴 1. 有限要素法を採用し 超音波伝搬現象を忠実に再現 2. 異方性 不均質性材料を忠実にモデル化 3. 数十億要素の大規模問題への対応によりフル3D 超音波解析を実現 4.AスコープおよびBスコープ表示機能により 実験結果と容易に比較可能 5. 拡張リスタート機能 6. プローブ遅延時間自動計算機能 7. レイリー減衰機能 8. プローブテンプレート機能により 複雑なフェーズドアレイプローブ等を容易に作成 9. モデル作成 表示機能 10.GPGPU による超高速計算に対応

ComWAVE の並列化効果 (CPU コアを使用した場合 ) 何れも 5,000 ステップ ( メッシュサイズ 0.065mm の時 鋼中伝播で約 45μs) の計算に必要な時間 (h) の概算値 (CPU: Pentium Xeon 3.0GHz (64bit) を使用 ) 処理要素数と並列化数の計算時間 (h) との関係 ( 注 1) 処理要素数 ( 必要メモリ ) ( 解析対象空間 : 波長 λを基準 ( 注 2)) 500 万 (350MB) (8.5λx8.5λx8.5λ) 2000 万 (1.4GB) (13.6λx13.6λx13.6λ) 5000 万 (3.5GB) (18.4λx 18.4λx 18.4λ) 1 億 (7.0GB) (23.2λx 23.2λx 23.2λ) 5 億 (35GB) (39.7λx 39.7λx 39.7λ) 10 億 (70GB) (50λx 50λx 50λ) 20 億 (140GB) (63λx 63λx 63λ) 1CPU コア 処理 CPU 数と計算時間 (h) 4CPU コア 8CPU コア 16CPU コア 32CPU コア 1CPU 4CPU 8CPU 16CPU 32CPU 1.065 0.3 0.2 0.135 0.1 4.26 1.2 0.8 0.54 0.4 10.65 3 2 1.35 1 21.3 6 4 2.7 2-30 20 13.5 10-60 40 27 20 - - 80 54 40 注 1) 一般的に計算時間は計算機環境に大きく依存するため 計算時間は目安として参照ください 注 2)1 波長あたり 20 要素で分割した際の解析対象空間を概算しています 並列化高速計算技術 汎用 FEM ComWAVE 必要メモリ 120GB/1 億要素 6GB/1 億要素 相対 CPU 時間 約 10 倍 1

ComWAVE GPGPU 版について マルチ GPU 対応 GPGPU(General Purpose GPU) とは? GPU(Graphics Processing Unit) を画像処理以外の汎用的な用途で利用 数百規模の演算コアを持つ CAE の分野に浸透しつつある NVIDIA Tesla c2050( メモリ 3GB): 約 5 千万要素の計算が可能 NVIDIA Tesla c2075( メモリ 6GB): CPU (Xeon W5590) GPGPU (Tesla C2075) 約 1 億要素の計算が可能 CPU vs GPU 性能比較 Floating Point Performance Memory Bandwidth 53.3 GFLOPS 32 GB/s 1030 GFLOPS 144 GB/s GPGPU の特長 CPUと比較して 演算性能が高い (10 倍 ) CPU と比較して メモリ プロセッサ間のデータ転送効率 ( メモリバンド幅 ) が高い (5 倍 ) GPGPU の利用により 計算時間の大幅な短縮が可能 またマルチ GPU により大規模計算も可能 これまで計算不可能であった問題も計算できる可能性が出てきた

GPGPU 版 (2 次元溶接部モデルの計算例 ) - 全要素数 : 493,868 要素 - 時間ステップ数 : 4,808 (20us) - 使用メモリ : 30 MB Displacement 3 2 1 0-1 -2 driving wave 5MHz -3 0 1 2 Time (μsec) 10 mm 36 mm

GPGPU 版 (2 次元溶接部モデルの計算例 ) - 全要素数 : 493,868 要素 - 時間ステップ数 : 4,808 (20us) - 使用メモリ : 30 MB 計算時間 [sec] 相対速度比 [1/core] CPU single 1,411 1 Tesla c2050 single 212 6.7

GPGPU 版 (2 次元溶接部と不均質材混合モデルの計算例 ) - 全要素数 : 493,868 要素 - 時間ステップ数 : 4,808 (20us) - 使用メモリ : 30 MB Displacement 3 2 1 0-1 -2 driving wave 5MHz -3 0 1 2 Time (μsec) 10 mm 36 mm

GPGPU 版 (2 次元溶接部と不均質材混合モデルの計算例 ) - 全要素数 : 493,868 要素 - 時間ステップ数 : 4,808 (20us) - 使用メモリ : 30 MB 計算時間 [sec] 相対速度比 [1/core] CPU single 4,557 1 Tesla c2050 single 225 20

GPGPU 版 (3 次元ステンレス鋼溶接部モデルの計算例 ) φ3.0 Displacement 3 2 1 0-1 -2 driving wave 5MHz -3 0 1 2 Time (μsec) 20mm - 全要素数 : 4,700 万要素 - 時間ステップ数 : 1,800 (10us) 10mm - 使用メモリ : 2.8GB

GPGPU 版 (3 次元ステンレス鋼溶接部モデルの計算例 ) 計算時間 [sec] 相対速度比 [1/core] CPU single 141,765 1 Tesla c2050 single 3,130 45 Tesla c2050 x 2 1,628 87

GPGPU による十億要素規模の計算例 GPGPUによるマトリクスアレイを用いたステンレス鋼溶接部横波探傷解析例 940,710,330 要素 (55μmメッシュ) 6,477 steps(50μs) 3x8の送受信分離型マトリクスアレイ探傷周波数 :2MHz( 横波入射角度 60 度 ) 計算時間 [hours] 相対速度比 [1/10cores] 10 CPU コア 103.5 1 Tesla c2075 10 枚 受信側断面 9.8 10.6 25mm 楕円き裂 : 長さ 20mm, 深さ 3mm 42mm 送信側断面

GPGPU による十億要素規模の B スコープ計算例 セクタスキャン +10-10 2 度毎に解析を 10 ケース実施 ( 展開角 20 度 ) 10 CPUコア 10ケース Tesla c2075 10 枚 10ケース 計算時間 [hours] 相対速度比 [1/10cores] 1,035 1 98 10.6

GPGPU 版 ( 超音波ワイヤーボンディングの計算例 ) 11.2mm 全要素数 :208,435,744 ステップ数 :18,473 (25μs) 要素大きさ :10μs 入力周波数 :100kHz, 振幅 10μm 金線 φ30μm 3mm 15.5mm 金線先端とチップとの接触を考慮 先端部半透明表示

GPGPU 版 ( 超音波ワイヤーボンディングの計算例 )

GPGPU 版 ( 超音波ワイヤーボンディングの計算例 ) 下図は 14μs での変形図 ( 変位 :30 倍に拡大 青 ~ 赤は 0~30μm) 計算時間 [hours] 相対速度比 [1/4cores] 4 CPU コア 73.5 1 Tesla c2075 4 枚 10.5 7 ボンディングシミュレーションのメリット 有限要素法の大規模解析により ホーン全体と 数 μmの金線とチップの接触による相互作用を同時に計算可能 ボンディング装置形状の違いばかりでなくチップ形状や接合部位 チップ固定場所の違いによる接触状況を詳細に解析することが可能 これにより最適な接合条件等の評価をシミュレーションにより確認することが可能

まとめ GPGPU を利用することで, 超音波シミュレーションを 10 倍から 80 倍もの速度で実施できることを示しました この 数十倍におよぶ高速化は 単に計算できるということにとどまらず 今まで時間的に不可能であった多数のパラメーターサーベイ計算による最適設計や3 次元モデルによる画像化 (B Cスコープ ) 解析を可能にするなど シミュレーシションの可能性を大きく広げるものです

超音波研究会 開催のお知らせ CAE POWER 2012 内で同時開催 超音波研究会 ( プロダクトセッション内で開催 ) 開催日 :10 月 3 日 ( 水 ) 場所 : 目黒雅叙園予定講演 : 富山大学様 IHI 様 川崎重工業様 首都大学東京様 東京大学様 WAI 社他 テーマセッション内では 元日本航空専門学校谷村様のご講演もございます 特設サイト :http://www.e-uketsuke.jp/caepower2012/ アンケート内に申込み URL を掲載