研究成果報告書

Similar documents
ホログラフィ ビームスプリッタ レーザ光 ミラー レーザ光 記録物体 ミラー 再生像 写真乾版 ホログラム 物体光 物体光 参照光 ミラー 再生光 ミラー ホログラムへの記録 ホログラムの再生 光の干渉を利用 光の回折を利用 2

<4D F736F F F696E74202D2091E63489F15F436F6D C982E682E992B48D8291AC92B489B F090CD2888F38DFC E B8CDD8

GPGPU

空間光変調器を用いた擬似振幅変調ホログラムによる光の空間モード変換 1. 研究目的 宮本研究室北谷拓磨 本研究は 中心に近づく程回折効率が小さくなるホログラムを作製し 空間光変調器 (spatial light modulator SLM) を用いて 1 次のラゲールガウスビーム (LG ビーム )

1 Table 1: Identification by color of voxel Voxel Mode of expression Nothing Other 1 Orange 2 Blue 3 Yellow 4 SSL Humanoid SSL-Vision 3 3 [, 21] 8 325

main.dvi

23 Fig. 2: hwmodulev2 3. Reconfigurable HPC 3.1 hw/sw hw/sw hw/sw FPGA PC FPGA PC FPGA HPC FPGA FPGA hw/sw hw/sw hw- Module FPGA hwmodule hw/sw FPGA h

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

EGunGPU


EnSightのご紹介

CELSIUSカタログ(2012年7月版)

GPU GPU CPU CPU CPU GPU GPU N N CPU ( ) 1 GPU CPU GPU 2D 3D CPU GPU GPU GPGPU GPGPU 2 nvidia GPU CUDA 3 GPU 3.1 GPU Core 1

Microsoft PowerPoint - machida0206

インターリーブADCでのタイミングスキュー影響のデジタル補正技術

Microsoft PowerPoint - GPU_computing_2013_01.pptx

粒子画像流速測定法を用いた室内流速測定法に関する研究

BRXL-14シリーズの仕様

CELSIUSカタログ(2012年5月版)

FIT2013( 第 12 回情報科学技術フォーラム ) I-032 Acceleration of Adaptive Bilateral Filter base on Spatial Decomposition and Symmetry of Weights 1. Taiki Makishi Ch


untitled

07-二村幸孝・出口大輔.indd

CMOS リニアイメージセンサ用駆動回路 C CMOS リニアイメージセンサ S 等用 C は当社製 CMOSリニアイメージセンサ S 等用に開発された駆動回路です USB 2.0インターフェースを用いて C と PCを接続

Mirror Grand Laser Prism Half Wave Plate Femtosecond Laser 150 fs, λ=775 nm Mirror Mechanical Shutter Apperture Focusing Lens Substances Linear Stage

hpc141_shirahata.pdf

Microsoft PowerPoint - 山形大高野send ppt [互換モード]

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

SUALAB INTRODUCTION SUALAB Solution SUALAB は 人工知能 ( ディープラーニング ) による画像解析技術を通して 迅速 正確 そして使いやすいマシンビジョン用のディープラーニングソフトウェアライブラリーである SuaKIT を提供します これは 従来のマシン

リソース制約下における組込みソフトウェアの性能検証および最適化方法

研究成果報告書

2. CABAC CABAC CABAC 1 1 CABAC Figure 1 Overview of CABAC 2 DCT 2 0/ /1 CABAC [3] 3. 2 値化部 コンテキスト計算部 2 値算術符号化部 CABAC CABAC

CADdoctor 製品構成 / 動作環境 製品バージョン : Ver 発行日 : 2019/7/26 製品構成 CADdoctor は 標準パッケージと追加オプションで構成されます 標準パッケージ (IGES 入出力 STL 出力 ) に入出力オプションを追加することにより 高精度の

スライド 1

PowerPoint Presentation

PowerPoint プレゼンテーション

Coding theorems for correlated sources with cooperative information

テクニカルガイド 増設メモリ

Pick-up プロダクツ プリズム分光方式ラインセンサカメラ用専用レンズとその応用 株式会社ブルービジョン 当社は プリズムを使用した 3CMOS/3CCD/4CMOS/4CCD ラインセンサカメラ用に最適設計した FA 用レンズを設計 製造する専門メーカである 当社のレンズシリーズはプリズムにて

増設メモリ 1. 機能仕様 型番 製品名 備考 N GB 増設メモリボード DDR3-1333(PC ) SDRAM, Unbuffered N GB 増設メモリボード DDR3-1333(PC ) SDRAM, Unbuffered N8

untitled

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

Slide 1

Coding theorems for correlated sources with cooperative information

PowerPoint プレゼンテーション

増設メモリ 1. 機能仕様 型番製品名備考 N GB 増設メモリボード (2x 4 GB/U) DDR3L-1333(PC3L-10600) SDRAM ECC 付 Registered, 2GBx2 枚の N GB 増設メモリボード DDR3L-1600(PC3

Microsoft PowerPoint - GPUシンポジウム _d公開版.ppt [互換モード]

PowerPoint プレゼンテーション

研究報告用MS-Wordテンプレートファイル

電気的特性 (Ta=25 C) 項目 記号 条件 Min. Typ. Max. 単位 読み出し周波数 * 3 fop khz ラインレート * Hz 変換ゲイン Gc ゲイン =2-5 - e-/adu トリガ出力電圧 Highレベル Vdd V -

線形システム応答 Linear System response

スライド 1

4 倍精度基本線形代数ルーチン群 QPBLAS の紹介 [index] 1. Introduction 2. Double-double algorithm 3. QPBLAS 4. QPBLAS-GPU 5. Summary 佐々成正 1, 山田進 1, 町田昌彦 1, 今村俊幸 2, 奥田洋司

システムソリューションのご紹介

CLEFIA_ISEC発表

Agenda GRAPE-MPの紹介と性能評価 GRAPE-MPの概要 OpenCLによる四倍精度演算 (preliminary) 4倍精度演算用SIM 加速ボード 6 processor elem with 128 bit logic Peak: 1.2Gflops

ボルツマンマシンの高速化

Coding theorems for correlated sources with cooperative information


LSM5Pascal Ver 3.2 GFP 4D Image VisArt Carl Zeiss Co.,Ltd.

液相レーザーアブレーションによるナノ粒子生成過程の基礎研究及び新規材料創成への応用 北海道大学大学院工学工学院量子理工学専攻プラズマ応用工学研究室修士 2年竹内将人

ここまで進化した! 外観検査システムの今 表 2 2 焦点ラインスキャンカメラ製品仕様 項目 仕 様 ラインセンサ 4K ラインセンサ 2 光学系 ビームスプリッター (F2.8) ピクセルサイズ 7μm 7μm, 4096 pixels 波長帯域 400nm ~ 900nm 感度 可視光 : 量子

テクニカルガイド 増設メモリ


ADC121S Bit, ksps, Diff Input, Micro Pwr Sampling ADC (jp)

Release Note for Media File Player v1.6.5 (Japanese)

H1-4

2012 M

System Requirements for Geomagic

it-ken_open.key

AW-SF200 導入手順書

1 Visible spectroscopy for student Spectrometer and optical spectrum phys/ishikawa/class/index.html

[1] [2] [3] (RTT) 2. Android OS Android OS Google OS 69.7% [4] 1 Android Linux [5] Linux OS Android Runtime Dalvik Dalvik UI Application(Home,T

160311_icm2015-muramatsu-v2.pptx

CPU Levels in the memory hierarchy Level 1 Level 2... Increasing distance from the CPU in access time Level n Size of the memory at each level 1: 2.2

LD

BR-H1016シリーズの仕様

de:code 2019 CM04 Azure Kinect DK 徹底解説 ~ 進化したテクノロジーとその実装 ~ 技術統括室 千葉慎二 Ph.D.

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

Microsoft Word - 卒業論文.doc

並列・高速化を実現するための 高速化サービスの概要と事例紹介

A Study of Adaptive Array Implimentation for mobile comunication in cellular system GD133

Microsoft Word ●IntelクアッドコアCPUでのベンチマーク_吉岡_ _更新__ doc

Microsoft Word - Dolphin Expressによる10Gbpソケット通信.docx

Microsoft Word - Vista搭載LDT_LNB .doc

円筒面で利用可能なARマーカ

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015


空気の屈折率変調を光学的に検出する超指向性マイクロホン

平成 22 年度 革新的な三次元映像技術による超臨場感コミュニケーション技術研究開発 の開発成果について 1. 施策の目標 人体を収容できる大きさの 3 次元音響空間についてリアルタイムに音響レンダリングできるシステム ( シリコンコンサートホール ) を 2013 年までに開発する 具体的には,

まま送信する電気 OSDM-PON ( 図 2 (a)) から検討を始める. つづいて, 光信号を伝送する本来の光 OSDM-PON ( 図 2 (b)) の実現性の検討を行う. 本研究では, 検討の第 1 歩として, 次の条件でシミュレーションにより検討を行う. (1) 各ユーザ速度を 1 Gbp

untitled

ヘテロジニアス型事象再構成アルゴリズムの開発_矢野_修正版

す 局所領域 ωk において 線形変換に用いる係数 (ak 画素の係数 (ak bk ) を算出し 入力画像の信号成分を bk ) は次式のコスト関数 E を最小化するように最適化 有さない画素に対して 式 (2) より画素値を算出する される これにより 低解像度な画像から補間によるアップサ E(

N08

PowerPoint プレゼンテーション

マルチコアPCクラスタ環境におけるBDD法のハイブリッド並列実装

Transcription:

様式 C-19 F-19 Z-19( 共通 ) 1. 研究開始当初の背景ホログラフィックメモリは 2 次元ページデータを一括に処理するため, 他の光記録技術に比べデータ転送速度の面で優位にあり, 次世代光記録の本命技術として注目されている. 現在のところ, 大容量化では多重記録により 1TB/inch 2 の記録密度を達成した例が報告されている. しかしながら, この記録密度は,1 ディスク当たり 500TB~1PB といわれるホログラフィック記録の理論記録密度限界には程遠い. これは, 新たな記録再生方式の開発により, ホログラフィックメモリは更なる記録密度向上の可能性を秘めていることを意味しており, 理論記録密度限界に近づけるべく新たな記録再生方式が継続的に提案されている. 新たな記録再生方式の解析的評価には, 電子的な信号処理から光による記録再生までの全過程を含めたメモリシステムの全動作シミュレーションが必須である. 我々は, GPU による汎用計算 (GPGPU) を用いたホログラフィックメモリの高速全動作シミュレータ ( 図 1) を世界に先駆けて開発し, 大型計算機を用いずに PC1 台で高速計算を可能にしている. Input data Binary data 2D data page Mirror convert Holographic medium SLM Reference Beam splitter Signal 10101010000 111011010100 01110101000 101001000 fringe pattern 2D page data encoding Calculation by GPU Computing with NVIDIA CUDA Technology 2D data page Analysis with 3D FFT-BPM decoding Binary data 10101010000 111011010100 01110101000 101001000 Holographic Readout medium Reading このシミュレータの中核である, 体積ホログラムの 3 次元数値解析手法として, 高速フーリエ変換ビーム伝搬法 (FFT-BPM) を用いている. この手法は, 有限差分時間領域 (FDTD) 法に比べて計算精度は落ちるものの, 計算時間とメモリを大幅に減らすことができるため,FDTD 法では不可能であった実際の記録メディアと同じ厚さ (100~1000 m) の計算を PC で実行することが可能となり, より現実的な条件下でシミュレーションを実行することが可能となった. しかしながら, 大きな解析領域で計算が可能になれば, 必然的に計算時間は増大するため, 計算時間短縮 Mirror convert Image sensor Output data 図 1 GPGPU を用いたホログラフィックメモリの高速全動作シミュレータ のためには更なる高速化を行うことが必要である. 2. 研究の目的本研究では, 低消費電力で廉価な計算環境下でも高速に実行可能な, ホログラフィックメモリの全動作シミュレータの性能向上を目的とし, シミュレータの更なる高速化とシミュレータによる解析結果の妥当性を実験結果との比較により評価する. 具体的には, (1) シミュレータの解析エンジンを改良し,2 つの GPU ユニットを用いた並列実行により全動作シミュレータの計算時間を更に短縮すること (2) 同一条件下でのシミュレータの解析結果と実験結果との比較を行い, 全動作シミュレータによる計算結果の妥当性について評価することを目的とする. 3. 研究の方法 (1) 2 つの GPU ユニットを用いた並列実行による全動作シミュレータの計算時間の短縮 図 2 に光学的記録過程の計算手順を示す. 伝搬方向 (z 方向 ) の微小ステップ (dz) ごとに実行される FFT-BPM による記録媒質内の光波伝搬計算と, 光波の空間分布に応じた記録媒質の屈折率変調の計算は, 共に GPU を利用している. これまでの計算プロセス ( 図 2 (a) ) では, 光波伝搬計算, 屈折率変調の計算と順次行い, 次の微小ステップの計算に進むが, 次の微小ステップの光波伝搬計算では,1 つ前の微小ステップで計算した屈折率変調の値は利用しない. そこで, 光学的記録過程における記録媒質内の光波伝搬と, それに伴う屈折率変調の更新の計算は並列的に実行可能であることに着目し, 図 2(b) に示されるような,2 つの GPU ユニットを用いた並列実行による光学的記録過程の計算時間の短縮を試みる. 2 つの GPU ユニットを用いた並列実行による光学的記録過程の計算時間を評価するため, 図 3 に示すような透過型コリニアホログラフィックメモリの光学系を仮定し,1 ページデータの記録過程を計算するのに要する時間を測定する. 試行回数は 3 回とし, その平均時間を記録する. 高速化率は, フリーの高速フーリエ変換ライブラリである FFTW を用いて CPU のみで計算を実行した場合の計算時間を基準とする.GPU を用いた計算では, GPU ボードとして GPU ユニットを 2 つ有する NVIDIA 社の GeForce GTX 590 を用い, CUDA のツールキットに含まれる FFTW とよく似たライブラリ構成の CUFFT という高速フーリエ変換ライブラリを使用する. また, 2 つの GPU ユニットを並列的に動作させるために OpenMP を導入し,2 つの CPU コアを個々の GPU ユニット制御に割り当てて並列計算を実行する. 計算に使用した PC の仕様

を表 1 に示す. 光学的記録過程計算開始 ループ開始 (L: 媒質厚さ ) z = 0, dz, 2dz,, L データ読み込み光波分布 A xy (z) 屈折率分布 n xy (z) 光波伝搬計算 (FFT-BPM) A xy (z), n xy (z) A xy (z+dz) 屈折率変調計算 A xy (z), n xy (z) n xy (z) ループ終了 光学的記録過程計算終了 データ書き出し光波分布 A xy (z+dz) データ書き出し屈折率分布 n xy (z) (a) 1 つの GPU ユニットを用いた計算手順 光学的記録過程計算開始 ループ開始 (L: 媒質厚さ ) z = 0, dz, 2dz,, L データ読み込み光波分布 A xy (z), 屈折率分布 n xy (z) GPU_2 表 1 計算速度の評価に用いた PC の仕様 Operating System CPU Main Memory Windows 7 Professional (64bit) Intel Core i7 3820 (Clock freq. : 3.6GHz) 64GB (PC3-12800) GPU NVIDIA GeForce GTX 590 CUDA Version 4.2 Coding Software Microsoft Visual Studio 2008 Professional (2) シミュレータの解析結果と実験結果との比較による全動作シミュレータの性能評価 透過型コリニア光学系におけるシフト選択特性について, 解析結果と実験結果を比較し, 全動作シミュレータの性能を評価する. 実験光学系を図 4 に示す. 光源として波長 633nm のヘリウムネオンレーザを, 記録材料として厚さ 16 m のフォトポリマー (Litiholo 社製 C-RT20) を用いて, 図 5 に示されるようなランダムドットのリング型参照光を用いた時のシフト選択特性を測定する. 記録時には図 5(a) の画像を, 再生時には図 5(b) の画像を, 画素ピッチ 32 m の透過型空間光変調器 (SLM) に表示し, 再生光分布をイメージセンサでで検出することにより, 記録媒質のシフト量に対する信号対雑音比 (SNR) とビット誤り率 (BER) を測定する. シミュレーション実行時には, 実験と同じパラメータを用いて, 媒質のシフト量に対する SN 比と BER を求める. 実験およびシミュレーションより得られた SN 比および回折効率を比較し, 全動作シミュレータによる計算結果の妥当性について評価する. 光波伝搬計算 (FFT-BPM) A xy (z), n xy (z) A xy (z+dz) 屈折率変調計算 A xy (z), n xy (z) n xy (z) x 50mm 50mm 50mm 50mm データ書き出し光波分布 A xy (z+dz) ループ終了 光学的記録過程計算終了 データ書き出し屈折率分布 n xy (z) (b) 2 つの GPU ユニットを用いた計算手順 図 2 体積ホログラムの 3 次元解析における光学的記録過程の計算手順 from He-Ne Laser SLM (Pixel pitch: 32 μm) shift (f=50mm) Medium (Thickness: 16μm) y 10mm 図 4 実験光学系 256 64 (f=50mm) Image Sensor z Spatial Light Modulator (SLM) + Phase Mask f f N y N x y L N z Medium z x 図 3 計算速度の評価に用いる透過型コリニアホログラフィックメモリの記録光学系 256 64 (a) 記録時 (a) (b) 再生時 (b) ( 信号光 + 参照光 ) ( 参照光のみ ) 図 5 SLM に表示する信号光および参照光

4. 研究成果 (1) 2 つの GPU ユニットを用いた並列実行による全動作シミュレータの計算時間の短縮 図 3 に示す透過型コリニアホログラフィックメモリの光学系における,1 ページデータの記録過程を計算するのに要する時間を測定した. 表 2 に, 厚さ方向のサンプル数一定 (N z=1000) で, 面方向のサンプル数 (N x N y) を変化させた場合における,1 ページデータの記録過程を計算するのに要する時間の測定結果を示す. 表 2 より, 面方向のサンプル数が増加するにしたがって, 計算速度は飛躍的に向上し,2 つの GPU ユニットを用いた並列実行による光学的記録過程の計算速度は,CPU のみで計算を実行した場合の約 80 倍にまで到達していることがわかる. 表 2 面方向のサンプル数 (N x N y) に対する 1 ページデータ記録過程の計算時間測定結果 (N z=1000) N x N y CPU based 256 256 115.19 512 512 487.03 1024 1024 1900.02 Calculation time [sec.] (Speed ratio) Single GPU based Dual GPU based (FFTW) (CUFFT) (CUFFT+OpenMP) 5.43 (21.21) 11.64 (41.84) 32.61 (58.26) 3.98 (28.94) 8.36 (58.26) 23.91 (79.47) (2) シミュレータの解析結果と実験結果との比較による全動作シミュレータの性能評価 図 4 に示される実験光学系を用いて, 透過型コリニア光学系におけるシフト選択特性について, 記録媒質のシフト量に対する SNR と BER を測定した. また, 実験条件と同じ条件下でシミュレータを用いて計算を行い, 実験と同様に記録媒質のシフト量に対する SNR と BER を算出した. 計算に用いたパラメータを表 3 に示す. 表 3 計算パラメータ Laser wavelength l [nm] 633 Refractive index of photopolymer n 0 1.5 Maximun index modulation depth n max 4.0 10-3 SLM 256 256 Page data 64 64 Pixel size [ m 2 ] 32 32 Sample number N x N y N z 2048 2048 100 Step size Dx Dy Dz [ m 3 ] 0.86 0.86 0.16 Beam intensity ratio I sig / I ref 1 Numerical aparature of objective lens NA 0.092 Total recording power P in [mw] 0.2 Saturation energy flux density E sat [J/cm 2 ] 0.02 記録時には図 5(a) の画像を, 再生時には図 5(b) の画像を SLM に表示し, イメージセンサを用いて出力画像を検出した. 図 5(a) の中央部にある 2 次元データは, あるデータ列に 2/4 変調を施して生成している. また, 再生時における媒質のシフト量は, 実験では 1 m, シミュレーションでは 0.86 m とし, 各位置で画像を取得した. 図 6 に再生時における記録媒質のシフト量に対するイメージセンサの取得画像を示す. 図 6 上は実験によって得られた画像, 図 6 下はシミュレーションによって得られた画像である. 上述の手順で取得した画像データを元に,SNR および BER を求めた. Shift amount 0 μm 5 μm 10 μm 15 μm Shift amount 0 μm 5.2 μm 10.3 μm 14.6 μm 図 6 再生時における記録媒質のシフト量に対する取得画像 図 7 に記録媒質のシフト量に対する SNR の変化を, 図 8 に記録媒質のシフト量に対する BER の変化をそれぞれ示す.SNR および BER の値は実験結果と解析結果で若干異なるものの, いずれも同様の傾向を示しており, 本研究で開発したシミュレータによって得られる結果は妥当なものであることが確認できた. 本研究で開発した全動作シミュレータは, ホログラフィックメモリシステムの高速解析を目的として開発したが, この全動作シミュレータのコアシステムを用いた,3 次元表示の基本動作シミュレーションへの応用を示すことができた. Signal to noise ratio SNR 4 3 2 1 0 0 2 4 6 8 10 12 14 16 Shift amount of medium [ m] 図 7 記録媒質のシフト量に対する SNR

10 0 Bit error rate BER 10-1 10-2 10-3 10-4 0 2 4 6 8 10 12 14 16 Shift amount of medium [ m] 図 8 記録媒質のシフト量に対する BER 5. 主な発表論文等 ( 研究代表者 研究分担者及び連携研究者には下線 ) 雑誌論文 ( 計 2 件 ) 1. 舟越久敏, 岡本淳, 渋川敦史, 菅悠太, 佐久間大樹 : 体積ホログラムの高速数値解析手法を応用した新しい 3 次元ディスプレイの基本動作シミュレーション, 映像情報メディア学会技術報告, 査読なし, 2016, Vol. 40, No. 6, pp.309-313. 2. 舟越久敏, 岡本淳 : ホログラフィックメモリ用全動作シミュレータにおける 2 つの GPU を用いた解析エンジンの高速化, 映像情報メディア学会技術報告, 査読なし, 2015, Vol. 39, No. 7, pp.27-30. 6. 研究組織 (1) 研究代表者舟越久敏 (FUNAKOSHI, Hisatoshi) 岐阜大学 教育学部 准教授研究者番号 :50413711