Microsoft PowerPoint - iaca.ppt
|
|
|
- みそら ありたけ
- 7 years ago
- Views:
Transcription
1 Intel Architecture Code Analyzer について x86/x64 最適化勉強会 #2 (2011/10/1) Shiraishi Masao
2 自己紹介 白石匡央 (msiro) ブログ :Coding Memorandum 仕事 : 映像 Codec, トランスコーダの開発 趣味 : 競技プログラミング 変遷 : MSX(Z80) SunOS(SPARC) Windows(x86)
3 本日の発表について 静的解析ツール Intel Architecture Code Analyzer を取り上げます Intel CPU のアーキテクチャをより深く理解できる ( かもしれません )
4 x86/x64 最適化 コードを速くしたい 並列化 ワークロード最適化 SIMD 化 データ構造を選ぶ ボトルネックの排除 Intel アーキテクチャは複雑 ボトルネック要因が簡単には分からない ツールを使おう! 一般的にはプロファイラ ( 実行解析 ) を使います でも, 本日は 静的解析ツール を取り上げます
5 whatif.intel.com インテルの実験的ソフトウェアの公開の場 Performance Tuning Intel Performance Bottleneck Analyzer Intel Software Autotuning Tool Intel Software Tuning Agent Intel Architecture Code Analyzer : (IACA) Intel Performance Tuning Utility Intel Platform Modeling with Machine Learning
6 IACA 機能概要 機能概要 x86/x64 命令がどの port で実行されるかを示す front-end,ooo, メモリキャッシュを考慮する 各 port のサイクル数を示す ( コードの静的解析による ) スループットとレイテンシを示す クリティカルパスを示す 元々は Sandy Bridge が出る前に AVX を評価するツールだった (?) Ver.1.1 から Nehalem,Westmere をサポート IACA は ASCII 出力のコマンドラインツールです 次画面で実行結果例を示します
7 Intel(R) Architecture Code Analyzer Version Analyzed File -.. test Release test.exe Binary Format - 32Bit Architecture - Intel(R) AVX Analysis Report Total Throughput: 76 Cycles; Throughput Bottleneck: Port0, Port1 Total number of Uops bound to ports: 340 Data Dependency Latency: 51 Cycles; Performance Latency: 103 Cycles Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles Num of Ports pressure in cycles Uops 0 - DV D 3 - D ^ X 1 1 CP mov dword ptr [esp+0xc], eax 2^ 1 X 1 mov dword ptr [esp+0x8], ecx X X CP mov eax, dword ptr [esp+0xc] 1 X X 1 1 mov edx, dword ptr [esp+0x8] X X movdqa xmm0, xmmword ptr [eax] 1 1 lea esi, ptr [0x4030b0] 1 X X 1 1 movdqa xmm4, xmmword ptr [eax+0x20] 1 1 lea ecx, ptr [0x403130] 1 1 X pshuflw xmm0, xmm0, 0xd8 1 X 1 pshufd xmm1, xmm0, 0x0 2^ X X pmaddwd xmm1, xmmword ptr [esi] 1 1 X pshufd xmm3, xmm0, 0x55 1 X 1 pshufhw xmm0, xmm0, 0xd8 2^ 1 X X 1 1 pmaddwd xmm3, xmmword ptr [esi+0x20] 1 1 X pshufd xmm2, xmm0, 0xaa 1 X 1 pshufd xmm0, xmm0, 0xff
8 前提知識 ( パイプライン ) SandyBridge のパイプライン x86/x64 命令 front-end μops スケジューラ発行ポート実行ユニット インテル 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス マニュアル より
9 前提知識 ( 発行ポート ) SandyBridge の発行ポートと実行ユニット インテル 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス マニュアル より
10 IACA を知るきっかけ Intel Software Developer Day 2011 (7/15) SandyBridge 向けワークロードの最適化 の中で紹介 ボトルネックの大部分はイベントベースの解析で検知できる IACA もしくはコードの調査のみで判別できるものがある 特定 Port への高い依存性の検知 次ページの画面例とともに紹介 iaca.exe -arch SNB -analysis THROUGHPUT -graph g.dot regspill.exe
11 IACA 画面例? Intel Software Developer Day インテルマイクロアーキテクチャー SandyBridge 向けワークロードの最適化 より しかしながら, 現在の公開版 (Rev.1.1.3) にこのような機能はない
12 IACA の使い方 解析対象のコードブロックの前後にマーカー (10byte/x86) を入れる iacamarks.h にマクロが定義される IACA_START : 解析コードブロックの開始位置 IACA_END : 解析コードブロックの終了位置 コマンド引数 arch <type> -cp <type> -include_ebx 32ビットオブジェクト 64ビットオブジェクト AVX,nehalem,westmere DATA_DEPENDENCY,PERFORMANCE マーカー前後のpop/push ebxを解析対象に含める -mark <n> -o < ファイル名 > n 番目のブロックを解析する 出力ファイル名 0 のとき全て
13 IACA 出力詳細 Intel(R) Architecture Code Analyzer Version Analyzed File -.. test Release test.exe Binary Format - 32Bit Architecture - Intel(R) AVX Analysis Report Total Throughput: 76 Cycles; Throughput Bottleneck: Port0, Port1 Total number of Uops bound to ports: 340 Data Dependency Latency: 51 Cycles; Performance Latency: 103 Cycles Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles Num of Ports pressure in cycles Uops 0 - DV D 3 - D ^ X 1 1 CP mov dword ptr [esp+0xc], eax 2^ 1 X 1 mov dword ptr [esp+0x8], ecx X X CP mov eax, dword ptr [esp+0xc] 1 X X 1 1 mov edx, dword ptr [esp+0x8] X X movdqa xmm0, xmmword ptr [eax] 1 1 lea esi, ptr [0x4030b0] 1 X X 1 1 movdqa xmm4, xmmword ptr [eax+0x20] 1 1 lea ecx, ptr [0x403130] 1 1 X pshuflw xmm0, xmm0, 0xd8 1 X 1 pshufd xmm1, xmm0, 0x0 2^ X X pmaddwd xmm1, xmmword ptr [esi] 1 1 X pshufd xmm3, xmm0, 0x55 1 X 1 pshufhw xmm0, xmm0, 0xd8 2^ 1 X X 1 1 pmaddwd xmm3, xmmword ptr [esi+0x20] 1 1 X pshufd xmm2, xmm0, 0xaa 1 X 1 pshufd xmm0, xmm0, 0xff
14 IACA 出力詳細 ( サマリー ) Analysis Report Total Throughput: 76 Cycles; Throughput Bottleneck: Port0, Port1 Total number of Uops bound to ports: 340 Data Dependency Latency: 51 Cycles; Performance Latency: 103 Cycles コードブロック全体のスループットとレイテンシ スループットのボトルネック μop 数 スループットは次に示すものの最大値である (= ボトルネック ) 各発行ポートのスループット front-end の最大スループット (= 4μOPs/cycle) 除算ユニットのスループット
15 IACA 出力詳細 ( サマリー ) Analysis Report Total Throughput: 76 Cycles; Throughput Bottleneck: Port0, Port1 Total number of Uops bound to ports: 340 Data Dependency Latency: 51 Cycles; Performance Latency: 103 Cycles Data Dependecy Latency: Data Dependency クリティカルパスの実行サイクル数 ( 前命令の結果を必要とする命令系列の最大パス ) Performance Latency: Performance クリティカルパスの実行サイクル数 次の基準を考慮 前命令の実行結果に依存する命令 front-end で遅れる命令 ポートコンフリクトにより遅れる命令
16 IACA 出力詳細 Intel(R) Architecture Code Analyzer Version Analyzed File -.. test Release test.exe Binary Format - 32Bit Architecture - Intel(R) AVX Analysis Report Total Throughput: 76 Cycles; Throughput Bottleneck: Port0, Port1 Total number of Uops bound to ports: 340 Data Dependency Latency: 51 Cycles; Performance Latency: 103 Cycles Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles Num of Ports pressure in cycles Uops 0 - DV D 3 - D ^ X 1 1 CP mov dword ptr [esp+0xc], eax 2^ 1 X 1 mov dword ptr [esp+0x8], ecx X X CP mov eax, dword ptr [esp+0xc] 1 X X 1 1 mov edx, dword ptr [esp+0x8] X X movdqa xmm0, xmmword ptr [eax] 1 1 lea esi, ptr [0x4030b0] 1 X X 1 1 movdqa xmm4, xmmword ptr [eax+0x20] 1 1 lea ecx, ptr [0x403130] 1 1 X pshuflw xmm0, xmm0, 0xd8 1 X 1 pshufd xmm1, xmm0, 0x0 2^ X X pmaddwd xmm1, xmmword ptr [esi] 1 1 X pshufd xmm3, xmm0, 0x55 1 X 1 pshufhw xmm0, xmm0, 0xd8 2^ 1 X X 1 1 pmaddwd xmm3, xmmword ptr [esi+0x20] 1 1 X pshufd xmm2, xmm0, 0xaa 1 X 1 pshufd xmm0, xmm0, 0xff
17 IACA 出力詳細 (Port 毎のサイクル ) Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles Port0,2,3 には,regular pipe と secondary pipe がある Port0 : Divider Pipe 第 1 サイクルは双方ビジー 次サイクルでは Port0 が使用可能 Divider pipe は, 除算実行が終わるまでビジー Port2,3 : Address Generate Unit(AGU) 256bit ロードは 2 サイクル Port ビジーであるが, AGU は 1 サイクル後にフリーとなり store address generation 可
18 IACA 出力詳細 (Port 毎のサイクル ) CPU による違い AP-945 SSE2 を使用した逆離散コサイン変換 -arch AVX Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles arch westmere / nehalem Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles
19 SandyBridge 向け最適化 2 個 / サイクルのロードを実行できる 高速化前 loop_start: paddd xmm0, [rsi] paddd xmm0, [rsi+16] paddd xmm0, [rsi+32] paddd xmm0, [rsi+48] paddd xmm0, [rsi+64] paddd xmm0, [rsi+80] paddd xmm0, [rsi+96] paddd xmm0, [rsi+112] 高速化後 loop_start: paddd xmm0, [rsi] paddd xmm1, [rsi+16] paddd xmm0, [rsi+32] paddd xmm1, [rsi+48] paddd xmm0, [rsi+64] paddd xmm1, [rsi+80] paddd xmm0, [rsi+96] paddd xmm1, [rsi+112] Intel Software Developer Day インテルマイクロアーキテクチャー SandyBridge 向けワークロードの最適化 によれば, 1.65 倍早くなる ( ループ処理のオーバヘッドで 2 倍にならない )
20 IACA 出力詳細 Intel(R) Architecture Code Analyzer Version Analyzed File -.. test Release test.exe Binary Format - 32Bit Architecture - Intel(R) AVX Analysis Report Total Throughput: 76 Cycles; Throughput Bottleneck: Port0, Port1 Total number of Uops bound to ports: 340 Data Dependency Latency: 51 Cycles; Performance Latency: 103 Cycles Port Binding in cycles: Port 0 - DV D 3 - D 4 5 Cycles Num of Ports pressure in cycles Uops 0 - DV D 3 - D ^ X 1 1 CP mov dword ptr [esp+0xc], eax 2^ 1 X 1 mov dword ptr [esp+0x8], ecx X X CP mov eax, dword ptr [esp+0xc] 1 X X 1 1 mov edx, dword ptr [esp+0x8] X X movdqa xmm0, xmmword ptr [eax] 1 1 lea esi, ptr [0x4030b0] 1 X X 1 1 movdqa xmm4, xmmword ptr [eax+0x20] 1 1 lea ecx, ptr [0x403130] 1 1 X pshuflw xmm0, xmm0, 0xd8 1 X 1 pshufd xmm1, xmm0, 0x0 2^ X X pmaddwd xmm1, xmmword ptr [esi] 1 1 X pshufd xmm3, xmm0, 0x55 1 X 1 pshufhw xmm0, xmm0, 0xd8 2^ 1 X X 1 1 pmaddwd xmm3, xmmword ptr [esi+0x20] 1 1 X pshufd xmm2, xmm0, 0xaa 1 X 1 pshufd xmm0, xmm0, 0xff
21 IACA 出力詳細 ( 命令詳細 ) Num of Ports pressure in cycles Uops 0 - DV D 3 - D ^ X 1 1 CP mov dword ptr [esp+0xc], eax 2^ 1 X 1 mov dword ptr [esp+0x8], ecx X X CP mov eax, dword ptr [esp+0xc] 1 X X 1 1 mov edx, dword ptr [esp+0x8] X X movdqa xmm0, xmmword ptr [eax] X X CP mov eax, dword ptr [ebp-0x8]!!!!!!!!!! cdq 1 1 X X mov ecx, 0x3!!!!!!!!!! idiv ecx Num of Uops : μop 数 X : このportでも実行可能であることを示す CP : クリティカルパス! : サポート対象外の命令
22 IACA 出力詳細 ( 命令詳細 ) Num of Ports pressure in cycles Uops 0 - DV D 3 - D * xor eax, eax 1 1 X X nop 1 X 1 X add ecx, eax 1 X X 1 CP add eax, 0x1 1 X X 1 CP cmp eax, 0x2710 0F jl 0xfffffff4 * : port に割り当てられない命令 zero idiom XOR REG, REG SUB REG, REG PXOR/VPXOR XMMREG, XMMREG PSUBB/W/D/Q XMMREG, XMMREG VPSUBB/W/D/Q XMMREG, XMMREG XORPS/PD XMMREG, XMMREG VXORPS/PD YMMREG, YMMREG NOP VZEROUPPER FXCHG
23 IACA 出力詳細 ( 命令詳細 ) Num of Ports pressure in cycles Uops 0 - DV D 3 - D X X movzx eax, byte ptr [ebp-0x11] 1 X X 1 test eax, eax 0F jz 0x9 2^ 1 X 1 mov dword ptr [ebp-0x8], 0xa F : マクロフュージョン 2 つの命令を単一 μop にマージ インテル 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス マニュアル より
24 IACA 出力詳細 ( 命令詳細 ) Num of Ports pressure in cycles Uops 0 - DV D 3 - D X X movzx eax, byte ptr [ebp-0x11] 1 X X 1 test eax, eax 0F jz 0x9 2^ 1 X 1 mov dword ptr [ebp-0x8], 0xa ^ : マイクロフュージョン複数の μop を単一の μop に纏める 例 : ロード + op ADDPS XMM9, OWORD PTR [RSP+40] FADD DOUBLE PTR [RDI+RSI*8] XOR RAX, QWORD PTR [RBP+32]
25 IACA 出力詳細 ( 命令詳細 ) Num of Ports pressure in cycles Uops 0 - DV D 3 - D X X 1 2 CP vaddpd ymm11, ymm10, ymmword ptr [rsi+rax*8] 2 1 X 2 CP vmovaps ymmword ptr [rcx+rax*8], ymm CP vmulpd ymm14, ymm3, ymm11 1@ 1 addps xmm0, xmm1 1 1 vmulpd ymm12, ymm2, ymm CP vsqrtpd ymm4, : AVX-256 に SSE コードが続くケース ペナルティが発生 SSE の代わりに AVX-128 命令を使う SSE コードの直前に VZEROUPPER を入れる
26 まとめ IACA では, スーパースカラ実行の効率を評価することができる ( サマリ画面 ) コードのどこを変えれば良いかは分かり難い Intel Software Developer Day で紹介された画面機能が公開されることを期待したい
適応フィルタのSIMD最適化
茂木和洋 @ まるも製作所 今回は省略 初めての方は #1 の資料を参照 適応フィルタとは 適応フィルタの問題点 ( 速度面で ) SIMD 比較命令でマスク処理 ベンチマーク 固定のフィルタではなく 入力値によって処理を変更し 最適な結果を求める 例 基準値との差異を閾値と比較して 参照画素として使うか使わないかを切り替える 最小自乗法でフィッティングしてフィルタ係数自体を動的に作成する 他いろいろ
Microsoft PowerPoint - NxLecture ppt [互換モード]
011-05-19 011 年前学期 TOKYO TECH 命令処理のための基本的な 5 つのステップ 計算機アーキテクチャ第一 (E) 5. プロセッサの動作原理と議論 吉瀬謙二計算工学専攻 kise_at_cs.titech.ac.jp W61 講義室木曜日 13:0-1:50 IF(Instruction Fetch) メモリから命令をフェッチする. ID(Instruction Decode)
ストリーミング SIMD 拡張命令2 (SSE2) を使用した、倍精度浮動小数点ベクトルの最大/最小要素とそのインデックスの検出
SIMD 2(SSE2) / 2.0 2000 7 : 248602J-001 01/10/30 1 305-8603 115 Fax: 0120-47-8832 * Copyright Intel Corporation 1999-2001 01/10/30 2 1...5 2...5 2.1...5 2.1.1...5 2.1.2...8 3...9 3.1...9 3.2...9 4...9
動画系のSIMD最適化
茂木和洋 @ まるも製作所 まるも製作所の中の人をしてます 就職活動の一環として大学 4 年の夏に MPEG-2 デコーダを作っていたら某企業に拾ってもらえました 就職先の上司の縁で 通信系の研究所に飛ばされて H.264/AVC のエンコーダを作ったりしてました 現在はファブレス LSI メーカに転職してオリジナルの CODEC を作ってたりします 動画 CODEC のプログラム的特徴 SIMD
16 2020 H.264/AVC 2 H.265/HEVC 1 H.265 JCT-VC HM(HEVC Test Model) HM 5 5 SIMD HM 33%
H.265/HEVC 2014 (410808) 16 2020 H.264/AVC 2 H.265/HEVC 1 H.265 JCT-VC HM(HEVC Test Model) HM 5 5 SIMD HM 33% Abstract In recent years, high resolution video technology has been developed in order to start
インテル(R) Visual Fortran コンパイラ 10.0
インテル (R) Visual Fortran コンパイラー 10.0 日本語版スペシャル エディション 入門ガイド 目次 概要インテル (R) Visual Fortran コンパイラーの設定はじめに検証用ソースファイル適切なインストールの確認コンパイラーの起動 ( コマンドライン ) コンパイル ( 最適化オプションなし ) 実行 / プログラムの検証コンパイル ( 最適化オプションあり ) 実行
インテル® VTune™ パフォーマンス・アナライザー 9.1 Windows* 版
VTune 9.1 Windows* ................................. 3...................... 3.................................................. 3............................................ 4 :.........................4................................................
Microsoft PowerPoint - Lecture ppt [互換モード]
2012-05-31 2011 年前学期 TOKYO TECH 固定小数点表現 計算機アーキテクチャ第一 (E) あまり利用されない 小数点の位置を固定する データ形式 (2) 吉瀬謙二計算工学専攻 kise_at_cs.titech.ac.jp W641 講義室木曜日 13:20-14:50-2.625 符号ビット 小数点 1 0 1 0 1 0 1 0 4 2 1 0.5 0.25 0.125
2.1 インテル マイクロアーキテクチャー Haswell インテル マイクロアーキテクチャー Haswell は インテル マイクロアーキテクチャー Sandy Bridge とインテル マイクロアーキテクチャー Ivy Bridge の成功を受けて開発された この新しいマイクロアーキテクチャーの
2 章インテル 64 プロセッサー アーキテクチャーと IA-32 プロセッサー アーキテクチャー 本章では 最新世代のインテル 64 プロセッサーと IA-32 プロセッサー ( インテル マイクロアーキテクチャー Haswell インテル マイクロアーキテクチャー Ivy Bridge インテル マイクロアーキテクチャー Sandy Bridge ベースのプロセッサーと インテル Core マイクロアーキテクチャー
インテル(R) Visual Fortran Composer XE
Visual Fortran Composer XE 1. 2. 3. 4. 5. Visual Studio 6. Visual Studio 7. 8. Compaq Visual Fortran 9. Visual Studio 10. 2 https://registrationcenter.intel.com/regcenter/ w_fcompxe_all_jp_2013_sp1.1.139.exe
Microsoft* Windows* 10 における新しい命令セットの利用
Microsoft* Windows* 10 における新しい命令セットの利用 この記事は インテル デベロッパー ゾーンに公開されている Follow-Up: How does Microsoft Windows 10 Use New Instruction Sets? の日本語参考訳です 以前のブログ ソフトウェアは実際に新しい命令セットを使用しているのか? ( 英語 ) では いくつかの異なる
1007 ステルスデバッガを利用したマルウェア解析手法の提案
マルウェア対策研究人材育成ワークショップ 2008 ステルスデバッガを利用したマルウェア 解析手法の提案 NTT 情報流通プラットフォーム研究所 川古谷裕平岩村誠伊藤光恭 2008/10/10 1 目次 背景 ステルスデバッガの提案 CCC Dataset 2008 検体による評価 考察 まとめ 2008/10/10 2 背景 マルウェアの高度化 高機能化 柔軟な機能追加 自身の隠蔽化 耐解析機能
Exploring the x64
Exploring the x64 村上純一執行役員先端技術研究部長 ( 株 ) フォティーンフォティ技術研究所 自己紹介 村上純一 ( 株 ) フォティーンフォティ技術研究所 カーネルモードでの Windows Linux における開発 セキュリティ脆弱性分析 マルウェア解析 P2P 解析等 講演活動 Black Hat 2008 US and Japan, AVAR 2009, RSA Conference(2009-)
Microsoft PowerPoint - NxLec-2010-11-01.ppt
2010 年 後 学 期 レポート 問 題 計 算 機 アーキテクチャ 第 二 (O) 4. シングルサイクルプロセッサの 実 装 とパイプライン 処 理 大 学 院 情 報 理 工 学 研 究 科 計 算 工 学 専 攻 吉 瀬 謙 二 kise _at_ cs.titech.ac.jp S321 講 義 室 月 曜 日 5,6 時 限 13:20-14:50 1 1. 1から100までの 加 算
AxC_lj.fm
IA-32 IA-32 Intel Pentium 4 Intel NetBurst 1 2 /SIMD IA-32 Pentium 4 ( OP) IA-32 IA-32 ( OP) 1 I/O 2 xchg ( OP) 5 ( OP) IA-32 ROM ( OP) ROM ROM ( OP) ( OP) 4 1 32 ROM 16 PADDQ PMULUDQ 2 1 1 1 2 2 2 1 http://www.intel.co.jp/jp/developer/vtune/
Security Solution 2008.pptx
Security Solution 2008 Windows DOS (apack, lzexe, diet, pklite) Linux (gzexe, UPX) PE PE DOS Stub Space Section Header.idata PE Header & Optional Header Space.unpack (unpack code) Section Header.unpack
Managing and Sharing MATLAB Code
MATLAB 入門 ~ 開発向けプログラミング編 ~ MathWorks Japan アプリケーションエンジニアリング部テクニカルコンピューティング 大開孝文 2015 The MathWorks, Inc. 1 プログラミング言語としての MATLAB 2014 年 7 月 IEEE Spectrum による プログラミング言語の人気調査 (12 種類の項目での結果 ) 結果 : MATLAB が
160311_icm2015-muramatsu-v2.pptx
Linux におけるパケット処理機構の 性能評価に基づいた NFV 導 の 検討 村松真, 川島 太, 中 裕貴, 林經正, 松尾啓志 名古屋 業 学 学院 株式会社ボスコ テクノロジーズ ICM 研究会 2016/03/11 研究 的 VM 仮想 NIC バックエンド機構 仮想化環境 仮想スイッチ パケット処理機構 物理環境 性能要因を考察 汎 IA サーバ NFV 環境に適したサーバ構成を検討
untitled
PC [email protected] muscle server blade server PC PC + EHPC/Eric (Embedded HPC with Eric) 1216 Compact PCI Compact PCIPC Compact PCISH-4 Compact PCISH-4 Eric Eric EHPC/Eric EHPC/Eric Gigabit
untitled
EPX-64S Rev 1.2 1.. 3 1.1.......... 3 1.2....... 3 1.3....... 4 1.4... 4 1.5... 4 2........ 5 2.1.... 5 EPX64S_GetNumberOfDevices........ 5 EPX64S_GetSerialNumber........ 6 EPX64S_Open....... 7 EPX64S_OpenBySerialNumber
インテル(R) Visual Fortran Composer XE 2013 Windows版 入門ガイド
Visual Fortran Composer XE 2013 Windows* エクセルソフト株式会社 www.xlsoft.com Rev. 1.1 (2012/12/10) Copyright 1998-2013 XLsoft Corporation. All Rights Reserved. 1 / 53 ... 3... 4... 4... 5 Visual Studio... 9...
Code_Aster / Salome-Meca 中級者への道 2015年5月31日
Code_Aster / Salome-Meca 中級者への道 2015年5月31日 目次 1.Code_Aster / Salome-Meca とは 2.初心者 中級者 上級者の定義 3.Eficas, ASTK で何ができる 4.公式 Documentation, Validation を活用しよ う 5.メッセージファイルを読んでエラーを解決 目次 6.コマンドファイルをテキストエディタで 編集しなければならない場合はどうする
PowerPoint Presentation
VME Embedded System ユーザーズマニュアル ~ Slim VME Embedded ~ Tecstar Page: 1 Agenda 1. VME Embedded System 概要 2. VME Embedded の特徴 3. Embedded Overview 4. VMEファイルとHEXファイルについて 5. Slim VME について 6. Deployment Toolの起動方法について
Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments
計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];
PSG共通フォーマットv110
PSG PSG (Vers.1.00) Ver.1.10 (1) Code=125 20(EXT) (2) (3) Ver.1.00 3-1 (1) ASCII Little Endian(X86) Big Endian(UNIX ) (2) PSG (3) (4) (5) 4byte channel 2byte (6) PSG Ver.1.10 2001 5 1 page.2 3-2 32bytes
命令セットの構成例 a) 算術 演算命令 例 )ADD dest, source : dest dest + source SUB dest, source : dest dest - source AND dest, source : dest dest AND source SHR reg, c
第 11 回機械語とアーキテクチャ コンピュータは, 記号で組み立てられ, 記号で動く機械 : ソフトウェアソフトウェア としても理解されなければならない ソフトウェアの最も下位レベルのしくみが ( 命令セット ) アーキテクチャ である 講義では命令符号 ( 機械語 ) の構成と種類についてまとめる また, 機械語を効率良く実行するために採用されている技術について紹介する 機械語とアセンブリ言語
Upload path ファイル送信先ディレクトリのパスを指定します ホームディレクトリに画像を送信する場合は空白のまま サブディレクトリに画像を送信する場合はディレクトリ名を指定します さらに下位のディレクトリを指定する場合は \ マークを利用します 例 ) ホームディレクトリ以下の camera
はじめに 本ドキュメントでは AXIS ネットワークカメラ / ビデオエンコーダのファームウエアバージョン 5.5x 以降で 任意の間隔で画像を FTP サーバへ送信するための設定手順を説明します 設定手順手順 1:AXIS ネットワークカメラ / ビデオエンコーダの設定ページにアクセスする 1. Internet Explorer などの Web ブラウザを起動します 2. Web ブラウザの URL
修士論文
AVX を用いた倍々精度疎行列ベクトル積の高速化 菱沼利彰 1 藤井昭宏 1 田中輝雄 1 長谷川秀彦 2 1 工学院大学 2 筑波大学 1 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算 - 4. 実験 - 倍々精度疎行列ベクトル積 - 5. まとめ 多倍長精度計算フォーラム 2 目次 1. 研究背景 目的 2. 実装, 実験環境 3. 実験 - 倍々精度ベクトル演算
TFTP serverの実装
TFTP サーバーの実装 デジタルビジョンソリューション 佐藤史明 1 1 プレゼンのテーマ組み込みソフトのファイル転送を容易に 2 3 4 5 基礎知識 TFTP とは 実践 1 実際に作ってみよう 実践 2 組み込みソフトでの実装案 最後におさらい 2 プレゼンのテーマ 組み込みソフトのファイル転送を容易に テーマ選択の理由 現在従事しているプロジェクトで お客様からファームウェアなどのファイル転送を独自方式からTFTPに変更したいと要望があった
MultiLABELISTOCX と MultiLABELISTV4 MLOCX は MLV4 のレイアウト発行機能を継承しています したがって MLV4 の振分発行やプ リセット発行を使用するための登録情報は使用できません MLV4 のレイアウト管理でレイアウトを作成すると 拡張子が m lay
6. 注意事項 MultiLABELISTOCX と MultiLABELISTV4 使用しない登録情報 ( レイアウト管理 ) 使用しない登録情報 ( その他 ) 機能しない項目 全般 レイアウト情報およびプリンタ情報 プログラミングに関して COM LPT LANからの出力 LPTからの出力 LANからの出力ステータス4の使用税編集について レイアウト情報に関して 連番印字機能 小ラベル印字機能
計算機アーキテクチャ特論 後半第2回 アウトオブオーダー実行 Out-of-Order Execution
計算機アーキテクチャ特論 後半第 2 回 アウトオブオーダー実行 Out-of-Order Execution 講師加藤真平 本資料は授業用です 無断で転載することを禁じます 前回の理解度クイズ 問 1 マルチコア (CMP) 化が進んだ理由を簡潔に述べよ 答え消費電力や発熱の問題により 単一プロセッサの動作周波数を上げることができなくなったため 複数のプロセッサコアを並べることで性能を改善するようになった
#include <stdio.h> unsigned char x86[] = { 0x8b, 0x44, 0x24, 0x04, // mov eax,[esp+4] 0x03, 0x44, 0x24, 0x08, // add eax,[esp+8] 0xc3 // ret }; int ma
x86 JIT Web JavaScript x86 JIT JIT x86 JIT Windows OS DEP x86 ASLR DEP ASLR Return-Oriented Programming JIT-Spraying JavaScript JIT x86 x86 JIT How to execute arbitrary code on x86 JIT Compiler Yoshinori
チーズケーキ技術 17.12
2 1 Node.js 1 9 1 10 1.1...................................... 10 Node.js.............................. 10 FFMPEG............................. 10 1.2............................... 11 JavaScript................................
3 SIMPLE ver 3.2: SIMPLE (SIxteen-bit MicroProcessor for Laboratory Experiment) 1 16 SIMPLE SIMPLE 2 SIMPLE 2.1 SIMPLE (main memo
3 SIMPLE ver 3.2: 20190404 1 3 SIMPLE (SIxteen-bit MicroProcessor for Laboratory Experiment) 1 16 SIMPLE SIMPLE 2 SIMPLE 2.1 SIMPLE 1 16 16 (main memory) 16 64KW a (C )*(a) (register) 8 r[0], r[1],...,
PowerPoint プレゼンテーション
FLEXSCHE Excel 帳票 入門ガイド 1 目次 2 EXCEL 帳票とは EDIF を用いて出力された一時データを元に それを EXCEL 形式の帳票として出力する機能です 利用するには FLEXSCHE EDIF の他 Microsoft Excel 2003 以降が必要です レイアウトデザインも EXCEL で行うので 多くの方に操作に抵抗なく編集していただけます この入門ガイドでは
ソフトウェア基礎技術研修
命令と命令表現 ( 教科書 3.1 節 ~3.4 節 ) プロセッサの命令と命令セット 命令 : プロセッサへの指示 ( プロセッサが実行可能な処理 ) 加算命令 減算命令 論理演算命令 分岐命令 命令セット : プロセッサが実行可能な命令の集合 ( プログラマから見えるプロセッサの論理仕様 ) プロセッサ A 加算命令分岐命令 プロセッサ B 加算命令減算命令 命令セットに含まれない命令は直接実行できない!
Cisco Feature Navigator 簡易説明書
http://tools.cisco.com/itdit/cfn/ 上記へアクセスすると下記画面が表示されます Cisco Feature Navigator 簡易説明書 各項目の説明 Research features( 機能による調査 ) Search by Feature: 機能による検索 Search by Technology: テクノロジーによる検索 Research software
Microsoft PowerPoint - Sol7 [Compatibility Mode]
ミニクイズ 4 E ハザード ( つ前の命令の結果を必要とする状況 ) が発生する条件を つ挙げよ. また それぞれの時に 制御線 ForwardA, ForwardB はどのように設定すれば良いか? ( 回答 ) E/.RegWrite= かつ E/.RegisterRd = ID/.RegisterRs この時,ForwardA = と制御すれば良い. E/.RegWrite= かつ E/.RegisterRd
Microsoft PowerPoint - Chap4 [Compatibility Mode]
計算機構成論 (Chap. ) @C01 http://www.ngc.is.ritsumei.ac.jp/~ger/lectures/comparch2012/index.html (user=ganbare, passwd = 初回の講義で言いました ) 講義に出るなら 分からないなら質問しよう 単位を取りたいなら 章末問題は自分で全部といておこう ( レポートと考えればいいんです!) ご意見
SQUFOF NTT Shanks SQUFOF SQUFOF Pentium III Pentium 4 SQUFOF 2.03 (Pentium 4 2.0GHz Willamette) N UBASIC 50 / 200 [
SQUFOF SQUFOF NTT 2003 2 17 16 60 Shanks SQUFOF SQUFOF Pentium III Pentium 4 SQUFOF 2.03 (Pentium 4 2.0GHz Willamette) 60 1 1.1 N 62 16 24 UBASIC 50 / 200 [ 01] 4 large prime 943 2 1 (%) 57 146 146 15
任意の間隔での FTP 画像送信イベントの設定方法 はじめに 本ドキュメントでは AXIS ネットワークカメラ / ビデオエンコーダにおいて任意の間隔で画像を FTP サー バーへ送信するイベントの設定手順を説明します 設定手順手順 1:AXIS ネットワークカメラ / ビデオエンコーダの設定ページ
はじめに 本ドキュメントでは AXIS ネットワークカメラ / ビデオエンコーダにおいて任意の間隔で画像を FTP サー バーへ送信するイベントの設定手順を説明します 設定手順手順 1:AXIS ネットワークカメラ / ビデオエンコーダの設定ページにアクセスする 1.Web ブラウザを起動します FW v6.50 以下の場合は Internet Explorer を FW v7.10 以降の場合は
PowerPoint プレゼンテーション
コンピュータアーキテクチャ 第 7 週命令セットアーキテクチャ ( 命令の表現 命令の実行の仕組 ) 2013 年 11 月 6 日 金岡晃 授業計画 第 1 週 (9/25) 第 2 週 (10/2) 第 3 週 (10/9) 第 4 週 (10/16) 第 5 週 (10/23) 第 6 週 (10/30) 第 7 週 (11/6) 授業概要 2 進数表現 論理回路の復習 2 進演算 ( 数の表現
CoIDE 用 F4D_VCP の説明 V /07/05 USB の VCP( 仮想 COM ポート ) による非同期シリアル通信を行うプログラムです Free の開発ツール CoIDE で作成した STM32F4 Discovery 用のプロジェクトです プログラムの開始番地は 0x
CoIDE 用 F4D_VCP の説明 V001 2014/07/05 USB の VCP( 仮想 COM ポート ) による非同期シリアル通信を行うプログラムです Free の開発ツール CoIDE で作成した STM32F4 Discovery 用のプロジェクトです プログラムの開始番地は 0x08000000 です デバッグが可能です 目次 1. USB の VCP( 仮想 COM ポート )
HULFT-DataMagic Ver2.2.0 製品対応OS
Ver2.2.0 製品対応 OS 2014 年 2 月 5 日以降適用 版最新 Version 2.2.0 for コード変換 オプション for DB 接続 オプション (Oracle) for DB 接続 オプション (DB2) for DB 接続 オプション (PostgreSQL) for DB 接続 オプション (SQL Server) for Excel オプション for テンプレート
インテル エクステンデッド メモリ 64 テクノロジ ソフトウェア デベロッパーズ ガイド 第 2 巻 ( 全 2 巻 ) リビジョン 1.1 注記 : 本書は 第 1 巻と第 2 巻で構成されています ソフトウェアを設計する際は 第 1 巻と第 2 巻の両方を参照してください
インテル エクステンデッド メモリ 64 テクノロジ ソフトウェア デベロッパーズ ガイド 第 2 巻 ( 全 2 巻 ) リビジョン 1.1 注記 : 本書は 第 1 巻と第 2 巻で構成されています ソフトウェアを設計する際は 第 1 巻と第 2 巻の両方を参照してください 300835-002JA 本資料に掲載されている情報は インテル製品の概要を目的としたものです 本資料は 明示されているか否かにかかわらず
PrimerArray® Analysis Tool Ver.2.2
研究用 PrimerArray Analysis Tool Ver.2.2 説明書 v201801 PrimerArray Analysis Tool Ver.2.2 は PrimerArray( 製品コード PH001 ~ PH007 PH009 ~ PH015 PN001 ~ PN015) で得られたデータを解析するためのツールで コントロールサンプルと 1 種類の未知サンプル間の比較が可能です
$ cmake --version $ make --version $ gcc --version 環境が無いあるいはバージョンが古い場合は yum などを用いて導入 最新化を行う 4. 圧縮ファイルを解凍する $ tar xzvf gromacs tar.gz 5. cmake を用
本マニュアルの目的 Linux サーバー版 Gromacs インストールマニュアル 2015/10/28 本マニュアルでは 単独ユーザが独占的に Linux サーバー (CentOS 6.6) を使用して Gromacs ジョブを実行するための環境構築方法と Winmostar のリモートジョブ機能による計算手順を示しています つまり複数ユーザが共同使用する計算サーバー等は対象外です そのため計算環境は全てユーザのホームディレクトリ配下で行う構築することを想定しています
VDM-SL ISO.VDM++ VDM-SL VDM- RT VDM++ VDM,.VDM, [5]. VDM VDM++.,,, [7]., VDM++.,., [7] VDM++.,,,,,,,.,,, VDM VDMTools OvertureTo
KAOS 1 1 1 1 1,.,. ( ). KAOS VDM++.,.,,, 1. 1.1,, [1].,,, [2].,, [3]. 1.2 ( ),, [3] KAOS, VDM++, KAOS VDM++ 1 Kyushu University, KAOS,, KAOS, KAOS, VDM++., 1.3 2,., 3, KAOS VDM++. 4, 3,. 5 2. 2.1,,,,,
PowerPoint プレゼンテーション
プログラミング応用演習 第 3 回構造体, ファイル入出力 先週の出席確認へのコメント 暗号を破りたいが 平文の候補が多すぎる 人間の目で確認する代わりに どんなプログラムがあればよいか? 辞書を挙げた人が多かった 正しい着眼です 何億個もの平文候補が想定されるので 形態素解析や品詞判別を挙げた人もいます 辞書に近い回答で悪くはないのですが 平文候補ごとにあまり高機能なものを呼び出すと時間がかかる
Microsoft Word - SmartManager User's Manual-2 3 0_JP.docx
SMART MANAGER 取扱説明書 Rev.1.0 この度は 当社製品をお買い上げいただき 誠にありがとうございます ご使用前に取扱説明書をよくお読みの上 正しく安全にお使いください 本マニュアルの内容や画像は製品の性能向上のために予告なく変更又は修正されることがあります マニュアルの内容については 正確性を検証するために最善を尽くしておりますが 記載内容についての保証はいたしておりません ユニモテクノロジー株式会社
tutorial_lc.dvi
00 Linux v.s. RT Linux v.s. ART-Linux Linux RT-Linux ART-Linux Linux [email protected] 1 1.1 Linux Yes, No.,. OS., Yes. Linux,.,, Linux., Linux.,, Linux. Linux.,,. Linux,.,, 0..,. RT-Linux
Linkexpress トラブル初期調査資料 採取コマンド使用手引書
FUJITSU Software Linkexpress Standard Edition V5.0L15 Linkexpress Enterprise Edition V5.0L15 Linkexpress トラブル初期調査資料採取コマンド使用手引書 Windows/Windows(64) J2X1-2740-14Z0(00) 2014 年 12 月 まえがき 本書の目的 本書は 下記製品でエラーが発生した場合の初期調査資料の採取方法を説明します
PCIe SSD (P3700 / P4501 / P4600 / P4800X 向け)書き込み保証値と書き込みデータ量の確認方法
(P3700 / P4501 / P4600 / P4800X 向け ) 書き込み保証値と書き込みデータ量の確認方法 2018 年 5 月 富士通株式会社 有寿命部品 - 製品の書き込み保証値 本製品は 書き込み寿命を有する NAND フラッシュ (P4800X は 3D Xpoint ) を含んだ 有寿命部品 となります お客様のご使用方法により 保証期間内または SupportDesk 契約期間内に
はじめに MS842e 仮想 COM ドライバ インストールマニュアル このマニュアルでは ユニテック 2D バーコードスキャナ MS842e の 仮想 COM ドライバ のインストール方法を紹介しています 仮想 COM ドライバは 日本語入りの QR コード を読取る場合に必要です また 使用して
はじめに MS842e 仮想 COM ドライバ インストールマニュアル このマニュアルでは ユニテック 2D バーコードスキャナ MS842e の 仮想 COM ドライバ のインストール方法を紹介しています 仮想 COM ドライバは 日本語入りの QR コード を読取る場合に必要です また 使用している ( 使用する予定の ) アプリケーションが COM ポートを必要とする場合にも対応できます 使用できないアプリケーションもございますので
パケットモニター (Wireshark) の使い方 第 1 版 1.Wireshark とは ネットワーク上 (LAN ケーブルに流れている ) のパケットを取得して その中の情報を画面に表示するソフトウェア (LAN アナライザーまたはパケットモニター ) の 1 つに Wiresh
パケットモニター (Wireshark) の使い方 1.Wireshark とは ネットワーク上 (LAN ケーブルに流れている ) のパケットを取得して その中の情報を画面に表示するソフトウェア (LAN アナライザーまたはパケットモニター ) の 1 つに Wireshark がある Wireshark は 非常に高機能なオープンソース ( ソース コードが公開されている ) の LAN アナライザで
NFC ucode タグのメモリフォーマット規定
[White Paper] Ubiquitous ID Center Specification DRAFT 2011-02-08 NFC ucode タグのメモリフォーマット規定 Standard of memory format of NFC ucode tag Number: Title: NFC ucode タグのメモリフォーマット規定 Standard of memory format of
Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 0 Copyright 2017 FUJITSU AD
Software-Defined Tester(SDT) を用いた高精度遅延測定による SDN/NFV 品質向上 富士通アドバンストテクノロジ株式会社システム技術統括部大久保克彦 [email protected] 0 背景 リアルタイム性が必要な分野への適用 5G( 低遅延 ) による新たなサービス展開 ゲーム VoIP 動画医療金融車載 遅延がサービス品質に直結 End-to-End
