GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer
|
|
|
- ちかこ ささおか
- 6 years ago
- Views:
Transcription
1 GTC Japan, 2018/09/14 得居誠也, Preferred Networks Chainer における 深層学習の高速化 Optimizing Deep Learning with Chainer
2
3 Chainer のミッション Deep Learning とその応用の研究開発を加速させる 環境セットアップが速い すぐ習熟 素早いコーディング 実験の高速化 結果をさっと公開 論文化 モデルをすぐ応用へ 3
4 Chainer のミッション Deep Learning とその応用の研究開発を加速させる 環境セットアップが速い すぐ習熟 素早いコーディング 実験の高速化 結果をさっと公開 論文化 モデルをすぐ応用へ 4
5 Agenda 1. Chainer の基本 2. Chainer での深層学習の高速化 5
6 1. Chainer の基本 6
7 の前に Deep Learning の基本 7
8 イヌ ネコ 車 入力とパラメータから予測を計算するプログラムを記述して 予測が合うようにパラメータを学習する 8
9 訓練データセット ミニバッチ取得 前処理 順伝播 逆伝播 W W λδw パラメータ更新 9
10 Dataset Updater Iterator, converter Link, Variable, FunctionNode W W λδw Optimizer 10
11 誤差逆伝播 w f x g y h z 0.5 x -2 y -2 z 1 w x y 11
12 誤差逆伝播の実装方法 : Define and Run 計算グラフを作る データをグラフに流す グラフを逆方向にたどって 勾配を計算する 12
13 誤差逆伝播の実装方法 : Define by Run 順伝播を計算する Python コードを実行 実行中に計算の過程をグラフに記録 グラフを逆順にたどって 勾配を計算 13
14 a = F.linear(x, W1, b1) h = F.relu(a) y = F.linear(h, W2, b2) loss = F.softmax_cross_entropy(y, t) loss.backward() 14
15 Define by Run の利点 順伝播が Python プログラムとして自然に書ける デバッグが容易 print デバッグ デバッガ (pdb) の使用 etc. Python 制御構文がそのまま使える 入力に応じて計算を変える というのが Python プログラムとして自然に書ける 15
16 Define by Run の実行特性 計算グラフが毎 iteration で構築される CPU オーバーヘッドを考慮する必要 グラフ最適化はしづらい アドホックな高速化はしやすい 16
17 Chainer はスケールする Python は遅いが GPU の計算コストが十分高ければオーバーヘッドは隠蔽できる ChainerMN を使うことで複数 GPU にスケールできる 17
18 Google AI Open Images Challenge (Object Detection Track) 500 クラスのオブジェクト 1.7M 枚の訓練画像 12M オブジェクト (bounding box) Kaggle 上で 7-8 月にかけて開催 Mark Paul Gosselaar plays the guitar by Rhys A ( CC BY 2.0. Annotated image borrowed from 18
19 Google AI Open Images Challenge PFDet チーム MN-1b: Tesla V100 x 512 枚 1 回の実験で 33 時間 これをくり返し安定して実施 83% のスケーリング効率 T. Akiba, T. Kerola, Y. Niitani, T. Ogawa, S. Sano, S. Suzuki. PFDet: 2nd Place Solution to Open Images Challenge 2018 Object Detection Track 19
20 2. Chainer での深層学習の高速化 20
21 まず高速化の前に 究極的に 高い精度のモデルを素早く手に入れるのが目標であることを忘れない 学習プログラムの完了が速くなっても 得られるモデルの予測性能が落ちていたら意味がない ( という claim をつけた上で 今日のトークでは予測性能の話はほとんどしません ) 21
22 Chainer におけるパフォーマンスの勘所 GPU の計算が効率的かどうか GPU カーネルがちゃんと詰まっているかどうか (CPU ボトルネック ) 22
23 ResNet 50 Tesla V100 (16GB RAM) ImageNet 前処理 :random crop + flip バッチサイズ 32 SerialIterator, StandardUpdater 23
24 GPU 計算の高速化 cudnn を使う で cudnn 同梱パッケージが入る (92 の部分は使用している CUDA toolkit のバージョンに合わせる ) 24
25 GPU 計算の高速化 cudnn autotune 機能を使う 各 convolution の初回実行時に最適なカーネルを探す ( 初回のみオーバーヘッドがある ) 25
26 GPU 計算の高速化 FP16 で計算する メモリ使用量 速度ともに改善する TensorCore が使えればさらに高速に 計算精度が落ちるので 最終的なモデルの予測性能が保たれることを確認する 26
27 GPU 計算の高速化 FP16 で精度を上げる手段 TensorCore を使う (gemm 内の accumulation が fp32) FP32 update 勾配をパラメータの fp32 コピーに足し込む Optimizer の.use_fp32_update() を呼ぶ Loss scaling Backprop 時に定数倍されたエラーを扱うことで underflow を防ぐ StandardUpdater 等の loss_scale= や Optimizer の set_loss_scale() で設定可能 27
28 GPU 計算の高速化 FP16 モードを使う (beta 版機能 ) or デフォルトで float16 が使われる と組合せると TensorCore も有効に 28
29 Visual Profiler で見てみる (fp32 mode) Data load/preprocess: 0.069sec Iteration: 0.112sec データの読み込み 前処理が間に合っていない 29
30 Visual Profiler で見てみる (fp16 mode) Data load/preprocess: 0.138sec Iteration: 0.079sec GPU 側が速くなった分カーネル発行の余裕がなくなり ロード 前処理が隠蔽できなくなっている ロード 前処理自体にもさらに時間がかかるように 30
31 データ前処理の高速化 NumPy の float16 計算は遅い 前処理までは float32 でやることにする 31
32 前処理 fp32 化 Data load/preprocess: 0.070sec Iteration: 0.077sec カーネル発行の余裕がなくなった分 まだデータ前処理のオーバーヘッドが露出している 32
33 データ前処理の高速化 前処理を並列化する MultiprocessIterator を使う データ間の並列化に加え データの先読みも行う 33 参考 :FP32
34 FP16 FP32 34
35 forward/backward の高速化 (beta 版機能 ) 静的グラフ最適化 ( 今月中にリリース予定 ) 計算グラフのうち静的 (iteration ごとに不変 ) な部分をキャッシュし Python オーバーヘッドを減らす モデルの forward とつけるだけ 35
36 特に backward 側に余裕ができた 36
37 cudnn の使用 様々なテクニック Chainer の機能を組合せることでおよそ 3.7 倍の高速化修正は 8 行 37
38 おまけ : バッチサイズを増やす メモリに余裕がある場合 バッチサイズを増やすことで GPU を相対的に重くできる 学習を速く進めるにはテクニックが必要 ( 学習率を同じ比率で上げるなど ) FP16 の方がデータあたりのメモリ消費が少ないのでより大きなバッチサイズを使える FP32 (batchsize x4) FP16 (batchsize x8) 38
39 FP16, Large batch (256) カーネルがちゃんと詰まっている 39
40 さらなる高速化 ChainerMN による multi GPU 学習 ( 次バージョンで Chainer 本体に統合予定 ) 40
41 Chainer 本体のパフォーマンスに対する取り組み CuPy の CPU オーバーヘッド削減 Kernel launch の高速化 Chainer のメモリオーバーヘッド削減 メモリを削減することで より大きなモデル ミニバッチが使えるようになり GPU 負荷を上げる Chainer の CPU オーバーヘッド削減 ( 今後 ) Static subgraph の範囲を広げ グラフ最適化などを盛り込んでいく 41
42 まとめ cudnn の様々な高速化機能を Chainer から使う FP16 + TensorCore を使う 思い通りに速くならなかったら Visual Profiler CPU ボトルネックを解消するには NumPy での fp16 計算を避ける iterator を並列化する Static subgraph optimization を有効にする ChainerMN でさらにスケール Chainer/CuPy の高速化にも引き続き取り組んでいきます 42
第 1 回ディープラーニング分散学習ハッカソン <ChainerMN 紹介 + スパコンでの実 法 > チューター福 圭祐 (PFN) 鈴 脩司 (PFN)
第 1 回ディープラーニング分散学習ハッカソン チューター福 圭祐 (PFN) 鈴 脩司 (PFN) https://chainer.org/ 2 Chainer: A Flexible Deep Learning Framework Define-and-Run Define-by-Run Define Define by Run Model
VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12
VOLTA TENSOR コアで 高速かつ高精度に DL モデルをトレーニングする方法 成瀬彰, シニアデベロッパーテクノロジーエンジニア, 2017/12/12 アジェンダ Tensorコアとトレーニングの概要 混合精度 (Tensorコア) で FP32と同等の精度を得る方法 ウェイトをFP16とFP32を併用して更新する ロス スケーリング DLフレームワーク対応状況 ウェイトをFP16で更新する
Slide 1
ハンズオン受講の為の準備講座 これから始める人の為の ディープラーニング基礎講座 村上真奈 NVIDIA CUDA & Deep Learning Solution Architect NVIDIA Corporation 1 機械学習とディープラーニングの関係 AGENDA ディープラーニングとは? ニューラルネットワークの構造 ディープラーニングの学習とは 畳み込みニューラルネットワーク 午後に予定しているハンズオンの為の基礎講座ディープラーニングをこれから始める方を対象に基礎概念や用語の解説を行います
ストリームを用いたコンカレントカーネルプログラミングと最適化 エヌビディアジャパン CUDAエンジニア森野慎也 GTC Japan 2014
ストリームを用いたコンカレントカーネルプログラミングと最適化 エヌビディアジャパン CUDAエンジニア森野慎也 GTC Japan 2014 コンカレントな処理の実行 システム内部の複数の処理を 平行に実行する CPU GPU メモリ転送 カーネル実行 複数のカーネル間 ストリーム GPU 上の処理キュー カーネル実行 メモリ転送の並列性 実行順序 DEFAULT STREAM Stream : GPU
Anaconda (2019/7/3)
Published on Research Center for Computational Science (https://ccportal.ims.ac.jp) Home > Anaconda3-2019.03 (2019/7/3) Anaconda3-2019.03 (2019/7/3) 1 利用方法 conda, anaconda に関する情報はウェブ上にたくさんありますので それらも参考にしてください
PowerPoint Presentation
ディープラーニングの 実践的な適用ワークフロー MathWorks Japan テクニカルコンサルティング部縣亮 2015 The MathWorks, Inc. 1 アジェンダ ディープラーニングとは?( おさらい ) ディープラーニングの適用ワークフロー ワークフローの全体像 MATLAB によるニューラルネットワークの構築 学習 検証 配布 MATLAB ではじめるメリット 試行錯誤のやりやすさ
Microsoft Word - .....J.^...O.|Word.i10...j.doc
P 1. 2. R H C H, etc. R' n R' R C R'' R R H R R' R C C R R C R' R C R' R C C R 1-1 1-2 3. 1-3 1-4 4. 5. 1-5 5. 1-6 6. 10 1-7 7. 1-8 8. 2-1 2-2 2-3 9. 2-4 2-5 2-6 2-7 10. 2-8 10. 2-9 10. 2-10 10. 11. C
Apache Arrow 須藤功平株式会社クリアコード RubyData Tokyo Meetup Apache Arrow Powered by Rabbit 2.2.2
Apache Arrow 須藤功平株式会社クリアコード RubyData Tokyo Meetup 2018-11-17 Apache Arrow 各種言語で使えるインメモリーデータ処理プラットフォーム 提供するもの 高速なデータフォーマット 高速なデータ処理ロジック 各プロダクトで個別に実装するより一緒にいいものを実装して共有しよう! 効率的なデータ交換処理... 利用例 Apache Arrow
PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部
PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server ご紹介 @ OSC Tokyo/Spring 2015 2015/02/28 株式会社イグアスソリューション事業部 アジェンダ Eclipse ベースの PHP 開発ツール Zend Studio 11 日本語版によるアプリケーション開発について PHP アプリケーションサーバー Zend Server
Rの基本操作
Microsoft Azure 高校生のための Azure Machine Learning By M. Takezawa 機械学習 (Machine Learning) とは 機械学習とは 機械にデータを学習させ データに潜むパターンや特性を発見し予測させることです Microsoft Azure Machine Learning とは Microsoft 社が提供する Azure の機能の一つであり
NGSハンズオン講習会
207.08.08 版 プラスアルファの内容です NGS 解析 ( 初 ~ 中級 ) ゲノムアセンブリ後の各種解析の補足資料 ( プラスアルファ ) 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究プログラム寺田朋子 門田幸二 Aug 29-30 207 Contents Gepard でドットプロット 連載第 8 回 W5-3 で最も長い sequence 同士のドットプロットを実行できなかったが
dlshogiアピール文章
第 28 回世界コンピュータ将棋選手権 dlshogi アピール文章 山岡忠夫 2018 年 5 月 1 日更新 下線部分は 第 5 回将棋電王トーナメントからの差分を示す 1 特徴 ディープラーニングを使用 指し手を予測する Policy Network 局面の勝率を予測する Value Network 入力特徴にドメイン知識を活用 モンテカルロ木探索 並列化 自己対局による強化学習 既存将棋プログラムの自己対局データを使った事前学習
Oracle Data Pumpのパラレル機能
Oracle Data Pump のパラレル機能 Carol Palmer オラクル社 Principal Product Manager はじめに Oracle Database 10g 上の Oracle Data Pump により 異なるデータベース間のデータとメタデータを高速で移動できます Data Pump の最も便利な機能の 1 つは エクスポート ジョブとインポート ジョブをパラレルに実行しパフォーマンスを高める機能です
WiFiの現状
V1.0 2019/10/23 はじめての AI 用パソコン Chainer/caffe/opencv 学習編 (ubuntu 版 ) 抜粋版 スペクトラム テクノロジー株式会社 https://spectrum-tech.co.jp [email protected] 1 目次 ページ 1. Ubuntuについて 3 2. 基本コマンド 3 3. 基本操作 5 4. 日常運用 9
SUALAB INTRODUCTION SUALAB Solution SUALAB は 人工知能 ( ディープラーニング ) による画像解析技術を通して 迅速 正確 そして使いやすいマシンビジョン用のディープラーニングソフトウェアライブラリーである SuaKIT を提供します これは 従来のマシン
SuaKIT suɑ kít Deep learning S/WLibrary for MachineVision SuaKIT は ディスプレイ 太陽光 PCB 半導体など 様々な分野で使用できる メーカー独自のディープラーニングのマシンビジョンソフトウェアライブラリーです SuaKIT は 様々な産業分野から実際に取得された画像データに基づいて開発されました Samsung LG SK Hanwha
データセンターの効率的な資源活用のためのデータ収集・照会システムの設計
データセンターの効率的な 資源活用のためのデータ収集 照会システムの設計 株式会社ネットワーク応用通信研究所前田修吾 2014 年 11 月 20 日 本日のテーマ データセンターの効率的な資源活用のためのデータ収集 照会システムの設計 時系列データを効率的に扱うための設計 1 システムの目的 データセンター内の機器のセンサーなどからデータを取集し その情報を元に機器の制御を行うことで 電力消費量を抑制する
AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン
ハンズオンラボ2 DIGITS による物体検出入門 村上真奈 NVIDIA CUDA & Deep Learning Solution Architect NVIDIA Corporation 1 AGENDA ディープラーニングとは Qwiklab/Jupyter notebook/digits の使い方 DIGITS による物体検出入門ハンズオン ディープラーニングとは 機械学習とディープラーニングの関係
スライド 1
GPU クラスタによる格子 QCD 計算 広大理尾崎裕介 石川健一 1.1 Introduction Graphic Processing Units 1 チップに数百個の演算器 多数の演算器による並列計算 ~TFLOPS ( 単精度 ) CPU 数十 GFLOPS バンド幅 ~100GB/s コストパフォーマンス ~$400 GPU の開発環境 NVIDIA CUDA http://www.nvidia.co.jp/object/cuda_home_new_jp.html
提案書
アクセスログ解析ソフト Angelfish インストールについて Windows 版 2018 年 05 月 07 日 ( 月 ) 有限会社インターログ TEL: 042-354-9620 / FAX: 042-354-9621 URL: http://www.interlog.co.jp/ はじめに Angelfish のインストールに手順について説明致します 詳細は US のヘルプサイトを参照してください
CuPy とは何か?
GTC Japan 2018 CuPy NumPy 互換 GPU ライブラリによる Python での高速計算 Preferred Networks 取締役最高技術責任者奥田遼介 [email protected] CuPy とは何か? CuPy とは GPU を使って NumPy 互換の機能を提供するライブラリ import numpy as np X_cpu = np.zeros((10,))
Pervasive PSQL v11 のベンチマーク パフォーマンスの結果
Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7
ディープラーニングが変える未来 - PFN の事業戦略と Chainer on AWS - Preferred Networks 研究担当 VP 比戸将平
ディープラーニングが変える未来 - PFN の事業戦略と Chainer on AWS - Preferred Networks 研究担当 VP 比戸将平 株式会社 Preferred Networks (PFN) 設立 :2014 年 3 月 所在地 : 東京本社 カリフォルニア州バークレー ( 米国子会社 ) 社員数 : 日本約 150 名 米国 7 名 人工知能技術 ( ディープラーニング )
PowerPoint プレゼンテーション
Oracle GRID Center Flash SSD + 最新ストレージと Oracle Database で実現するデータベース統合の新しい形 2011 年 2 月 23 日日本オラクル Grid Center エンジニア岩本知博 進化し続けるストレージ関連技術 高速ストレージネットワークの多様化 低価格化 10GbE FCoE 8Gb FC ディスクドライブの多様化および大容量 / 低価格化
ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン
ハンズオンラボ DIGITS による物体検出入門 山崎和博 ディープラーニング ソリューションアーキテクト エヌビディア ディープラーニングとは AGENDA Qwiklabs/DIGITS の使い方 DIGITS による物体検出入門ハンズオン ディープラーニングとは 様々な分野でディープラーニングを応用 インターネットとクラウド 医学と生物学 メディアとエンターテイメント セキュリティと防衛 機械の自動化
FUJITSU Cloud Service for OSS 「コンテナサービス」 ご紹介資料
注 : 本サービスは 新規申込の受付を停止しております サービスご検討中のお客様におかれましては ご不便をおかけし申し訳ございません FUJITSU Cloud Service for OSS コンテナサービス ご紹介 2018 年 8 月富士通株式会社 本資料の無断複製 転載を禁じます 本資料は予告なく内容を変更する場合がございます Version 1.01 目次 Docker/Kubernetes
Mastering the Game of Go without Human Knowledge ( ) AI 3 1 AI 1 rev.1 (2017/11/26) 1 6 2
6 2 6.1........................................... 3 6.2....................... 5 6.2.1........................... 5 6.2.2........................... 9 6.2.3................. 11 6.3.......................
Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ 3.7x faster P100 V100 P10
NVIDIA TESLA V100 CUDA 9 のご紹介 森野慎也, シニアソリューションアーキテクト (GPU-Computing) NVIDIA Images per Second Images per Second VOLTA: ディープラーニングにおける大きな飛躍 ResNet-50 トレーニング 2.4x faster ResNet-50 推論 TensorRT - 7ms レイテンシ
,., ping - RTT,., [2],RTT TCP [3] [4] Android.Android,.,,. LAN ACK. [5].. 3., 1.,. 3 AI.,,Amazon, (NN),, 1..NN,, (RNN) RNN
DEIM Forum 2018 F1-1 LAN LSTM 112 8610 2-1-1 163-8677 1-24-2 E-mail: [email protected], [email protected], [email protected],,.,,., LAN,. Android LAN,. LSTM LAN., LSTM, Analysis of Packet of
PowerPoint プレゼンテーション
ARM 用統合開発環境 EWARM アドオンツール C-RUN のご紹介 2015.1 IAR システムズ株式会社 www.iar.com C-RUN 概要 www.iar.com C-RUN とは? 統合開発環境 EWARM のデバッグ機能が強化されました C-RUN はデバッグ効率アップを目的としたアドオンツールです 単体テスト時の動的解析が簡単 & 安価に可能です 従来の解析ツール 開発プロセスの変更が必要
PowerPoint プレゼンテーション
講座準備 講座資料は次の URL から DL 可能 https://goo.gl/jnrfth 1 ポインタ講座 2017/01/06,09 fumi 2 はじめに ポインタはC 言語において理解が難しいとされる そのポインタを理解することを目的とする 講座は1 日で行うので 詳しいことは調べること 3 はじめに みなさん復習はしましたか? 4 & 演算子 & 演算子を使うと 変数のアドレスが得られる
About me! 足立昌彦 / +Masahiko.Adachi )! バイドゥ株式会社技術顧問 (Simeji)! 株式会社カブク Co-Founder! Google Developer Expert (Android)
Discover Support Library Masahiko Adachi @adamrokcer / +Masahiko.Adachi 28 th Sep, 2013 About me! 足立昌彦 ( @adamrocker / +Masahiko.Adachi )! バイドゥ株式会社技術顧問 (Simeji)! 株式会社カブク Co-Founder! Google Developer Expert
XNA Framework
XNA Framework 2.0 M@STER SESSION 01 XNA Framework の技術的背景 システム基盤は.NET Framework マネージ環境で実行 クロスプラットフォーム Windows, Xbox360, Zune DirectX, MDX から独立している 開発 実行環境の構造 XNA Game Studio (Visual Studio 2005) XNA Framework
名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL アライアンスパートナー コアテクノロジーパートナー NVIDIA JAPAN ソリュ
GPUDirect の現状整理 multi-gpu に取組むために G-DEP チーフエンジニア河井博紀 ([email protected]) 名称 : 日本 GPU コンピューティングパートナーシップ (G-DEP) 所在 : 東京都文京区本郷 7 丁目 3 番 1 号東京大学アントレプレナープラザ, 他工場 URL http://www.gdep.jp アライアンスパートナー コアテクノロジーパートナー
製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析
ホワイトペーパー Excel と MATLAB の連携がデータ解析の課題を解決 製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析に使用することはできず
パフォーマンス徹底比較 Seasar2 vs Spring 2006/04/12 株式会社電通国際情報サービスひがやすを株式会社アークシステム本間宏崇 Copyright the Seasar Foundation and the others all rights reserved.
パフォーマンス徹底比較 Seasar2 vs Spring 2006/04/12 株式会社電通国際情報サービスひがやすを株式会社アークシステム本間宏崇 1 目的 DI コンテナの実装によるパフォーマンスの違いを明らかにする DI コンテナが行う処理の中で どこに時間が掛かるのかを明らかにする 2 ベンチマーク測定環境 ハードウェア HP ProLiant DL360 G4p CPU: Intel Xeon
Sylpheed とは オープンソースのメールソフト ライセンスは GPL+LGPL 高速 軽量 高機能 高い操作性 高い信頼性 導入が容易 マルチプラットフォーム Windows, Linux, etc. 多言語対応 ( 約 30 ヶ国語 )
最新版オープンソースメールソフト Sylpheed 3.0 徹底解説 ~ マルチスレッド対応とプラグイン機能による Sylpheed の未来 ~ OpenSource Conference 2010 Tokyo/Spring SRA OSS, Inc. 日本支社山本博之 Sylpheed とは オープンソースのメールソフト ライセンスは GPL+LGPL 高速 軽量 高機能 高い操作性 高い信頼性
MMUなしプロセッサ用Linuxの共有ライブラリ機構
MMU なしプロセッサ用 Linux の共有ライブラリ機構 大谷浩司 高岡正 近藤政雄 臼田尚志株式会社アックス はじめに μclinux には 仮想メモリ機構がないので共有ライブラリ機構が使えない でもメモリ消費抑制 ストレージ消費抑制 保守性の向上のためには 欲しい 幾つかの実装があるが CPU ライセンス 機能の制限のためにそのまま利用できない RidgeRun 社 (Cadenux 社 )
course pptx
ParaView () 20105141CAE OPENFOAM (R) is a registered trade mark of OpenCFD Limited, the producer of the OpenFOAM software and owner of the OPENFOAM (R) and OpenCFD (R) trade marks. This offering is not
自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2
リカレントニューラルネットワークの概要と動作原理 竹田卓也 後援 : ドワンゴ 1 自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2 アウトライン Feed forward neural network Recurrent neural
PowerPoint プレゼンテーション
IDCF クラウドハンズオン IDCFクラウド 上に クラウドメール配信サービス SendGrid と超高速 WordPress 仮想マシン KUSANAGI でサイトを構築してみよう! 1 本日の内容 WordPress の高速化について 超高速 WordPress 仮想マシン KUSANAGI について ハンズオン KUSANAGI for IDCF クラウド仮想マシンの構築 起動 クラウドメール配信サービス
自己紹介 小林由幸 1999 年にソニーに入社 2003 年より機械学習技術の研究開発を始め 音楽解析技術 12 音解析 のコアアルゴリズム 認識技術の自動生成技術 ELT などを開発 近年は Neural Network Console を中心にディープラーニング関連の技術 ソフトウェア開発を進め
GTC Japan 2017 ソニーのディープラーニングソフトウェア Neural Network Libraries / Console ソニーネットワークコミュニケーションズ株式会社 / ソニー株式会社シニアマシンラーニングリサーチャー小林由幸 ソニー株式会社マシンラーニングリサーチエンジニア成平拓也 自己紹介 小林由幸 1999 年にソニーに入社 2003 年より機械学習技術の研究開発を始め
VelilogHDL 回路を「言語」で記述する
2. ソースを書く 数値表現 数値表現形式 : ss'fnn...n ss は, 定数のビット幅を 10 進数で表します f は, 基数を表します b が 2 進,o が 8 進,d が 10 進,h が 16 進 nn...n は, 定数値を表します 各基数で許される値を書くこ Verilog ビット幅 基数 2 進表現 1'b0 1 2 進 0 4'b0100 4 2 進 0100 4'd4 4
Slide 1
ディープラーニング最新動向と技術情報 なぜ GPU がディープラーニングに向いているのか エヌビディアディープラーニングソリューションアーキテクト兼 CUDAエンジニア村上真奈 ディープラーニングとは AGENDA なぜ GPU がディープラーニングに向いているか NVIDIA DIGITS 2 ディープラーニングとは 3 Google I/O 2015 基調講演 ディープラーニングのおかげで わずか一年で音声認識の誤認識率が
Poincaré Embedding による 分散表現の獲得 M1 橋本隼人 森信介 京都大学情報学研究科 / 学術情報メディアセンター森研究室 1
Poincaré Embedding による 分散表現の獲得 M1 橋本隼人 森信介 京都大学情報学研究科 / 学術情報メディアセンター森研究室 1 おしらせ 予稿集から変更 ネガティブサンプリングの式 追加実験 ご意見等は予稿のアドレスかこちらへ http://www.ar.media.kyoto-u.ac.jp/ 京都大学森研究室自然言語処理
Source Insight
ソースインサイト プログラムエディタ Source Insight のご紹介 ソースを理解しながら 効率の良いコーディング エクセルソフト株式会社営業部 エクセルソフト株式会社 Copyright 2008 XLsoft K.K. All Rights Reserved. - 1 - 目次 プログラムエディタ Source Insight のご紹介 ソースを理解しながら 効率の良いコーディング 目次
CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン
CUDA 画像処理入門 エヌビディアジャパン CUDA エンジニア森野慎也 GTC Japan 2014 CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン RGB Y( 輝度 ) 変換 カラー画像から グレイスケールへの変換 Y = 0.299 R + 0.587
Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行
< ここに画像を挿入 > Oracle SQL Developer の移行機能を使用した Oracle Database への移行 以下の事項は 弊社の一般的な製品の方向性に関する概要を説明するものです また 情報提供を唯一の目的とするものであり いかなる契約にも組み込むことはできません 以下の事項は マテリアルやコード 機能を提供することをコミットメント ( 確約 ) するものではないため 購買決定を行う際の判断材料になさらないで下さい
PowerPoint プレゼンテーション
次世代 IoT に向けた AI の組み込み実装への 取り組み AI の推論機能を FPGA に実装するための技術とソリューション提案 Embedded Product Business Development Department Agenda 1. エッジAIの現状 2. 組み込みAIのニーズ 3.FPGAとエッジAI 4. 組み込み向けエッジAI 実装の特性 (GPUとFPGA) 5. エッジAI
MMC Unity講座
MMC Unity 講座 第 4 回 : ~ バーを実装 ~ 今回のおしながき 1. バーの作成 2. スクリプトの作成 3. ゲームオーバーの設定 4. ビルドする 2 今回の新概念 Constraints 列挙型 enum FixedUpdateメソッド Tag Build 3 バーの作成 4 バーの作成 Hierarchy タブの Canvas を右クリック UI Image 名前を Bar
3次多項式パラメタ推定計算の CUDAを用いた実装 (CUDAプログラミングの練習として) Implementation of the Estimation of the parameters of 3rd-order-Polynomial with CUDA
3 次多項式パラメタ推定計算の CUDA を用いた実装 (CUDA プログラミングの練習として ) Estimating the Parameters of 3rd-order-Polynomial with CUDA ISS 09/11/12 問題の選択 目的 CUDA プログラミングを経験 ( 試行錯誤と習得 ) 実際に CPU のみの場合と比べて高速化されることを体験 問題 ( インプリメントする内容
適応フィルタのSIMD最適化
茂木和洋 @ まるも製作所 今回は省略 初めての方は #1 の資料を参照 適応フィルタとは 適応フィルタの問題点 ( 速度面で ) SIMD 比較命令でマスク処理 ベンチマーク 固定のフィルタではなく 入力値によって処理を変更し 最適な結果を求める 例 基準値との差異を閾値と比較して 参照画素として使うか使わないかを切り替える 最小自乗法でフィッティングしてフィルタ係数自体を動的に作成する 他いろいろ
ホワイトペーパー FUJITSU AI Zinraiディープラーニング システム FUJITSU Storage ETERNUS NR1000A Series 増大する学習データに対応するディープラーニングシステム
ホワイトペーパー FUJITSU AI Zinrai ディープラーニングシステム FUJITSU Storage ETERNUS NR1000A Series 増大する学習データに対応するディープラーニングシステム 2018 年 12 月 第 1.0 版 本書では FUJITSU AI Zinrai ディープラーニングシステムと FUJITSU Storage ETERNUS NR1000A Series
プログラミング基礎I(再)
山元進 クラスとは クラスの宣言 オブジェクトの作成 クラスのメンバー フィールド 変数 配列 メソッド メソッドとは メソッドの引数 戻り値 変数の型を拡張したもの 例えば車のデータベース 車のメーカー 車種 登録番号などのデータ データベースの操作 ( 新規データのボタンなど ) プログラムで使う部品の仕様書 そのクラスのオブジェクトを作ると初めて部品になる 継承 などの仕組みにより カスタマイズが安全
Microsoft Word - Python利用環境構築ガイド_ docx
Python 利 環境構築ガイド (2019 年 5 7 版 ) このガイドは プログラミング 語 Python を いてメッシュ農業気象データを処理できるように PC をセットアップする 順を説明するものです 1. 使 するソフトウェア 1-1. Anaconda と Spyder Anaconda は プログラミング 語 Python の利 環境と Python を利 する上で便利なソフトウェアが
智美塾 ゆもつよメソッドのアーキテクチャ
ゆもつよメソッドのテスト要求分析とテストアーキテクチャ設計 JaSST13 東京智美塾 2013 年 1 月 30 日 湯本剛 ( 日本 HP) [email protected] ゆもつよ風テスト開発プロセス テスト計画 実現したい品質の具体的把握 テスト箇所の選択 テストの目的設定 テスト対象アイテム特定 テスト分析 テストタイプ特定 機能の整理 & 再分類 テスト条件となる仕様項目特定
MATLAB EXPO 2019 Japan プレゼン資料の検討
自動運転向けソフトウェア Autoware と MATLAB /Simulink の連携 ~ 事例紹介 ~ 2019 年 5 月 28 日株式会社ネクスティエレクトロニクス SW 開発部技術開発グループ太田徳幸 Copyright TOMEN Electronics Corp. 目次 2/31 1. 会社概要 2. Autoware Toolbox 紹介 1. 取り組み背景 2. Autoware
UMLプロファイル 機能ガイド
UML Profile guide by SparxSystems Japan Enterprise Architect 日本語版 UML プロファイル機能ガイド (2016/10/07 最終更新 ) 1. はじめに UML では ステレオタイプを利用することで既存の要素に意味を追加し 拡張して利用することができます このステレオタイプは個々の要素に対して個別に指定することもできますが ステレオタイプの意味と適用する
Java知識テスト問題
Java 知識テスト SDAS プログラマ(Java 編 ) 運営事務局 このテストは J2EE プログラマとしての Java の知識を評価するものです 問題は 30 問, テスト時間は J2EE 知識テストとあわせて 90 分です 問題は全て択一式です 選択肢から 1 つだけ選択してください 資料の閲覧は禁止です テストが終わり次第 答案用紙を提出していただいてかまいません テスト終了後, 本テストの内容を他の方に話さないでください
1. GPU コンピューティング GPU コンピューティング GPUによる 汎用コンピューティング GPU = Graphics Processing Unit CUDA Compute Unified Device Architecture NVIDIA の GPU コンピューティング環境 Lin
Windows で始める CUDA 入門 GTC 2013 チュートリアル エヌビディアジャパン CUDA エンジニア森野慎也 1. GPU コンピューティング GPU コンピューティング GPUによる 汎用コンピューティング GPU = Graphics Processing Unit CUDA Compute Unified Device Architecture NVIDIA の GPU コンピューティング環境
b4-deeplearning-embedded-c-mw
ディープラーニングアプリケーション の組み込み GPU/CPU 実装 アプリケーションエンジニアリング部町田和也 2015 The MathWorks, Inc. 1 アジェンダ MATLAB Coder/GPU Coder の概要 ディープニューラルネットワークの組み込み実装ワークフロー パフォーマンスに関して まとめ 2 ディープラーニングワークフローのおさらい Application logic
P1-1 P1-2 P1-3 P1-4 P1-5 P1-6 P3-1 P3-2 P3-3 P3-4 P3-5 P3-6 P5-1 P5-2 P5-3 P5-4 P5-5 P5-6 P7-1 P7-2 P7-3 P7-4 P7-5 P7-6 P9-1 P9-2 P9-3 P9-4 P9-5 P9-6 P11-1 P11-2 P11-3 P11-4 P13-1 P13-2 P13-3 P13-4 P13-5
