PowerPoint プレゼンテーション - PDF 無料ダウンロード

リフレッシュ meet-up 機械学習のガクシュウ 2015 年 12 月 16 日技術研究所井上祐寛

もくじ機械学習とは機械学習の分類深層学習 Deep Learnig 研究の最新動向最新の機械学習デモ Tensor Flow Google Cloud API Raspberry Pi で Watson 日本語質問応答システム 1

機械学習とは機械が学習するってどういう事ですか? 機械はどうやって学習するの? 機械が学習すると何が嬉しいの? 機械学習の分類 2

1. 機械学習とは機械が学習するってどういう事ですか? 明示的にプログラミングすることなくデータから学習することによってコンピュータが振る舞い方 ( モデル ) を獲得する技術 ( 科学的方法論 ) 縦横 30cm 未満なら S へ移動縦横 30cm 以上なら L へ移動 cross_entropy = - tf.reduce_sum(y_*tf.log(y_con v)) train_step = tf.train.adamoptimizer(1e- 4).minimize(cross_entropy) correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1)) プログラムされたルールによって分類 S L L S 特徴から分類 3

1. 機械学習とは機械はどうやって学習するの? 例えば子供に写真を見せてさかなを教えてみましょうこれは??? さかなだよこれは? さかなさかなだよこれは? 初めて見せる写真さかな ( 特徴 ) 紡錘系背びれ尾びれエラ目玉が大きい 4

1. 機械学習とはさかなの写真正解データさかなさかな入力特徴を学習円柱状でまん中が太く両端がしだいに細くなる大きい黒い丸 ( 目 ) 初めて見せる写真入力見分けるモデル学習の結果得られた法則性数式データ構造変更可能なパラメータ値の集合イラストは? さかな 5

1. 機械学習とは機械学習はデータを判断すること識別分類予測クラスタリング犬猫機械学習を利用した例市場などの予測文字認識画像解析異常検知故障予知レコメンデーションロボットなどの行動獲得遺伝子などの相関分析医療などの診断質問応答対話システム 6

1. 機械学習とは機械が学習すると何が嬉しいの? 頭痛と熱が続いておとといからです入力どうされましたか? いつからですか? 支援アドバイス 1 アドバイス 2 アドバイス 3 音声認識問診内容の認識知識からアドバイスの提示学習済の知識症例論文知識医師は問診で忙しい一週間で読めても 4 つくらいの論文報告され増える症例に有効なものもがある現実には毎月 2 万もの論文が発表され一人の人間が読みこなせる量ではない最新の論文症例を医者にかわって学習しておくことで医師に対してアドバイスをする事ができ医師患者にとって有益に働く 7

機械学習の分類教師あり学習教師なし学習その他分類 ( 中間的手法 ) 8

2. 機械学習の分類機械学習分類教師あり学習既知の情報を使って未知の情報の予測器を構築します回帰実数値を予測する回帰手法線形回帰リッジ回帰クラス分類カテゴリを予測する分類手法としてロジスティック回帰サポートベクターマシン教師なし学習データに含まれるパターンを見つけ出しデータの性質を理解することを目指すクラスタリングクラスタリングの代表的手法として K 平均法混合正規分布情報圧縮次元削除の手法として主成分分析その他分類レコメンデーション自然言語処理強化学習半教師あり学習アンサンブル学習オンライン学習深層学習目的とデータ特性に応じて教師あり / なしの枠を超えて開発された機械学習の分類 9

2. 機械学習の分類教師あり学習正解のついたデータを使いモデルの生成を行う学習データ正解のついたデータで入力出力がセットとなる ( こう入力したこう出力する ) 特徴属性 ( 連続値 / 離散値 ) 入力データ正解データ出力データさかなデータはラベル or 数値となる例 : ラベル = 男 / 女晴 / 曇 / 雨数値 = 長さ温度正解の値正解がラベルの場合は識別問題この時の正解はクラス (class) と呼ぶ正解が数値の場合は回帰問題この時の正解はターゲット (class) と呼ぶ 10

2. 機械学習の分類特徴属性 ( 連続値 / 離散値 ) 学習データ正解データデータの例 : ベクトルです入力データ [( 男 28,178, 75, yes), ( 女 68,165, 44, no)] 出力データ [0,1] 入力データ出力データ入力データモデル出力データ [ 画素, ] さかな入力データを出力データ ( 正解 ) となるようモデルを学習する 11

2. 機械学習の分類教師なし学習教師なし学習は入力用データのみを与えデータの中になる一定のパターンやルールを抽出する ( モデル推定パターンなどの特徴抽出 ) 正解情報が無いデータを使いモデル推定パターンなどの特徴を検出特徴属性 ( 連続値 / 離散値 ) 入力データ与えられた入力データに潜む規則性を学習すること目的着目すべき規則性 1 モデル推定入力データ全体を支配する規則性学習によって推定する問題がモデル推定 2 パターンマイニング入力データの部分集合内あるいは部分集合間に成り立つ規則性多くの様相に埋もれて見えにくくなっているものを発見する問題がパターンマイニングさかなっぽいなぁ 12

3. 深層学習深層学習 Deep Learning ディープラーニングの基本ディープラーニングの種類画像認識 / 音声認識 / 自然言語処理 13

3. 深層学習ブレイクスルー ILSVRC(Imagenet Large Scale Visual Recognition Challenge) 2012 年カナダのトロント大学 ( 初参加 ) が開発した SuperVision が他を大きく引き離して優勝 Task 1 (classification) Result # Team name Error (5 guesses) Description 1 SuperVision 0.15315 Using extra training data from ImageNet Fall 2011 release 2 SuperVision 0.16422 Using only supplied training data 3 ISI 0.26172 Weighted sum of scores from each classifier with SIFT+FV, LBP+FV, GIST+FV, and CSIFT+FV, respectively. 4 ISI 0.26602 Weighted sum of scores from classifiers using each FV. 5 ISI 0.26646 Naive sum of scores from classifiers using each FV. トロント大学の SuperVision がエラー率 15 で他を圧倒的に引き離し勝利ちなみに 2015 年は Google が 4.82% でトップ 6 ISI 0.26952 Naive sum of scores from each classifier with SIFT+FV, LBP+FV, GIST+FV, and CSIFT+FV, respectively. 7 OXFORD_VGG 0.26979 Mixed selection from High-Level SVM scores and Baseline Scores, decision is performed by looking at the validation performance お手軽デモ http://demo.caffe.berkeleyvision.org/ 14

3. 深層学習 1,000 クラスある候補の中からどれだけ正確に答えを識別できるかを競う学習アルゴリズムの競技 ( 学習データ 1,000 万枚主題 15 万枚 ) 出題ヒョウ正解確信度 15

3. 深層学習ディープラーニングの基本ニューラルネットワーク入力層隠れ層出力層前の層の出力 0.5-2 -1 重み 0.3 x 3 0.4 b=0. 3 X=f(0.5*(-1) + (-2)*0.3 + 3*0.4 + 0.3) = f(0.4) 16

3. 深層学習手書き文字の認識 MNIST( エムニスト ) 画像認識の世界ではよく使われる標準的な手書き画像データセット 28 x 28 = 784 ピクセル画像は 7 万枚画像には正解ラベルが付けられているこの画像をピクセル単位に分解してニューラルネットワークに読み込ませ認識させる 17

3. 深層学習入力データ 28x28 pixel 入力層 784 個並ぶ出力層 0~9 まで 10 個並ぶ出力結果数字確率 0 0.05 1 0.05 2 0.05 3 0.40 4 0.05 5 010 6 0.05 7 0.05 8 0.15 9 0.05 18

3. 深層学習間違えて認識した場合出力結果数字確率 0 0.05 1 0.05 2 0.05 3 0.15 4 0.05 5 010 6 0.05 7 0.05 8 0.40 9 0.05 重みづけを変えて正しい正解が出せるよう調整する ( 学習法 : 誤差逆伝播 back Propagation) 出力結果数字確率 0 0.05 1 0.05 2 0.05 3 0.40 4 0.05 5 010 6 0.05 7 0.05 8 0.15 9 0.05 正解が出力されるよう ( 誤差を小さく ) 各重みづけを調整します重みづけを大きくすると誤差が減るのか小さくすると誤差が減るのかを計算し誤差が小さくなる方向にそれぞれの重みづけを微調整する 19

宣伝詳しくは機械学習勉強会へ! 次年度は人工知能 / 機械学習勉強会へパワーアップ! 活動テーマの例 SF 映画に学ぶ AI 20

3. 深層学習研究の最新動向 21

3. 深層学習 Zero-Shot Learnig カナダウグイス Canada War Canada War lion ライオン lion 事例空間ラベル空間 X: 原言語 Y: 目的言語事例をラベル空間へ写像する行列 M を学習対訳抽出 22

3. 深層学習 Caption Generation 23

3. 深層学習 Caption Generation 24

3. 深層学習画像を入力すると説明文を出力する画像認識の CNN(Convolutional neural network) と自然言語処理の RNN(Recurrent Neural Network) の組合せ http://deeplearning.cs.toronto.edu/i2t http://googleresearch.blogspot.jp/2014/11/a-picture-is-worth-thousand-coherent.html 25

3. 深層学習マルチモーダル分散表現画像とテキストを共通のベクトル空間で表現するマルチモーダル分散表現ベクトル表現の間で演算が可能も可能例えば青い車の画像から青という単語を引いて赤という単語を足すと演算先の空間の近傍には赤い車が集まっている事となる 26

最新の機械学習デモ Tensor Flow Google Cloud API Raspberry Pi で Watson 日本語質問応答システム 27

4. 最新の機械学習デモ TensorFlow 2015/11 音声検索写真認識翻訳サービスとなど自社サービスに適用してきた google 機械学習の開発基盤が OSS として公開 Tutorials MNIST MNIST For ML Beginners Deep MNIST for Expoerts 単層ロジスティック回帰 ( 識別率約 91.2%) 多層畳み込みニューラルネットワーク ( 識別率約 99.2%) DEMO 自分で書いた文字を認識させよう 28

4. 最新の機械学習デモ Google Cloud Vision API 2015/12/2 What is Cloud Vision API? 画像認識機能を簡単の API で提供 (REST) TensorFlow 学習しなくとも手軽に Deep Learnig が試せる顔検知画像上の複数の顔目鼻口の位置感情物体検知ロゴ認識ランドマークの認識セーフサーチ検知 OCR 29

4. 最新の機械学習デモ Raspberry Pi で Watson 日本語応答システムデモ動画 30

おしまい 31