人工知能と機械学習

Similar documents
PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

AI AI Artificial Intelligence AI Strategy& Foresight AI AI AI AI 1 AI AI AI AI AI AI AI AI AI AI AI AI AI 2 AI 1 AI AI 3 AI 3 20 AI AI AI AI AI

PowerPoint プレゼンテーション

Slide 1

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1

人工知能による物流改革_損保ジャパン日本興亜

ユーザーのページ

PowerPoint プレゼンテーション

Microsoft PowerPoint - e-stat(OLS).pptx

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

Cisco ViewMail for Microsoft Outlook クイックスタートガイド (リリース 8.5 以降)


コンピュータ応用・演習 情報処理システム

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

PowerPoint プレゼンテーション

< 目次 > 1. パソコンの画面構成... 3 連絡先一覧... 3 連絡先一覧の切り替え... 4 連絡先... 6 付帯情報... 7 関連... 7 代行入力... 8 CRM... 8 グローバルメニュー SkyDesk Cards R for ios 画面構成... 12

Rの基本操作

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

目次 目次 1. はじめに 2. ログイン ID とアクセス権限 3. 前提条件 4. 事前準備 ( ログイン ) 4-1. ログイン画面アクセス 4-2. ログイン 4-3. ログイン後 5. ホーム画面 6. 特記すべき画面操作 6-1. カレンダー表示 6-2. メニュー表示 6-3. クリッ

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

Bluemix いつでもWebinarシリーズ 第15回 「Bluemix概説(改訂版)」

人類の誕生と進化

メタデータスキーマレジストリ MetaBridge の概要

PowerPoint プレゼンテーション

13章 回帰分析

dlshogiアピール文章

スライド 1

Microsoft Word - Scratch編_プログラム見本-Web用.docx

スーパー英語アカデミック版Ver.2

2 Web ページの文字のサイズを変更するには 以下を実行します Alt + P キーを押して [ ページ ] メニューを選択します X キーを押して [ 文字のサイズ ] を選択します 方向キーを押して 文字のサイズを [ 最大 ] [ 大 ] [ 中 ] [ 小 ] [ 最小 ] から選択します

Microsoft Word - 26 【標準P】演習TN ArcGIS.doc

PowerPoint プレゼンテーション

Oracle Cloud Adapter for Oracle RightNow Cloud Service

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習

040402.ユニットテスト

スライド 1

PowerPoint プレゼンテーション

PDF Convertor for mac スタートアップガイド

PowerPoint プレゼンテーション

リスク分析・シミュレーション

PowerPoint プレゼンテーション

プロジェクトマネジメント知識体系ガイド (PMBOK ガイド ) 第 6 版 訂正表 - 第 3 刷り 注 : 次の正誤表は PMBOK ガイド第 6 版 の第 1 刷りと第 2 刷りに関するものです 本 ( または PDF) の印刷部数を確認するには 著作権ページ ( 通知ページおよび目次の前 )

PowerPoint プレゼンテーション

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

tokyo_t3.pdf

1.民営化

パワーポイントの品質と生産性を向上させるデザイン・テンプレート

目次 ログイン ログイン お知らせ画面... 3 チェック結果の表示 / 新規作成 / 更新 / データ出力 チェック結果一覧の表示 新規作成 チェック結果の検索 チェック結果の詳

Visual Studio 2017 RC インストール & ファーストステップガイド 2016 年 11 月 16 日 (V1.0)

PowerPoint プレゼンテーション

どのような生活を送る人が インターネット通販を高頻度で利用しているか? 2013 年 7 月 公益財団法人流通経済研究所主任研究員鈴木雄高 はじめにもはやそれなしでの生活は考えられない このように インターネット通販を生活に不可欠な存在と位置付ける人も多いであろう 実際 リアル店舗で買えて ネットで

1. 推計の概要 ブログ SNS 市場の市場規模の現状や将来動向について 推計を実施 具体的には ブログ SNS 市場及び関連市場の定義を行い それぞれについて 28 年度の市場規模を推計した また 21 年度の市場規模予測も行った (P3~4 参照 ) 推計に当たり 利用者数や閲覧数といった ブロ

言語切替 4 つの検索モードが用意されている 今回は 複数の検索項目を設定でき より目的に近い検索ができることから 構造化検索 モードを選択 した事例を紹介する 調査目的および調査対象調査対象例として下記の調査目的および開発技術を設定した 調査目的 : 下記開発技術について 欧州における参入企業や技

スライド 1

斎藤参郎 データサイエンス A 2018 年度水曜日 2 限目 (10:40-12:10) 0. イントロダクション 講義の進め方 担当昨年度より 講義の方針 1) 自宅でも学習できる 2) 様々なデータ分析手法を自分でインストールし 実験できる 環境の紹

スライド 1

サイト名

Microsoft Word - Manage_Add-ons

2-3. 上記 2-2 以外の利用目的は以下の通りです 利用目的対応する利用者情報の項目 (1) 当社のサービスに関連して 個人を識別できない 端末情報形式に加工した統計データを作成するため ログ情報 Cookie 及び匿名 ID 位置情報 (2) 当社又は第三者の広告の配信又は表示のため 端末情報

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

アプリで学習する QR コード アプリのダウンロードは こちらから ① アプリ検索 スマホでログイン 上記 QR コードからアプリのインストール画面に移動して アプリをインストールしましょう もし QR コードをうまく読み込めない場合は iphone 端末をお持ちでしたら App Store へ A

PowerPoint プレゼンテーション

第 12 講データ管理 1 2 / 14 ページ 12-1 データベースソフトの概要 データベースとは集められた様々なデータをテーマや目的に沿って分類 整理したものです データベースソフトでは データベースを作成し その管理を行います 何種類ものファイルや帳簿で管理していたデータをコンピュータ上で互

講義「○○○○」

目次 JAVIS Appli の基本機能... 3 JAVIS Appli について... 3 音声確認機能 JAVIS Appli( 有償版 ) の機能... 4 音声で読みの確認をする... 4 辞書機能... 5 単語を登録する... 5 単語を削除する... 6 音声コードの作成... 7

Presentation Title

PowerPoint プレゼンテーション

ixpand Transfer クイックガイド ixpand Transfer は サンディスク ixpand フラッシュドライブ専用の Android アプリケーションです 本アプリケーションは Android スマートフォンやタブレットに接続したサンディスク ixpand フラッシュドライブを使

OneDrive の初期設定を行う 1. に接続します 電子メールアドレス およびパスワードを入力して [ サインイン ] をクリックします 2. office365 ホーム画面より [OneDrive]

クラウドのサービスモデル・実装モデル

みらい翻訳_MiraiTranslator発表_ _1

(2)【講義】

スライド 1

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

Microsoft Azureが切り拓くRPAのさらなる未来

PowerPoint プレゼンテーション

Microsoft Word - FWTEC0003.doc

Microsoft Word - 博士論文概要.docx

TopSE並行システム はじめに

PowerPoint プレゼンテーション

Autodesk Inventor Skill Builders Autodesk Inventor 2010 構造解析の精度改良 メッシュリファインメントによる収束計算 予想作業時間:15 分 対象のバージョン:Inventor 2010 もしくはそれ以降のバージョン シミュレーションを設定する際

職業訓練実践マニュアル 重度視覚障害者編Ⅰ

第14回情報プロフェッショナルシンポジウム予稿集

See Matt to set up your class and account

PowerPoint プレゼンテーション

携帯電話を登録する 3 携帯電話で教員からのお知らせおよびレポート課題の情 報が得られます. 従来型携帯電話を利用するための情報登 録はパソコンを使って行います. スマートフォンユーザは スマートフォンユ ーザ向けガイド を参照してください. 携帯メールアドレスの登録 授業選択領域にて My Wor

Microsoft Word - P doc

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Transcription:

総務省 ICT スキル総合習得教材 [ コース 3] データ分析 3-5: 人工知能と機械学習 知 難 易 技 http://www.soumu.go.jp/ict_skill/pdf/ict_skill_3_5.pdf [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 1

座学本講座の学習内容 [3-5: 人工知能と機械学習 ] 講座概要 人工知能 (AI) の種類と人工知能の概念を紹介します 正解に相当する 教師データ の状況に応じた機械学習の分類を説明します 回帰分析 決定木 k 平均法 などの統計的機械学習の分析手法と用途を示します 機械学習において 特に注目を集めているニューラルネットワークとディープラーニングの特性と基本的な用途を説明します 講座構成 [1] 人工知能のイメージと定義 [2] 機械学習の分類 [3] 統計的機械学習の分析手法 [4] ニューラルネットワークとディープラーニング 学習のゴール 人工知能 (AI) の分類と定義を理解する 正解に相当する 教師データ の状況に応じた機械学習の分類を理解する 統計的機械学習の分析の用途を把握する ニューラルネットワークとディープラーニングの特性と基本的な用途を理解する 2

3-5[1] 人工知能のイメージと定義人工知能の大分類 人工知能 (AI) は大きく 汎用人工知能と特化型人工知能に分類されます 本コースのこれまでの講座では 人間が行うデータクレンジング データの可視化 データ分析を紹介してきました 一方 データ分析をはじめとするデータの利活用を 人工知能に代行させる 任せる といった形で人工知能 (AI: Artificial Intelligence) の活用への期待が高まっており 現在は第三次人工知能ブームとされています 第一次人工知能ブームは 1960 年前後 第二次人工知能ブームは 1980 年代であったとされています 人工知能は 表のように汎用人工知能と特化型人工知能に大別することができます 汎用人工知能と特化型人工知能の分類 分類説明イメージ 事例 汎用人工知能 特化型人工知能 様々な思考 検討を行うことができ 初めて直面する状況に対応できる人工知能 特定の内容に関する思考 検討にだけに優れている人工知能 将棋 炊事 掃除 洗濯といった様々な分野および初めての状況に対する思考 検討ができる 将棋に関する思考 検討のみできる人工知能 掃除に関する思考 検討のみできる人工知能 プロの棋士に勝てるほどに将棋に強い人工知能があっても 将棋以外に対応できない人工知能は 特化型人工知能に該当します 掃除のみ 空調のみ に関する思考 検討ができる特化型人工知能は 市販されている一部の家電製品に格納されています 人工知能は 強い AI と弱い AI という分類もあり 強い AI は意識や自我を持つ AI とされています 強い AI と弱い AI の分類は観念的であり 強い AI は概ね汎用人工知能に対応し 弱い AI は概ね特化型人工知能に対応すると示すケースもあります 人工知能学会では 人工知能研究には 人間の知能そのものをもつ機械を作ろうとする立場 人間が知能を使ってすることを機械にさせようとする立場 の 2 種類があると示し 実際の研究のほとんどは後者と記しています 出所 人工知能って何?[ ( 社 ) 人工知能学会 ] https://www.ai-gakkai.or.jp/whatsai/aiwhats.html 3

人工知能に関する定義とイメージ 人工知能 (AI) には 確立した学術的な定義や合意がありません 専門家や研究者の間でも 人工知能 に関する確立した学術的な定義 合意はありません 平成 28 年版情報通信白書 (P234) では 国内の主な研究者による人工知能 (AI) の定義 として13 人の研究者による定義 説明を紹介していますが その内容は様々です 出所 平成 28 年版情報通信白書 [ 総務省 ] http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h28/pdf/n4200000.pdf 様々な人工知能の定義 説明の中には 知的 知能を持つ という言葉が含まれるケースがあります ただし 知的 知能を持つ という感覚は 個々人の感じ方 考え方に依存する部分もあります スマートフォンの音声アシスタントに おはよう と話して おはようございます と返事が返ってくることを 知能を持つ と感じるかは 人それぞれです 人工知能 (AI) のイメージを尋ねた調査結果においても 日本とアメリカでは回答傾向が異なってなっており 日本では会話を重視しているのに対して アメリカでは認知 判断を重視しています 調査への回答者 [ 回答者数 ] 日本の就労者 [1,106 人 ] アメリカの就労者 [1,105 人 ] 日米における人工知能 (AI) のイメージに関する最大の回答割合の選択肢 複数回答における最大の回答割合となった選択肢 [ 回答割合 ] コンピューターが人間のように見たり 聞いたり 話したりする技術 [35.6%] 人間の脳の認知 判断などの機能を 人間の脳の仕組みとは異なる仕組みで実現する技術 [42.3%] 出所 ICT の進化が雇用と働き方に及ぼす影響に関する調査研究 [ 総務省 ( 調査委託先 : 株式会社野村総合研究所 )] http://www.soumu.go.jp/johotsusintokei/linkdata/h28_03_houkoku.pdf この講座では 人工知能の厳密な定義を行わず それぞれの人の考え方に依存する部分を含めて 人間が知的と感じる情報処理 技術 と見なします 4 3-5[1] 人工知能のイメージと定義 こんにちは

人工知能に含まれる分析技術 人工知能 機械学習 ディープラーニング には包含関係があります 人工知能に関わる分析技術として 機械学習 が挙げられ 機械学習の一つの技術として ディープラーニング ( 深層学習 ) が挙げられます 機械学習とは データから規則性や判断基準を学習し それに基づき未知のものを予測 判断する技術 と人工知能に関わる分析技術を指しています 機械学習の研究初期には 学習する 点に注目されてきましたが 現在では 学習に基づいて予測 判断する 点に注目されることが多くなっています 機械学習の定義にも曖昧な面もあり データ分析 と概ね同義に使われるケース 人間にとって分析プロセスや判断基準が不明なものを含めて目的志向のデータ活用を強調するケースもあります 近年 注目されている統計学を応用する機械学習は 統計的機械学習とも呼ばれます ディープラーニング ( 深層学習 ) は より基礎的で広範な機械学習の手法であるニューラルネットワークという分析手法を拡張し 高精度の分析や活用を可能にした手法です 本講座内でニューラルネットワーク ディープラーニングの分析イメージ 分析の特徴 活用されている用途を紹介します 人工知能 機械学習 ディープラーニングの包含関係と隆盛 3-5[1] 人工知能のイメージと定義 人工知能 (AI) 初期の AI が注目を集める マシンラーニング ( 機械学習 ) 機械学習が活発化し始める ディープラーニング ( 深層学習 ) ディープラーニングのブレイクスル が AI ブームを巻き起こす 1950 年代 1960 年代 1970 年代 1980 年代 1990 年代 2000 年代 2010 年代 出所 グーグルに学ぶディープラーニング [ 日経ビッグデータ編 / 日経 BP 社 ] に基づき作成 5

機械学習の分類 3-5[2] 機械学習の分類 機械学習の分類として 教師あり学習 教師なし学習 強化学習 の 3 種が挙げられます 機械学習は 真実のデータや人間による判別から得られた正解に相当する 教師データ の与えられ方によって分類することができます 猫犬鳥 写真の画像から性別を分類する機械学習では 実際の性別や人間が行った判断が教師データとなります 教師データの状況によって 機械学習は大きく 教師あり学習 教師なし学習 強化学習に分類されます 教師あり学習 と 教師なし学習 は統計学に基づいた 統計的機械学習 が一般的な一方で 強化学習 は 概ね統計学とは無関係です 教師データがある標本とない標本が組み合わさったデータを利用する 半教師あり学習 という種類もあります 教師あり学習 は 回帰や分類に利用されるケースが多く 教師なし学習 はグループ分けや情報の要約に利用されるケースが多くなっています 強化学習では 報酬 ( 評価 ) が与えられ 将棋のようなゲーム用の人工知能に応用されています ロボットの歩行距離に関する強化学習では 転倒せずに 歩けた距離 が報酬 ( 評価 ) として与えられ 試行錯誤で歩行距離を伸ばします 入力に関するデータ [ 質問 ] 出力に関するデータ ( 教師データ )[ 正しい答え ] 教師あり学習与えられる 与えられる 教師なし学習与えられる 与えられない 強化学習 与えられる ( 試行する ) 利用可能なデータに基づく機械学習の分類 ( 間接的 ) 正しい答え自体は与えられないが 報酬 ( 評価 ) が与えられる 主な活用事例 出力に関する回帰 分類 入力に関するグループ分け 情報の要約 将棋 囲碁 ロボットの歩行学習 6

教師あり学習 教師あり学習は正解に相当する教師データが与えられ 主に回帰や分類に利用されます 教師あり学習 は 結果や正解にあたる 教師データ が与えられるタイプの機械学習です 写真から年齢 性別を判定するモデルでは 戸籍等に基づく年齢 性別を 教師データ とすることもあれば 人間が見て判別した年齢 性別を 教師データ とするケースもあります 教師あり学習では 教師データを既知の情報として学習に利用し 未知の情報に対応することができる回帰モデルや分類モデルを構築します 例えば 猫 というラベル ( 教師データ ) が付けられた大量の写真をコンピュータが学習することで ラベルのない写真が与えられても 猫 を検出できるようになります コンピュータによる写真のラベル付けは 人間があらかじめ画像に割り当てたラベルを教師データとする 教師あり学習 に該当します 3-5[2] 機械学習の分類 回帰は講座 3-4 で示した回帰分析のように出力側の被説明変数として連続値を扱う一方で 分類の出力側は 優 / 良 / 可 / 不可 といった評価や移動手段の 徒歩 / バス / タクシー のような離散値です 猫というラベルがある画像 ( 教師データ ) 教師あり学習のイメージ コンピュータが学習 同種の画像の特徴を把握 = 猫 7

教師なし学習 教師なし学習には教師データがなく データのグループ分けや情報の要約に利用されます 教師なし学習 は 正解に相当する 教師データ が与えられないタイプの機械学習です 教師あり学習 では 現実のアウトプットに関するデータや人間が判別して与えた正解に相当する 教師データ が与えられていました アウトプットに関するデータや正解に相当するデータ ラベルは与えられず インプットに関するデータのみであっても 教師なし学習は対応可能です 教師なし学習では データのグループ分けや情報の要約などに活用されます データのグループ分けは クラスタリング と呼ばれる分析手法が代表的であり 情報の要約は 次元圧縮 という分析手法が代表的です 3-5[2] 機械学習の分類 教師データに相当するラベルがない場合であっても 大量の画像をコンピュータに学習させれば 画像の特徴 ( 例 : 大きさ 色 形状 ) からグループ分けや情報の要約が可能です 教師なし学習では 猫 や 鳥 というラベルは与えられていませんが 形や色などが近い属性でグループ分けできます コンピュータがグループの名前をつけることはできず グループ A グループ B といったラベルがないグループになります 教師なし学習のイメージ ラベル ( 教師データ ) がない画像 コンピュータが学習 グループ A グループ B 特徴 : 暖色系 長い尾 特徴 : 寒色系 短い尾 8

強化学習 強化学習では 試行錯誤を通じて 報酬 ( 評価 ) が得られる行動や選択を学習します 強化学習の例として 犬がいる部屋に ボタンを押すと餌が出る機械 を設置した場合を考えます 犬が偶然にボタンを押すと餌が出ますが 1 度だけの経験ではボタンと餌が出たことを結びつけられず 犬には餌が出た理由が分かりません ボタンを押す という試行を犬が繰り返すと 犬は ボタンを押す 餌が出る ということを学習します 犬にとっては ボタンを押す という行動が入力であり 得られる餌 が報酬 ( 評価 ) に当たります 犬 ボタン 餌 [ 報酬 ( 評価 )] ボタンを押す 餌が出る 3-5[2] 機械学習の分類 ロボットの歩行に関しても 歩けた距離 を報酬 ( 評価 ) として設定し 手足の動かし方を試行錯誤して歩行距離を伸ばすことが 強化学習に相当します 強化学習のイメージ ロボット 歩けた距離様々な手足の [ 報酬 ( 評価 )] 動かし方で歩いてみる 報酬 ( 評価 ) が与えられる学習を反復 報酬 ( 評価 ) が与えられる学習を反復 将棋に関する強化学習は 敵軍の王将をとることに最大の報酬 ( 評価 ) として設定し コンピュータに評価を高める指し方を反復して学習させます 将棋では 詰め将棋を除いて正解の一手という教師データはありませんが 勝利した場合に最大の報酬 ( 評価 ) を与え 勝利に近い局面ほど高い評価を与えることが可能です 強化学習は 一般に統計的機械学習の範疇外にあるため 以降では 教師あり学習 教師なし学習 に絞って 統計的機械学習における分析手法を示します 9

機械学習の代表的な分析手法 教師あり学習 教師なし学習 には それぞれ代表的な分析手法があります 代表的な教師あり学習の分析手法として 回帰分析や決定木などが挙げられます 講座 3-4でExcelの分析ツールでの実行方法を示した回帰分析は 教師あり学習 の一つの手法として位置づけられます 代表的な 教師あり学習 の分析手法 3-5[2] 機械学習の分類 回帰分析 決定木 分析手法名 分析手法 用途の概要 被説明変数と説明変数の関係を定量的に分析し 分析結果に基づく予測 分類のための基準 ( 境界線 ) を学習し 未知の状況でデータを分類 代表的な教師なし学習の分析手法として k 平均法 アソシエーション分析が挙げられます 代表的な 教師なし学習 の分析手法 k 平均法 分析手法名 アソシエーション分析 分析手法 用途の概要 特徴 傾向が似ている標本をいくつかのグループに分類 同時購入の頻度等を算出し 消費者の選択 購入履歴から推薦すべき商品を導出 ソーシャルネットワーク分析氏名が同時掲載される頻度や SNS 上での友人関係から人のつながりを分析 近年 注目されている ディープラーニング ( 深層学習 ) は 教師なし学習 強化学習への応用もあり得ますが 教師あり学習としての活用が一般的です 10

回帰分析 ( 最小二乗法 ) 回帰分析 ( 最小二乗法 ) は 教師あり学習の一手法でもあります 講座 3-4 において Excel の分析ツールによる手順を示した回帰分析 ( 最小二乗法 ) も機械学習の一種です 回帰分析はデータの規則性に基づいて予測を行うことができ 機械学習の概念に含まれます 3-5[3] 統計的機械学習の分析手法 回帰分析は アウトプットに関するデータである被説明変数を教師データとして利用し 教師あり学習に分類されます 被説明変数と説明変数の間の規則性を回帰式として導出した後は 説明変数に新たな値を与えても被説明変数の予測ができます スーパーマーケットの売上額 ( 連続値 ) は チラシの配布数 曜日 天候 ( 気温 湿度 天気 ) によって説明されるという回帰式を作ることができます 過去のデータから これらの変数間の関係を回帰式で導出すれば チラシの配布数 曜日 天気 ( 予報 ) が与えれば 売上高 を予測することができます 回帰分析の分析イメージ ( 線形 ) 回帰分析の分析イメージ ( 非線形 ) 11

決定木 購入の有無などの結果 ( 教師データ ) をもとにデータを分類し 様々な要因が結果に与える影響を把握する教師あり学習の一手法です 決定木 ( けっていぎ ) は 木の枝のような段階を経て分かれる形 ( 樹形図 : じゅけいず ) で判別基準を設定し データを分類する手法です 決定木は 現実における選択や分類を教師データとして与える 教師あり学習 の一種です 決定木における教師データは 商品を買う / 買わない 円分購入する といった選択であることが一般的です 商品を買う / 買わない といった区分を分析する場合は分類木 ( ぶんるいぎ ) 円分購入する という連続的に変化しうる値を分析する場合は 回帰木 ( かいきぎ ) と言います アイスクリームの購入が 休日や天候から影響を受ける場合は その影響の度合いを決定木で分析できます 決定木によって どのような状況や要素が 利用者の行動を変化させるかを判別することができます 3-5[3] 統計的機械学習の分析手法 決定木の樹形図 ( アイスクリームの購入選択 ) 購入割合 説明される選択アイスクリームを購入するか? 買う :30 人買わない :70 人 平日 休日 買う :10 人買わない :60 人買う :20 人買わない :10 人 晴れ雨晴れ雨 買う :8 人買わない :48 人買う :1 人買わない :13 人買う :18 人買わない :6 人買う :2 人買わない :4 人 14.3% 7.1% 75.0% 33.3% 12

k 平均法 ( クラスタリング ) 各標本を似たもの同士のグループ ( クラスター ) へ分類する教師なし学習の一つです k 平均法は標本をグループ分けする手法で 教師データのない教師なし学習です 3-5[3] 統計的機械学習の分析手法 データ分析におけるグループは クラスター ( 群 ) という専門用語が使われるため グループ分けの手法はクラスタリングと呼ばれます K 平均法の手順 (1) 分類するグループ数をk 個に定め グループの中心となる点として k 個の の位置をランダムに与える (2) 各標本 は 一番距離が近い に属すると考えて 各 に属する標本 にグループ分けする (3) グループ毎の の座標の平均値 ( 重心 ) をとって その重心の位置に を移動させる (4) 移動させた後の に一番距離が近い を取り直すことで 再び各 に属する標本 にグループ分けする [ が動かなくなるまで(3) と (4) を繰り返す ] 動きが分かるデモサイト https://wish.to/km K 平均法の初期値 K 平均法によるグループ分けの結果 グループ分け ( クラスタリング ) を用いることで 複数の観点から顧客や商品を分類することができます 安さを重視する消費者 高級感を重視する消費者 とグループを分けることができれば グループに応じた販促活動に活用できます 13

アソシエーション分析 同時に購入される商品セットやその確率を算出する教師なし学習の一つで ネットショッピングサイトの推薦商品の提示にも利用されています アソシエーション分析は 商品 A を買っている人の % が商品 B も買っている といった同時購入の確率などを導出する手法です アソシエーション分析の主な評価指標として 支持度 ( 同時確率 ) 確信度 ( 条件付き確率 ) リフト値 ( 改善率 ) の 3 種が挙げられます アソシエーション分析は 講座 3-4 で示した相関係数とは異なり 3 種以上の商品の組み合わせに関しても分析できます アソシエーション分析で把握できた同時購入等の情報は ネットショッピングにおける推薦 ( レコメンデーション ) や実店舗における商品の陳列やセット割引きの検討にも利用できます Amazon.co.jp をはじめとするネットショッピングのサイトでは この商品を買った人はこんな商品も買っています 等のメッセージで 関連商品の購入を勧める手法でも活用されています Amazon の同時購入商品の推薦 3-5[3] 統計的機械学習の分析手法 出所 Amazon.co.jp https://www.amazon.co.jp/ 14

ソーシャルネットワーク分析 ソーシャルネットワーク分析は 人間のつながりを可視化する教師なし学習の一つです 公表資料内で氏名が同時掲載される頻度や SNS 上で友人としてのつながりのデータに基づき 人のつながりの分析手法としてソーシャルネットワーク分析が挙げられます Mentionmapp Analytics では Twitter( ツイッター ) の情報に基づく人間関係を表せます 安倍首相をはじめとして 現在 Twitter のアカウントを公に利用している人に関する分析ができます 安倍首相の Twitter に関する Mentionmapp Analytics の可視化 3-5[3] 統計的機械学習の分析手法 Twitter における関係の強さ よく使う言葉を可視化できる whotwi( フーツイ ) というサービスもあります 安倍首相の Twitter アカウントは インドのモディ首相のアカウントとの関係が強いことが示されています 安倍首相の Twitter に関する whotwi の可視化 出所 Mentionmapp Analytics https://mentionmapp.com/ 出所 whotwi https://ja.whotwi.com/abeshinzo 15

ニューラルネットワーク 3-5[4] ニューラルネットワークとディープラーニング ニューラルネットワークは 文字や音声の認識といったパターン認識へ応用されています ディープラーニングの基本となるニューラルネットワークは 脳の神経回路の仕組みを模した分析モデルです ニューラル (neural) は 神経の という意味があります ニューラルネットワークは入力層 中間層 ( 隠れ層 ) 出力層の 3 層から成り立ちます 中間層 ( 隠れ層 ) では 一つ前の層から受け取ったデータに対し 重み付け と 変換 を施して次の層へ渡します ニューラルネットワークの出力は教師データ等と照合され より一致度が高くなるように重みのつけ方を調整します ニューラルネットワークは 教師なし学習や強化学習にも応用されますが 教師あり学習としての利用頻度が高くなっています ニューラルネットワーク ( 中間層が1 層のケース ) のイメージ 入力層 中間層 ( 隠れ層 ) 出力層 入力 1 重み付け 変換 入力 2 重み付け 出力 教師データ 入力 3 重み付け 変換 教師データと照合して重み付けを調整 ニューラルネットワークは回帰 分類 画像認識 音声認識 翻訳といった様々な分野で応用されています 16

ディープラーニング ( 深層学習 ) ディープラーニング ( 深層学習 ) は より高精度の認識などに活用されています 中間層 ( 隠れ層 ) を 2 層以上に多層化したニューラルネットワークをディープラーニングといいます ディープラーニングの日本語訳は 深層学習 ですが この 層 と言う言葉は 中間層が複数あること を示しています 中間層が複数あることで中間層が 1 層の場合に比べて より教師データに合致する複雑な出力をすることができます ディープラーニングの原理はニューラルネットワークと同じですが 中間層が多層化することでその精度が向上しました ニューラルネットワークは中間層が複数あるケースを含み ディープラーニングはニューラルネットワークの一種です 3-5[4] ニューラルネットワークとディープラーニング 入力層 ディープラーニング ( 中間層が 2 層 ) のイメージ 中間層 1 ( 隠れ層 2) 中間層 2 ( 隠れ層 2) 出力層 入力 1 重み付け 変換 重み付け 変換 入力 2 重み付け 出力 教師データ 入力 3 重み付け 変換 重み付け 変換 教師データと照合して重み付けを調整 中間層 ( 隠れ層 ) を多層化したディープラーニングは 教師データとより高精度に対応づけることが可能になりました 17

ニューラルネットワーク ディープラーニングの特徴 3-5[4] ニューラルネットワークとディープラーニング ニューラルネットワーク ディープラーニングは 従来型のプログラムと異なる特徴があります ディープラーニングによって 特徴量と呼ばれるデータの中で注目すべきポイントをコンピュータ自ら検出できるようになりつつあります 画像データをプログラミングによって分類する場合 従来は リンゴは赤い リンゴは丸い といった特徴量を人間が入力 指定する必要がありました 人間がプログラミングすることなく 大量の教師データを与えることで コンピュータ自ら学習することができます 従来型の If-Then-Else 型 のプログラムでは 丸くて赤い物であれば リンゴ と出力することはできますが 同じ丸くて赤い物である リンゴとトマトの識別 の条件設定やプログラミングは困難です ニューラルネット ディープラーニングは従来型のプログラムとは根本的に異なり 論理や言語で説明困難な特徴をコンピュータが自動的に習得します コンピューターの判別基準は サービス提供者にとってもブラックボックスであり 説明することができません リンゴとトマトを高い精度で識別 ラベル付与ができますが なぜそのように識別したのかは説明できません 識別 ラベル付与に関する信頼度合いを出力できますが 識別の基準 ( 例 : 色が 3 割 形が 7 割 ) といった分解はできません ニューラルネット ディープラーニングは 本番同様の学習 環境設定を行わずには精度や実用性の想定は困難です Google の CLOUD VISION API における画像認識のラベル付け ( リンゴとトマト ) 出所 CLOUD VISION API[Google Cloud Platform]https://cloud.google.com/vision/?hl=ja 18

A Neural Network Playground 3-5[4] ニューラルネットワークとディープラーニング ニューラルネットワーク ディープラーニング のイメージを確認できるウェブサイトもあります A Neural Network Playground は 画面左上の再生ボタンを押すことで 画面右側の青とオレンジの点を塗り分けを行う ニューラルネットワーク ディープラーニング の確認サイトです A Neural Network Playground は Daniel Smilkov 氏とShan Carter 氏によって 主に教育目的で制作されました 右側の画像の上にある Test loss や Training loss は それぞれテスト用データと学習用データで正しく塗り分けることができなかった割合を指します 機械学習においては 入手したデータをモデル構築用の学習用データと構築したモデルの精度を検証するテスト用データに分けることがあります 再生ボタンを押して 10 秒程度待つと 学習用データに合わせて重みを調整することで loss( ロス ) が小さくなります 画面上に [Epoch] と表示されているのが 教師データに合わせて重みを調節し直した回数に該当し 再生時間に応じて増加します 画面左側の画像で模様を複雑にしたり Noise( ノイズ ) を大きくすることで 塗り分けをより難しくできます A Neural Network Playground の画面 出所 A Neural Network Playground http://playground.tensorflow.org/ 19

3-5[4] ニューラルネットワークとディープラーニング 隠れ層が 1 層の場合 ( ニューラルネットワークのイメージ ) 隠れ層が一層のケースが ディープラーニングではないニューラルネットワークに該当します HIDDEN LAYER( 隠れ層 ) が 1 層となっていると ディープラーニングではないニューラルネットワークのイメージです HIDDEN LAYER( 隠れ層 ) の左側の +- をクリックすることで 中間層を増減させることができます 下の画像の例では 初期設定からノイズを増加させ 30 とし 各層におけるユニット数は 5 個としています 各層の上側にある +- をクリックすることで層内の神経細胞にあたるユニット数を増減させることができます 隠れ層が 1 層のニューラルネットワークのイメージ 出所 A Neural Network Playground http://playground.tensorflow.org/ 約 1000 回重みの調整をした段階におけるTest lossが0.379 Training lossが0.072と算出され 画面右の画像により塗り分けられない部分の割合を確認できます A Neural Network Playground では 画面左下の REGENERATE をクリックすると点が再生成されるため 実行ごとに微妙に結果は異なります 20

3-5[4] ニューラルネットワークとディープラーニング 隠れ層が 2 層以上の場合 ( ディープラーニングのイメージ ) 隠れ層を増やし ディープラーニングに対応する形にすると loss が低下する傾向があります HIDDEN LAYER( 隠れ層 ) が2 層以上となっているのが ディープラーニングのイメージです 下の画像の例では 隠れ層を3 層として 各層のユニット数はニューラルネットワークと同じ5としています 隠れ層が 3 層のディープラーニングのイメージ 出所 A Neural NetworkPlayground http://playground.tensorflow.org/ 約 1000 回重みの調整をした段階における Test loss が 0.251 Training loss が 0.062 と算出され 塗り分けられない部分の割合は隠れ層が 1 層のときと比較して減っていることが分かります ディープラーニングを利用することで より高精度の分析や判別が可能となってきています 21

3-5[4] ニューラルネットワークとディープラーニング人工知能サービスに関するクラウド APIの利用 クラウド APIを利用することで 安価に高精度の人工知能サービスを利用できます 教師あり学習 の人工知能サービスの精度を高めるためには より多くの教師データが必要です 教師データの形式が不統一であったり 教師データに誤りがあったりすると 高精度の人工知能サービスの構築ができません 高精度の人工知能サービスの構築には まず人間が講座 3-1 に示した データ形式を標準化 データクレンジング を行うことで 教師データを整備することが必要です 世界規模のクラウドプラットフォームでは 相対的に高精度の人工知能サービスを提供しています 講座 2-2 に示した Amazon が運営する AWS(Amazon Web Service) Microsoft が運営する Azure Google が運営する Google Cloud Platform の 3 大クラウドプラットフォームに加えて IBM が運営する IBM Cloud の Watson では 世界規模で人工知能サービスを提供しています 世界規模でのクラウドプラットフォーム 人工知能サービスを提供しているブランド Amazon Web Services は 米国その他の諸国における Amazon.com, Inc. またはその関連会社の商標です Microsoft Azure は 米国 Microsoft Corporation およびその関連会社の商標です 2017 Google LLC All rights reserved. Google および Google ロゴは Google LLC の登録商標です クラウドが提供している人工知能サービスを一時的に借りる方法として API の利用が挙げられます 講座 1-5 において示したように インターネットを経由して人工知能に関するサービスを利用できる API もあります ディープラーニングは 並列計算による高速化の余地が大きく 講座 2-5 に示した GPU クラウドコンピューティングも活用されています IBM Watson is a trademark of International Business Machines Corporation, registered in many jurisdictions worldwide. 世界規模のクラウドプラットフォームは 検索サービスを提供しているなど 人工知能サービスの精度向上に必要な教師データを収集しやすい環境を持っています 22

3-5[4] ニューラルネットワークとディープラーニングニューラルネットワーク ディープラーニングの応用例 ニューラルネットワーク ディープラーニングのビジネス面への応用には代表例があります ニューラルネットワーク ディープラーニングを用いた人工知能サービスの代表例として 画像認識 音声認識 音声合成 テキスト処理 翻訳が挙げられます 画像認識 画像データから 連想されるキーワードを出力したり 顔の画像を検出したりできる 応用例 : 顔画像から性別や年齢を推定 手書き文字画像のテキスト変換 テキスト処理 テキストデータから 内容を要約したり 内容に基づく文章の採点 分類をしたりできる 応用例 : 議事録から議事要旨の作成 口語体から文語体への変換 音声認識 音声データから 人間の発声を言葉として認識し テキストとして文字起こしできる 応用例 : 声の抑揚に基づく強調点の抽出 声から健康やストレスの検出 翻訳 テキストデータから 経験豊かな翻訳者が訳したような正確かつ自然な翻訳文を作成できる ( 多言語翻訳にも対応 ) 応用例 : 特定の翻訳者の訳し方を反映した翻訳 音声合成 テキストデータから 自然に聞こえる人間の発声を合成し 文章として読み上げることができる 応用例 : 歌を歌う ( ボーカロイド ) 特定の人物の発声を真似る 複数機能の組み合わせによる高度な活用も可能 画像認識 + 音声認識 を組み合わせることで 複数の知覚に基づく高精度の認識 音声認識 テキスト処理 音声合成 を組み合わせることで 人間と対話できるコンピューターの構築 23

ニューラルネットワーク ディープラーニングのサービス例 3-5[4] ニューラルネットワークとディープラーニング ニューラルネットワーク ディープラーニングは 画像認識や翻訳に活用されています Microsoft Azure では ディープラーニングに基づく画像認識をウェブブラウザを使って体験できます AzureのComputer VISION APIのデモでは 利用者が指定したウェブ上の画像やアップロードした画像に対して連想されるキーワードを表示します Microsoft Azureのデモサイトにおける画像認識 出所 Computer VISION API[Microsoft(Azure)] https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/ 東京スカイツリーの画像を指定すると sky( 空 ) outdoor( 野外 ) building( 建物 ) city( 都市 ) tall( 高い ) tower( 塔 ) といった連想されるキーワードを出力します Google 翻訳は 2016 年 11 月の ニューラルネットに基づく機械翻訳 (Neural Machine Translation) の導入により翻訳精度が向上しました Google の翻訳チームは 過去 10 年の開発の歴史を振り返っても それを大きく上回る飛躍的な前進 と記しています 人工知能の分析技術のニューラルネットワーク ディープラーニングは 様々なサービスにおける活用が期待されます 24 出所 Google 翻訳が進化しました [Google Japan Blog] https://japan.googleblog.com/2016/11/google.html