スライド 1



Similar documents
Box-Jenkinsの方法

Microsoft PowerPoint - Econometrics pptx

スライド 1

数学

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ

2016 年 度 情 報 リテラシー 三 科 目 合 計 の 算 出 関 数 を 用 いて 各 教 科 の 平 均 点 と 最 高 点 を 求 めることにする この2つの 計 算 は [ホーム]タブのコマ ンドにも 用 意 されているが 今 回 は 関 数 として 作 成 する まず 表 に 三 科

Microsoft PowerPoint - MVE pptx

(1)1オールゼロ 記 録 ケース 厚 生 年 金 期 間 A B 及 びCに 係 る 旧 厚 生 年 金 保 険 法 の 老 齢 年 金 ( 以 下 旧 厚 老 という )の 受 給 者 に 時 効 特 例 法 施 行 後 厚 生 年 金 期 間 Dが 判 明 した Bは 事 業 所 記 号 が

4 教 科 に 関 する 調 査 結 果 の 概 況 校 種 学 年 小 学 校 2 年 生 3 年 生 4 年 生 5 年 生 6 年 生 教 科 平 均 到 達 度 目 標 値 差 達 成 率 国 語 77.8% 68.9% 8.9% 79.3% 算 数 92.0% 76.7% 15.3% 94

Microsoft Word - Stattext05.doc


積 載 せず かつ 燃 料 冷 却 水 及 び 潤 滑 油 の 全 量 を 搭 載 し 自 動 車 製 作 者 が 定 める 工 具 及 び 付 属 品 (スペアタイヤを 含 む )を 全 て 装 備 した 状 態 をいう この 場 合 に おいて 燃 料 の 全 量 を 搭 載 するとは 燃 料

2 職 員 の 初 任 給 等 の 状 況 (1) 職 員 の 平 均 年 齢 平 均 給 料 月 額 及 び の 状 況 (26 年 4 月 1 日 現 在 ) 1 一 般 行 政 職 平 均 年 齢 静 岡 県 国 類 似 団 体 2 技 能 労 務 職 区 41.8 歳 42.6 歳 43.5

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

Taro-H19退職金(修正版).jtd

疑わしい取引の参考事例

一 般 行 政 職 給 料 表 の 状 況 ( 平 成 3 年 4 月 1 日 現 在 ) 1 級 級 3 級 4 級 5 級 6 級 単 位 : ( ) 7 級 1 号 給 の 給 料 月 額 137, 163,7 4,9 31,4 71, 33,3 359,7 最 高 号 給 の 給 料 月 額

2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36

単回帰モデル

平成15・16年度の建設工事入札参加資格の認定について

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

波佐見町の給与・定員管理等について

2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数

( 別 紙 ) 以 下 法 とあるのは 改 正 法 第 5 条 の 規 定 による 改 正 後 の 健 康 保 険 法 を 指 す ( 施 行 期 日 は 平 成 28 年 4 月 1 日 ) 1. 標 準 報 酬 月 額 の 等 級 区 分 の 追 加 について 問 1 法 改 正 により 追 加

スライド 1

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 2 年 月 1 日 現 在 ) 1 号 給 の 給 料 月 額 最 高 号 給 の 給 料 月 額 ( 注 ) 給 料 月 額 は 給 与 抑 制 措 置 を 行 う 前 のものです ( 単 位 : ) 3 職 員 の 平 均 給 与 月

(2) 共 通 費 について 第 2 編 共 通 費 2 12 共 通 費 算 定 に 関 する 数 値 の 取 り 扱 い (1) 積 み 上 げによる 算 定 積 み 上 げによる 算 定 は 第 3 編 18に 準 ずる (2) 率 による 算 定 公 共 建 築 工 事 共 通 費 積 算

別紙3

PowerPoint Presentation

Microsoft Word - Ⅱ章.doc

(4) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 概 要 国 の 給 与 制 度 の 総 合 的 見 直 しにおいては 俸 給 表 の 水 準 の 平 均 2の 引 下 げ 及 び 地 域 手 当 の 支 給 割 合 の 見 直 し 等 に 取 り 組 むとされている.

2 一 般 行 政 職 給 料 表 の 状 況 (24 年 4 月 1 日 現 在 ) 1 級 2 級 3 級 4 級 5 級 6 級 1 号 給 の 給 料 月 額 135,6 185,8 222,9 261,9 289,2 32,6 最 高 号 給 の 給 料 月 額 243,7 37,8 35

Q IFRSの特徴について教えてください

Microsoft PowerPoint - 報告書(概要).ppt

目 次 Ⅰ 概 要 3 Ⅱ 平 成 18 年 度 産 業 技 術 センター 利 用 に 関 するアンケート 調 査 結 果 ( 依 頼 試 験 ) 4 Ⅲ 平 成 18 年 度 産 業 技 術 センター 利 用 に 関 するアンケート 調 査 結 果 ( 機 器 開 放 ) 8 Ⅳ 平 成 18 年

Microsoft Word - ★HP版平成27年度検査の結果

Microsoft PowerPoint _R勉強会ichikura.ppt [互換モード]

(4) ラスパイレス 指 数 の 状 況 ( 各 年 4 月 1 日 現 在 ) ( 例 ) ( 例 ) 15 (H2) (H2) (H24) (H24) (H25.4.1) (H25.4.1) (H24) (H24)

Microsoft PowerPoint - 2.ppt [互換モード]

H28記入説明書(納付金・調整金)8

平成16年度

第1回

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定

PowerPoint プレゼンテーション

Microsoft Word - A04◆/P doc

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 23 年 4 月 1 日 現 在 ) 1 号 給 の 給 料 月 額 最 高 号 給 の 給 料 月 額 1 級 2 級 3 級 4 級 5 級 ( 単 位 : ) 6 級 7 級 8 級 135, , ,900 2

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

Microsoft Word - 公表資料(H22).doc

目 次 第 1 部 個 人 所 得 税 の 概 要 居 住 者 非 居 住 者 の 定 義 4 個 人 所 得 税 の 納 付 のしかた( 給 不 所 得 者 ) 5 居 住 者 の 個 人 所 得 税 額 の 計 算 のしくみ( 給 不 所 得 者 ) 6 非 居 住 者 の 個 人 所 得 税

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

Taro-給与公表(H25).jtd

総論

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 24 年 4 月 1 日 現 在 ) 1 号 給 の 給 料 月 額 最 高 号 給 の 給 料 月 額 ( 注 ) 給 料 月 額 は 給 与 抑 制 措 置 を 行 う 前 のものです 3 職 員 の 平 均 給 与 月 額 初 任 給

測量士補 重要事項「写真地図作成」

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

(5) 給 与 改 定 の 状 況 事 委 員 会 の 設 置 なし 1 月 例 給 事 委 員 会 の 勧 告 民 間 給 与 公 務 員 給 与 較 差 勧 告 A B A-B ( 改 定 率 ) 給 与 改 定 率 ( 参 考 ) 国 の 改 定 率 24 年 度 円 円 円 円 ( ) 改

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 23 年 4 月 1 日 現 在 ) 1 級 2 級 3 級 4 級 5 級 6 級 7 級 1 号 給 の 給 料 月 額 最 高 号 給 の 給 料 月 額 135,600 円 185,800 円 222,900 円 261,900 円

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 23 年 4 月 1 日 現 在 ) ( 単 位 : ) 1 級 2 級 3 級 4 級 5 級 6 級 7 級 8 級 1 号 給 の 給 料 月 額 135,6 161,7 222,9 261,9 289,2 32,6 366,2 41


質 問 票 ( 様 式 3) 質 問 番 号 62-1 質 問 内 容 鑑 定 評 価 依 頼 先 は 千 葉 県 などは 入 札 制 度 にしているが 神 奈 川 県 は 入 札 なのか?または 随 契 なのか?その 理 由 は? 地 価 調 査 業 務 は 単 にそれぞれの 地 点 の 鑑 定

(4) 給 与 制 度 の 総 合 的 見 直 しの 実 施 状 況 について 給 料 表 の 見 直 し ( 給 料 表 の 改 定 実 施 時 期 ) 平 成 27 年 4 月 日 ( 内 容 ) 一 般 行 政 職 の 給 料 表 について, 国 の 見 直 し 内 容 を 踏 まえ 平 均

t検定

内 において 管 理 されている 上 場 株 式 等 のうち 非 課 税 管 理 勘 定 に 係 るもの( 新 規 投 資 額 で 毎 年 80 万 円 を 上 限 とします )に 係 る 配 当 等 で 未 成 年 者 口 座 に 非 課 税 管 理 勘 定 を 設 けた 日 から 同 日 の 属

続 に 基 づく 一 般 競 争 ( 指 名 競 争 ) 参 加 資 格 の 再 認 定 を 受 けていること ) c) 会 社 更 生 法 に 基 づき 更 生 手 続 開 始 の 申 立 てがなされている 者 又 は 民 事 再 生 法 に 基 づき 再 生 手 続 開 始 の 申 立 てがなさ

研究テーマ考案 ブログ記事を知識源とした 雑談メタファに基づく情報推薦

公共建築工事共通費積算基準 平成26年版

空 き 家 を 売 却 した 場 合 の,000 万 円 控 除 特 例 の 創 設 被 相 続 人 が 住 んでいた 家 屋 及 びその 敷 地 を 相 続 があった 日 から 年 を 経 過 する 年 の 月 日 までに 耐 震 工 事 をしてから あるいは 家 を 除 却 し てから 売 却

1

も く じ 1 税 源 移 譲 1 2 何 が 変 わったのか 改 正 の 3 つ の ポイント ポイント1 国 から 地 方 へ 3 兆 円 規 模 の 税 源 が 移 譲 される 2 ポイント2 個 人 住 民 税 の 税 率 構 造 が 一 律 10%に 変 わる 3 ポイント3 個 々の 納

している 5. これに 対 して 親 会 社 の 持 分 変 動 による 差 額 を 資 本 剰 余 金 として 処 理 した 結 果 資 本 剰 余 金 残 高 が 負 の 値 となるような 場 合 の 取 扱 いの 明 確 化 を 求 めるコメントが 複 数 寄 せられた 6. コメントでは 親

(ⅴ) 平 成 28 年 4 月 1 日 から 平 成 35 年 12 月 31 日 までの 期 間 未 成 年 者 に 係 る 少 額 上 場 株 式 等 の 非 課 税 口 座 制 度 に 基 づき 証 券 会 社 等 の 金 融 商 品 取 引 業 者 等 に 開 設 した 未 成 年 者 口

平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について

目 次 1 個 人 基 本 情 報 個 人 基 本 情 報 入 力 画 面 の 分 散 4 申 告 区 分 および 申 告 種 類 の 選 択 方 法 5 繰 越 損 失 入 力 年 別 の 繰 越 損 失 額 入 力 に 対 応 6 作 成 手 順 作 成 手 順 の 流 れを 提 供 7 所 得

2 一 般 行 政 職 給 料 表 の 状 況 ( 平 成 22 年 4 月 1 日 現 在 ) 1 号 給 の 給 料 月 額 ( 単 位 : ) 1 級 2 級 3 級 4 級 5 級 6 級 7 級 135, , , , , ,600

Ⅰ. は じ め に 27 年 か ら の 不 況 の 影 響 で 不 動 産 競 売 物 件 が 増 加 し て い る 29 年 9 月 は 全 国 で 8 件 を 超 え た ( 前 年 同 月 は 約 6 件 ) ま た 不 動 産 競 売 の 情 報 が イ ン タ ー ネ ッ ト で 公

Microsoft Word - 04特定任期付職員(特任事務)給与規程【溶込】

23年度版 総社市様式外.xls

1 変更の許可等(都市計画法第35条の2)

説 明 内 容 料 金 の 算 定 期 間 と 請 求 の 単 位 について 分 散 検 針 制 日 程 等 別 料 金 料 金 の 算 定 期 間 と 支 払 義 務 発 生 日 日 程 等 別 料 金 の 請 求 スケジュール 料 金 のお 支 払 い 方 法 その 他 各 種 料 金 支 払

スライド 1

Microsoft Word - 奨学金相談Q&A.rtf

する 婦 人 相 談 所 その 他 適 切 な 施 設 による 支 援 の 明 記 禁 止 命 令 等 をすることが できる 公 安 委 員 会 等 の 拡 大 等 の 措 置 が 講 じられたものである 第 2 改 正 法 の 概 要 1 電 子 メールを 送 信 する 行 為 の 規 制 ( 法

<4D F736F F D2095BD90AC E937890C590A789FC90B382CC8EE582C893E09765>

3 職 員 の 初 任 給 等 の 状 況 (1) 職 員 の 及 び の 状 況 ( 平 成 24 年 4 月 1 日 現 在 ) 1 一 般 行 政 職 ( ベース) ,9 47,78 369,884 崎 県 , , ,

<4D F736F F D F4390B3208A948C E7189BB8CE F F8C668DDA97702E646F63>

Taro-2220(修正).jtd

(2) 広 島 国 際 学 院 大 学 ( 以 下 大 学 という ) (3) 広 島 国 際 学 院 大 学 自 動 車 短 期 大 学 部 ( 以 下 短 大 という ) (4) 広 島 国 際 学 院 高 等 学 校 ( 以 下 高 校 という ) ( 学 納 金 の 種 類 ) 第 3 条

Microsoft Word - 佐野市生活排水処理構想(案).doc

税金読本(8-5)特定口座と確定申告

Microsoft Word sozei-sample1.doc

<95BD90AC E93788C888E5A82CC8A FEE95F18CF68A4A97702E786C73>

< F2D824F C D9197A791E58A C938C8B9E>

2016 年 度 情 報 リテラシー 変 更 された 状 態 同 様 に 価 格 のセルを 書 式 設 定 する 場 合 は 金 額 のセルをすべて 選 択 し [ 書 式 ]のプルダウンメニューか ら[ 会 計 ]を 選 択 する すると が 追 加 され 金 額 としての 書 式 が 設 定 さ

<4D F736F F D F8D828D5A939982CC8EF68BC697BF96B38F9E89BB82CC8A6791E52E646F63>

3. 選 任 固 定 資 産 評 価 員 は 固 定 資 産 の 評 価 に 関 する 知 識 及 び 経 験 を 有 する 者 のうちから 市 町 村 長 が 当 該 市 町 村 の 議 会 の 同 意 を 得 て 選 任 する 二 以 上 の 市 町 村 の 長 は 当 該 市 町 村 の 議

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

< E937895AA8CF6955C976C8EAE904588F58B8B975E2E786C73>

Taro-1-14A記載例.jtd

(4) ラスパイレス 指 数 の 状 況 ( 各 年 4 月 1 日 現 在 ) (H25.4.1) (H25.4.1) (H25.7.1) (H25.7.1) (H25.4.1) (H25.7.1)

. 負 担 調 整 措 置 8 (1) 宅 地 等 調 整 固 定 資 産 税 額 宅 地 に 係 る 固 定 資 産 税 額 は 当 該 年 度 分 の 固 定 資 産 税 額 が 前 年 度 課 税 標 準 額 又 は 比 準 課 税 標 準 額 に 当 該 年 度 分 の 価 格 ( 住 宅

Transcription:

導 入 通 信 路 モデル Bayes 統 計 最 尤 推 定 とMAP 推 定 データの 性 質

機 械 学 習 の 先 史 時 代 -- 情 報 の 変 換 過 程 のモデル 化 -- 情 報 源 を 記 号 列 ( 例 えば 単 語 列 あるいは 文 字 列 )とする Noisy Channel Model 情 報 源 記 号 列 :t tx 情 報 変 換 雑 音 (N(0,σ 2 ) etc) 出 力 された 記 号 列 = 推 定 処 理 への 入 力 x 推 定 処 理 tˆ : 推 定 さ れた 情 報 源 記 号 列 出 力 された 記 号 列 = 推 定 処 理 への 入 力 データxから 情 報 源 記 号 列 tを 推 定 し を 計 算 する tˆ

Bayesの 定 理 Bayes 統 計 の 意 義 P( t x) P( x t) P( t) P( x) P(t x)は 新 たな 出 力 記 号 列 xが 得 られたときの 情 報 源 から 出 力 された 記 号 列 t を 推 定 する 式 で これ を 最 大 化 する t すなわち tˆ arg max Pt x t を 求 めるのが 目 標 ところが このままでは 既 に 得 られている 情 報 を 使 えないので Bayesの 定 理 で 変 換 する すると 既 知 の 情 報 源 状 態 と 出 力 記 号 列 のペアに 関 する 条 件 付 き 確 率 P(x t) (= 教 師 データ) 情 報 源 についての 事 前 知 識 P(t)が 使 える 形 になる

Bayes 統 計 とは 1. 常 にBayesの 定 理 を 用 いる 2. 用 いられる 確 率 は 主 観 確 率 (= 確 信 度 ) 3. 事 前 情 報 を 利 用 する 4. 未 知 量 ( 確 率 分 布 のパラメター)は 確 率 的 に 変 動 5. 観 測 されたデータは 絶 対 的 6. 推 測 は 常 に 条 件 付 7. アドホックな 手 続 きを 認 めない

Bayes 統 計 を 用 いた 情 報 変 換 過 程 のモデルに おける 出 力 データからの 情 報 源 の 推 定 方 法 通 信 路 を 条 件 付 確 率 でモデル 化 :P(x t) 目 的 は x が 観 測 されたときの t の 確 率 すなわち 事 後 確 率 P(t x)を 最 大 化 する 情 報 源 の 確 率 tˆ arg max P( t t t arg max P( x x) t) P( t) ここでベイズの 定 理 により P(t)は 情 報 源 記 号 列 の 既 知 の 統 計 的 性 質 が 利 用 できる P(x t) は 情 報 源 記 号 列 tが 情 報 変 換 およびnoisy channelの 雑 音 によってx 毎 に 変 化 する 確 率 この 確 率 は 多 数 の<t,x> 対 の 観 測 データにより 計 算 する

情 報 変 換 過 程 モデルの 適 用 例 例 : 機 械 翻 訳 元 言 語 x: 私 がリンゴを 食 べる P(t x) は 元 言 語 のテキスト x( 既 知 )が 翻 訳 先 言 語 のテキスト t に 翻 訳 される 確 率 P(x t) はtという 翻 訳 結 果 に 対 する 元 言 語 のテキス トがxである 確 率 P(t) 翻 訳 先 言 語 におけるテキストtの 自 然 さ 例 え tˆ ば N 単 語 列 のコーパスにおける 単 語 3-gram 確 率 以 上 の 設 定 で 下 の 式 tˆ arg max t P( t 機 械 翻 訳 x) は 機 械 翻 訳 の 出 力 arg max P( x t) P( t) この 考 え 方 を 元 にしたのが 現 在 主 流 となってきてい る 統 計 的 機 械 翻 訳 (IBMで1993 年 に 開 発 された) t 翻 訳 先 言 語 t: I eat an apple

日 英 機 械 翻 訳 の 例 P(リンゴを 食 べる eats an apple)=0.3 P(リンゴを 食 べる eats apples)=0.2 P( 彼 は He)=1.0 P(He eats apples)=0.2 P(He eats an apple)=0.5 P(He eats an apple 彼 はリンゴを 食 べる) =1.0x0.3x0.5=0.15 P(He eats apples 彼 はリンゴを 食 べる) =1.0x0.2x0.2=0.04 He eats an apple のほうが 良 い 英 訳 事 前 知 識 として P(He eats apple)=0.0 があれば 非 文 P(He eats apple)=0にできるのがベイズの 強 み

例 : 文 書 分 類 P(t x) においてxが 与 えられた 文 書 tがカテゴリ 推 定 されたカテゴリ: tˆ P(t) はカテゴリtの 文 書 の 出 現 確 率 P(x t)はカテゴリtにおいて 文 書 xが 出 現 する 確 率 このモデル 化 にはいろいろな 方 法 があるが 簡 単 なの は 出 現 する 単 語 w 1, w N P(x t) =P(w 1, w N t)だが このままでは 計 算 しにくい のでw 1, w N が 独 立 だとすると P( w N 1,..., wn t) P( wn t) n1 これを naïve Bayse 分 類 とよぶ arg max P( x t) P( t) t Why?

文 書 分 類 の 例 : 長 澤 まさみ vs 上 野 樹 里 長 澤 まさみ 関 連 の 文 書 に 高 い 確 率 で 出 現 する 単 語 主 演 映 画 東 宝 吉 田 礼 薬 師 丸 ひろ 子 サッカー 上 野 樹 里 関 連 の 文 書 に 高 い 確 率 で 出 現 す る 単 語 主 演 のだめ カンタービレ ドラマ ラスト フジテレビ 分 類 したい 文 書 :Dの 含 む 単 語 は 主 演 ラスト フレンズ P( 主 演 長 澤 )=0.1 P( 主 演 上 野 )=0.1 P(ラスト 長 澤 )=0.2 P(ラスト 上 野 )=0.2 P(フレンズ 長 澤 )=0.2 P(フレンズ 上 野 )=0.2

Googleのヒット 数 から 推 定 したところ P( 長 澤 )=0.6 P( 上 野 )=0.4 P( 長 澤 D)=P(D 長 澤 )P( 長 澤 ) =P( 主 演 長 澤 )P(ラスト 長 澤 )P(フレンズ 長 澤 )P( 長 澤 ) =0.1x0.2x0.2x0.6=0.0024 P( 上 野 D)=P(D 上 野 )P( 上 野 ) =P( 主 演 上 野 )P(ラスト 上 野 )P(フレンズ 上 野 )P( 上 野 ) =0.1x0.2x0.2x0.4=0.0016 よって 文 書 Dは 長 澤 に 分 類 しかし Dに カンタービレ という 単 語 も 含 まれ P(カン.. 長 澤 )=0.1 P(カン.. 上 野 )=0.8だと P( 長 澤 D)=0.00024 P( 上 野 D)=0.00128 で 文 書 Dは 上 野 に 分 類 直 感 にあっているようだ!

教 師 あり 学 習 上 記 の 例 では 情 報 源 のモデルであるP(t)やP(x t)は 単 に 出 現 確 率 だったが ここで 適 切 な 確 率 分 布 を 考 えることが 可 能 すると その 分 布 を 決 めるパラメターを 推 定 する 必 要 が 出 てく る そのために<t,x>という 情 報 源 の 状 態 と 出 力 データの 対 デー タが 多 数 入 手 できれば 利 用 する この<t,x>を 教 師 データ(あるいは 観 測 データ)と 呼 ぶ すると 機 械 学 習 の 中 心 となる 教 師 あり 学 習 は 確 率 分 布 P(t) P(x t)のパラメターを 教 師 データ<t,x>を 利 用 して 求 める という 問 題 になる

教 師 なし 学 習 教 師 あり 学 習 では 教 師 データ<t,x>の 集 合 が 与 えられた 状 態 で P(t)やP(x t)のパラメターを 求 めた しかし データ<x>の 集 合 だけが 与 えられていて(tは 与 えら れていない)ときはどうする? データ<x>の 集 合 から P(x)のパラメターだ けを 求 めることになる 直 観 的 には データ<x>を 類 似 したものにグループ 化 する クラスタリングと 言 い グループのことをクラスタと 呼 ぶ これを 教 師 なし 学 習 と 呼 ぶ

識 別 モデルと 生 成 モデル 入 力 データxに 対 応 する 予 測 値 tを 求 める 識 別 モデル(discrimiative model):p(t x)を 直 接 モデ ル 化 する このp(t x)によって 未 知 のxに 対 するtを 予 測 (あるいは 推 定 )する 方 法 t=f(x)となる 関 数 を 直 接 求 めるものもあり 事 前 分 布 生 成 モデル(generative model):ベイズの 定 理 で p(t x)をp(x t)p(t)/p(x)に 変 換 p(x t)を 学 習 p(t)を 事 前 データから 求 める これと 既 知 の<x,t>のペアの データからp(x t)のパラメターを 更 新 これによって 未 知 のxに 対 するtを 求 めるp(t x)の 確 率 分 布 をモデ ル 化 する 観 測 データが 知 られて 後 のp(x t)の 事 後 分 布

最 尤 推 定 とMAP 推 定 最 尤 推 定 分 布 P X のパラメタ-θの 推 定 値 を 以 下 の 式 で 求 める ˆ arg max P X,..., X 1 N あるいは 対 数 をとり 推 定 : 対 数 尤 度 の 最 大 化 ˆ arg max log P X,..., X ˆ arg max ただし X 1 log,..,x P N 1 N MAP 推 定 ( 事 後 確 率 の 最 大 化 ) 事 前 確 率 P が 与 えられていたときには 次 式 のように 事 後 分 布 の 確 率 を 最 大 化 するパラメタ-を 求 める X1,..., X N ˆ P はN個 の 観 測 データ

問 題 1 X 1 X 1 X P (X i は 0か1)で 定 義 されるベルヌ- イ 試 行 を 独 立 にN 回 繰 り 返 したとき 0がm 回 1がN-m 回 観 測 されたとする 最 尤 推 定 して θを 求 めよ 1 また 事 前 分 布 として P bただし 0 のときのMAP 推 定 した θ を 求 めよ この 場 合 の 結 果 の 意 味 を 考 察 せよ 問 題 2 次 式 の 多 項 分 布 において 最 尤 推 定 して θ i を 求 めよ 事 前 分 布 が P P N! X! X X1 X K X 1 1 K! 1 K 1 11 K 1 1 K 1 K K K k1 k の 場 合 の MAP 推 定 した θ i を 求 めよ

今 までは 情 報 源 の 記 号 tと 出 力 記 号 列 (= 直 接 に 観 測 されたデータ)xは 機 械 学 習 にお いて 直 接 に 計 算 の 対 象 としていた この 仮 定 が 成 立 する 場 合 も 多 い 身 長 体 重 薬 の 濃 度 価 格 などの( 連 続 ) 数 値 データ 人 数 個 数 などの 整 数 をとる 数 値 データ 割 合 %など データの 性 質 男 女 国 籍 など 属 性 が 記 号 の 場 合 ( 整 数 に 変 換 すれば 数 値 として 処 理 可 能 ) しかし 必 ずしも 直 接 に 観 測 されたデータだけ を 使 える 場 合 ばかりではない

観 測 データを 表 す 情 報 の 次 元 観 測 データ 点 が 人 間 の 場 合 の 例 x=( 身 長 体 重 血 圧 収 入 金 額 ) T 数 値 だけな ので 簡 単 単 位 は 外 部 知 識 とする Ex (170, 50, 120, 10,000,000) 確 率 分 布 としては 正 規 分 布 など x=( 職 業 発 熱 ) T 記 号 2つの 方 法 記 号 に 番 号 を 与 える Ex 無 職 =0, 学 生 =1,.. 発 熱 無 =0 有 =1 確 率 分 布 としては 離 散 数 値 をとる 分 布 など 数 値 の 意 味 付 け が 難 しい 記 号 の 種 別 ごとに1 次 元 を 与 える( 次 のページ 参 照 )

記 号 の 種 類 ごとに 次 元 を 割 り 当 てる 方 法 x=( 訪 問 国 1,, 訪 問 国 N) T 対 策 : 国 を 番 号 つける ex(usa,uk,italy) T (USA=1, UK=2, Japan=3, China=4, Italy=5, ) この 番 号 がベクトルの 何 番 目 の 要 素 かを 示 すとして 数 値 のベクトルとして 表 現 : Bernoulli 分 布 : x 上 のexは (1,1,0,0,1,.) T このベクトルの 次 元 は 世 界 中 の 国 の 数 だけあるため か なり 大 きい しかし 観 測 データには0が 多 く スパースな データ 記 号 の 出 現 回 数 のある 場 合 x=(( 訪 問 国 1 滞 在 日 数 1),,( 訪 問 国 N 滞 在 日 数 )) T ex((usa,15),(uk,5),(italy,3)) T (15,5,0,0,3,.) T 多 項 分 布 : Mult(15,5,0,0,3,... 15 USA 5 UK 0 Japan USA, 0 China UK, 3 Italy Japan Bern( x ) (1 ), China, Italy,...) 1 x

次 元 の 大 きさ 国 と 滞 在 日 数 の 例 と 同 じタイプの 問 題 を テキストデ ータで 考 えてみよう あるテキストを 表 現 するには そのテキストに 出 現 し た 各 単 語 の 個 数 で 表 現 する 次 元 は 語 彙 数 日 本 語 の 新 聞 では 約 40 万 語 固 有 名 詞 や 複 合 語 まで 入 れると 100 万 以 上 100 万 次 元 の ベクトルを 扱 う 必 要 あり! 個 々の 単 語 だけを 対 象 にすれば 済 むのか? ABC 証 券 ABC 証 券 株 式 会 社 総 理 が 失 言 総 理 が 訂 正 というような 単 語 の 連 鎖 で 見 ないと 分 からない 場 合 は? N 単 語 の 連 鎖 (=N-gram)の 種 類 数 は 100 万 のN 乗!!! しかし このような 多 次 元 がすべて 重 要 な 情 報 だとも 思 えない 次 元 圧 縮 の 技 術 が 有 望 i.e. Singular Value Decomposition (SVD)とかLatent Semantic Indexing(LSI)

特 殊 性 を 表 すデータ 1 これまでに 示 したデータ 点 の 数 値 は 観 測 さ れた 数 値 ( 出 現 回 数 など)を 直 接 使 っていた 観 測 データ 全 体 の 構 造 を 利 用 したtf*idfと 呼 ばれる 数 値 も 有 力 データ 点 頻 度 Data point Frequency : DF ただし DF(j)はj 番 目 の 次 元 のデータが0でな いデータ 点 の 数 また 観 測 データ 点 の 総 数 をNとする

特 殊 性 を 表 すデータ 2 データ 点 頻 度 Data point frequency:df ただし DF(j)はj 番 目 の 次 元 のデータが0でな いデータ 点 の 数 また 観 測 データ 点 の 総 数 をNとする IDF(j)=1/DF(j) TF(i,j)= 観 測 データ 点 iで 第 j 次 元 のデータの 出 現 回 数 TF*IDFの 定 義 : w j N i, TF*IDF(i, j) TF(i, j) log DF(j)

例 データ 例 旅 行 者 a:(usa=10, UK=2, Japan=3, China=0, Italy=0) 旅 行 者 b:(usa=0, UK=2, Japan=0, China=4, Italy=0) 旅 行 者 c:(usa=5, UK=0, Japan=2, China=0, Italy=0) 旅 行 者 d:(usa=2, UK=0, Japan=1, China=2, Italy=1) DF(USA)=3, DF(UK)=2, DF(JP)=3. DF(CH)=2, DF(IT)=1 N/DF(..)は USA=4/3, UK=4/2, JP=4/3, CH=4/2, IT=4/1 TF*IDF(USA,a)=10*log(4/3)=4.114, TF*IDF(USA,b)=0 TF*IDF(UK,a)=2*log(4/2)=2 TF*IDF(IT,d)=1*log(4/1)=2

特 殊 性 を 表 すデータ 3 TF*IDFの 定 義 : w j N i, TF*IDF(i, j) TF(i, j) log DF(j) TF*IDF(i,j)は データ 点 : iだけで 特 別 に 多 く 現 れる 次 元 : jの 数 値 を 表 す 例 えば 新 聞 の1 記 事 を 観 測 データ 点 とし 次 元 を 単 語 とすると TF*IDF(i,j)の 大 きな 単 語 iは 偏 りのある 特 殊 ないし 専 門 の 単 語 小 さな 単 語 は 一 般 的 な 単 語 といえる TF*DIFを 用 いて 観 測 データ 点 を 表 現 しなお すと いろいろなことが 見 えてくることがある

距 離 の 定 義 観 測 データ 点 を 多 次 元 空 間 中 の 点 と 定 義 そこで2つの 問 題 各 次 元 は 観 測 データ 点 からどのように 定 義 するか 次 元 のことをfeatureあるいは 素 性 (そせい)と 呼 ぶ この 問 題 をfeature design : 素 性 設 計 と 呼 ぶ 例 えば 2つの 素 性 の 比 を 新 たな 素 性 とする ex 身 長 / 体 重 2つの 素 性 の 連 続 したもの ex 日 本 銀 行 日 本 沈 没 しかし これは 個 別 適 用 分 野 に 応 じて 工 夫 すべし 多 次 元 空 間 における2 点 間 の 距 離 の 定 義 ユークリッド 距 離 ばかりではないのだ!