Microsoft PowerPoint - JKO18-learning.ppt

Similar documents
Microsoft PowerPoint - 13approx.pptx

2-1 / 語問題 項書換え系 4.0. 準備 (3.1. 項 代入 等価性 ) 定義 3.1.1: - シグネチャ (signature): 関数記号の集合 (Σ と書く ) - それぞれの関数記号は アリティ (arity) と呼ばれる自然数が定められている - Σ (n) : アリ

Microsoft PowerPoint - 05DecisionTree-print.ppt

040402.ユニットテスト

Microsoft PowerPoint - 05.pptx

Microsoft PowerPoint - ca ppt [互換モード]

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

Handsout3.ppt

Microsoft PowerPoint - DA2_2019.pptx

統計的データ解析

構造化プログラミングと データ抽象


Microsoft PowerPoint - mp11-06.pptx

Information Theory

Information Theory

構造化プログラミングと データ抽象

Microsoft PowerPoint - qcomp.ppt [互換モード]

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

Microsoft PowerPoint - ppt-7.pptx

混沌系工学特論 #5

PowerPoint Presentation

日心TWS

離散数学

Microsoft PowerPoint - kyoto

PowerPoint Presentation

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

オートマトン 形式言語及び演習 4. 正規言語の性質 酒井正彦 正規言語の性質 反復補題正規言語が満たす性質 ある与えられた言語が正規言語でないことを証明するために その言語が正規言語であると

PowerPoint プレゼンテーション

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Probit , Mixed logit

オートマトン 形式言語及び演習 3. 正規表現 酒井正彦 正規表現とは 正規表現 ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械正規表現 : 言語

基礎統計

生命情報学

論理と計算(2)

Functional Programming

知識工学 II ( 第 2 回 ) 二宮崇 ( ) 論理的エージェント (7 章 ) 論理による推論 命題論理 述語論理 ブール関数 ( 論理回路 )+ 推論 ブール関数 +( 述語 限量子 ( ) 変数 関数 定数 等号 )+ 推論 7.1 知識

コンピュータ応用・演習 情報処理システム

Microsoft PowerPoint - sc7.ppt [互換モード]

() ): (1) f(x) g(x) x = x 0 f(x) + g(x) x = x 0 lim f(x) = f(x 0 ), lim g(x) = g(x 0 ) x x 0 x x0 lim {f(x) + g(x)} = f(x 0 ) + g(x 0 ) x x0 lim x x 0

<4D F736F F F696E74202D2088C38D86979D985F82D682CC8FB591D22E >

様々なミクロ計量モデル†

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること

アルゴリズムとデータ構造

Microsoft PowerPoint SIGAL.ppt

パソコンシミュレータの現状

Microsoft PowerPoint - 08LR-conflicts.ppt [互換モード]

ボルツマンマシンの高速化

A Constructive Approach to Gene Expression Dynamics

講義「○○○○」

PowerPoint Template

Microsoft PowerPoint - OS12.pptx

memo

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

スライド 1

Microsoft PowerPoint - ProD0107.ppt

PowerPoint Presentation

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

線形システム応答 Linear System response

Microsoft PowerPoint - 5.ppt [互換モード]

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft PowerPoint - DA2_2018.pptx

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Learning Bayesian Network from data 本論文はデータから大規模なベイジアン ネットワークを構築する TPDA(Three Phase Dependency Analysis) のアルゴリズムを記述 2002 年の発表だが 現在も大規模用 BN モデルのベンチマークと

論理学補足文書 7. 恒真命題 恒偽命題 1. 恒真 恒偽 偶然的 それ以上分割できない命題が 要素命題, 要素命題から 否定 連言 選言 条件文 双 条件文 の論理演算で作られた命題が 複合命題 である 複合命題は, 命題記号と論理記号を 使って, 論理式で表現できる 複合命題の真偽は, 要素命題

Microsoft PowerPoint - 06.pptx

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

PowerPoint Presentation

ANOVA

メモリ管理

! Aissi, H., Bazga, C., & Vaderpoote, D. (2009). Mi max ad mi max regret versios of combiatorial optimizatio problems: A survey. Europea joural of ope

Microsoft PowerPoint - mp11-02.pptx

Microsoft PowerPoint - DA2_2017.pptx

Microsoft PowerPoint - 第3回2.ppt

論理と計算(2)

スライド 1

kiso2-03.key

モデリングとは

PowerPoint Presentation

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - algo ppt [互換モード]

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

特殊なケースでの定式化技法

スライド 1

微分方程式による現象記述と解きかた

FEM原理講座 (サンプルテキスト)

産業組織論(企業経済論)

Microsoft PowerPoint - システム創成学基礎2.ppt [互換モード]

Microsoft PowerPoint - ad11-09.pptx

スライド 1

プログラミング入門1

Microsoft PowerPoint - ch04j

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - VBA基礎(6).docx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

09 II 09/11/ y = e x y = log x = log e x 2. ( e x ) = e x 3. ( ) log x = 1 x 1 Warming Up 1 u = log a M a u = M log a 1 a 0 a 1 a r+s 0 a r

青焼 1章[15-52].indd

Transcription:

観察からの学習 Chapter 18 Section 1 3,5

概要 学習エージェント 帰納的学習 決定木学習

学習 学習は未知の環境では本質的 設計者が全能でないときと同値 学習はシステム構成の方法として有用 その方法を書き下そうとするよりもエージェントを現実に立ち向かわせる 学習は性能を向上させるようにエージェントの決定機構を修正させる

Learning agents

学習要素 学習要素の設計は次のものに影響される 性能要素のどの部分を学ぶか この部分を学ぶためにどのようなフィードバックが用意されているか この部品を使うためにどのような表現が使われるか フィードバックの種類 : 教師あり学習 : それぞれの事例に対して正解が用意 教師なし学習 : 正解が与えられない 強化学習 : 時々報酬

帰納的学習 最も簡単な方法 : 事例から関数を学ぶ f は目標関数 O O X +1 事例は対 (x, f(x)) である X x X 問題 : 事例による訓練用の集合を与えられたとき h f とするような仮説 h を発見する ( これは実際の学習を極端に簡易化したもの ): 前もっての知識を無視している 事例が与えられると仮定している f(x)

帰納的学習の方法 訓練集合で f に一致するように h を構成 調整する ( 事例でhがfに一致するなら hは一貫性がある ) 例カーブをあわせる :

帰納的学習の方法 訓練集合で f に一致するように h を構成 調整する ( 事例でhがfに一致するなら hは一貫性がある ) 例カーブをあわせる :

帰納的学習の方法 訓練集合で f に一致するように h を構成 調整する ( 事例でhがfに一致するなら hは一貫性がある ) 例カーブをあわせる :

帰納的学習の方法 訓練集合で f に一致するように h を構成 調整する ( 事例でhがfに一致するなら hは一貫性がある ) 例カーブをあわせる :

帰納的学習の方法 訓練集合で f に一致するように h を構成 調整する ( 事例でhがfに一致するなら hは一貫性がある ) 例カーブをあわせる :

帰納的学習の方法 訓練集合でfに一致するようにhを構成 調整する ( 事例でhがfに一致するなら hは一貫性がある ) 例カーブをあわせる : オッカムのかみそり : データと一貫性の有る最も簡単な仮説を好む

学習決定木 問題 : 次の属性の元で レストランで席を待つべきかを決める : 1. 代替 : 近くに代わりのレストランがあるか 2. バー : 待つ間 居心地のよいバーの場所があるか 3. 金土 : 今日は金曜かあるいは土曜か 4. 空腹 : われわれは空腹か 5. 客 : レストランには何人の客がいるか ( 空, 有る程度, 満席 ) 6. 価格 : 価格の範囲 ($, $$, $$$) 7. 雨 : 外は雨か 8. 予約 : 予約をしたか 9. 種類 : 何料理か ( フランス イタリア タイ バーガー ) 10. 待ち時間 : どのくらい待たされるか (0-10, 10-30, 30-60, >60)

属性ベースの表現 事例が属性の値 (Boolean, discrete, continuous) によって示される 席を待つ 待たないの状況 : 事例でのクラス分けは肯定 (T) か否定 (F)

決定木 仮設の一つの表現法 以下は待つかどうかについての肯定の木

表現力 決定木は入力属性のいかなる関数をも表すことが可能 ブール関数に対しては真理表の行 葉へのパス : いかなる訓練集合に対しても一貫性のある決定木があり この木は各事例 ( x で f が非決定的でない限り ) に対して葉へのパスを有する しかし 新しい事例を作り出すことはない もっと簡便な決定木を探したい

仮説空間 n のブール属性に対してどれだけ異なる決定木が存在するのか = ブール関数の数 = 2 n 行 = 2 2n の異なる真理表 6 個のブール属性で 18,446,744,073,709,551,616 木

仮説空間 n のブール属性に対してどれだけ異なる決定木が存在するのか = ブール関数の数 = 2 n 行 = 2 2n の異なる真理表 6 個のブール属性で 18,446,744,073,709,551,616 木 単なる連言の仮説はいくつになるか (e.g., Hungry Rain) 属性は内部 ( 肯定 ), 内部 ( 否定 ) あるいは外部の値を取る 3 n 個の異なる連言の仮説 より表現的な仮説の空間 目的関数が表される機会を増やす 訓練集合と一貫性の有る仮説の数を増やす より悪い予測をもたらすことも

決定木学習 目的 : 訓練用のサンプルと一貫性のある小さな木を見つける 考え方 : ( 再帰的に ) 木のルートとして 最も重要な 属性を選ぶこと

属性の選択 考え方 : よい属性は事例を理想的に 全て肯定 と 全て否定 に分割する Patrons? はよい選択か

情報定理を用いて DTL アルゴリズムで Choose-Attribute を実現するために 情報の内容 ( エントロピー ): I(P(v 1 ),, P(v n )) = Σ i=1 -P(v i ) log 2 P(v i ) p 個の肯定の事例と n 個の否定の事例を含んでいる訓練集合に対して : p I(, p+ n n ) = p+ n p p n log 2 log 2 p+ n p+ n p+ n n p+ n

情報定理を用いて 選択した属性 A は訓練の集合 E を A に対する値に従って部分集合 E 1,, E v に分割する ここでは A は v 個の異なる値を取る 属性テストでのエントロピーによる情報の獲得 (IG) あるいは減少は : IG を最大にする属性を選択する = + + + + = v i i i i i i i i i n p n n p p I n p n p A remainder 1 ), ( ) ( ) ( ), ( ) ( A remainder n p n n p p I A IG + + =

情報の獲得 訓練集合に対して, p = n = 6, I(6/12, 6/12) = 1 bit 属性 Patrons と Type を考える ( そして他も ): 2 4 6 2 4 IG( Patrons) = 1 [ I(0,1) + I(1,0) + I(, )] =.0541 bits 12 12 12 6 6 2 1 1 2 1 1 4 2 2 4 2 IG( Type) = 1 [ I(, ) + I(, ) + I(, ) + I( 12 2 2 12 2 2 12 4 4 12 4 2, )] 4 = 0 bits Patrons が全ての属性の中で最大の IG であるので DTL アルゴリズムは Patrons をルートにする

Example 12 個の事例から学習した決定木 : 肯定 の木より簡単 より複雑な仮設は少量のデータによって正当化されない

性能測定 h f であることをどのように知るか 計算可能 統計的学習の定理を用いる 事例による新たなテスト集合で h を試みる ( 訓練集合で用いた事例の空間と同一の分布を用いる ) 学習カーブ = 訓練集合の大きさの関数としてのテスト集合の正しさの割合

学習性能について 学習カーブは次のことに従属する 実現可能 ( 目的関数を表すことができる ) か実現不可能 実現不可能は属性の欠如による あるいは制約された仮説のクラス ( 例えば頭打ちの線形関数 ) 冗長な表現 ( 例えば無関係な属性からの負荷 )

計算論的学習定理 特定の訓練集合から組み立てた仮説が実際の関数に十分に近いと知ることができるのか いくつの事例が十分な量か どのように選ぶべきか 訓練集合の大きさと確率的分布に関連して学習アルゴリズムはどれだけよいのかを示してくれる計算論的性格を知りたい

PAC learning おそらく近似的に正しい仮定 (PAC): 非常に悪い仮設 h は非常に高い確率で早い段階で修正される [Valiant 1984]. 不動集合の仮定 : 訓練集合とテスト集合は同じ確率分布を用いて同じ事例の集まりからランダムに抽出される 集合の大きさ 実際にそして期待される誤り 仮説空間の大きさには関係が有る

PAC 学習 : 形式化 X は可能な全ての事例の集合 D は事例が抽出されたところの分布 H は可能な全ての仮説空間で f H m は訓練のための事例の数 error(h) = Probability(h(x) f(x) x is drawn from X with D) error(h) ε ならば h は近似的に正しい

PAC 学習 : 形式化 証明すべきこと : m 個の事例の後 高い確率で全ての一貫性のある仮説は近似的に正しい 全ての一貫性のある仮説は f の近くの半径 ε- の中にある H H bad ε f

複雑性の解析 非常に悪い仮説 h bad H bad が最初の m 個の事例と一貫性がある確率は 定義により error(h bad ) > ε 一つの事例と一致する確率は (1-ε) であり m 個の事例とは (1-ε) m H bad が一貫性がある仮説を少なくとも一つ有している確率は Probability(H bad has a consistent hypothesis) 非常に悪いがすべての事例と合致するようなことがあってはならない H bad (1-ε) m H (1-ε) m 非常に悪い仮設の数 あまりよい類推とは考えにくいがほかに方法がないのであろう 仮設の数

複雑性の解析 この値をある小さな確率 δ に抑えたいとする H (1-ε) m δ これは少なくとも m 個の事例が次のようになっているとき可能である m 1/ε(ln 1/δ + ln H ) これは事例の複雑性である このたくさんの事例 m で一貫性がある仮説を学習アルゴリズムが返すなら 少なくとも確率 1-δ でエラーは高々 ε である H = 2 2n なので複雑性は属性 n の数に応じて指数的 (2 n ) に大きくなる 結論 : ブール関数を学習することはテーブルルックアップよりは良くはない

PAC 学習 : 観察 仮説 h(x) は m 個の事例と一貫性が有り確率 1-δ で最大 ε のあやまりがある これは最悪の場合の解析 結果は分布 D には独立である 拡大率の解析 : for ε 0, m proportionally for δ 0, m logarithmically for H, m logarithmically

決定リストを学習する 可能な仮設の空間を制限する 最も簡単な仮説を返す 解決困難! ブール関数の部分集合のみを考える 決定木は制限された形式での論理的表現 : x WillWait(x) <=> Patrons(x,Some) (Patrons(x,Full) Fri/Sat(x)) Patrons(x,Some) Y Yes N (Patrons(x,Full) Fri/Sat(x)) Y Yes N No

決定リストを学習する 任意の大きさのリストはあるブール関数を表すことができる たかだか k < n リテラルのテストを伴ったリストは k-dl ブール言語を定義する n 属性では言語は k-dl(n) テストの言語 Conj(n,k) はたかだか 3 Conj(n,k) の異なったコンポーネントの集合を持つ (Y,N,absent) k-dl(n) 3 Conj(n,k) Conj(n,k)! (any order) 2n i Conj(n,k) = Σ i=0 ( ) = O(n k ) k

決定リストを学習する k-dl(n) = 2 O(n^klog(n^k)) m 個の式での置き換えを行うこと : m 1/ε(ln 1/δ + O(n k log(n k ))) ちいさな数 k に対して合理的であるリテラルテストの大きさでは事例の数は多項式である アルゴリズム : 訓練集合にまったく一致するテストを見出し それを決定リストに加え 事例から除く 全ての事例が取り除かれるまでこれを続ける

決定リスト学習アルゴリズム function Decision-List-Learning(examples) returns a decision list DL, No, or Fail if examples is empty then return No t := a test that matches a nonempty subset of examples i of examples such that all elements in it are either positive or negative if there is no such t then return Fail if the examples in examples i are positive then o := Yes else o :=No return a decision list DL with initial test t and outcome o and remaining elements defined by Decision-List-Learning(examples - examples i )

席を待つ例

席を待つ例

制限されたブール関数 Type Boolean conjunctions K-DNF K-CNF K-DL Smallest K-DL Complexity polynomial polynomial polynomial polynomial NP-hard

バイアスの種類 絶対バイアス 仮説の種類を限定する : CNF, k-dl, etc 好みのバイアス when h 1 と h 2 a 化一貫する仮説のとき 簡単な方 ( 短い方, 最小の木,...) ランダムバイアス 一貫している配列野中からランダムに一つ抽出する 悪いバイアスからの復帰 平均の 多重の配列 異なったバイアスに自然に変化する

まとめ 学習は未知の環境と怠惰な設計で必要とされる 学習エージェント = 性能要素 + 学習要素 教師あり学習では 訓練用の事例と一貫する最も簡単な仮説を見つけること 情報獲得を用いての決定木学習 学習性能 = テスト集合で計測されて予測の正確さ