自己紹介 : 村脇有吾 京都大学大学院情報学研究科知能情報学専攻助教工学部電気電子工学科兼担 専門 : 計算言語学と自然言語処理 表の仕事は普通のテキスト処理 単語分割 ゼロ照応解析 常識的知識の獲得ほか 今日お話も裏の仕事 言語の研究ですが テキストは直接扱いません 2

Similar documents
自己紹介 村脇有吾 出身は京都大学黒橋研究室 (2011 年博士 ) 九州大学助教 (2013 年 10 月 -) もともとは ( 今も ) 日本語解析を研究 1 年半前から言語の系統と変化の研究も 2

数理言語

生命情報学

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

日心TWS

スライド 1

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

レイアウト 1

P1.\..

10_11p01(Ł\”ƒ)

P1.\..

Q34Q35 2

Microsoft Word - 補論3.2

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 三次元座標測定 ppt

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

Information Theory

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

NLP プログラミング勉強会 6 かな漢字変換 自然言語処理プログラミング勉強会 6 - かな漢字変換 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

スライド 1

配付資料 自習用テキスト 解析サンプル配布ページ 2

Microsoft Word - SPSS2007s5.doc

解析センターを知っていただく キャンペーン

PowerPoint Presentation

ドキュメント1

nlp1-12.key

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

SAP11_03

1. はじめに 2

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

PowerPoint Presentation

‚å„´577-03

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Z...QXD (Page 1)

ビジネス統計 統計基礎とエクセル分析 正誤表

MRI X......

.g.i.~.^.A

ヴィエトナム高原におけるマッシュルーム栽培の基本

2.

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

Microsoft PowerPoint - 資料04 重回帰分析.ppt

OpRisk VaR3.2 Presentation

パソコンシミュレータの現状

今日の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか

PowerPoint Presentation

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

画像類似度測定の初歩的な手法の検証

FEM原理講座 (サンプルテキスト)

言語モデルの基礎 2

Probit , Mixed logit

PowerPoint プレゼンテーション

P indd


サイボウズ ガルーン 3 管理者マニュアル

85

1


1

H1_H4_ ai

今日からはじめるプロアクティブ

1 2 STEP 1 STEP 2 STEP 3


untitled

制御盤BASIC Vol.3

altus_storage_guide

数値計算法

各学科 課程 専攻別開設授業科目 ( 教職関係 ) 総合情報学科 ( 昼間コース ) 中学校教諭 1 種免許状 ( 数学 ) 高等学校教諭 1 種免許状 ( 数学 ) 代数学 線形代数学第一 2 線形代数学第二 2 離散数学 2 応用代数学 2 オペレーションズ リサーチ基礎 2 数論アルゴリズム

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft PowerPoint - システム創成学基礎2.ppt [互換モード]

2014 年電子情報通信学会総合大会ネットワークシステム B DNS ラウンドロビンと OpenFlow スイッチを用いた省電力法 Electric Power Reduc8on by DNS round- robin with OpenFlow switches 池田賢斗, 後藤滋樹

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史

PowerPoint プレゼンテーション

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

PowerPoint プレゼンテーション

スライド 1

画像処理工学

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

統計的データ解析

PowerPoint プレゼンテーション

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

スライド 1

Microsoft PowerPoint SIGAL.ppt

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

31 33

働く女性の母性健康管理、母性保護に関する法律のあらまし

講義「○○○○」

DVIOUT

様々なミクロ計量モデル†

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

ベイズ統計入門

概要 単語の分散表現に基づく統計的機械翻訳の素性を提案 既存手法の FFNNLM に CNN と Gate を追加 dependency- to- string デコーダにおいて既存手法を上回る翻訳精度を達成

Microsoft Word - ㅎ㇤ㇺå®ı璃ㆨAIã†®æŁ°ç’ƒ.docx

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

Day 鹿児島弁の宿題から学んで欲しいこと 2. 句や文を組み立てる仕組み (1)(2): 併合 (merge) ( 長距離 ) 依存関係 ((long-distance) dependency) 3. 言語間の相違性と類似性

スライド 1

cat A

無印良品のスキンケア

Transcription:

潜在表現に基づく 言語構造の史的変化の分析 京都大学 村脇有吾 機構間連携 文理融合プロジェクト 言語における系統 変異 多様性とその数理 シンポジウム 2018 年 2 月 2 日 TKP 東京駅大手町カンファレンスセンター

自己紹介 : 村脇有吾 京都大学大学院情報学研究科知能情報学専攻助教工学部電気電子工学科兼担 専門 : 計算言語学と自然言語処理 表の仕事は普通のテキスト処理 単語分割 ゼロ照応解析 常識的知識の獲得ほか 今日お話も裏の仕事 言語の研究ですが テキストは直接扱いません 2

言語構造の潜在表現 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論 1 1 0 0 表層特徴列 x ll, 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を推定 ( 内部ノードの状態 年代も同時推定 ) 史的変化の統計的推論 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 シミュレーションによる分析 Step 3. 遷移率行列を用いて言語の時間変化をシミュレート 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 3

言語構造の潜在表現 史的変化の統計的推論 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論表層特徴列 x ll, 1 1 0 0 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を ( 内部ノードの状態 年代も同時推定 ) 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 Step 3. 遷移率行列を用いて言語の時間変化をシミュレート シミュレーションによる分析 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 3

基本語順 : Subject, Object, Verb [Dryer, 2005] SOV 日本語 John ga tegami o yon-da S O V SVO 英語 The dog chased the cat S V O VSO アイルランド語 Léann na sagairt na leabhair V S O The priests are reading the books. 4

基本語順 : Subject, Object, Verb [Dryer, 2005] 出典 : http://wals.info/feature/81a 5

基本語順に関する疑問 [Maurits+, PNAS 2014] なぜ世界における分布がこのようになっているのか どのように変化してきたのか 原型言語 ( それが存在したとして ) はどの語順だったのか 6

基本語順に関する従来説の例 [Maurits+, PNAS 2014] SOV が最も高頻度なのは 1. 機能的に優れているから 2. かつてより高頻度だったなごりにすぎない SVO の方が機能的に優れている SOV SVO が SVO SOV よりも多い ( と推測 ) 原型言語も SOV だったかも パントマイム実験で SOV が選好される 原型言語は SOV だった傍証 現代人 ( しかも WEIRD) を使った実験で原型言語のことが本当にわかるのか 7

史的変化の推論 個別言語の分析 歴史文献の分析 中英語期に SVO への固定化が進む 内的再構 オーストロアジア語族のムンダ語派は (S)OV 語順だが VO 語順の痕跡が残る [Donegan+, 2004] 言語間比較 共時類型論の動態化 [Greenberg, 1969] 系統学的比較法 8

系統学的比較法 系統樹が ( 主に語彙的手がかりを用いた推論により ) 既知とする 系統樹上のどのエッジで注目する値が出現したか推測できる ( 場合がある ) 簡単のために 2 値特徴で例示するが 多値特徴への拡張は容易 9

系統学的比較法 系統樹が ( 主に語彙的手がかりを用いた推論により ) 既知とする 系統樹上のどのエッジで注目する値が出現したか推測できる ( 場合がある ) 簡単のために 2 値特徴で例示するが 多値特徴への拡張は容易 9

系統学的比較法 もちろん現在得られる手がかりだけでは確信を持って決められない場合も多い 人間はお手上げ 10

系統学的比較法 もちろん現在得られる手がかりだけでは確信を持って決められない場合も多い 人間はお手上げ 10

系統学的比較法 もちろん現在得られる手がかりだけでは確信を持って決められない場合も多い 人間はお手上げ 確率的手法の出番 10

状態遷移モデル ( マルコフ連鎖 ) まずは簡単のために離散時間を考える 時刻 tt である値 ( 状態 ) のとき 時刻 tt + 1 で取る値 ( 状態 ) の確率のモデル 0.95 0.05 0.90 0.10 11

連続時間マルコフ連鎖 (CTMC) 現在の値がaaのとき時間 tt 後に値がbbになる確率 : exp(tttt) aa,bb αα αα ただし遷移率行列 QQ = ββ ββ 確率 時間 時間 12

( 年代つき ) 系統樹群を用いた 遷移率行列の推定 [Greenhill+, 2010] [Maurits+, PNAS 2014] 観測データ ( 年代つき ) 系統樹 ( 群 ) 葉ノードの状態 潜在データ 遷移率行列 内部ノードの状態 time before present QQ = αα αα ββ ββ 0 13

言語構造の潜在表現 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論 1 1 0 0 表層特徴列 x ll, 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を推定 ( 内部ノードの状態 年代も同時推定 ) 史的変化の統計的推論 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 Step 3. 遷移率行列を用いて言語の時間変化をシミュレート シミュレーションによる分析 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 14

言語構造の潜在表現 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論 1 1 0 0 表層特徴列 x ll, 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を推定 ( 内部ノードの状態 年代も同時推定 ) 史的変化の統計的推論 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 Step 3. 遷移率行列を用いて言語の時間変化をシミュレ シミュレーションによる分析 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 14

基本語順の遷移確率と 将来変化の予測 [Maurits+, PNAS 2014] 15

言語構造の潜在表現 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論表層特徴列 x ll, 1 1 0 0 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を推定 ( 内部ノードの状態 年代も同時推定 ) 史的変化の統計的推論 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 Step 3. 遷移率行列を用いて言語の時間変化をシミュレート シミュレーションによる分析 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 16

言語構造の潜在表現 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論 1 1 0 0 表層特徴列 x ll, 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を推定 ( 内部ノードの状態 年代も同時推定 ) 史的変化の統計的推論 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 Step 3. 遷移率行列を用いて言語の時間変化をシミュレート シミュレーションによる分析 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 16

特徴間の依存関係を利用した 含意的普遍性 [Greenberg, 1963] 目的語 動詞と名詞 関係節の語順の関係 If VO, then NRel If RelN, then OV 分析の精緻化 NRel RelN VO OV 基本語順の変化は一大変化であり 他の特徴の変化と連動しているはず 英語の SVO 語順への変化は 孤立語化と連動しているように見える 17

単純に特徴ごとに遷移率行列を 用意すると独立性を仮定したことに 特徴対の値の組み合わせ 12 が不自然だという知識を推論に反映させられない time before present 0 11 11 11 11 21 22 11 11 22 特徴 1 1 2 特徴 2 1 2 QQ 1 = αα 1 αα 1 QQ2 = ββ αα 1 2 ββ 1 αα 2 ββ 2 ββ 2 18

値の組み合わせの展開による 依存関係モデル化 [Dunn+, Nature 2011] 3 個以上の特徴や 多値特徴 ( 基本語順は 6-7 値 ) は組合せ爆発を起こして推論困難 time before present 0 1 1 1 1 3 4 1 1 4 特徴 1 QQ = 1 2 11 12 21 22 特徴 2 1 2 qq 12 1 2 qq 21 qq 31 qq 13 qq 42 qq 24 qq 34 3 4 qq 43 11 12 21 22 qq 12 qq 13 qq 21 qq 24 qq 31 qq 34 qq 42 qq 43 19

表層特徴列を互いに独立な 潜在パラメータ列に写像 104 個の特徴を 100 個の 2 値パラメータに再編 パラメータは仮定により互いに独立 確率的生成モデル パラメータ列から特徴列への変換は生成 特徴列からパラメータ列への変換は事後推論 [Murawaki, IJCNLP2017] 潜在空間上で操作 表層特徴列 x ll, 2 1 3 潜在パラメータ列 z ll, 推論 1 1 0 0 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 20

特徴間の依存関係を捉えるのは 0 1 0 1 潜在パラメータ列 z ll, 重み行列 WW 2.9 6.3 8.2 0.2 重み行列 WW 0.4-4.3-0.2 0.3-0.3-5.7-2.5 1.2-0.2 5.9 0.3-2.4 = 8.4 [Murawaki, IJCNLP2017] -2.3-7.3 2.5 特徴スコア列 θθ ll, Softmax 分布から確率的に生成 1 1 3 表層特徴列 x ll, 21

特徴間の依存関係を捉えるのは 0 1 0 1 潜在パラメータ列 z ll, 重み行列 WW 2.9 6.3 8.2 0.2 重み行列 WW 0.4-4.3-0.2 0.3-0.3-5.7-2.5 1.2-0.2 5.9 0.3-2.4 = 8.4 [Murawaki, IJCNLP2017] -2.3-7.3 2.5 特徴スコア列 θθ ll, Softmax 分布から確率的に生成 表層特徴列の一部 (26.9%) が与えられたとき 残りの欠損値 潜在パラメータ列 重み行列 WW を事後推論 1 1 3 表層特徴列 x ll, 21

獲得されたパラメータの 地理的分布の例 表層的特徴に見られた地理的信号を潜在的パラメータへ写像しても維持している ( ように見える ) 22

言語構造の潜在表現 Step 1. 各言語を潜在表現に変換 潜在パラメータ列 z ll, 推論 1 1 0 0 表層特徴列 x ll, 2 1 3 Step 2. 系統樹群から各潜在パラメータの遷移率行列を推定 ( 内部ノードの状態 年代も同時推定 ) 史的変化の統計的推論 0 time before present 1 0 0 0 各パラメータの遷移率行列 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 Q kk = 0.0003 0.0002 1 1 1 0 0 1 1 1 1 1 1 0 Step 3. 遷移率行列を用いて言語の時間変化をシミュレート シミュレーションによる分析 潜在パラメータ列 z ll, 1 1 0 0 時間 tt Q kk = 0.0003 0.0002 潜在パラメータ列 z ll, 生成 1 0 0 1 表層特徴列 x ll, 1 1 2 23

2 千年後の基本語順の予測 平均遷移確率 語順維持確率の言語ごとのばらつき 24

日本語の将来予測 25

回帰分析 SVO 語順を持つ言語のうち どのような特徴を持つものが安定的 孤立語性と語順維持確率に高い相関 日本語が 2 千年後に SVO 語順に変化する (12.3%) 場合 何が特徴的 格表示に接語 ( が を ) を使わない可能性が高い このばらつきの説明 26

まとめと今後の課題 潜在表現への変換により言語の構造的特徴間の依存関係を捉える史的変化の分析手法を提案 今後の課題 基本語順以外の特徴の分析 祖語の推論結果の分析 大語族の系統推定と世界祖語 () の語順推定 接触のモデル化 [Murawaki, NAACL2016] 27