したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

Similar documents
講義「○○○○」

Microsoft PowerPoint - 10.pptx

横浜市環境科学研究所

Microsoft PowerPoint - H21生物計算化学2.ppt

様々なミクロ計量モデル†

情報工学概論

Microsoft Word - 補論3.2

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - 9.pptx

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69

Microsoft Word - NumericalComputation.docx

PowerPoint Presentation

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

スライド 1

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

memo

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

航空機の運動方程式

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

スライド 1

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

パソコンシミュレータの現状

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft PowerPoint - 2.ppt [互換モード]

PowerPoint Presentation

Microsoft PowerPoint - sc7.ppt [互換モード]

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

統計的データ解析

Probit , Mixed logit

ベイズ統計入門

kubo2015ngt6 p.2 ( ( (MLE 8 y i L(q q log L(q q 0 ˆq log L(q / q = 0 q ˆq = = = * ˆq = 0.46 ( 8 y 0.46 y y y i kubo (ht

EBNと疫学

微分方程式による現象記述と解きかた

Microsoft PowerPoint - 7.pptx

Microsoft PowerPoint - 第3回2.ppt

DVIOUT-SS_Ma

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft Word - thesis.doc

スライド 1

日心TWS

ベクトルの基礎.rtf

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

特殊なケースでの定式化技法

カイ二乗フィット検定、パラメータの誤差

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

青焼 1章[15-52].indd

学習指導要領

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

航空機の運動方程式

生命情報学

スライド 1

基礎統計

スライド 1

チェビシェフ多項式の2変数への拡張と公開鍵暗号(ElGamal暗号)への応用

Microsoft PowerPoint - H22制御工学I-2回.ppt

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

数学の世界

Microsoft Word - 2_0421

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

<4D F736F F D2097CD8A7793FC96E582BD82ED82DD8A E6318FCD2E646F63>

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - H22制御工学I-10回.ppt

Functional Programming

調和系工学 ゲーム理論編

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

2011年度 大阪大・理系数学

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

Microsoft PowerPoint - mp11-02.pptx

Microsoft Word - 微分入門.doc

B. モル濃度 速度定数と化学反応の速さ 1.1 段階反応 ( 単純反応 ): + I HI を例に H ヨウ化水素 HI が生成する速さ は,H と I のモル濃度をそれぞれ [ ], [ I ] [ H ] [ I ] に比例することが, 実験により, わかっている したがって, 比例定数を k

PowerPoint プレゼンテーション

FEM原理講座 (サンプルテキスト)

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft Word - 付録1誘導機の2軸理論.doc

1.民営化

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること

Microsoft PowerPoint - stat-2014-[9] pptx

目次 ガウス過程 (Gaussian Process; GP) 序論 GPによる回帰 GPによる識別 GP 状態空間モデル 概括 GP 状態空間モデルによる音楽ムードの推定

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

 

13章 回帰分析

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

Microsoft PowerPoint - 基礎・経済統計6.ppt

解析センターを知っていただく キャンペーン

DVIOUT

vecrot

PowerPoint プレゼンテーション

講義「○○○○」

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

共役類の積とウィッテンL-関数の特殊値との関係について (解析的整数論 : 数論的対象の分布と近似)

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Transcription:

Bayesian Inference with ecological applications Chapter 10 Bayesian Inference with ecological applications 輪読会 潜在的な事象を扱うための多項分布モデル Latent Multinomial Models 本章では 記録した頻度データが多項分布に従う潜在的な変数を集約したものと考えられるときの データ解析の手法を紹介する この手法は標識再捕獲の解析に幅広く応用でき 観察された捕獲履歴が複 数の事象からなる場合には常に適切な手法である 個体の誤識別に関するモデルについて考えよう 10.1 MODEL ある動物の閉鎖個体群における個体数 の推定を行うことを考える Model は その動物の捕獲 はどの調査回 でも個体や時間によって変化しないことを想定したモデルである 個々の動物の捕獲履歴 capture history は 総調査回数 の長さをもつ二値のベクト ルにより表わされる 例えば 4 回の調査で 1 回目と 3 回目のみに発見できた場合 もしくは と 記述される 捕獲履歴は を用いて指標化すると扱いやすい 上記のの例ではとなる 捕獲履歴をもつ個体の数をとするとき は個体数とセル 捕獲履歴における調査回での記録 を母数とする多項分布に従う変数である Model による解析は容易である 観察履歴頻度 observed frequency は母数に観察 個体数 とセル をもつ多項分布に従っている また観察個体数は二項分布に従う 多項分布に従うは それらの積 として表わされるだろう PANEL 10.1 に BUGS code を示す 10.2 MODEL 個体が正しく識別できない場合 データに存在しないのに観察される個体 ghost record が含まれるため Model は個体数を過大評価してしまう そこで Model では 誤識別された個体は 1 個体しか存在しないと想定 * して 誤識別の可能性をモデルに考慮する 正識別率 correct identification probability をとすると Model では以下のように 3 つの事象とそのが考えられる 捕獲されない 捕獲され 識別も正しい 捕獲されたが 識別が誤っている * 遺伝物質を用いた識別では妥当なようです

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする Model の解析では 始めに潜在履歴頻度 latent history frequency を記録履歴頻 度 に変換する必要がある 行列は 潜在履歴から記録履歴が生じるとき それ以外でとなるの 行列である (Table 10.1) ここで 潜在履歴頻度の妥当な集合 ば 尤度は次式の条件付きの和として表現できる を知ることができるのであれ 集合 の推定には線形代数の知識を必要とする Digression: Some Linear Algebra 0 でない行列を 0 に写像するベクトルの集合 零空間 null space という概念を導入しよう ベクトルが 行列の零空間に属するとき から次のように記述できる 同様に もしを満たす潜在履歴頻度のひとつを見つけることができるなら と記述できる となる潜在履歴頻度は 個体の識別が完全に正しい場合に容易に得られる 行列の零空間は 線形に独立な個の基底ベクトル basis vector からなり を定数とすると が成り立つ (Table 10.2) Sample Calculation of Null Space Basis Vector の場合について 行列の零空間における基底ベクトルの計算を例示する 行列は と表わされる 行列の零空間をとすると は が成り立つ したがって

となり 行列の零空間における個の基底ベクトルが求められた 10.3 GIBBS SAMPLING FOR MODEL 個体が潜在履歴をもつ : 個体数において 潜在履歴頻度が起こる : 潜在履歴頻度を考慮したときの 記録履歴頻度が起こる : 全条件付き分布は 事前分布を考慮すると に比例する分布である Prior and Full Conditionals for and との事前分布がベータ分布およびに従うとき 全条件付き分布もまたベータ分布およびに従う Prior and Full Conditionals for and を固定すると新しいの値が標本抽出できないため の一組として Gibbs sampling を行う この連結全条件付分布は をの事前分布とすると

と表現される に関する事前知識がない場合 適当な大きな値を与えて 事前分布に離散的な一様分 布を用いるのが妥当かもしれない 有限な範囲をもたない非正則な一様分布も事後 分布は正則となるので 事前分布として用いることができる そこで 複数の事前分布を使って解析結果の感 度を評価することが勧められる Gibbs Sampling Gibbs sampling は次のように行われる 妥当な潜在履歴頻度の集合から初期値 を発生させる から と を計算する と を標本抽出する とおく とする 0 を除いた離散的な一様分布 から を標本 抽出し 潜在履歴頻度の候補 を発生させる ここで は の基底ベクトル は調節パラメータである を計算し ので候補値を採択する ( ) 個の基底ベクトルすべてで を十分に多く繰り返す を繰り返す 10.4 AN IMPLEMENTATION OF MODEL 調査回数 個体数 捕獲 正識別率から記録履歴頻度を発生させ シミュレーションによる Model の個体数推定を行った まず Model で平坦な事前分布を用いて推定を行ったところ 個体数はほどの過大評価がされた ( 事後分布の中央値 ) Model による推定は 110000 回の標本抽出と最初の 10000 回を焼き捨てにより行われた 最初の 5000 回はの調節期間としても用いた から始め の基底ベクトルの新しい候補が採択された場合にはを 0.95 倍し 採択されなかった場合には 1/0.95 倍する Step 5 のには より大きい整数の中で最も近いものを当てはめた Model の結果は満足のいくものであった (Table 10.3) Markov 連鎖はかなり長い自己相関を示しており (Figure 10.1) これは Metropolis-Hastings の標本抽出における低い移動率 ( 標本抽出された値の変化が小さいということ?) に原因があるようだ 調節された 212 個のの多くが 3 以下の値を示し 1 個 ( 頻度 0 の潜在履歴を増やす基底ベクトル ) のだけが 12 となった さらに この低い移動率は潜在履歴の多くが低い頻度をもつことによるようだ 243 種類の潜在履歴のうち 145 種類が頻度 0 となり 215 種類が頻度 3 以下となった 残り 28 種類の潜在履歴に注目すると実際のものとよく一致していた (Figure 10.2) つまり 基底ベクトルの新しい候補値が採択されるときは十分大きな事前分布から候補地が選ばれているとしての値を小さく 逆に基底ベクトルの新しい候補値が採択されないときは事前分布の大きさが十分でないとしての値を大きくしている

10.5 EXTENSIONS Bayesian Inference with ecological applications 輪読会 標識再捕獲データの多くはベルヌーイ試行に従う事象の履歴として記述される 事象の履歴が完全に観察さ れる場合 モデルのパラメータ推定は容易だ しかし 実際のデータの多くは 事象の履歴というよりは そ れらが複合した捕獲履歴であり その要素となる事象の多くが直接観察されない こうした複数の事象からな る履歴は 容易な推定を許さない尤度関数を導く 本章のモデル手法は そのような複合的な履歴が観察され る多くの場合に応用できる 多項分布に従う潜在的な変数 により頻度ベクトル を観察できない事象の履歴を記述し 変換 に集約されたものとして考えることができる また 本章で発達させた Gibbs sampling の方法も他の標識再捕獲モデルの多くに応用できるだろう Model とその他のモデルの違いは 行列の行に含まれる 1 の数が複数になることだ ひとつの潜 在履歴頻度が複数の記録履歴頻度を生じさせる それゆえ Model を解析するうえで 潜在的な事象を扱 う多項分布の構造に対しての知識が必要となる こうした理解は 必ずしも他のモデルでは必要にならないが 解析に対して明瞭な概念や多目的な枠組みを与えてくれるだろう PANEL 10.1 model { for ( t in 1:T ) { p[ t ] ~ dunif ( 0,1 ) # 捕獲 の事前分布 for ( j in 1:Cells ) { for ( t in 1:T ) { # セルの計算の一部 c[ j,t ] <- pow( p[ t ], omegas[ j,t ] ) * pow( 1 - p[ t ], 1 - omegas[ j,t ] ) pi[ j ] <- prod( c[ j,1:t ] ) # セル : の積の計算 for ( j in 2:Cells ) { pi.obs[ j ] <- pi[ j ] / ( 1 pi[ 1 ] ) # 観察履歴のセル n <- sum( f [ 2: Cells] ) # 観察履歴から捕獲された個体数 を計算 f [ 2: Cells] ~ dmulti ( pi.obs[ 2:Cells ], n ) # 観察履歴 : ここで尤度を計算 pn <- 1 pi [ 1 ] n ~ dbin ( pn, N ) # 捕獲された個体数と捕獲から個体数 を推定 cn ~ dunif (n, 10000 ) # 個体群に含まれる個体数 の事前分布 N <- round (cn) # 個体数 を自然数に