スライド 1

Similar documents
kubo2015ngt6 p.2 ( ( (MLE 8 y i L(q q log L(q q 0 ˆq log L(q / q = 0 q ˆq = = = * ˆq = 0.46 ( 8 y 0.46 y y y i kubo (ht

/22 R MCMC R R MCMC? 3. Gibbs sampler : kubo/

/ *1 *1 c Mike Gonzalez, October 14, Wikimedia Commons.

Microsoft PowerPoint - R-stat-intro_20.ppt [互換モード]

60 (W30)? 1. ( ) 2. ( ) web site URL ( :41 ) 1/ 77

今日の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか

この 2 つの式に基づきシェーファーが考えたのがシェーファーのプロダクションモデル 式 (3) です (Schaefer 1957) db/dt = rb (1 B/K) qxb (3) ここで q は漁具能率 X は漁獲努力量 Y は漁獲量で Y = qxb と仮定されています ロジスティック式を

日心TWS

今回 次回の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ Danger!! (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか これは次回)

kubostat2017j p.2 CSV CSV (!) d2.csv d2.csv,, 286,0,A 85,0,B 378,1,A 148,1,B ( :27 ) 10/ 51 kubostat2017j (

MCMCについて

untitled

kubostat1g p. MCMC binomial distribution q MCMC : i N i y i p(y i q = ( Ni y i q y i (1 q N i y i, q {y i } q likelihood q L(q {y i } = i=1 p(y i q 1

12/1 ( ) GLM, R MCMC, WinBUGS 12/2 ( ) WinBUGS WinBUGS 12/2 ( ) : 12/3 ( ) :? ( :51 ) 2/ 71

統計的データ解析

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

EBNと疫学

講義「○○○○」

PowerPoint プレゼンテーション

kubo2017sep16a p.1 ( 1 ) : : :55 kubo ( ( 1 ) / 10

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

様々なミクロ計量モデル†

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

解析センターを知っていただく キャンペーン

kubostat2018a p.1 統計モデリング入門 2018 (a) The main language of this class is 生物多様性学特論 Japanese Sorry An overview: Statistical Modeling 観測されたパターンを説明する統計モデル

統計モデリング入門 2018 (a) 生物多様性学特論 An overview: Statistical Modeling 観測されたパターンを説明する統計モデル 久保拓弥 (北海道大 環境科学) 統計モデリング入門 2018a 1

kubostat2018d p.2 :? bod size x and fertilization f change seed number? : a statistical model for this example? i response variable seed number : { i

Microsoft Word - eviews6_

kubostat7f p GLM! logistic regression as usual? N? GLM GLM doesn t work! GLM!! probabilit distribution binomial distribution : : β + β x i link functi

Microsoft PowerPoint - GLMMexample_ver pptx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

数値計算法

Microsoft Word - VB.doc

PowerPoint プレゼンテーション

スライド 1

C#の基本

情報工学概論

スライド 1

カイ二乗フィット検定、パラメータの誤差

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典


Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

一般化線形 (混合) モデル (2) - ロジスティック回帰と GLMM

ベイズ統計入門

スライド 1

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

Medical3

みっちりGLM

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft Word - apstattext04.docx

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

PrimerArray® Analysis Tool Ver.2.2

Probit , Mixed logit

Stanによるハミルトニアンモンテカルロ法を用いたサンプリングについて

Microsoft Word - mstattext02.docx

Microsoft Word - å“Ÿåłžå¸°173.docx

スライド 1

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

Microsoft Word doc

Excelにおける回帰分析(最小二乗法)の手順と出力

まず y t を定数項だけに回帰する > levelmod = lm(topixrate~1) 次にこの出力を使って先ほどのレジームスイッチングモデルを推定する 以下のように入力する > levelswmod = msmfit(levelmod,k=,p=0,sw=c(t,t)) ここで k はレジ

kubostat2017b p.1 agenda I 2017 (b) probability distribution and maximum likelihood estimation :

C3 データ可視化とツール

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

k2 ( :35 ) ( k2) (GLM) web web 1 :

講義のーと : データ解析のための統計モデリング. 第2回

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

Microsoft PowerPoint - 資料04 重回帰分析.ppt

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

講義のーと : データ解析のための統計モデリング. 第5回

Microarray Data Analysis Tool Ver3.0 Manual.doc

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt


Microsoft Word - 補論3.2

Microsoft PowerPoint - stat-2014-[9] pptx

dae opixrae 1 Feb Mar Apr May Jun と表示される 今 必要なのは opixrae のデータだけなので > opixrae=opixdaa$opi

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

データ科学2.pptx

角度統計配布_final.pptx

生命情報学

Microsoft PowerPoint - Econometrics pptx

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

201711grade2.pdf

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

1 環境統計学ぷらす 第 5 回 一般 ( 化 ) 線形混合モデル 高木俊 2013/11/21

③ 水産資源解析の概要 さまざまな資源量推定手法 どの資源評価モデルが良いのか 資源量推定のさいに重要な3つのこと 1

Microsoft PowerPoint - SAS2012_ZHANG_0629.ppt [互換モード]

Microsoft Word - appendix_b

スライド 1

第7章

布に従う しかし サイコロが均質でなく偏っていて の出る確率がひとつひとつ異なっているならば 二項分布でなくなる そこで このような場合に の出る確率が同じであるサイコロをもっている対象者をひとつのグループにまとめてしまえば このグループの中では回数分布は二項分布になる 全グループの合計の分布を求め

最小二乗法とロバスト推定

Transcription:

WinBUGS 入門 水産資源学におけるベイズ統計の応用ワークショップ 2007 年 8 月 2-3 日, 中央水研 遠洋水産研究所外洋資源部 鯨類管理研究室 岡村寛

WinBUGS とは BUGS (Bayesian Inference Using Gibbs Sampling) の Windows バージョン フリーのソフトウェア Gibbs samplingを利用した事後確率からのサンプリングを行う

WinBUGS プログラムコードは R とよく似ている それゆえ,Rでプログラムが書けると理解が早いし, 何かと便利 R2WinBUGSというRからWinBUGSを呼び出して実行するプログラムも開発されている 様々な状況に自動で対応して適当なサンプリング法を選んでくれる 例. log-concave adaptive rejection sampling 範囲を制限したとき スライスサンプラー範囲制約がないとき Metropolis 法

WinBUGS 画面

WinBUGS プログラム 基本的に,model.odc,data.dat,inits.inの3つのファイルからなる. model.odc の中身の例 model{ for (i in 1:N){ Y[i] ~ dnorm(mu[i],tau) mu[i] <- a + b*x[i] # a + b*(x[i]-mean(x)) is better. } }

WinBUGS プログラミングの注意 1 変数を2 度定義できない x <- 1 x <- 3 ベクトルや行列で対応 if 文は使えない X = (3, NA, 2) X=cbind(c(1,3),c(3,2)) X[t,2]~dpois(N[X[t,1]]) ( ただし, この場合はNAのままでもOK) Y ~ dnorm(log(n), sigma) Y ~ dnorm(ln, sigma) LN <- log(n)

WinBUGS プログラミングの注意 2 最初に少ないパラメータからスタートして ( いくつかのパラメータをfix), 段々複雑にする R2WinBUGSを使うとデータの扱いなど便利 bugs(data, inits,, debug=true, ) Trapというエラーメッセージが出ることがある 初期値がおかしい事前分布を少し狭く ~ 徐々に広げる

WinBUGS プログラミングの注意 3 まず最尤法を用いた簡単なプログラムであたりをつける プロット! プロット! プロット! あまり洗練されたプログラムを書こうとしないこと よく使う人と友達になる 仲間を増やす

例題 1( 検定 ) 池 A, 池 B の中のある場所をランダムに選んで毎回同じ時間調査し, その中にいるメダカの数を数えた結果, 下のようなデータが得られた ( 池 B は行きにくいので 3 回しか調査できなかった ). 池 A と池 B のメダカの数は違うであろうか?

検定仮説 検定したい仮説 : 池 Aの平均メダカ数 = 池 Bの平均メダカ数 池 Aと池 Bの平均メダカ数は, 池 A: 平均 1.5, 分散 1.7 池 B: 平均 0.0, 分散 0.0

t 検定 池 B はメダカのサンプルなしなので, 池 A の平均 が 0 と有意に違うかどうかを見る t 検定を行う > x <- c(1,1,0,4,2,2,0,2) > t.test(x) t = 3.2404, df = 7, p-value = 0.01425 有意

通常の検定の何が問題か? 池 Bはすべて0の観測値であるが,3 回 0が続いただけである. これは10 回 0が続いたのとは証拠の大きさが異なるはずである. 先の検定は, そこのとこを考慮していない. 3 回とも0だったので分散は0となり,0 確実である. しかし,3 回しかやってないので, たまたま0が続いたということもあるのでは? > rpois(3,1.5) [1] 0 0 0 なんていこうともありうる.

GLM してみる カウントデータであるし, 池 A の平均と分散はおよそ等しいのでポアソン分布を仮定して GLM してみる a <- factor(c(rep("a",8),rep("b",3))) x1 <- data.frame(area=a, med=c(x,rep(0,3))) res <- glm(med~area,family=poisson,data=x1)

GLM 結果 > summary(res) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) 0.4055 0.2887 1.405 0.160 areab -19.7081 5442.46-0.004 0.997 収束していない. これは池 B が全部 0 だからである

こんなふうに考えてみる 池 Aから3 回続けてサンプルしたとき, すべて0となる確率はどうなるか? これがすごく小さかったら, 池 Bは池 Aよりメダカが少ないと考えてもおかしくないであろう. 確率が大きければ, 池 Aと池 Bが違うと考える根拠は希薄であることになる.

事後予測分布 ベイズ推定で考えると, 池 A のデータが与えられたとき, 新たな調査を行って 3 回続けて 0 となる確率を推定す れば良い y = { 新たに調査したら3 回続けて0} とするとき, 事後予測分布 P(y x) = P(y θ)p(θ x)dθを推定する ポアソン分布を仮定すると3 回続けて0 = {exp(-θ)} 3 = exp(-3θ)

WinBUGS コード model{ Jm ~ dunif(0,100) mu <- pow(jm,-2) for (i in 1:N){ x[i] ~ dpois(mu) # likelihood } Prob <- exp(-3*mu) } list(x = c(1,1,0,4,2,2,0,2), N=8) # data

WinBUGS 実行 1. プログラムを WinBUGS 上で開く 2. ツールバーの Model の Specification を選択 3. プログラムの model 部分を選んで, Specification Tool の check model をクリック 4. データ先頭の list を選んで,Specification Tool の load data をクリック 5. compile をクリック

WinBUGS 実行 6. 初期値を自動生成するため, 今回は gen inits をクリック 7. ツールバー Inference をクリックして, Samples を選択 8. Sample Monitor Tool の node に mu と入れて, set をクリック 9. Sample Monitor Tool の node に Prob と入れて,set をクリック

WinBUGS 実行 10. 再びツールバーの Model をクリックし, 今度は Update を選択 11. Update Tool の update ボタンをクリック 12. Sample Monitor Tool に行って,node に mu と入れる. 下のボタンが active になる 13. density や stats ボタンを押して結果を見る 14. node に Prob を入れて同じことをする

WinBUGS 実行 と文章や口で言っても分かりにくいので, 実際にやってみる 実演 WinBUGS the movie! というページもある. 動画で紹介. http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/winbugsthemovie.html

事後分布 平均 1.43 95%CI[0.72, 2.38] 平均 0.03 95%CI[0.001, 0.11]

まとめ ベイズ推定によって, うまいこと問題 ( 池 Bのサンプルサイズを考慮, 観測したどのデータも0, など ) を回避していることに注意 池 Bの結果を, 池 Aの結果が与えられたという条件のもとで, 池 A= 池 Bとしたとき, 池 Bの結果と同じようになる確率で評価した. 他にどんなモデリングが考えられるか?( 例. 池 Bの方も池 Aと同じようにモデル化して, 二つの平均を比較するとか )

例題 2( 階層ベイズ ) 大西洋ビンナガマグロの漁獲量と CPUEのデータにプロダクションモデルをフィットし, そのパラメータの推定結果を用いて,MSYを計算せよ. 最近の漁獲量は適切な水準にあると言えるか?

CPUE (Catch Per Unit Effort) CPUE = 漁獲量 / 努力量 CPUE = qp q: 漁獲効率,P: 資源量 ( 個体数 or 個体重量 ) CPUE を使って個体群の増減が分かる 年トレンドの推定 CPUE の標準化 (GLM 等 ) CPUE = qp x (Hilborn & Walters 1992)

MSY の考え方 個体群の増加率 ( ロジスティック曲線 ) dp/dt = rp(1-p/k) P: 資源量,r: 内的自然増加率, K: 環境収容量 MSY(Maximum Sustainable Yield): dp/dt が最大になるのは,P=K/2 のとき 0 K P P=K/2 になるように魚を獲っていたら, 最大の収穫を得ながら, 個体群を健全に維持できる!

状態空間モデル State-Space Model X t-1 X t X t+1 Y t-1 Y t Y t+1 プロセス方程式 : X t = G(X t-1, w t ) 観測方程式 : Y t = F(X t, v t )

個体群動態モデルのパラメータ推定 ロジスティックモデル B t+1 = {B t + rb t (1-B t /K)-C t }exp(u t ) I t = qb t exp(w t ) MSY = rk/4 B MSY = K/2 E MSY = r/(2q) u t ~ N(0,s A2 ), w t ~ N(0,s O2 ) プログラム中では,r と K の相関を弱めるため,P t = B t /K を使う

状態空間モデルの特徴 観測誤差とプロセス誤差を同時に推定することが可能 計算機集約的な方法と組み合わせることにより, 柔軟なモデリング 推定が可能 カルマン フィルタは状態空間モデルの特殊な場合と考えられる 一般に計算大変

データ : 漁獲量と CPUE 南大西洋ビン ナガマグロの データ

WinBUGS 実行 実演

事後分布 110,000 万回計算して, 最初の 10,000 回を burn-in として取り除いた

R と K の相関 K 600.0 500.0 400.0 相関係数 = -0.84 300.0 200.0 0.0 0.2 0.4 r

自己相関 thinning なし thinning=50 thinning=100 thinning=200

2 本の chain でやってみる V R W R = V/W V = pool した chain の変動 W = 個々の chain の平均変動

2 本の chain でやってみる

R2WinBUGS RからWinBUGSを呼び出して解析を実行し,Rの中でoutputを操作 データや初期値の作成が楽ちん 即 codaを使える 最初は少ない繰り返し数で

R2WinBUGS でやってみる

coda

まとめ 個体群動態モデルでは, 従来観測誤差かプロセス誤差のどちらか一方だけを仮定することが多かったが, ベイズ型状態空間モデルを使うことによってどちらの誤差も考慮した分析が比較的容易に行える いろいろプロットして, うまくいっているか確認することが大事 R2WinBUGSを使うといろいろ便利なことが

参考文献 Meyer, R., and Millar, R. B. 1999. BUGS in Bayesian stock assessments. CJFAS 56: 1078-1086. Plummer, M. 2006. CODA: convergence diagnosis and output analysis for MCMC. R News 6(1): 7-11. Spiegelhalter et al. 2003. WinBUGS user manual version 1.4.