2 値データの Intraclass Correlation Coefficient の推定マクロプログラム 稲葉洋介 1 田中紀子 1 1 国立国際医療研究センターデータサイエンス部生物統計研究室 Macro program for calculating Intraclass Correlati

Similar documents
Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

Probit , Mixed logit

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

3/4/8:9 { } { } β β β α β α β β

講義「○○○○」

解析センターを知っていただく キャンペーン

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

Microsoft Word - 補論3.2

日心TWS

<4D F736F F F696E74202D204D C982E682E892B290AE82B582BD838A E8DB782CC904D978A8BE68AD482C98AD682B782E988EA8D6C8E402E >

スライド 1

カイ二乗フィット検定、パラメータの誤差

PowerPoint プレゼンテーション

Microsoft PowerPoint - SPECTPETの原理2012.ppt [互換モード]

ビジネス統計 統計基礎とエクセル分析 正誤表

5 Armitage x 1,, x n y i = 10x i + 3 y i = log x i {x i } {y i } 1.2 n i i x ij i j y ij, z ij i j 2 1 y = a x + b ( cm) x ij (i j )

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

様々なミクロ計量モデル†

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Mantel-Haenszelの方法

情報工学概論

統計的データ解析

布に従う しかし サイコロが均質でなく偏っていて の出る確率がひとつひとつ異なっているならば 二項分布でなくなる そこで このような場合に の出る確率が同じであるサイコロをもっている対象者をひとつのグループにまとめてしまえば このグループの中では回数分布は二項分布になる 全グループの合計の分布を求め

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

2016.

第121回関東連合産科婦人科学会総会・学術集会 プログラム・抄録

kubostat7f p GLM! logistic regression as usual? N? GLM GLM doesn t work! GLM!! probabilit distribution binomial distribution : : β + β x i link functi

kubostat2017b p.1 agenda I 2017 (b) probability distribution and maximum likelihood estimation :

untitled


PR

【アフィリコード】総合マニュアル

【アフィリコードプラス】総合マニュアル

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

本文/目次(裏白)

報告書

& 3 3 ' ' (., (Pixel), (Light Intensity) (Random Variable). (Joint Probability). V., V = {,,, V }. i x i x = (x, x,, x V ) T. x i i (State Variable),

基礎統計

スライド 1

Microsoft PowerPoint - GLMMexample_ver pptx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです ゲージ R&R 分析 ( 交差 ) 概要 測定システ


PowerPoint プレゼンテーション

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

DVIOUT-ar

,, Poisson 3 3. t t y,, y n Nµ, σ 2 y i µ + ɛ i ɛ i N0, σ 2 E[y i ] µ * i y i x i y i α + βx i + ɛ i ɛ i N0, σ 2, α, β *3 y i E[y i ] α + βx i

Bvarate Probt Model 0.24% 0.4% 5.%.% %.% Keyword Bvarate Probt Model 6- TEL & FAX: E-mal:

Microsoft PowerPoint - stat-2014-[9] pptx

t sex N y y y Diff (1-2)

X X X Y R Y R Y R MCAR MAR MNAR Figure 1: MCAR, MAR, MNAR Y R X 1.2 Missing At Random (MAR) MAR MCAR MCAR Y X X Y MCAR 2 1 R X Y Table 1 3 IQ MCAR Y I

t χ 2 F Q t χ 2 F 1 2 µ, σ 2 N(µ, σ 2 ) f(x µ, σ 2 ) = 1 ( exp (x ) µ)2 2πσ 2 2σ 2 0, N(0, 1) (100 α) z(α) t χ 2 *1 2.1 t (i)x N(µ, σ 2 ) x µ σ N(0, 1

Microsoft PowerPoint - statistics pptx

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

橡表紙参照.PDF

スライド 1

応用数学III-4.ppt

(iii) x, x N(µ, ) z = x µ () N(0, ) () 0 (y,, y 0 ) (σ = 6) *3 0 y y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y ( ) *4 H 0 : µ

数値計算法

第7章

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

Microsoft PowerPoint - SAS2012_ZHANG_0629.ppt [互換モード]

福大紀要 02730816/教育科学 太田 氏家

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

Microsoft Word doc

日本統計学会誌, 第44巻, 第2号, 251頁-270頁

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

パーキンソン病治療ガイドライン2002

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

ANOVA

立命館

Medical3

τ-→K-π-π+ν τ崩壊における CP対称性の破れの探索

Microsoft PowerPoint - statistics pptx

4.9 Hausman Test Time Fixed Effects Model vs Time Random Effects Model Two-way Fixed Effects Model

スライド 1

景気指標の新しい動向

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

欠測を含む順序カテゴリカル経時データの解析 -GEE プロシジャの有用性 - 駒嵜弘 1 藤原正和 2 ( 1 マルホ株式会社 2 塩野義製薬株式会社 ) Ordinal longitudinal data analysis with missing data -Usefulness of Proc

ワースペクトルの離散フーリエ逆変換として以下の式で 与えられる XkY k rm IDFT Xk Y k 信号の位相スペクトルが 変量確率分布に従う場合 の POC 関数の統計的性質 3 3. 著者らのグループがこれまでに行ってきた POC 関数の XkY k W mk Xk Y k 統計的解析では

研修コーナー

混沌系工学特論 #5

L Y L( ) Y0.15Y 0.03L 0.01L 6% L=(10.15)Y 108.5Y 6%1 Y y p L ( 19 ) [1990] [1988] 1

SAS_2014_zhang_3

今回 次回の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ Danger!! (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか これは次回)

             論文の内容の要旨

抄録/抄録1    (1)V

EBNと疫学

2016 Institute of Statistical Research

Autumn II III Zon and Muysken 2005 Zon and Muysken 2005 IV II 障害者への所得移転の経済効果 分析に用いるデータ

JFE.dvi


λ n numbering Num(λ) Young numbering T i j T ij Young T (content) cont T (row word) word T µ n S n µ C(µ) 0.2. Young λ, µ n Kostka K µλ K µλ def = #{T

研究シリーズ第40号

1 Jensen et al.[6] GRT S&P500 GRT RT GRT Kiriu and Hibiki[8] Jensen et al.[6] GRT 3 GRT Generalized Recovery Theorem (Jensen et al.[6])

Transcription:

2 値データの Intraclass Correlation Coefficient の推定マクロプログラム 稲葉洋介 1 田中紀子 1 1 国立国際医療研究センターデータサイエンス部生物統計研究室 Macro program for calculating Intraclass Correlation Coefficient for binary data Yosuke Inaba, Noriko Tanaka Biostatistics Section, Department of Data Science National Center for Global Health and Medicine

要旨 : アウトカムが 2 値の場合の Intraclass Coefficient Correlation( 級内相関係数 :ICC) について, 幾つかの異なる推定量を SAS で実装し, マクロプログラムを作成した. また条件を変化させて性能を比較し, 推定量の選択の基準等を議論する キーワード : Intraclass Coefficient Correlation,,ICC, Binary, Survival Cluster Randomized trial 2

ICC とは 3

ICC とは Intraclass Correlation Coefficient( 級内相関係数 :ICC) 同一クラスター ( 定義された群 あるいは繰り返し測定された個体 ) 内のデータの相似性を示す定量的な指標 4

応用 評価者間信頼性の指標 精神医学的測定 病理 画像診断 クラスターランダム化試験 検出力に影響する要因 (murray 2004) 生存時間をエンドポイントとする試験では イベント有無の 2 値データで計算した ICC を用いる場合が多い 5

Correlated binary data ICC=0.1 Cluster y 1 1 1 0 1 1 1 1 0 1 1 2 1 0 1 1 1 0 1 1 1 1 3 0 0 0 1 1 0 0 1 1 0 4 1 0 0 1 0 1 1 1 0 1 5 1 1 1 0 0 1 1 1 1 0 6 0 1 1 0 0 0 0 1 1 1 7 0 0 1 0 0 1 1 1 1 1 8 1 1 0 1 0 0 0 0 1 1 9 0 1 0 0 0 1 0 0 0 0 10 1 0 1 0 1 0 1 1 1 1 ICC=0.9 Cluster y 1 1 1 1 1 1 1 1 1 1 1 2 0 0 0 0 0 0 0 0 0 0 3 1 1 1 1 1 1 1 1 1 1 4 1 0 0 0 0 0 0 0 0 0 5 1 1 1 1 1 1 0 1 1 1 6 0 0 1 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 10 1 1 1 1 1 1 1 1 1 1 6

定義 7

k : クラスター数 ICC の定義 n i : i 番目のクラスターの要素数 X ij ~Bernulli π i = 1,, k j = 1,, n i : 応答 (1: 成功 or 0: 失敗 ) Y i = X ij : i 番目のクラスターの成功の総数 8

ICC の定義 全てのオブザベーションにおいて成功確率は共通 (Pr X ij = 1 : = π for i, j) とし, 異なるクラスター間のオブザベーションは全て独立と仮定する. 同一クラスター内では, 任意のオブザベーションの組 (X ij, X il ) の相関は共通とし, (common-correlation model) Corr X ij, X il ρ を ICC と定義する 9

ICC の定義 この時 E X ij = π, Var X ij = π(1 π) より Var Y i = n i π 1 π 1 + n i 1 ρ Y i は二項分布に従うが ρ > 0 の時に過大分散 ρ < 0 の時に過少分散となる 10

ICC の定義 ( 一般化線形モデル ) β i ~N 0, σ 2 β e ij ~N 0, σ 2 : クラスターの変量効果 : 誤差 X ij = μ + β i + e ij Var X ij = Var X ij = σ β 2 + σ 2 ゆえに Corr X ij, X il = σ β 2 σ β 2 +σ 2 = ICC 11

ICC マクロについて 12

マクロ化の動機 ICC の計算方法 2 値データの ICC は出版されているものだけで 10 種類以上 (Ridout 1996) SAS/STAT で直接計算できるプロシージャは無い 13

記載例 : %Binary_ICC( ICC マクロ詳細 Input=library.raw2,Cluster=region,Response =y, Output=result,Method=aov aovs peq,ci=y,iter=100) 仕様の詳細は資料集参照 14

Output 15

Method glmm nlmixed プロシージャを使用 データによっては収束しない事があるので注意 16

注意事項 以下の状況で Method によっては計算できないため欠損値が返る 全ての応答が 0 or 全ての応答が 1 全てのクラスターサイズが 1 Moment estimator(keq,keqs etc) は推定値が 1 を超える場合がある 本マクロでは計算値をそのまま出力している 17

シミュレーション 18

シミュレーションデータ詳細 各推定量の挙動を確認するため シミュレーションを実施した 以下の条件でシミュレーションデータを生成した (R の関数 rcbin を IML で呼び出して使用 ) π : 0.1, 0.5, 0.9 Num of Cluster : 10, 30, 50 Cluster Size( 平均 20% で変動 ) : 10, 30, 50 ρ :0.1, 0.5, 0.9 各設定の反復回数は 100 回 19

以下の混合 2 項分布よりシミュレーションデータを生成した (R の rcbin 関数を SAS/IML により呼び出して使用 ) Z i, ν ij ~ bernulli π, μ ij ~bernulli y ij = 1 μ ij ν ij + μ ij Z i ただし 以下の場合は除外 Y i = 1 for k Y i = n i for k n i = 1 for k データ生成方法 ρ 20

シミュレーションエラー π の設定値と生成されたシミュレーションデータの π の差の分布 21

シミュレーション結果 41 サンプルについて glmm は推定が収束せず推定値が得られなかった 41/8100 なので 結果に大きな影響なし 結果の詳細は配布資料参照 22

シミュレーション考察 aov, aovs, fc, mak, peq, pgp, ppr, stab, ub の推定値は 設定に関わらず精度が良い keq, keqs, kpr, kprs, w, ws は ρ の値が大きくクラスターサイズが小さいと推定が不安定になっている glmm はクラスターサイズが小さい時にややバイアスが入るが概ね安定的 23

まとめ ICC を計算するマクロを実装した 各推定量の挙動をシミュレーションにより確認した 今後は機能拡充を目指す 推定量の追加 (Extended quasi-likelihood estimator 等 ) 他の方法による信頼区間 Glmm での詳細な指定 24

参照文献 FISHER, R. A. Statistical methods for research workers. Edinburgh: Oliver and Boyd, 1925. DONNER, Allan. A review of inference procedures for the intraclass correlation coefficient in the one-way random effects model. International Statistical Review/Revue Internationale de Statistique, 1986, 67-82. 25

参照文献 DONOVAN, A. M.; RIDOUT, M. S.; JAMES, D. J. Assessment of somaclonal variation in apple. II. Rooting ability and shoot proliferation in vitro. Journal of horticultural science, 1994, 69.1: 115-122. 26

参照文献 GIBSON, G. J.; AUSTIN, E. J. Fitting and testing spatio temporal stochastic models with application in plant epidemiology. Plant Pathology, 1996, 45.2: 172-184. RIDOUT, Martin S.; DEMETRIO, Clarice GB; FIRTH, David. Estimating intraclass correlation for binary data. Biometrics, 1999, 55.1: 137-148. 27

Back up Z i, ν ij ~ bern π, μ ij ~bern ρ y ij = 1 μ ij ν ij + μ ij Z i y ij ~bernulli π, ICC = ρ の証明 : Pr y ij = 0 = Pr μ ij = 0, ν ij = 0 + Pr μ ij = 1, Z i = 0 = 1 ρ 1 π + ρ 1 π = 1 π Pr y ij = 1 = Pr μ ij = 0, ν ij = 1 + Pr μ ij = 1, Z i = 1 = 1 ρ π + ρπ = π 28

E y ij Back up = 0 1 π + 1 π = π Var y ij = 1 π 0 π 2 + π 1 π 2 = π 1 π 29

Back up ICC = Corr y ij, y il = Cov y ij,y il Var y ij Var y il Cov y ij, y il = Cov 1 μ ij ν ij + μ ij Z i, 1 μ il ν il + 30

Back up 従って Corr y ij, y il = π 1 π ρ π 1 π = ρ 31