<4D F736F F D2088E38A77939D8C7695D78BAD89EF313791E63789F18C588CFC E646F6378>

Similar documents
Microsoft Word - 第7回傾向スコア.docx

<4D F736F F D2088E38A77939D8C7695D78BAD89EF313491E63789F18C588CFC E646F6378>

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Medical3

<4D F736F F F696E74202D F95618A7789EF B836A F838C834E B88E38A77939D8C76322E >

医学統計勉強会 第 6 回経時的繰り返し測定データの解析 医学統計勉強会 東北大学病院循環器内科 東北大学病院臨床研究推進センター共催東北大学大学院医学系研究科 EBM 開発学寄附講座宮田敏 Absence of evidence is not evidence of absence! - Carl

Chapter 1 Epidemiological Terminology

MedicalStatisticsForAll.indd

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313691E63589F194E497A682C695AA8A84955C2E >

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313791E63589F194E497A682C695AA8A84955C2E >

青焼 1章[15-52].indd

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

8 A B B B B B B B B B 175

EBM&CQ.ppt

JGSS統計分析セミナー2009-傾向スコアを用いた因果分析-

スライド 1

Medical3

PowerPoint プレゼンテーション

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - å“Ÿåłžå¸°173.docx

様々なミクロ計量モデル†

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - SPSS2007s5.doc

Microsoft Word - Stattext12.doc

相関分析・偏相関分析

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - SAS2012_ZHANG_0629.ppt [互換モード]

Microsoft PowerPoint 古川杉本SASWEB用プレゼン.ppt

統計的データ解析

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

ANOVA

横浜市環境科学研究所

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

EBNと疫学

クロス集計表の作成 2 つのカテゴリ変数をもつデータがあるとする ( 例 )AGE( 年齢 ),EXPOSURE( 曝露の有無 ) と DISEASE( 病気の有無 ) についての 40 人のデータ タブ区切りテキストファイル

Microsoft Word - 保健医療統計学112817完成版.docx

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - e-stat(OLS).pptx

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Probit , Mixed logit

Microsoft Word - 第14回定例会_平田様_final .doc

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

情報工学概論

Microsoft Word - 使用説明書.doc

Microsoft PowerPoint - sc7.ppt [互換モード]

重症度スコアの評価

課題名

解析センターを知っていただく キャンペーン

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - A1.ppt [互換モード]

日心TWS

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

経済統計分析1 イントロダクション

現況解析2 [081027].indd

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

日本語論文タイトル

データの取り扱いについて (原則)

データ科学2.pptx

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D2091E63489F190B691B68E9E8AD489F090CD2E646F6378>

lee1

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

<4D F736F F D208D7393AE8C6F8DCF8A7789EF8FB4985E905C82B58D9E82DD91E5927C919F8AED D322E646F63>

スライド 1

<4D F736F F F696E74202D A328CC B835E89F090CD89898F4B814096F689AA>

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

厚生労働科学研究費補助金(循環器疾患等生活習慣病対策総合研究事業)

PowerPoint プレゼンテーション

共分散分析 ANCOVA

因子分析

Microsoft PowerPoint - 応用統計_因果.ppt

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

スライド 1

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

する 研究実施施設の環境 ( プライバシーの保護状態 ) について記載する < 実施方法 > どのような手順で研究を実施するのかを具体的に記載する アンケート等を用いる場合は 事前にそれらに要する時間を測定し 調査による患者への負担の度合いがわかるように記載する 調査手順で担当が複数名いる場合には

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

症例報告書の記入における注意点 1 必須ではない項目 データ 斜線を引くこと 未取得 / 未測定の項目 2 血圧平均値 小数点以下は切り捨てとする 3 治験薬服薬状況 前回来院 今回来院までの服薬状況を記載する服薬無しの場合は 1 日投与量を 0 錠 とし 0 錠となった日付を特定すること < 演習

為化比較試験の結果が出ています ただ この Disease management というのは その国の医療事情にかなり依存したプログラム構成をしなくてはいけないということから わが国でも独自の Disease management プログラムの開発が必要ではないかということで 今回開発を試みました

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint - åł€æžœæ”¨è«Œã†®å�ºç¤”(çfl°æ€Š)final

Microsoft PowerPoint - statistics pptx

Microsoft Word - appendix_b

論文内容の要旨

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Transcription:

東北大学病院循環器内科 東北大学病院臨床研究推進センター共催東北大学大学院医学系研究科 EBM 開発学寄附講座宮田敏 Absence of evdence s not evdence of absence! - Carl Sagan - 1

1. 因果効果と交絡因子 医学において新規薬剤が開発されたり, 新たな手術技法が考案されたりしたとき, これらの新しい処置 (= 医学的介入 ) の因果効果を検証するための研究が行われます 通常 処置 と アウトカム は 様々な交絡因子 (= confoundng factor, 予後因子 背景因子 共変量 ) の影響を受けるため 処置を行った対象だけを検討 (sngle arm) してもアウトカムに対する効果は分かりません 因果効果の検証のための方法として 無作為化比較試験 (Randomzed Controlled Tral, RCT) と呼ばれる方法があります (RCT については, 次回詳しく取り上げます )RCT においては 新しい処置を受ける群 (treatment group) と共に 標準的な処置 ( あるいはプラセボ ) を受ける対照群 (control group) を置く (control) 処置群と対照群の割り付けは, 無作為割り付けによる (randomzaton) ヒトを対象とする場合 試験について十分な情報開示を行った上で 被験者から文書による同意を得る (nformed consent) RCT では 処置群と対照群の無作為割り付けを行うことにより 処置群と対照群における処置の有無以外の要因は, 全て偶然の誤差によるものと解釈出来ます このことで交絡因子の影響を除き 真の因果効果のみを検証することが出来るようになります しかし 臨床における観察研究では 群の割り付けを無作為化することが困難 2

で, 処置群と対照群の間で交絡因子の分布に大きな違いが出ることがあります 例えば, ある薬剤の投薬の効果を検証する際 医師は適応がある患者 最も治療を必要としている患者に優先して投与するかもしれません また 喫煙のような有害な習慣の場合 無作為に割り付けて喫煙を強要するわけにも生きません このように処置がランダムに割り付けられない場合 処置の因果効果は様々な交絡因子の影響を受けるため 交絡の影響をコントロールする研究デザインが必要になります 近年交絡をコントロールする手法として注目されている手法の一つが傾向スコア (Propensty Score, PS) になります 傾向スコアは 処置 の有無に関わる全交絡因子の情報を集約する手法で 層別や多変量解析など従来用いられた手法に代わるものとして盛んに用いられています 例 :lndner データオハイオ州 lndner センターで経皮的冠動脈形成術 (Percutaneous Coronary Interventons (PCIs)) を施行した 996 名の患者のうち PCI のみの患者 298 名と PCI+ Abcxmab( アブシキマブ ) 投与の患者 698 名に対して PCI 施行 6 ヶ月経過後の平均余命を比較したデータ (1997 年 ) lfepres:pci 施行 6 ヶ月経過後の平均余命. 死亡 =0, 生存 =11.6 cardbll:pci 施行後 6 ヶ月間の心臓病関連医療費 ( ドル ) abcx:abcxmab 投与有り =1, 投与なし =0 stent: ステント heght: 身長 female: 性別 ( 女性 ) dabetc: 糖尿病 acutem:7 日以内の AMI ejecfrac: 左室駆出率 lfepres cardbll abcx stent heght female dabetc acutem ejecfrac 1 0 14301 1 0 163 1 1 0 56 2 11.6 3563 1 0 168 0 0 0 56 3 11.6 4694 1 0 188 0 0 0 50 3

Name abcx=0 : (n=298) abcx=1: (n=698) p-value cardbll 14614.22 ± 14514 16126.68 ± 9383.83 0.098 heght 171.45 ± 10.59 171.44 ± 10.69 0.996 ejecfrac 52.29 ± 10.3 50.4 ± 10.42 0.009 stent 174 (58.4%) 492 (70.5%) 0 female 115 (38.6%) 231 (33.1%) 0.11 dabetc 80 (26.8%) 143 (20.5%) 0.031 acutem 18 (6%) 125 (17.9%) 0 Lndner データからは Abcxmab 投与群と非投与群では, 身長を除く全ての変数に有意な差があることが分かります 傾向スコアを用いた解析では 介入群と非介入群の間で共変量 ( 背景因子 ) の比較を行い どの程度の差があるかを確認することが最初の一歩になります 二群の比較は 1)Welch s t-test( 連続変数の場合 不等分散 ), 2) Fsher s exact test( 離散変数の場合 ) によって行います また 以下の standardzed dfference も検討します Standardzed dfference の絶対値が 0.1 より小さい場合 二群の間の差は軽微であると判断されます 2. 傾向スコア 定義 傾向スコア (Propensty Score, PS) 処置の有無に関与する複数の共変量を用いた 処置群 対照群への割り付け確率を予測するスコア PS P treatment group x X 通常傾向スコアはロジスティック回帰モデルによって推定されます しかし 4

そのほかの方法で PS が推定されることもありますので 論文では必ず PS の推定方法を明記する必要があります 処置の有無に関与する共変量は全て PS 予測に用いられ PS 予測に用いられた共変量の情報は全て PS に吸収されたと解釈されます 従って それ以降の解析では,PS 予測に用いた共変量は使用されません 介入の有無に関与すると思われる共変量をすべて用いて PS を予測した後 変数選択によって更に PS 予測に適した共変量の組み合わせを探索する場合もあります 傾向スコアの特徴 : 群の割り付けに関する多くの交絡因子を, 一次元の情報に集約し調整する ( 交絡因子の数がイベントに比べて多いとき 次元の縮小に有用 ) 同じ傾向スコアを持つ標本は 処置群と対照群の多くの共変量が同時にバランスされている 例 :lndner データの傾向スコア ロジスティック回帰モデルによる傾向スコアの推定 : ただし p log 1 p 0 1 4 heght stent female 2 dabetc 5 acutem 6 ejectfrac p :Abcxmab 投与群への割り付け確率 = 傾向スコア. 上の式の 右辺で 傾向スコアの推定には heght から ejectfrac までの共変量が用いられていますが cardbll は用いられていないことに注意してください これは cardbll が治療群選択後にかかった医療費を表していて Abcxmab 投与群への割り付け確率 = 傾向スコアには関係がないからです このように 傾向スコアの推定では群の割り付けに関わる共変量は全て用いられるのが原則であり 論文にはどの共変量が傾向スコアの推定に用いられたか明記する必要があります 3 ロジスティック回帰モデルによって PS を推定したら 推定のパフォーマンスを評価して論文で報告します Hosmer-Lemeshow 検定検定の結果 p-value = 0.060 Hosmer-Lemeshow 検定の場合 帰無仮説は モデルがデータに適合している です 帰無仮説が棄却できないことで ぎりぎりモデルの適合性が認められたことになります 5

ROC 解析と AUC 解析の結果 AUC = 0.619 通常 AUC > 0.8 (>0.7) 程度でモデルがデータに適合しているといいますから この場合あまりあてはまりはよくないということになります 介入するか否かの判断には 他の要因も関与していることが示唆されます 例 :SPSS による傾向スコアの推定 ( ロジスティック回帰による ) 1. lndner.sav を読み込む 2. 分析 回帰 二項ロジスティック 3. 従属変数 :abcx 共変量 :stent ~ ejectfrac 6

4. カテゴリ ボタン: カテゴリ変数として stent, female, dabetc, acutem を選択 続行 5. 保存 ボタン : 予測値の 確率 所属グループ を選択 続行 6. オプション ボタン: Hosmer-Lemeshow の適合度 にチェック 続行 7

7. ロジスティック回帰 ウィンドで OK 3. 傾向スコアマッチング (Propensty Score Matchng) 傾向スコアを用いた解析では 傾向スコアが同じサンプルは 交絡因子の分布が同じになる傾向があるとされています ( 数学的な証明は省略します ) そこで 傾向スコアを推定した後 処置群と対照群で同じ傾向スコアを持つサンプルをマッチングさせることを考えます 以下の方法でマッチング ( 対応付け ) を行います 処置群と対照群で同じ傾向スコアを持つサンプルをマッチ ( 対応付け ) する ただし 傾向スコアは実数値であるから完全にマッチすることはない ある幅 (calper wdth という ) の範囲の傾向スコアを同一視する Calper 幅には各種の提案がある PS のロジット変換の標準偏差の 20% 未満 単純に PS±0.001 などと指定する もし 同じ傾向スコアを持つペアが複数存在するときは 順番はランダムにマッチングさせる 同じ傾向スコアを持つサンプルが他方の群に存在しないときは そのサンプルはマッチデータから削除する 例 :SPSS を用いた傾向スコアマッチング (lndner データ ) 1. 傾向スコアの推定まで行う 2. 変換 変数の計算 8

3. ロジスティック回帰で推定した群の割り付け確率 = 傾向スコアを 適当な桁数に丸める 新たに 丸めた後の変数名を PS とし 数式 は以下の通り RND(PRE_1, 0.01) ここでは小数点以下第 2 位まで丸めたが 丸める程度は状況による もし小数点以下の桁数が一桁のように少なければ マッチするサンプルは増えますがマッチングの程度は荒くなります 逆に 小数点以下第 3 位 4 位と高次まで求めると マッチするサンプル数が少なくなってしまいます 4. 傾向スコアが同じペアが複数あった場合 ランダムにマッチングを行うため 乱数を生成しておきます 変換 変数の計算 変数名 :ran1 数式 :unform(1) 9

5. 以下 傾向スコアの順にサンプルをソート ( 並べ直し ) し 処置群と対照群で同じ傾向スコアを持つペアを抽出していきます 10

11

12

4. 傾向スコアモデルのチェック 傾向スコアを推定した後 傾向スコアの粋手がうまくいっているかどうか検証する必要があります 傾向スコアを推定するのに用いたロジスティック回帰モデルの パフォーマンスを評価する Hosmer-Lemeshow の適合度検定 ROC 曲線 同じ傾向スコアを持つサンプルは 交絡因子の分布が同じになる傾向がある 13

傾向スコアマッチング後の共変量の比較 Name abcx=0 : (n=275) abcx=1: (n=275) p-value standardzed-dfference cardbll 14841.53 ± 14965.5 15778.05 ± 9073.46 0.375 0.076 heght 171.5 ± 10.63 172.26 ± 10.95 0.409 0.07 ejecfrac 51.83 ± 10.35 52.13 ± 9.65 0.724 0.03 stent 174 (63.3%) 180 (65.5%) 0.656 0.046 female 99 (36%) 90 (32.7%) 0.473-0.069 dabetc 62 (22.5%) 63 (22.9%) 1 0.009 acutem 18 (6.5%) 16 (5.8%) 0.86-0.03 lndner データの場合 傾向スコアの推定に用いた共変量だけでなく PS の推定に用いられなかった cardbll も結果的に差がなくなっています マッチングされた後のサンプル数を確認する 処置群と対照群で傾向スコアの分布の乖離があまりに大きいと マッチされるサンプルが少なくなり 解析に適しません 傾向スコアマッチング後の共変量の比較のため ここでの解析は連続変数には Welch s t-test 離散変数には Fsher's exact test を用いています しかし マッチされたペアのデータを対応のあるデータと解釈して 連続変数に pared t-test 離散変数に McNemar tes を用いる考え方もあります ( 私は あまり賛成しませんが...) 5. 傾向スコアを用いた解析法 以上述べてきたような方法で傾向スコアを推定した場合 推定した傾向スコアを用いた解析はいくつかの場合に分けられます 5.1 傾向スコアマッチングを用いた解析 処置群と対照群で同じ傾向スコアを持つサンプルをマッチさせます その場合 マッチする相手がいなかったサンプルは対応付けされたデータからは除かれます 従って 処置群と対照群で傾向スコアの分布が大きく異なるときは マッチされたデータの数は大幅に少なくなり 元データの限られた一部分しか見ていないことになります そうではなく 処置群と対照群の多くのサンプルがマッチされた場合は 共変量の情報は全て傾向スコアに吸収されていますので 群の違いのみに注目した単変量解析に帰着します 回帰分析であれば単回帰 ロジスティック回帰モデルであれば 対応のあるデータに対する条件付きロジスティック回帰 生存時間解析であれば群の違いに注目した単変量の log- 14

rank 検定を行うことになります 5.2 マッチングを行わずに 傾向スコアを用いる解析 傾向スコアマッチングを行った場合 介入群と対照群で背景因子がそろう傾向にあるが マッチングを行うために使えるサンプル数が減る傾向がある 以下のマッチングを行わない方法は すべてのサンプルを用いるてんが異なる 5.2.1. 層別処置群 対照群をプールした上で 傾向スコアの値で層別する ( 通常 5 層に分ける ). その上で 層別に解析を行う ( 例 :stratfed Cox proportonal hazard model) 5.2.2. 共変量としての傾向スコアマッチングは行わず 全てのサンプルを用い 群の割り付けを表すダミー変数 G と傾向スコアの値 PS を共変量とした多変量モデルを当てはめる p log 0 G 1PS 1 p p log 0 G 1 1 p PS other 1: treatment group, G 0 : control group 上の式は ロジスティック回帰を例に説明していますが 他のモデルでも同様です 第一式では 傾向スコアのみを共変量として用いています 一方第二式では傾向スコアの他にモデルに残っている共変量をモデルに入れています ただし第二式のようなモデルでは 傾向スコアの推定に使った共変量をモデルに入れてはいけません そのような共変量の情報は 全て傾向スコアに吸収されていると考えるからです Lndner データの例でいえば cardbll:pci 施行後 6 ヶ月間の心臓病関連医療費 ( ドル ) のように傾向スコアの推定に用いられなかった共変量が 付け加えられる可能性があります 2 5.2.3. 重み付け :Inverse-probablty score-based weghted methods (IPTW) 傾向スコアの逆数を重み付けとして 各種多変量モデルを推定する 15

W Z 1: treatment group 1 Z, Z PS 1 PS 0 : control group 1 : treatment group( 介入群では 介入する確率の逆数 ) PS 1 : control group( 対照群では 介入しない確率の逆数 ) 1 PS つまり 介入の有無の判断が確定的なサンプルは重みを軽く 介入するかしないか判断が微妙な場合については重みを重くして重点的に学習する戦略をとる 線形回帰モデル ロジスティック回帰モデル Cox 比例ハザードモデルなどいずれの解析モデルにも 重み付き回帰モデルが存在するので その重みに傾向スコアの逆数を用いるということ 傾向スコアを用いた解析法には 未だ最終的な答えはありません 上記いずれかの方法を 少なくとも複数用いて 同じような結果が出ることを確かめるべきだと思われます もっとも代表的なのは 最低 傾向スコアマッチングと IPTW の二つを行い 同様な結果を得ることを示します 以上 Take Home Message 1. 因果効果と交絡因子 2. 傾向スコア 3. 傾向スコアマッチング 4. 傾向スコアモデルのチェック 5. 傾向スコアを用いた解析法. 傾向スコアマッチング : 対応づけられたデータに対する単変量解析. 層別. 共変量としての傾向スコア 16

v. 重み付け :Inverse-probablty score-based weghted methods (IPTW) 参考文献 Rosenbaum & Rubn, The central role of the propensty score n observatonal studes for causal effects Bometrka (1983) 70 (1): 41-55. 星野崇宏 調査観察データの統計科学 因果推論 選択バイアス データ融合 岩波書店 (2009/7/29) ISBN-10: 4000069721 17