A による共分散分析 浜田知久馬 東京理科大学 ANCOVA usng A Chkuma Hamada Tokyo Unversty of cence A による 共分散分析 東京理科大学 浜田知久馬 UGIJ009 009.7.3 金
発表構成 医薬研究における現状 共変量調整の役割 交絡とは 共変量調整の原理 共分散分析のモデルと数理 Aによる解析と解釈 共分散分析の適用例 3 医学論文におけるサブグループ解析 共変量調整の現状 TATITIC IN MEDICINE 00;:97-930 ubgroup analyss, covarate adustment and baselne comparsons n clncal tral reportng: current practce and problems tuart J. Pocock, usan E. Assmann, Laura E. Enos and Lnda E. Kasten 4
対象ジャーナル 群当たり 50 例以上の無作為化臨床試験 997 年 7 月 ~9 月に公表された計 50 報 Brtsh Medcal Journal BMJ5 報 New England Journal of Medcne NEJM4 報 Journal of the Amercan Medcal Assocaton JAMA6 報 Lancet 5 報 5 6 3
7 8 4
用語分散分析と共分散分析 ANOVA: ANalyss Of VArance 分散分析 群間比較 ANCOVA: ANalyss of COVArance 共分散分析 反応変数に相関にある変数 C 共変量 を考慮した分散分析 ANOVA 群間比較 9 分散分析 ANOVA: ANalyss Of VArance 分散 varance: ばらつきを表す統計用語分散分析 : データのばらつきを構成する要因が複数存在するときに個々の要素に分解二元配置 two-way 分散分析要因の例 薬剤 A,B,C 用量 6,7,8 0 5
薬剤 A B C 8 7 6 8 7 6 8 7 6 用量 共変量調整の役割 共変量 : covarates 調整 : adust 群間の共変量の分布の偏りの除去交絡の調整群間の平均値の差を偏りなく推定 共変量に由来する誤差変動の除去解析の精度, 検出力の向上, 群間の平均値の差の分散の低下, 信頼区間幅の減少 6
ダーツ投げの偏り bas と精度 precson 3 ダーツ投げの偏りと精度 不偏で精度がよい 偏りあるけど精度はよい 不偏だけど精度が悪い 偏りありかつ精度が悪い 4 7
交絡 confoundng とは 薬剤投与 drug 反応 response 交絡因子 交絡因子 confoundng factor の必要条件 薬剤投与と関連する. 反応と関連する. 3 薬剤投与と反応の中間媒介変数ではない. 5 6 8
交絡 confoundng 血圧と給料の間には正の相関がある. 給料を上げるためには塩辛いものを食べればよいのか? 年功序列的に給料は上がる 正の相関. 年齢が上がれば血圧も上がる 正の相関. 年齢という第 3 の因子が交って絡んで, 見かけ上の相関が生じる. 年齢が交絡因子 7 交絡の例 血圧 給料 年齢 血圧と給料には正の相関がある. 年齢と血圧は正の相関がある. 3 年齢と給料には正の相関がある. 年齢が, 交絡して, 血圧と給料に見かけ上の正の相関を生じさせる. 新入社員は給料も血圧も低い. 部長は給料も血圧も高い. 8 9
交絡に対する対処 デザインの工夫無作為化, 層別割付, 最小化割付 解析法の工夫 a 共変量の群間の偏り, 共変量の反応変数との関連の解析 b デザインベースドの解析層別, 層を併合したMH 流の調整解析 c モデルベースドの調整解析重回帰, ロジスティック回帰,Cox 回帰 9 交絡への対処 薬剤投与 drug 反応 response 交絡因子 C C の群間の偏りの解析 無作為化割付 デザインベースドの解析 C と反応変数 の関連評価 モデルによる調整解析 0 0
調整した解析 adusted analyss 複数の交絡因子の影響を同時に考慮した解析 目的 : 交絡因子の偏りの除去, 精度の増大調整しない解析の妥当性を保証 方法 : デザインベースドの調整解析交絡因子の値が近い個体間で比較層別, 層を併合した重み付き平均を算出, モデルベースドの調整解析共変量の影響のモデル化と除去 重回帰,Cox 回帰, ロシ スティック回帰 収縮期血圧の例 単位 :mmhg 薬剤 P プラセボ群 生データ平均年齢 39 4 4 43 43 44 45 46 47 49 43.9 血圧 95 99 06 5 6 0 7 04 9 08.3 薬剤 A 実薬群 生データ平均 年齢 36 37 38 39 39 40 4 4 44 47 40.3 血圧 88 94 96 9 98 89 03 97 0 05 97. 血圧の t 検定 : p=0.005 ** 年齢の t 検定 : p=0.000 * 有意な結果は年齢の交絡のためか?
収縮期血圧のプロット 平均 : 08.3 平均 : 97. b p 0 血圧 00 90 薬剤 P g 薬剤 A 血圧の t 検定 :p=0.005 ** 3 GLM による調整しない解析 data data; do g= to ; do = to 0; nput age bp @@;output; end;end; cards; 39 95 4 99 4 06 43 43 5 44 6 45 0 46 7 47 04 49 9 36 88 37 94 38 96 39 9 39 98 40 89 4 03 4 97 44 0 47 05 ; proc glm; class g; model bp=g; lsmeans g/pdff tdff; 4
調整前分散分析 t 検定 の結果 ource DF um of quares Mean quare F Value Pr > F Model 66.050000 66.050000 0.6 0.005 Error 8 09.700000 60.650000 Corrected Total 9 707.750000 σ g bp LMEAN 95% Confdence Lmts 08.300000 03.603 3.473987 最小 乗平均 97.00000 9.0603 0.373987 Least quares Means for Effect g Dfference Between Means 平均値の差と信頼区間 95% Confdence Lmts for LMean- LMean.00000 3.78877 8.473 5 年齢のプロット 平均 : 43.9 平均 : 40.3 48 46 年齢 a g e 44 4 40 38 36 薬剤 P g 薬剤 A 年齢の t 検定 :p=0.000 * 6 3
年齢と血圧の散布図 血圧 r=0.78,p<0.000 年齢 薬剤 P 薬剤 A 7 薬剤と血圧と年齢 薬剤 血圧 年齢 薬剤群には年齢が若い人が多い. 年齢と血圧は正の相関がある. 3 年齢が, 交絡して, 薬剤と血圧に見かけ上の関連を生じさせる. 8 4
共変量調整の原理 共変量の値が似ている個体同士で比較マッチング層別解析 数学モデルによる共変量の影響の除去共分散分析 9 年齢の影響の調整 マッチング 薬剤 P 生データ平均年齢 39 4 4 43 43 44 45 46 47 49 43.9 血圧 95 99 06 5 6 0 7 04 9 08.3 薬剤 A 生データ平均 年齢 36 37 38 39 39 40 4 4 44 47 40.3 血圧 88 94 96 9 98 89 03 97 0 05 97. 年齢が同じ個体を集めて比較. 年齢分布が強制的にそろえられる. マッチしない個体が多くなる. 30 5
年齢の影響の調整 層別 薬剤 P 生データ平均年齢 39 4 4 43 43 44 45 46 47 49 43.9 血圧 95 99 06 5 6 0 7 04 9 08.3 95 08.0 3.3 薬剤 A 生データ平均 年齢 36 37 38 39 39 40 4 4 44 47 40.3 血圧 88 94 96 9 98 89 03 97 0 05 97. 93.6 99.75 05 年齢の層ごとに平均値の差 Nで重みを付けた併合平均値の差 n n V[ ], w n n n n 3 年齢の影響の調整 層別 data data;set data; f age <= 39 then agec=; f 40<=age <=44 then agec=; f 45<=age then agec=3; proc glm; class agec g; model bp=agec g ; lsmeans g/pdff tdff; 3 6
年齢の影響の調整 層別 年齢層 薬剤 P N 30 代 95.0 40 代前 08.0 6 40 代後 3.3 3 併合 08.3 0 薬剤 A N 93.6 5 99.75 4 05 97. 0 差 -.4-8.5-8.3-6.95 p=0.069 重み w 5 0.833 5 64.4 6 4 3 0.75 3 33 年齢の影響の調整 3 共分散分析 薬剤 P 生データ平均年齢 39 4 4 43 43 44 45 46 47 49 43.9 血圧 95 99 06 5 6 0 7 04 9 08.3 修正血圧 00.3 00.9 06. 09.5 3.5.8 96.0 0.4 95.7 07.3 05. 薬剤 A 生データ平均 年齢 36 37 38 39 39 40 4 4 44 47 40.3 血圧 88 94 96 9 98 89 03 97 0 05 97. 修正血圧 98.4 0.7 03.0 97.3 03.3 9.6 04.9 97. 06.8 96.7 00.3 血圧 =a+b 年齢 + 誤差 b=.7 年齢を平均 4. 歳に調整修正平均の差 05.-00.3=4.9 p=0.9 34 7
年齢の影響の調整 3 共分散分析 血圧 血圧 =a+.7 年齢 P A 年齢 薬剤 P 薬剤 A 35 年齢の影響の調整 3 共分散分析 proc glm; class g; model bp=age g; lsmeans g/pdff tdff; 36 8
9 37 調整しない平均値の差と分散と信頼区間 CLConfdence Lmt ] [ n n t CL n n V DF Z: 年齢 : 血圧 38 調整前の平均値の差 0.005 3.78 8.4, 3.48.0. ] [ 3.48.3 0 60.65 0 60.65 ] [. 08.3 97. 8 p n n t CL E n n V
共分散分析の役割 血圧と年齢が高い y 血圧 調整後の平均値の差 A 群 血圧と年齢 が低い P 群 平均 : 40.3 年齢 平均 : 43.9 39 y y 共分散分析のモデル y : 傾き 0 40 0
共分散分析のモデル : 群,: 個体 : 反応変数, : 共変量 : N0, 独立に等分散の正規分布 4 d d d d 最小二乗推定 0 e e e 3 4
43 最小 乗法の模式図 0 X X 0 44 共通の傾きの最小二乗推定. 0 0 y y d d
3 45 共通の傾きの最小二乗推定 ] [ ] [ ] [ ] [ ] [ y y y y V w w w w w V V V V 46 調整後の平均値の差と分散 ] [ ] [ V n n V ad ad
4 47 調整前と調整後の比較 ] [ ] [ V n n V ad ad ] [ n n V 調整前調整後 48 調整前と調整後の比較 であれば調整前後の平均値の差は等しくなる. 無作為化で偏りの除去が期待できる. が重要な共変量であれば σ >σ ad であれば調整後の平均値の差の方が分散は小さくなる. 偏りがなくても共分散分析により, 精度, 検出力が向上.
調整前と調整後の分散 σ σ ad 49 調整前分散分析 t 検定 の結果 ource DF um of quares Mean quare F Value Pr > F Model 66.050000 66.050000 0.6 0.005 Error 8 09.700000 60.650000 Corrected Total 9 707.750000 σ g bp LMEAN 95% Confdence Lmts 08.300000 03.603 3.473987 最小 乗平均 97.00000 9.0603 0.373987 Least quares Means for Effect g Dfference Between Means 平均値の差と信頼区間 95% Confdence Lmts for LMean- LMean.00000 3.78877 8.473 50 5
調整後共分散分析の結果 ource DF um of quares Mean quare F Value Pr > F Model 34.70894 567.360447 6.83 <.000 Error 7 573.0906 33.707594 Corrected Total 9 707.750000 σ ad g bp LMEAN 95% Confdence Lmts 05.35978 0.06440 09.44555 00.640 96.054485 04.473560 最小 乗平均 σ =60.65 Least quares Means for Effect g Dfference Between Means 平均値の差と信頼区間 95% Confdence Lmts for LMean-LMean 4.97955 -.477.365088 5.7, V[ ] n 33.7 33.7 0 0 9.8 3.03 調整後の平均値の差 43.9, ad..740.3 43.9 5.0 n 40.3 ad 40.3 43.9 V[ ] V[ ] 5 6
調整前 調整前と調整後の比較 97. 08.3. CL..03.48 8.4, 3.78 p 0.005 調整後 5.0 CL 5.0.03.03.37,.4 p 0.9 0 53 : N0, 傾きの異なるモデル : 群,: 個体 : 反応変数, : 共変量 54 7
8 55 最小二乗推定 d d 0 56 最小二乗推定 y d d 0 0
9 57 傾きの分散 V ] [ 58 P A
共分散分析 ANCOVA 調整前の平均値の差 調整後の平均値の差 59 調整によって平均値の差がなくなる例 調整前の平均値の差 60 30
共分散分析の仮定 つの群で共に, 年齢の血圧との間には直線的な関係がある. つの群間で, 傾きが等しい. 群 血圧の交互作用が存在しない. 3 誤差の分布に等分散性と正規性, : N0, 6 傾きが異なる例 6 3
共分散分析の適用例 経時測定データ解析における投与前値を共変量とした共分散分析 臓器重量の解析における体重を共変量とした共分散分析 63 経時データの共分散分析投与前値 の扱い 投与後の値 post: と同様に単純に モデルに含めて解析. 投与後の値だけで解析. 3 投与前値の差をとって解析. 4 投与前値との比をとって解析. 5 独立変数 共変量 としてモデルに含めて 解析.ANCOVA. 64 3
投与後値, 差, 共分散分析の比較 統計量 分散 post σ 差 - σ +σ -ρσ ANCOVA -β σ -ρ σ 母相関係数 ρ ρ=0 ρ=0.5 ρ=.0 post σ σ σ 差 - σ σ 0 ANCOVA σ 0.75σ 0 65 投与後差, 共分散分析の比較 分散差 - post ANCOVA 母相関係数 ρ 66 33
共分散分析の利点 ANCOVA -β ρ=0 β=0 post と等価 ρ =0 差 - と等価 30<ρ< 精度が高い - は ρ>0.5 以上ないと post より精度が悪い 67 ラットの体重 単位 :g と肝臓重量 単位 :g 用量 mg 項目 0 体重 336. 360.4 39.6 340.7 358. 35.5 35 373.5 346.4 36 肝臓 0.3.47 0.54 0.46.05 9.74.8.7.. 体重 365.4 360.5 336. 39 3. 35.4 343 369.8 340.6 34. 肝臓.39 0.7 0.6 9.7 9.09 0.9 0.99.35 9.96 0.8 3 体重 33.5 3.7 307.7 30.9 99.4 36.9 38.9 30.8 30.7. 肝臓.06.79 0.8 0.93 9.98.88.8.07.. 0 体重 6 88 87.9 303.9 85.3 69. 66 79. 39.7 39.8 肝臓 0.44.68.86.6.58.5..35 9.97 3.5 68 34
共分散分析の結果 体重 肝臓調整前 肝臓調整後 群平均 D 平均 D 平均 0 348.3 5.4 0.88 0.6 9.7 344.8 7. 0.6 0.9 9.58 3 33.5** 0.4. 0.64.58 0 80.0**.6.63. 3.48 69 肝臓重量 体重 70 35
調整前後の解析プログラム proc glm data=ow; class dose; model lver=dose/ss; lsmeans dose/tdff pdff ad=dunnett; run; proc glm data=ow; class dose; model lver=bw dose/ss; lsmeans dose/tdff pdff ad=dunnett; run; 7 調整前の解析結果 ource DF Type II Mean quare F Value Pr > F dose 3 5.880605.960074.75 0.0575 dose LIVER LMEAN H0:LMean=Control t Value Pr > t 0 0.880000 0.5990000-0.75 0.7990 3. 0.85 0.7307 0.690000.98 0.37 7 36
調整後の解析結果 ource DF Type II Mean quare F Value Pr > F BW 0.087653 0.087653 39.39 <.000 dose 3 5.896660 8.63034 59.9 <.000 dose LIVER LMEAN H0:LMean=Control t Value Pr > t 0 9.74 9.584538-0.76 0.776 3.580 8.58 <.000 0 3.4786359.7 <.000 73 共変量選択方針 薬剤を投与する前に測定 反応変数に関連 予後因子 群間で偏り 交絡可能性因子 3 割り付け調整因子 4 施設 国 5 投与前値 薬剤を投与後に測定される結果系変数で調整する場合は結果の解釈は困難 74 37