Appendix Real examples of statistical analysis 検定 偶然を超えた差なら有意差という P<0.05 なら統計学的有意というデータ型 比較型で検定手法は異なる Chi-square test ( カイ二乗検定 ) Medical Tribune. 2018-1-28. 2 1 2 Chi-square test ( カイ二乗検定 ) Medical Tribune. 2018-3-1. 3 4 3 Unpaired t-test( 対応のない t 検定 ) Wilcoxon test( ノンパラメトリック ) Medical Tribune. 2017-12-07. 4 Paired t-test( 対応のある t 検定 ) Paired t-test( 対応のある t 検定 ) Wilcoxon test( ノンパラメトリック ) 5 Medical Tribune. 2017-12-07. 6 5 6 1
相関分析 (Correlation analysis) ANOVA( 分散分析 ) ANOVA( 分散分析 ) 7 Medical Tribune. 2018-1-21. 8 7 8 虐待の相談件数は年々増えている 心理的虐待は特に増え方が著しい 年間 14 万件の相談件数がある 相談しない例は その倍以上はあるだろう ( 実態はもっと!) 1 万件以上 / 月 都道府県辺り 約 500 件 / 月の相談件数 気づく点をあげなさい 調べたいことをあげなさい どういった分析をしますか? 追加データは必要か? 子供は毎年 100 万人出生 10 年 ~1,000 万人 100 人に一人が虐待? 同じ人が何回も虐待相談しているので 過大評価? 10 歳以上の人も虐待対象なので 過大評価? 9 10 気づく点をあげなさい 調べたいことをあげなさい どういった分析をしますか? 追加データは必要か? 子育て 教育無償化への関心は子育て世代で高い Why? 当事者は関心が高い 40 歳以上ではそんなに関心度は変わらない Why? 当事者でなければ同じ 優先度 5~7 位なのに どうして関心度 50% 程度と高いか? 40 歳以上では ( 歳を取ると ) 何事へも関心度が高くなる 11 12 2
X と Y の関係 単変量解析 多変量解析 モデル解析 Multivariate Analysis 多変量解析 説明変数原因変数独立変数 X Z 影響変数撹乱変数交絡変数 Y 目的変数結果変数従属変数 13 14 用 途 回帰モデル 交絡変数の影響を除去して 因果関係を正しく検討したい ある人の目的変数値を予測したい 他のリスクファクターの寄与度を見たい どれが真に独立な影響因子かを見極めたい 回帰モデル ( 回帰式とも言う ) Y = b 0 + b 1 LDL + b 2 Obesity パラメタ ( 回帰係数とも言う ) b 0,, b 1, b 2 Y によって名称が変わる Y が連続量 重回帰 (Multiple regression) Y がイベント ( 二値 ) の有無 ロジスティック回帰 (Logistic regression) Y がイベント発現までの時間 コックス回帰 (Cox regression) 15 16 重回帰分析 結果の読み方 結果変数 ( y ) 体重減少 (kg) 説明変数 ( x ) ジョギング 交絡変数 ( z ) 年齢 性別 飲酒量 モデル式 y=a +b 1 x 1 +c 1 z 1 +c 2 z 2 < 直線関係が前提 > 目的変数は体重減少 (kg) 説明変数 単位 推定値 P 値 ジョギング 実施 5kg 0.03 年齢 10 歳 -2kg 0.53 性別 女性 2kg 0.30 飲酒量 ビール1 本 -3kg 0.09 17 18 3
適当なモデルかのチェック Logistic regression ロジスティック回帰 モデルへの適合度 残差 Residual Lack of fit analysis 決定係数 ( 説明割合 ) Adjusted R 2 for the number of variables in the model 影響度の分析 てこ比 Leverage Isolated point であり 回帰係数にすごく影響するデータ 影響度 Influence 各回帰係数の推定値に影響するデータ 交互作用項を入れたら 必ず主効果も含むこと 目的変数 (y 変数 )= 二値データ心筋梗塞の有無 骨折の有無 などその危険因子を, 多変量的に探るその将来予測をする 定式化 P = Pr (D+) は, 疾病確率 x 1,, x k は, 説明 ( リスク ) 変数 ln P 1 P = a + b 1x 1 + + b k x k P = exp(a + b 1x 1+... +b kx k) 1 + exp(a + b 1x 1+... +b kx k) 19 20 Logistic Regressionでの相対リスク (Relative Risk, RR) リスク比 (Risk Ratio, RR) 相対リスク (Relative Risk) RR = Risk in exposed group / Risk in unexposed group = aτ a+b cτ c+d オッズ比 (Odds Ratio, OR) 相対オッズ (Relative Odds) OR = Odds in exposed group / Odds in unexposed group = aτ b cτ d ~ RR (if a, c~0) Disease Normal Exposed a b Unexposed c d ロジスティック回帰 Logistic regression ln P 1 P = a + b 1x 1 + + b k x k P = exp(a + b 1x 1+... +b kx k) 1 + exp(a + b 1x 1+... +b kx k) OR = exp (b i ) x 1 1 単位当たりのオッズ比 21 22 交互作用を含むモデルの有用性 Survival analysis Survival analysis 生存時間解析 ロジスティック回帰 (Logistic regression) 目的変数妊娠高血圧腎症早産説明変数プロバイオティクス摂取 23 Outcome アウトカム Time to event data Point Censoring 打ち切り [ + データ ] Methods Kaplan-Meier plot カプラン マイヤープロット Log-rank test ログランク検定 Cox proportional hazards model Cox 比例ハザードモデル 23 24 4
ロジスティック回帰との違い 評価項目が 骨折 の場合 Logistic 骨折の有無 Survival 骨折までの期間 違い Logistic イベントの有無 オッズ比 (~ リスク比, in a rare event) Survival 速さ ( 早く起こると危険 ) ハザード比 腎臓進行がんの RCT 縦軸 : 無増悪生存率 Survival Analysis 生存率解析 Kaplan-Meier Curve カプラン マイヤー曲線 Progression-free survival (PFS) 無増悪生存率 Median Survival Time (MST) 生存期間中央値 Log-rank test ログランク検定 Hazard Ratio (HR) ハザード比 Relative Risk の 1 つ時間概念が入る 25 26 比例ハザード性を満たす 比例ハザード性を満たさない 15% リスク低下 生存時間解析 Survival analysis 累積発生率 Kaplan-Meier plot 群間比較 Log-rank test ハザード比 Hazard ratio Medical Tribune. 2017-4-06. 28 27 28 5