当し図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法であるちなみに直線で回帰する手法はコクランアーミテージの傾向検定疾患の確率 x : リスクファクター図 6. ロジスティック曲線と回帰直線疾患が発

6.. ロジスティック回帰分析 6. ロジスティック回帰分析の原理ロジスティック回帰分析は判別分析を前向きデータ用にした手法 () ロジスティックモデル疾患が発症するかどうかをリスクファクターから予想したいまたは疾患のリスクファクターを検討したい判別分析は後ろ向きデータ用だから前向きデータ用にする必要があるロジスティック回帰分析を適用ロジスティック回帰分析 ( ロジット回帰分析 ) は判別分析をロジスティック曲線によって前向き研究から得られたデータ用にした手法多種類のリスクファクターに基いて被験者が疾患を発症するかどうかを予想したりリスクファクターの影響力を検討したりするための手法ロジスティックモデル( ロジットモデル ) p l=ln( p )=b 0 + b x + + b p x p p= + exp( l) = + exp( b 0 b x b p x p ) l: ロジット ( 対数オッズ ) p: 疾患を発症する確率 b 0 : 定数 b ~b p : 偏回帰係数このモデルは第 5 章第 5 節で説明した判別スコアを確率に変換するロジスティック曲線の式において事前確率の項 ln{π /(-π )} と定数 a 0 を一緒にして b 0 にしたものに相当するこのモデルを前向き研究から得られたデータに適用し重回帰分析の原理を応用して定数と偏回帰係数を求める手法がロジスティック回帰分析これは目的変数が名義尺度のデータで説明変数が計量尺度のデータである回帰分析に相 6-

当し図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法であるちなみに直線で回帰する手法はコクランアーミテージの傾向検定疾患の確率 0.5 0 x : リスクファクター図 6. ロジスティック曲線と回帰直線疾患が発症する前に疾患が発症するかどうかをリスクファクターから予想したいロジスティック回帰分析前向き研究から得られたデータを用いる疾患が発症した後で疾患であるかどうかを診断指標とリスクファクターから診断したい判別分析後ろ向き研究から得られたデータを用いる (2) 一般化線形モデル確率をロジットに変換するのは説明変数との関係を直線的つまり線形にするため目的変数を線形にする変換関数のことをリンク関数 ( 連結関数 ) と呼ぶリンク関数によって線形にしたモデルも線形モデルとして扱う一般化線形モデル (GLM : generalized linear model) 6-2

6.2 ロジスティック回帰分析結果の解釈 6. ロジスティック回帰分析ロジスティック回帰分析ではオッズ比を指標にする () ロジスティック回帰分析の適用例脂質異常が動脈硬化症のリスクファクターになるかどうかを検討するために 25 名の被験者を対象にして動脈硬化症が発症するかどうかを前向きに観察した被験者の動脈硬化症の発症の有無と脂質異常スコア ( 脂質異常の程度を表す解説用仮想データ ) 性年齢は表 6. のとおり性と年齢はリスクファクターというよりも被験者の背景因子の代表的項目 < 表 6. 動脈硬化症の有無と脂質異常スコア等 > No. 動脈硬化症脂質異常スコア性年齢無 0 男 36 2 無 0 男 55 3 無 0 女 27 4 無 0 女 42 5 無男 35 6 無男 39 7 無男 4 8 無男 45 9 無女 32 0 無女 42 無女 5 2 無女 53 3 無 2 男 43 4 無 2 男 47 5 無 2 女 52 6 有男 46 7 有女 24 8 有女 38 9 有女 58 20 有 2 男 2 6-3

2 有 2 男 30 22 有 2 男 37 23 有 2 女 24 24 有 2 女 56 25 有 2 女 58 (2) 計算結果 === ロジスティック回帰分析 (logistic regression analysis) === [DANS V7.0] データ名 : 表 6. 目的変数 y : 動脈硬化症 (0: 無 : 有 ) 説明変数 x : 脂質異常スコア説明変数 x 2: 性 (0: 男 : 女 ) 説明変数 x 3: 年齢 ( 才 ) 各変数の基礎統計量 x : 例数 =25 平均値 =.2 標準偏差 =0.70707 標準誤差 =0.442 x 2: 例数 =25 平均値 =0.52 標準偏差 =0.509902 標準誤差 =0.098 x 3: 例数 =25 平均値 =4.28 標準偏差 =.033 標準誤差 =2.20267 y : 例数 =25 平均値 =0.4 標準偏差 =0.5 標準誤差 =0. 反応有 : コード = 例数 =0 反応無 : コード = 以外例数 =5 相関行列 (correlation coefficient matrix) x x 2 x 3 y ------------------------------------ x -0.069 0.009 0.47 x 2-0.069 0.5 0.3 x 3 0.009 0.5-0.57 y 0.47 0.3-0.57 ------------------------------------ 全変数を選択した結果( 反復回数 :4) ロジットモデル :p=/{+exp(-β0-σβj xj)} p:y=( 反応有 ) の確率 β0: 定数 βj: 変数 xjの偏回帰係数標準有意確率変数偏回帰係数標準誤差オッズ比偏回帰係数 Waldのχ^2 p 値 -- 定数 -.53326 2.8006 0.494649 0.4886 x 2.08029 0.923026 8.0068.47099 5.07949 0.024205* x 2.348.576 3.850 0.687399.45983 0.226957 x 3-0.0560363 0.0494628 0.945505-0.6746.28345 0.257258 -- 6-4

変数偏回帰係数 95%CI 下限上限オッズ比 95%CI 下限上限 ---------------------------------------------------------------------------- 定数 -.53326-5.80609 2.73957 x 2.08029 0.2793 3.88939 8.0068.353 48.88 x 2.348-0.838749 3.53495 3.850 0.43225 34.2933 x 3-0.0560363-0.52982 0.040909 0.945505 0.85845.0476 ---------------------------------------------------------------------------- 対数尤度 : 回帰 L(β)=-2.5043 定数項 L0=-6.8253 飽和 Lf=0 擬似寄与率 R^2=0.25686 AIC( 赤池の情報量基準 )=33.0086 回帰とズレの検定要因 (-)* 対数尤度自由度 χ^2 値有意確率 p 値 -------------------------------------------------------------------- 回帰 4.320 3 8.6420 0.0344493* ズレ (LOF) 2.5043 2 25.0086 0.246793 -------------------------------------------------------------------- 全体 6.8253 24 (3) 各種パラメーターの意味ロジスティック回帰式ロジットと説明変数の因果関係をロジスティックモデルで近似した式 p l=ln( p )=.53326+ 2.08029 x +.348 x 2 0.0560363 x 3 p= + exp(.53326 2.08029 x.348 x 2 + 0.0560363 x 3 ) l: ロジット ( 対数オッズ ) p: 動脈硬化症の発症確率偏回帰係数重回帰分析の偏回帰係数に相当する係数標準誤差偏回帰係数の標準誤差他の変数が一定という条件で各変数が増加した時ロジットがいくつ変化するかを表す値ロジットの変化量 = 対数オッズの差オッズ比偏回帰係数 ( 対数オッズの差 ) を指数変換してオッズの比にした値他の変数が一定という条件で各変数が増加した時オッズが相対的に何倍になるかを表す値調整オッズ比または補正オッズ比とも呼ばれる反応率が小さい (0% 未満 ) 時相対危険度の近似値と解釈できる 6-5

標準偏回帰係数説明変数を標準偏差単位にした時の偏回帰係数重回帰式の標準偏回帰係数に相当他の変数が一定という条件で各変数が標準偏差増加した時ロジットがいくつ変化するかを表す値ワルドの χ 2 値偏回帰係数が 0 かどうかの検定を行うための検定統計量この値は変数選択の基準値として利用されることもある第 3 節参照偏回帰係数の 95% 信頼区間偏回帰係数の推定結果偏回帰係数について実質科学的に考察するための情報オッズ比の 95% 信頼区間偏回帰係数の 95% 信頼区間を指数変換した値オッズ比について実質科学的に考察するための情報 AIC( 赤池の情報量基準 ) モデルの適合度を表す指標 AIC は回帰誤差と説明変数の数の両方を考慮した指標この値が小さいほど単純でかつ適合度の良いモデルであることを表す回帰とズレの検定偏回帰係数の検定とモデルとデータのズレの検定回帰の検定は全ての偏回帰係数が 0 かどうかの検定ズレの検定はモデルと実際のデータのズレが 0 かどうかの検定回帰の検定結果 : 有意ズレの検定結果 : 有意ではないとりあえずモデルが適合していると解釈しかし検定結果よりもロジスティック回帰式全体を実質科学的に考察する方が大切 (4) ロジスティック回帰分析の注意点 i) 誤差の少ない信頼のおける多数のデータに適用したか? 目安 : 例数 ( 変数の数 0) または ( 変数の数の 2 乗 ) の大きい方 6-6

疾患の発症例数と非発症例数はできるだけ同じくらいが理想 ii) ロジスティック回帰分析に組み込んだ項目が適当か? iii) 組み込んだ項目はリスクファクターだけか? 診断指標に相当するものはないか? iv) ロジスティック回帰式が実質科学的に納得できるか? v) ロジットは確率が 0 またはになる時は計算できないので注意! 説明変数によって疾患の発症と非発症が完全に決まってしまう時は計算不可能例えば第 5 章の表 5. のデータにロジスティック回帰分析を適用すると途中で計算が発散して不適解になるこれは TC と TG で正常群と動脈硬化群が完全に判別可能のため === ロジスティック回帰分析 (logistic regression analysis) === [DANS V7.0] データ名 : 表 5. 目的変数 y : 群 (0: 正常 : 動脈硬化症 ) 説明変数 x :TC (mg/dl) 説明変数 x 2:TG (mg/dl) 各変数の基礎統計量 x : 例数 =25 平均値 =224.4 標準偏差 =28.296 標準誤差 =5.6592 x 2: 例数 =25 平均値 =207.2 標準偏差 =60.747 標準誤差 =2.0349 y : 例数 =25 平均値 =0.4 標準偏差 =0.5 標準誤差 =0. 反応有 : コード = 例数 =0 反応無 : コード = 以外例数 =5 相関行列(correlation coefficient matrix) x x 2 y ---------------------------- x 0.499 0.783 x 2 0.499 0.025 y 0.783 0.025 ---------------------------- 全変数を選択した結果( 反復回数 :) ロジットモデル :p=/{+exp(-β0-σβj xj)} p:y=( 反応有 ) の確率 β0: 定数 βj: 変数 xjの偏回帰係数偏回帰係数初期値 :β0=-6.569 β=0.33592 β2=-0.074889 標準有意確率変数偏回帰係数標準誤差オッズ比偏回帰係数 Waldのχ^2 p 値 -- 定数 -448.932 5693.3 0.0062775 0.9375 x 2.26982 29.6859 9.67765 64.2269 0.00584632 0.939052 x 2-0.340886 6.29705 0.74-20.527 0.00293052 0.956828 -- 6-7

変数偏回帰係数 95%CI 下限上限オッズ比 95%CI 下限上限 ---------------------------------------------------------------------------- 定数 -448.932-607.6 0709.7 x 2.26982-55.935 60.453 9.67765 5.2308e-25.79658e+26 x 2-0.340886-2.6829 2.00 0.74 3.0384e-06 62934 ---------------------------------------------------------------------------- 対数尤度 : 回帰 L(β)=-5.24827e-05 定数項 L0=-6.8253 飽和 Lf=0 擬似寄与率 R^2=0.999997 AIC( 赤池の情報量基準 )=6.000 回帰とズレの検定要因 (-)* 対数尤度自由度 χ^2 値有意確率 p 値 -------------------------------------------------------------------- 回帰 6.8252 2 33.6505 4.9305e-08*** ズレ (LOF) 5.24827e-05 22 0.00004965 -------------------------------------------------------------------- 全体 6.8253 24 偏回帰係数の標準誤差が非常に大きな値になり偏回帰係数とオッズ比の 95% 信頼区間が異常な値になっている計算が発散して不適解になったため 6-8

6.3 変数の選択変数選択法は重回帰分析と同様 () 変数選択法できるだけ少ない変数でできるだけ効率的に疾患の発症を予測できる簡便で実用的なロジスティック回帰式を組み立てるための手法重回帰分析の変数選択法と同じ原理 i) 変数指定方法実質科学的な知見に基づいて適当な変数を指定 ii) 総当たり法全ての変数の組み合わせを計算し最良のものを選択 iii) 逐次選択法一定の規則に従って変数を逐次選択変数増加法 ( 前進的選択法 ) 変数減少法( 後退的選択法 ) 変数増減法変数減増法 (2) 変数増減法の手順 ) 最初の変数の取り込み単独でロジットに最も寄与している変数つまりワルドの χ 2 値が最大の変数を取り込むロジット情報全体残差自由度 = n-2 寄与分 x 図 6.2 つの説明変数を取り込んだ時 2) 次の変数の取り込み残りの変数から今取り込んだ変数と共有する情報を取り除きその上でワルドの χ 2 値が最大のものを探すそしてその変数が取り込み基準を満足するなら取り込む 6-9

各種の取り込み基準 i) ワルドの χ 2 値が基準値以上 ii) 有意確率 p 値が基準値以下ロジット情報全体残差自由度 = n-3 x j の単独寄与分 x x j 図 6.3 次の説明変数を取り込んだ時 3) 変数の追い出しこれまでに取り込んだ変数のうちワルドの χ 2 値が最小のものを探すそしてその変数が追い出し基準を満足するなら追い出すロジット情報全体残差 x k を追い出す x x j x k 図 6.4 説明変数の追い出し 6-0

各種の追い出し基準 i) ワルドの χ 2 値が基準値未満 ii) 有意確率 p 値が基準値より大きい 4) 変数選択の終了 2) に戻って変数の取り込みを続け取り込む変数も追い出す変数もなくなるまで 2) と 3) を繰り返す (3) 変数選択の例 === ロジスティック回帰分析 (logistic regression analysis) === [DANS V7.0] データ名 : 表 6. 目的変数 y : 動脈硬化症 (0: 無 : 有 ) 説明変数 x : 脂質異常スコア説明変数 x 2: 性 (0: 男 : 女 ) 説明変数 x 3: 年齢 ( 才 ) 各変数の基礎統計量 x : 例数 =25 平均値 =.2 標準偏差 =0.70707 標準誤差 =0.442 x 2: 例数 =25 平均値 =0.52 標準偏差 =0.509902 標準誤差 =0.098 x 3: 例数 =25 平均値 =4.28 標準偏差 =.033 標準誤差 =2.20267 y : 例数 =25 平均値 =0.4 標準偏差 =0.5 標準誤差 =0. 反応有 : コード = 例数 =0 反応無 : コード = 以外例数 =5 相関行列 (correlation coefficient matrix) x x 2 x 3 y ------------------------------------ x -0.069 0.009 0.47 x 2-0.069 0.5 0.3 x 3 0.009 0.5-0.57 y 0.47 0.3-0.57 ------------------------------------ 前進的変数増減法(stepwise forward selection method) による変数選択結果取り込み基準 :χ^2 値 2 追い出し基準 :χ^2 値 <2 反復回数 :5 ロジットモデル :p=/{+exp(-β0-σβj xj)} p:y=( 反応有 ) の確率 β0: 定数 βj: 変数 xjの偏回帰係数標準有意確率変数偏回帰係数標準誤差オッズ比偏回帰係数 Waldのχ^2 p 値 -- 定数 -2.634.8234 4.96304 0.0258947* x.7329 0.800372 5.65305.22485 4.68392 0.0304462* -- 6-

変数偏回帰係数 95%CI 下限上限オッズ比 95%CI 下限上限 ---------------------------------------------------------------------------- 定数 -2.634-4.9535-0.36658 x.7329 0.63494 3.30089 5.65305.7762 27.369 ---------------------------------------------------------------------------- 対数尤度 : 回帰 L(β)=-3.793 定数項 L0=-6.8253 飽和 Lf=-3.3668 擬似寄与率 R^2=0.898076 AIC( 赤池の情報量基準 )=3.4386 回帰とズレの検定要因 (-)* 対数尤度自由度 χ^2 値有意確率 p 値 -------------------------------------------------------------------- 回帰 3.0599 6.298 0.026888* ズレ (LOF) 0.352502 0.705004 0.4007 -------------------------------------------------------------------- 全体 3.45849 2 変数選択法で選択されなかった変数は疾患の発症に寄与していないとは限らないある変数が疾患の発症に寄与していないことを検証したい時は変数選択をしない方が良い変数選択法で得られた変数の組み合わせは実質科学的に最適なものとは限らない実質科学的に解釈困難な結果または実用的ではない結果なら特定の変数を強制的に取り込んだり追い出したりして色々なロジスティック回帰式を検討した方が良い 6-2

6.4 順序ロジスティック回帰分析 6. ロジスティック回帰分析目的変数が順序尺度の時は順序ロジスティック回帰分析を用いることができる () 累積ロジスティックモデル目的変数が疾患の有無ではなく表 6.2 の動脈硬化症重症度のような順序尺度のデータの時は順序ロジスティック回帰分析を適用することができる < 表 6.2 動脈硬化症の重症度と脂質異常スコア等 > No. 動脈硬化症重症度脂質異常スコア性年齢無男 2 2 無男 30 3 無男 37 4 無女 24 5 無女 56 6 無女 58 7 無 2 男 46 8 無 2 女 24 9 無 2 女 38 0 無 2 女 58 無 3 女 26 2 無 3 女 4 3 軽症男 23 4 軽症男 43 5 軽症男 47 6 軽症女 22 7 軽症女 39 8 軽症女 52 9 軽症 2 男 35 20 軽症 2 男 4 2 軽症 2 男 45 22 軽症 2 男 53 23 軽症 2 女 23 24 軽症 2 女 28 25 軽症 2 女 32 6-3

26 軽症 2 女 43 27 軽症 3 男 40 28 軽症 3 女 24 29 軽症 3 女 27 30 軽症 3 女 42 3 重症男 20 32 重症男 44 33 重症女 34 34 重症 2 男 35 35 重症 2 男 37 36 重症 2 女 42 37 重症 2 女 5 38 重症 3 男 36 39 重症 3 男 4 40 重症 3 男 5 4 重症 3 男 55 42 重症 3 女 2 43 重症 3 女 35 44 重症 3 女 36 累積ロジスティックモデル ( 比例オッズモデル ) i) ロジスティックモデル : 無を疾患無軽症と重症を疾患有と考えた時のモデル p l =ln ( )=b p 0 + b x + + b p x p p = + exp( b 0 b x b p x p ) l :p のロジット p : 軽症または重症になる確率 b 0 : 定数 b ~b p : 偏回帰係数 ii) ロジスティックモデル 2: 無と軽症を疾患無重症を疾患有と考えた時のモデル p 2 l 2 =ln( )=b p 20 + b x + + b p x p 2 6-4

p 2 = + exp( b 20 b x b p x p ) l 2 :p 2 のロジット p 2 : 重症になる確率 b 20 : 定数 b ~b p : 偏回帰係数この 2 つのモデルは定数が異なるだけで偏回帰係数は同じと仮定したモデル偏回帰係数が同じということは 2 つのモデルのロジットの違いは定数 b 0 と b 20 の差に影響されるだけで説明変数には影響されないということその結果これらのモデルのロジスティック曲線は図 6.5 のように立ち上がりの位置が異なるだけで傾きは同じになる確率 (p ) 0.8 0.6 0.4 モデル疾患有 : 軽症重症 0.2 0 0.8 確 0.6 率 (p 2 ) 0.4 疾患無 : 無説明変数 (x) モデル 2 疾患有 : 重症 0.2 0 疾患無 : 無軽症説明変数 (x) 図 6.5 累積ロジスティックモデル 6-5

(2) 計算結果 === 順序ロジスティック回帰分析 === [DANS V7.0] データ名 : 表 6.2 目的変数 y : 動脈硬化症重症度 (0: 症状なし : 軽症 2: 重症 ) 説明変数 x : 脂質異常スコア説明変数 x 2: 性 (0: 男 : 女 ) 説明変数 x 3: 年齢 ( 才 ) 順序 : 動脈硬化症重症度 (0: 症状なし : 軽症 2: 重症 )=0 各変数の基礎統計量 x : 例数 =2 平均値 =.66667 標準偏差 =0.778499 標準誤差 =0.224733 x 2: 例数 =2 平均値 =0.666667 標準偏差 =0.492366 標準誤差 =0.4234 x 3: 例数 =2 平均値 =38.25 標準偏差 =3.777 標準誤差 =3.97554 順序 2: 動脈硬化症重症度 (0: 症状なし : 軽症 2: 重症 )= 各変数の基礎統計量 x : 例数 =8 平均値 =.88889 標準偏差 =0.758395 標準誤差 =0.78755 x 2: 例数 =8 平均値 =0.555556 標準偏差 =0.53 標準誤差 =0.2057 x 3: 例数 =8 平均値 =36.6 標準偏差 =0.873 標準誤差 =2.407 順序 3: 動脈硬化症重症度 (0: 症状なし : 軽症 2: 重症 )=2 各変数の基礎統計量 x : 例数 =4 平均値 =2.2857 標準偏差 =0.82542 標準誤差 =0.220603 x 2: 例数 =4 平均値 =0.42857 標準偏差 =0.53553 標準誤差 =0.37253 x 3: 例数 =4 平均値 =38.4286 標準偏差 =0.58 標準誤差 =2.7486 全体各変数の基礎統計量 x : 例数 =44 平均値 =.95455 標準偏差 =0.805636 標準誤差 =0.2454 x 2: 例数 =44 平均値 =0.545455 標準偏差 =0.503686 標準誤差 =0.0759336 x 3: 例数 =44 平均値 =37.6364 標準偏差 =.0224 標準誤差 =.6668 y : 例数 =44 平均値 =2.04545 標準偏差 =0.776233 標準誤差 =0.702 相関行列(correlation coefficient matrix) x x 2 x 3 y ------------------------------------ x 0.20 0.00 0.30 x 2 0.20-0.4-0.84 x 3 0.00-0.4 0.00 y 0.30-0.84 0.00 ------------------------------------ 6-6

累積ロジットモデル:pk=/{+exp(-β0k-Σβj xj)} 反復回数 :4 pk: 順序 (k+) 以上の累積確率 β0k:kの定数 βj: 変数 xjの偏回帰係数標準有意確率変数偏回帰係数標準誤差オッズ比偏回帰係数 Waldのχ^2 p 値 -- 定数 0.0845924.33833 0.0039957 0.94960 定数 2 -.87488.37266.8656 0.798 x 0.835876 0.38309 2.30683 0.67342 4.7626 0.0290845* x 2-0.892357 0.596739 0.409689-0.449468 2.2369 0.3483 x 3-0.003446 0.0268545 0.996564-0.0379347 0.064244 0.898024 -- 変数偏回帰係数 95%CI 下限上限オッズ比 95%CI 下限上限 ---------------------------------------------------------------------------- 定数 0.0845924-2.53849 2.70767 定数 2 -.87488-4.56525 0.8549 x 0.835876 0.085737.58658 2.30683.0889 4.887 x 2-0.892357-2.0694 0.27723 0.409689 0.27207.3947 x 3-0.003446-0.0560754 0.049922 0.996564 0.945468.05042 ---------------------------------------------------------------------------- 対数尤度 : 回帰 L(β)=-44.4207 定数項 L0=-47.72 飽和 Lf=-.38629 擬似寄与率 R^2=0.070469 AIC( 赤池の情報量基準 )=96.844 回帰とズレの検定要因 (-)* 対数尤度自由度 χ^2 値有意確率 p 値 -------------------------------------------------------------------- 回帰 3.2929 3 6.58259 0.086467+ ズレ (LOF) 43.0344 39 86.0688 2.596e-05*** -------------------------------------------------------------------- 全体 46.3257 42 ロジスティック回帰式 i) ロジスティックモデル p l =ln ( )=0.0845924+ 0.835876 x p 0.892357 x 2 0.003446 x 3 ii) ロジスティックモデル 2 p 2 l 2 =ln( )=.87488+ 0.835876 x p 0.892357 x 2 0.003446 x 3 2 (3) 重症度の予測方法表 6.2 の No.3 の被験者 : 重症度 =( 軽症 ) 脂質異常スコア = 性 =0( 男 ) 年齢 =23 6-7

i) ロジスティックモデル l =0.0845924+ 0.835876 0.892357 0 0.003446 23=0.8434 p = + exp( 0.8434) 0.699 軽症または重症の確率 ii) ロジスティックモデル 2 l =.87488+ 0.835876 0.892357 0 0.003446 23=.86 p = + exp(.86) 0.246 重症の確率 i) と ii) より症状無になる確率 -p ( 軽症または重症になる確率 )=-0.699=0.30 軽症になる確率 p ( 軽症または重症になる確率 )-p 2 ( 重症になる確率 )=0.699-0.246=0.453 重症になる確率 p 2 ( 重症になる確率 )=0.246 これらの確率を比べるとこの被験者は軽症になる確率が最も高い実際の重症度も軽症確率 0.8 0.6 0.4 0.2 0 症状無になる確率 =0.30 p =0.699 モデルモデル 2 軽症になる確率 =0.453 p 2 =0.246 重症になる確率 =0.246 説明変数 (x) 図 6.6 各重症度になる確率 6-8

(4) 重回帰分析を適用した場合 === 重回帰分析 (multiple regression analysis) === [DANS V7.0] データ名 : 表 6.2 目的変数 y : 動脈硬化症 (0: 症状なし : 軽症 2: 重症 ) 説明変数 x : 脂質異常スコア説明変数 x 2: 性 (0: 男 : 女 ) 説明変数 x 3: 年齢 ( 才 ) 全変数を選択した結果標準有意確率変数偏回帰係数標準誤差偏回帰係数偏相関係数偏 F 値 p 値 -- 定数 0.6590 0.508394.68029 0.20235 x 0.35884 0.4233 0.32785 0.337 4.92557 0.03297* x 2-0.34666 0.22956-0.224943-0.232628 2.28847 0.382 x 3-0.00275 0.003962-0.058009-0.06922 0.04564 0.95297 -- 変数偏回帰係数 95% 信頼区間幅下限上限 ------------------------------------------------------------ 定数 0.6590.0275-0.36849.6865 x 0.35884 0.287662 0.0282225 0.603546 x 2-0.34666 0.4634-0.80980 0.648 x 3-0.00275 0.0205-0.022243 0.098988 ------------------------------------------------------------ 重寄与率 ( 決定係数 )R^2=0.3984 自由度調整済重寄与率 ( 決定係数 )R'^2=0.0753285 重相関係数 R =0.373952 自由度調整済重相関係数 R' =0.27446 分散分析表 (ANOVA table) 要因平方和自由度平均平方和 F 値有意確率 p 値 - 回帰 3.6234 3.2077 2.6767 0.06887 残差 22.286 40 0.55749 - 全体 25.909 43 重回帰式 y=0.6590+ 0.35884 x 0.34666 x 2 0.00275 x 3 表 6.2 の No.3 の被験者 : 重症度 =( 軽症 ) 脂質異常スコア = 性 =0( 男 ) 年齢 =23 y=0.6590+ 0.35884 0.34666 0 0.00275 23=0.949308 この結果からこの被験者の重症度は ( 軽症 ) に近いと予想できる目的変数が順序尺度のデータの時は順序ロジスティック回帰分析を適用するよりも重回帰分析を適用した方が実用的 6-9