EBNと疫学 - PDF 無料ダウンロード

ノンパラメトリック検定 94

質的変数と質的変数の関連性を調べる - クロス表行周辺度数肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人列周辺度数 95

クロス表 - 行パーセント各行のセルの度数を行周辺度数で割って 100 をかけたもの行周辺度数肺がん合計発生発生しない 10%(100 人 ) 90%(900 人 ) あり 1000 人 100 1/1000 100 900/1000 喫煙 1%(10 人 ) 99%(990 人 ) なし 1000 人 100 10/1000 100 990/1000 合計 110 人 1890 人 2000 人 96

クロス表 - 列パーセント各列のセルの度数を列周辺度数で割って 100 をかけたもの肺がん合計発生発生しない 91%(100 人 ) 48%(900 人 ) あり 100 100/110 100 900/1890 1000 人喫煙 9%(10 人 ) 52%(990 人 ) なし 100 10/110 100 990/1890 1000 人合計 110 人 1890 人 2000 人列周辺度数 97

( 復習 ) リスクとオッズ 98

関連性の指標 (1) ーリスク比とオッズ比イベント要因発生発生しないあり A B なし C D 99

関連性の指標 (2) ーファイ係数 φ( ファイ ) 係数相関係数の一種 -1から1の間の値をとる 0なら関連なし AD BC φ = (A + B)(C + D)(A + C)(B + D) イベント要因発生発生しないあり A B なし C D 100

クロス表のグラフ表現 0.0 0.2 0.4 0.6 0.8 1.0 肺がん発症なし肺がん発症 0 200 400 600 800 喫煙有り喫煙なし喫煙有り喫煙なし肺がん発症肺がん発症なし 101

クロス表の検定 χ 2 検定 (1) クロス表とは 2 つの質的変数の関係をみる表表の中のセルには度数 ( 人数 ) が入るクロス表で期待値から観測値のズレがあるかどうかの検討 ( ズレがないが帰無仮説 ) ズレがあるとその表には偏りがある偏りがあるということは 2 つのカテゴリカル変数の間に何らかの関係があるということになる肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 102

期待値合計人数の比から計算できる各セルの期待度数期待値の表は以下のようになる肺がん合計発生発生しないあり 55 人 945 人 1000 人喫煙なし 55 人 945 人 1000 人合計 110 人 1890 人 2000 人 103

χ 2 検定 (2) 帰無仮説肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人喫煙と肺がんの発症には関係がない合計人数の比から計算できる期待値と観察値にズレがないズレがあることとは比率計算上均等に人数が割り振られていないので偏りが生じているということ 104

χ 2 検定統計量 ( 観測度数期待度数 ) 期待度数 χ 2 検定 (3) 2 の各セルの合計これが自由度 ( 列数 -1) ( 行数 -1) のカイ二乗分布に従う一般に2 2 表と呼ばれる2 値と2 値の表の検定統計量は以下のように表現できる N ad bc 2 p q m n 肺がん合計発生発生しないあり a 人 b 人 m 人喫煙なし c 人 d 人 n 人合計 p 人 q 人 N 人 105

2 2 表の検定の時の注意各セルの期待度数が小さくなる (10 以下 5 以下など諸説あり ) 場合は以下の式で調整して計算する N ( ad - bc - N/2 ) 2 p q m n このような調整法をイエーツの補正という経験年数外科病棟内科病棟計 10 年以上 a 人 b 人 m 人 10 年未満 c 人 d 人 n 人計 p 人 q 人 N 人 106

フィッシャーの直接確率法クロス表の検定で各セルの値が小さいとき ( 4 以下 ) に行う検定法帰無仮説 ( 二つの変数に関係がない ) のもとで得られたデータより極端な場合が偶然生じる確率を直接求める場合の数 ( コンビネーション ) を用いて計算する 107

分析例ある病院勤務の看護師のうち 98 名の経験年数 (10 年以上 vs10 年未満 ) と病棟 ( 外科 vs 内科 ) で人数に偏りがあるのかないのかを検討するクロス表は以下 108

分析結果結果表で見るのは χ2 検定結果連続修正 ( イエーツ補正 ) Fisher の直接法 ( 一般的には両側 ) 尤度比はカイ二乗検定と同等 ( 測定値と期待値の比の対数の二乗に測定値をかけたものの各セルの和 ) だがクロス表の検定では参照しないことがほとんど線形と線形による連関はクロスする変数が連続変量であった場合の検討方法で一般的には参照しない 109

結果の読み取り期待度数 ( 期待値 ) が 5 未満のセルはなかったので Fisher は参考にしなくてもよい一番期待度数が小さいセルの期待度数は 10 年以上の外科で 10.36 イエーツ補正を報告する ( 論文に記述する ) かしないかは微妙なところ = どちらでも良い補正した結果を報告する場合はイエーツ補正を実施した旨も記載することいずれにせよ 5% 水準で有意に観測値は期待値よりも偏りがある経験年数は病棟によって均等でない外科では経験年数が 10 年未満の人が多い 110

マンホイットニーの U 検定 2 つのグループで順序変数 ( 順序尺度 ) の差を検定する方法対応のない t 検定 ( 連続変数のみ ) に相当順序変数だけでなく連続変数でも使えて検出力が高い検定といわれている連続変数でも対象者数が少なく正規分布していない ( 平均と分散で表すのが妥当でない ) データであればこの方法で検討する順序変数として扱う場合は中央値と範囲 ( 最小値と最大値 ) を記述統計量として示すウィルコクソンの順位和検定と同等の検定本によってはウィルコクソンの順位和検定として登場することもあるが実質的に等価 SPSS ではマンホイットニーの U 検定として登場する 111

例内科と外科の新人看護師それぞれ 5 名に現在の勤務先について就活時の志望順位は何位だったかを聞いた内科 :3 位 1 位 5 位 6 位 7 位外科 :4 位 2 位 6 位 8 位 7 位志望順位は同じレベルなのか異なるのか志望順位には差がないが帰無仮説以下計算手順を見る ( やや複雑 ) 112

手順 1 並び替えとタイデータグループ ( 内科外科 ) を混みにしてデータを一列に並びかえる同順位 ( タイデータ ) では平均値を与える 6 位と 7 位の平均の 6.5 8 位と 9 位の平均の 8.5 科内科外科内科外科内科内科外科内科外科外科 data 1 2 3 4 5 6 6 7 7 8 順位 1 2 3 4 5 6.5 6.5 8.5 8.5 10 113

手順 2 順位和と平均ランク各グループ別に順位の和 ( 順位和 ) を出す内科の順位和は 1+3+5+6.5+8.5=24 外科の順位和は 2+4+6.5+8.5+10=31 順位和をデータの個数で割る ( 平均ランク ) 内科の平均ランク : 24/5=4.8 外科の平均ランク : 31/5=6.2 114

2 つの Mann-Whitney の U の計算この後の計算で用いる U 値を算出する 2 つのグループを A B としてケース数を n1,n2 とするとグループ A の U(U1) の計算式はもう一つの U2 は U1>(n1 n2) 2 のときは U2 をそれ以外のときは U1 を Mann-Whitney の U として扱う 115

今回の例での Mann-Whittney の U U1=5x5 + 5x(5+1) 2 24 = 16 U2=5x5 16 = 9 16 > 5x5/2=12.5 なので U2 が Mann- Whittney の U としてこの後の計算式に用いることができるようになる 116

検定統計量を求めるグループ A のケース数が n1 グループ B が n2 全対象者数は N(= n1 + n2) 順位 i の同順位データの数を t とする Z は検定統計量で標準正規分布に従う 117

今回の例の検定統計量 Z の分子は 9-5x5/2 = -3.5 Z の分母は 5x5/10x(10-1) x (10 3-10)/12 (T1+T2) 同順位は 2 つ (6.5 と 8.5) ある同順位数は 6.5 位では 2 つ 8.5 位でも 2 つなので T1=(2 3-2)/12=0.5 T2=(2 3-2)/12=0.5 4.758 Z=-3.5 4.758 = -0.73559 118

SPSS の計算結果一般には漸近有意確率を参照する正確有意確率は合計 30 ケース以下で同順位データが存在しないときのみ参照する Wilcoxson の W はウィルコクソン検定の計算の際に使用する値結果的に Mann- Whitney の U 検定と同じなので特に参照せず標準誤差は先の分母の値標準化された検定の統計が Z の値有意にはならなかった 119

ウィルコクソンの符号付順位検定対応のある順序変数の検定連続量の検定の対応のある t 検定に相当前後で順序は変わらないが帰無仮説例看護学生 5 名への就職説明会の前後で A 病院への志望順位がどう変わったか学生 A B C D E 前 1 6 7 9 9 後 5 2 3 8 4 120

計算方法 1 2 つめ ( 後 ) の変数から 1 つめ ( 前 ) の変数の値を引くその時の差の符号 (+ か - か ) を示す値が同じ ( 差が 0) の場合は分析から外す差の絶対値を示す差の絶対値の大きさに順位をつける ( 同順位は平均順位 ) 学生 A B C D E 前 1 6 7 9 9 後 5 2 3 8 4 差 4-4 -4-1 -5 符号 + - - - - 差の絶 4 4 4 1 5 対値順位 3 3 3 1 5 121

計算方法 2 符号がプラスになった順位の合計 Sp と符号がマイナスになった順位の合計 Sn を求める Sp = 3 Sn = 1+3+3+5 = 12 Sp と Sn のそれぞれをケース数で割って平均ランク (Xp Xn) を求める Xp = 3 / 1 = 3 Xn = 12 / 4 =3 122

計算方法 3 min(sp,sn) は Sp, Sn のうち小さい方の値 n はケース数 tj は j 番目に同順位になった場合のデータの個数同順位が発生した個数を d として j は 1 から d まで存在しうるこの Z は標準正規分布する 123

今回の例の場合 min(sp,sn) は min(3,3) で同じなので 3 n は 5 人なので 5 差の絶対値の同順位は 1 回だけあった (d=1 ) t 1 は 3 1 度だけ 3 位が 3 個あった計算すると分母は 3 (5x6)/4 分子は 5x(5+1)(2x5+1)/24 (3 3-3)/48 計算すると -1.236245 124

SPSS 計算結果検定統計は min(sp,sn) のこと標準誤差は先ほどの分子の計算結果標準化された検定の統計が検定統計量 ( 標準正規分布を用いて検定する ) 有意確率は 0.216 で有意ではなかった 125

クラスカルウォリス検定 3 つ以上の群で順位に差があるかどうか順位に差がないが帰無仮説例 : ある病院の病棟別新人 12 名の看護基礎技術力スコア N が小さいので ANOVA でなくノンパラメトリック検定で検討今度は外来が加わって 3 カテゴリになった病棟別で技術力スコアに差があるのかどうかを検討する内科 50 80 58 81 外科 67 69 72 88 外来 54 62 75 77 126

並び替える内科外来内科外来外科外科外科外来外来内科内科外科得点 50 54 58 62 67 69 72 75 77 80 81 88 順位 1 2 3 4 5 6 7 8 9 10 11 12 小さい順に並び替えて順位を振りグループ別に順位和と平均ランクを出す内科の順位和 =25 =6.25 平均ランク外科の順位和 =30 =7.50 平均ランク外来の順位和 =23 =5.75 平均ランク順位和内科 1 10 3 11 25 外科 5 6 7 12 30 外来 2 4 8 9 23 127

検定統計量 H を求める Ri はグループ i の順位和 ni はグループ i のケース数 (N は全ケース数 ) この H はカイ二乗分布するのでカイ二乗検定自由度は全グループ数 -1 今回の例の場合 12/(12x13) x (252/4 + 302/4 + 232/4) 3x13=0.500 自由度は 3-1=2 128

SPSS の分析結果検定統計量は H の値自由度 2 のカイ二乗検定では p=0.779 で有意にならなかった 129

フリードマン検定 3 つ以上の対応のあるグループで順序変数 ( 順序尺度 ) に違いがあるかを検定する方法反復測定分散分析に相当 3 回以上測定した時系列データや反復測定データの分析に使える測定時点患者 1 時間後 2 時間後 3 時間後 4 時間後 A 9 17 12 16 B 1 21 16 11 C 7 19 6 9 130

ノンパラメトリック検定と多重比較 3 群以上の比較でどの群とどの群の間に差があるかを調べたいペアごとに検定を繰り返すと検定の多重性の問題が出るのはノンパラメトリック検定でも同じ検定の多重性の問題 1 度の検定で 5% の有意水準にした 95% の確率で有意差がでない 3 回 t 検定を行うと 0.95 0.95 0.95=86% の確率で有意差がでないつまり 1-0.86=0.14 で 14% の確率で有意になる検定を繰り返すと有意になりやすくなるため検定を多く行うと結果が甘くなるノンパラメトリック検定の多重比較の調整で使える方法ボンフェローニ (Bonferroni) 法有意水準を検定の回数で割って厳しくする方法. 手計算でも簡単スティールドゥワス (Steel-Dwass ) 法テューキー (Tukey) 法のノンパラメトリック版 131

順位相関係数順序変数同士の相関係数スピアマン (Spearman) とケンドール (Kendall) の 2 種類スピアマンの順位相関係数 (ρ) ピアソンの相関係数 ( 連続量同士の相関係数 ) の計算に使うデータを順位にしたものケンドールの順位相関係数 ( ケンドールの τ) 2 つの順序変数の順位の組み合わせのうち, 大小関係が一致するペアの割合 132

まとめパラメトリックノンパラメトリック名義尺度比率カイ二乗検定, フィッシャーの正確確率検定独立した 2 群の代表値対応がある 2 群の代表値対応のない t 検定対応のある t 検定順序尺度以上カイ二乗検定, フィッシャーの正確確率検定マンホイットニーの U 検定ウィルコクソンの符号付き順位検定独立した 3 群 ( 以上 ) の代表値対応がある 3 群 ( 以上 ) の代表値一元配置分散分析反復測定分散分析クラスカルワリス検定フリードマン検定相関係数ピアソンの積率相関係数順位相関係数 133

2 変量検定のまとめ 1 カテゴリ変数連続変数 / 順序変数カテゴリ変数のカテゴリの数は? 2 値 3 値以上連続変数か順序変数か? 連続変数か順序変数か? 連続変数順序変数連続変数順序変数対応があるかないか? 対応があるかないか一元配置分散分析クラスカルウォリス検定対応あり : 対応がある t 検定対応なし : 独立した t 検定対応あり : ウィルコクソンの符号付き順位検定対応なし : マンホイットニーの U 検定 134

2 変量検定のまとめ 2 カテゴリ変数カテゴリ変数 10 以上 : χ 2 検定両方の変数のカテゴリの数は? 2 カテゴリ 2 カテゴリ少なくとも片方は 3 カテゴリ以上 4 つのセルのうち最も低い期待度数は? χ 2 検定 10 未満 : 5 未満 : イェーツ補正の χ 2 検定フィッシャーの正確確率検定 135

参考文献土田昭司社会調査のためのデータ分析入門有斐閣 2000 高木廣文林邦彦エビデンスのための看護研究の読み方進め方中山書店 2006 中村好一編論文を正しく読み書くためのやさしい統計学診断と治療社 2006 136