EBNと疫学

Similar documents
Medical3

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft Word - Stattext12.doc

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

EBNと疫学

MedicalStatisticsForAll.indd

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B>

Medical3

基礎統計

ANOVA

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft Word - 保健医療統計学112817完成版.docx

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

PowerPoint プレゼンテーション

統計的データ解析

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

ビジネス統計 統計基礎とエクセル分析 正誤表

PowerPoint プレゼンテーション

相関分析・偏相関分析

経済統計分析1 イントロダクション

クロス集計表の作成 2 つのカテゴリ変数をもつデータがあるとする ( 例 )AGE( 年齢 ),EXPOSURE( 曝露の有無 ) と DISEASE( 病気の有無 ) についての 40 人のデータ タブ区切りテキストファイル

モジュール1のまとめ

Microsoft Word - apstattext04.docx

Microsoft Word - å“Ÿåłžå¸°173.docx

際 正規分布に従わない観測値に対して通常の t 検定を適用した場合 どのような不都合が生じるかを考える 一般に通常の t 検定や Wilcoxon 検定などの仮説検定を行う場合 2つの処理の間に差がないことが真実であるにもかかわらず差があると主張する過誤確率 ( 第 1 種の過誤確率 ) 2つの処理

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

青焼 1章[15-52].indd

スライド 1

. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

様々なミクロ計量モデル†

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Probit , Mixed logit

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - 基礎・経済統計6.ppt

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

無党派層についての分析 芝井清久 神奈川大学人間科学部教務補助職員 統計数理研究所データ科学研究系特任研究員 注 ) 図表は 不明 無回答 を除外して作成した 設問によっては その他 の回答も除外した この分析では Q13 で と答えた有権者を無党派層と定義する Q13 と Q15-1, 2 のクロ

因子分析

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word - lec_student-chp3_1-representative

第1回

Microsoft PowerPoint - Statistics[B]

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft PowerPoint - statistics pptx

Microsoft Word - 補論3.2

講義「○○○○」

Microsoft PowerPoint - Econometrics pptx

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

ベイズ統計入門

Microsoft PowerPoint - ch04j

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

カイ二乗フィット検定、パラメータの誤差

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

解析センターを知っていただく キャンペーン

Microsoft Word - mstattext02.docx

仮説検定の手順

JUSE-StatWorks/V5 ユーザーズマニュアル

散布度

Microsoft PowerPoint - データ解析基礎2.ppt

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft Word - SPSS2007s5.doc

<4D F736F F D204A4D5082C982E682E991CE B A F2E646F63>

Microsoft PowerPoint ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Transcription:

ノンパラメトリック検定 94

質的変数と質的変数の関連性を調べる - クロス表 行周辺度数 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 列周辺度数 95

クロス表 - 行パーセント 各行のセルの度数を行周辺度数で割って 100 をかけたもの 行周辺度数 肺がん合計発生発生しない 10%(100 人 ) 90%(900 人 ) あり 1000 人 100 1/1000 100 900/1000 喫煙 1%(10 人 ) 99%(990 人 ) なし 1000 人 100 10/1000 100 990/1000 合計 110 人 1890 人 2000 人 96

クロス表 - 列パーセント 各列のセルの度数を列周辺度数で割って 100 をかけたもの 肺がん合計発生発生しない 91%(100 人 ) 48%(900 人 ) あり 100 100/110 100 900/1890 1000 人喫煙 9%(10 人 ) 52%(990 人 ) なし 100 10/110 100 990/1890 1000 人合計 110 人 1890 人 2000 人 列周辺度数 97

( 復習 ) リスクとオッズ 98

関連性の指標 (1) ーリスク比とオッズ比 イベント 要因 発生発生しない あり A B なし C D 99

関連性の指標 (2) ーファイ係数 φ( ファイ ) 係数 相関係数の一種 -1から1の間の値をとる 0なら関連なし AD BC φ = (A + B)(C + D)(A + C)(B + D) イベント 要因 発生発生しない あり A B なし C D 100

クロス表のグラフ表現 0.0 0.2 0.4 0.6 0.8 1.0 肺がん発症なし肺がん発症 0 200 400 600 800 喫煙有り喫煙なし 喫煙有り 喫煙なし 肺がん発症 肺がん発症なし 101

クロス表の検定 χ 2 検定 (1) クロス表とは 2 つの質的変数の関係をみる表 表の中のセルには度数 ( 人数 ) が入る クロス表で期待値から 観測値のズレがあるかどうかの検討 ( ズレがない が帰無仮説 ) ズレがあるとその表には偏りがある 偏りがあるということは 2 つのカテゴリカル変数の間に何らかの関係があるということになる 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 102

期待値 合計人数の比から計算できる各セルの期待度数 期待値の表は以下のようになる 肺がん合計発生発生しないあり 55 人 945 人 1000 人喫煙なし 55 人 945 人 1000 人合計 110 人 1890 人 2000 人 103

χ 2 検定 (2) 帰無仮説 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 喫煙と肺がんの発症には関係がない 合計人数の比から計算できる期待値と観察値にズレがない ズレがあること とは 比率計算上均等に人数が割り振られていないので偏りが生じているということ 104

χ 2 検定統計量 ( 観測度数 期待度数 ) 期待度数 χ 2 検定 (3) 2 の各セルの合計 これが自由度 ( 列数 -1) ( 行数 -1) のカイ二乗分布に従う 一般に2 2 表と呼ばれる2 値と2 値の表の検定統計量は以下のように表現できる N ad bc 2 p q m n 肺がん合計発生発生しないあり a 人 b 人 m 人喫煙なし c 人 d 人 n 人合計 p 人 q 人 N 人 105

2 2 表の検定の時の注意 各セルの期待度数が小さくなる (10 以下 5 以下など諸説あり ) 場合は以下の式で調整して計算する N ( ad - bc - N/2 ) 2 p q m n このような調整法を イエーツの補正 という 経験年数 外科病棟 内科病棟 計 10 年以上 a 人 b 人 m 人 10 年未満 c 人 d 人 n 人 計 p 人 q 人 N 人 106

フィッシャーの直接確率法 クロス表の検定で各セルの値が小さいとき ( 4 以下 ) に行う検定法 帰無仮説 ( 二つの変数に関係がない ) のもとで得られたデータより極端な場合が偶然生じる確率を直接求める 場合の数 ( コンビネーション ) を用いて計算する 107

分析例 ある病院勤務の看護師のうち 98 名の経験年数 (10 年以上 vs10 年未満 ) と病棟 ( 外科 vs 内科 ) で人数に偏りがあるのかないのかを検討する クロス表は以下 108

分析結果 結果表で見るのは χ2 検定結果 連続修正 ( イエーツ補正 ) Fisher の直接法 ( 一般的には両側 ) 尤度比はカイ二乗検定と同等 ( 測定値と期待値の比の対数の二乗に測定値をかけたものの各セルの和 ) だが クロス表の検定では参照しないことがほとんど 線形と線形による連関は クロスする変数が連続変量であった場合の検討方法で 一般的には参照しない 109

結果の読み取り 期待度数 ( 期待値 ) が 5 未満のセルはなかったので Fisher は参考にしなくてもよい 一番期待度数が小さいセルの期待度数は 10 年以上の外科で 10.36 イエーツ補正を報告する ( 論文に記述する ) かしないかは微妙なところ = どちらでも良い 補正した結果を報告する場合はイエーツ補正を実施した旨も記載すること いずれにせよ 5% 水準で有意に観測値は期待値よりも偏りがある 経験年数は病棟によって均等でない 外科では経験年数が 10 年未満の人が多い 110

マン ホイットニーの U 検定 2 つのグループで順序変数 ( 順序尺度 ) の差を検定する方法 対応のない t 検定 ( 連続変数のみ ) に相当 順序変数だけでなく連続変数でも使えて 検出力が高い検定といわれている 連続変数でも対象者数が少なく 正規分布していない ( 平均と分散で表すのが妥当でない ) データであればこの方法で検討する 順序変数として扱う場合は中央値と範囲 ( 最小値と最大値 ) を記述統計量として示す ウィルコクソンの順位和検定と同等の検定 本によってはウィルコクソンの順位和検定として登場することもあるが 実質的に等価 SPSS ではマンホイットニーの U 検定として登場する 111

例 内科と外科の新人看護師それぞれ 5 名に現在の勤務先について 就活時の志望順位は何位だったかを聞いた 内科 :3 位 1 位 5 位 6 位 7 位 外科 :4 位 2 位 6 位 8 位 7 位 志望順位は同じレベルなのか異なるのか 志望順位には差がない が帰無仮説 以下計算手順を見る ( やや複雑 ) 112

手順 1 並び替えとタイ データ グループ ( 内科 外科 ) を混みにして データを一列に並びかえる 同順位 ( タイ データ ) では平均値を与える 6 位と 7 位の平均の 6.5 8 位と 9 位の平均の 8.5 科内科外科内科外科内科内科外科内科外科外科 data 1 2 3 4 5 6 6 7 7 8 順位 1 2 3 4 5 6.5 6.5 8.5 8.5 10 113

手順 2 順位和と平均ランク 各グループ別に順位の和 ( 順位和 ) を出す 内科の順位和は 1+3+5+6.5+8.5=24 外科の順位和は 2+4+6.5+8.5+10=31 順位和をデータの個数で割る ( 平均ランク ) 内科の平均ランク : 24/5=4.8 外科の平均ランク : 31/5=6.2 114

2 つの Mann-Whitney の U の計算 この後の計算で用いる U 値を算出する 2 つのグループを A B として ケース数を n1,n2 とすると グループ A の U(U1) の計算式は もう一つの U2 は U1>(n1 n2) 2 のときは U2 を それ以外のときは U1 を Mann-Whitney の U として扱う 115

今回の例での Mann-Whittney の U U1=5x5 + 5x(5+1) 2 24 = 16 U2=5x5 16 = 9 16 > 5x5/2=12.5 なので U2 が Mann- Whittney の U としてこの後の計算式に用いることができるようになる 116

検定統計量を求める グループ A のケース数が n1 グループ B が n2 全対象者数は N(= n1 + n2) 順位 i の同順位データの数を t とする Z は検定統計量で 標準正規分布 に従う 117

今回の例の検定統計量 Z の分子は 9-5x5/2 = -3.5 Z の分母は 5x5/10x(10-1) x (10 3-10)/12 (T1+T2) 同順位は 2 つ (6.5 と 8.5) ある 同順位数は 6.5 位では 2 つ 8.5 位でも 2 つなので T1=(2 3-2)/12=0.5 T2=(2 3-2)/12=0.5 4.758 Z=-3.5 4.758 = -0.73559 118

SPSS の計算結果 一般には漸近有意確率を参照する 正確有意確率は合計 30 ケース以下で 同順位データが存在しないときのみ参照する Wilcoxson の W はウィルコクソン検定の計算の際に使用する値 結果的に Mann- Whitney の U 検定と同じなので特に参照せず 標準誤差は先の 分母 の値 標準化された 検定の統計 が Z の値 有意にはならなかった 119

ウィルコクソンの符号付順位検定 対応のある順序変数の検定 連続量の検定の対応のある t 検定に相当 前後で順序は変わらない が帰無仮説 例 看護学生 5 名への就職説明会の前後で A 病院への志望順位がどう変わったか 学生 A B C D E 前 1 6 7 9 9 後 5 2 3 8 4 120

計算方法 1 2 つめ ( 後 ) の変数から 1 つめ ( 前 ) の変数の値を引く その時の差の符号 (+ か - か ) を示す 値が同じ ( 差が 0) の場合は分析から外す 差の絶対値を示す 差の絶対値の大きさに順位をつける ( 同順位は平均順位 ) 学生 A B C D E 前 1 6 7 9 9 後 5 2 3 8 4 差 4-4 -4-1 -5 符号 + - - - - 差の絶 4 4 4 1 5 対値 順位 3 3 3 1 5 121

計算方法 2 符号がプラスになった順位の合計 Sp と 符号がマイナスになった順位の合計 Sn を求める Sp = 3 Sn = 1+3+3+5 = 12 Sp と Sn のそれぞれをケース数で割って平均ランク (Xp Xn) を求める Xp = 3 / 1 = 3 Xn = 12 / 4 =3 122

計算方法 3 min(sp,sn) は Sp, Sn のうち小さい方の値 n はケース数 tj は j 番目に同順位になった場合のデータの個数 同順位が発生した個数を d として j は 1 から d まで存在しうる この Z は標準正規分布する 123

今回の例の場合 min(sp,sn) は min(3,3) で同じなので 3 n は 5 人なので 5 差の絶対値の同順位は 1 回だけあった (d=1 ) t 1 は 3 1 度だけ 3 位が 3 個あった 計算すると分母は 3 (5x6)/4 分子は 5x(5+1)(2x5+1)/24 (3 3-3)/48 計算すると -1.236245 124

SPSS 計算結果 検定統計は min(sp,sn) のこと 標準誤差は 先ほどの分子の計算結果 標準化された検定の統計が 検定統計量 ( 標準正規分布を用いて検定する ) 有意確率は 0.216 で有意ではなかった 125

クラスカル ウォリス検定 3 つ以上の群で順位に差があるかどうか 順位に差がない が帰無仮説 例 : ある病院の病棟別新人 12 名の看護基礎技術力スコア N が小さいので ANOVA でなくノンパラメトリック検定で検討 今度は外来が加わって 3 カテゴリになった 病棟別で技術力スコアに差があるのかどうかを検討する 内科 50 80 58 81 外科 67 69 72 88 外来 54 62 75 77 126

並び替える 内科外来内科外来外科外科外科外来外来内科内科外科 得点 50 54 58 62 67 69 72 75 77 80 81 88 順位 1 2 3 4 5 6 7 8 9 10 11 12 小さい順に並び替えて順位を振り グループ別に順位和と平均ランクを出す 内科の順位和 =25 =6.25 平均ランク 外科の順位和 =30 =7.50 平均ランク 外来の順位和 =23 =5.75 平均ランク 順位和 内科 1 10 3 11 25 外科 5 6 7 12 30 外来 2 4 8 9 23 127

検定統計量 H を求める Ri はグループ i の順位和 ni はグループ i のケース数 (N は全ケース数 ) この H はカイ二乗分布するのでカイ二乗検定 自由度は 全グループ数 -1 今回の例の場合 12/(12x13) x (252/4 + 302/4 + 232/4) 3x13=0.500 自由度は 3-1=2 128

SPSS の分析結果 検定統計量は H の値 自由度 2 のカイ二乗検定では p=0.779 で有意にならなかった 129

フリードマン検定 3 つ以上の対応のあるグループで順序変数 ( 順序尺度 ) に違いがあるかを検定する方法 反復測定分散分析に相当 3 回以上測定した時系列データや反復測定データの分析に使える 測定時点 患者 1 時間後 2 時間後 3 時間後 4 時間後 A 9 17 12 16 B 1 21 16 11 C 7 19 6 9 130

ノンパラメトリック検定と多重比較 3 群以上の比較でどの群とどの群の間に差があるかを調べたい ペアごとに検定を繰り返すと検定の多重性の問題が出るのはノンパラメトリック検定でも同じ 検定の多重性の問題 1 度の検定で 5% の有意水準にした 95% の確率で有意差がでない 3 回 t 検定を行うと 0.95 0.95 0.95=86% の確率で有意差がでない つまり 1-0.86=0.14 で 14% の確率で有意になる 検定を繰り返すと有意になりやすくなるため 検定を多く行うと結果が甘くなる ノンパラメトリック検定の多重比較の調整で使える方法 ボンフェローニ (Bonferroni) 法 有意水準を検定の回数で割って厳しくする方法. 手計算でも簡単 スティール ドゥワス (Steel-Dwass ) 法 テューキー (Tukey) 法のノンパラメトリック版 131

順位相関係数 順序変数同士の相関係数 スピアマン (Spearman) とケンドール (Kendall) の 2 種類 スピアマンの順位相関係数 (ρ) ピアソンの相関係数 ( 連続量同士の相関係数 ) の計算に使うデータを順位にしたもの ケンドールの順位相関係数 ( ケンドールの τ) 2 つの順序変数の順位の組み合わせのうち, 大小関係が一致するペアの割合 132

まとめ パラメトリック ノンパラメトリック 名義尺度 比率カイ二乗検定, フィッシャーの正確確率検定 独立した 2 群の代表値 対応がある 2 群の代表値 対応のない t 検定 対応のある t 検定 順序尺度以上 カイ二乗検定, フィッシャーの正確確率検定 マンホイットニーの U 検定 ウィルコクソンの符号付き順位検定 独立した 3 群 ( 以上 ) の代表値 対応がある 3 群 ( 以上 ) の代表値 一元配置分散分析 反復測定分散分析 クラスカルワリス検定 フリードマン検定 相関係数ピアソンの積率相関係数順位相関係数 133

2 変量検定のまとめ 1 カテゴリ変数 連続変数 / 順序変数 カテゴリ変数のカテゴリの数は? 2 値 3 値以上 連続変数か順序変数か? 連続変数か順序変数か? 連続変数順序変数連続変数順序変数 対応があるかないか? 対応があるかないか 一元配置 分散分析 クラスカル ウォリス検定 対応あり : 対応がある t 検定 対応なし : 独立した t 検定 対応あり : ウィルコクソンの符号付き順位検定 対応なし : マンホイットニーの U 検定 134

2 変量検定のまとめ 2 カテゴリ変数 カテゴリ変数 10 以上 : χ 2 検定 両方の変数のカテゴリの数は? 2 カテゴリ 2 カテゴリ 少なくとも片方は 3 カテゴリ以上 4 つのセルのうち最も低い期待度数は? χ 2 検定 10 未満 : 5 未満 : イェーツ補正の χ 2 検定 フィッシャーの正確確率検定 135

参考文献 土田昭司社会調査のためのデータ分析入門有斐閣 2000 高木廣文 林邦彦エビデンスのための看護研究の読み方 進め方中山書店 2006 中村好一編論文を正しく読み書くためのやさしい統計学診断と治療社 2006 136