医学薬学分野の研究で用いられるのは推測統計学母集団のデータ多数データの数学的要約記述記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出標本集団のデータ少数データの数学的要約記述推測統計学 ( 近代統計学 ) 逆規定確率的推測記述記述統計学調査対象集団 =

1.. 統計学の基本的な概念 1.1 統計学とは何ぞや? 統計学は沢山のデータを要約し中に含まれている情報を把握しやすくするための手段データデータデータデータデータデータ要約値 ( 統計量 ) 実質科学的評価 < 例 >100 人の日本人について体重を測定した場合 100 個のデータを眺めただけでそこに含まれる情報を読み取るのは困難 100 個のデータのほぼ真ん中を表す要約値として平均値を求める平均値が 60kg だった 100 人の日本人の体重はだいたい 60kg ぐらいであるという情報を読み取ることができる日本人の体重はだいたい 60kg ぐらいであると推測する統計学では平均値のような要約値または代表値のことを統計量と呼ぶ厳密に言うと確率的に変動する個々のデータを確率変数と呼び確率変数 x の関数として定義される値 z=f(x) を統計量と呼ぶ本書では平均値のように複数のデータを四則演算によって要約した統計量を要約値と呼びそのような要約をしないポイント的な統計量を代表値と呼ぶことにする要約値は中心極限定理によって近似的に正規分布するが代表値は正規分布するとは限らない 1-1

医学薬学分野の研究で用いられるのは推測統計学母集団のデータ多数データの数学的要約記述記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出標本集団のデータ少数データの数学的要約記述推測統計学 ( 近代統計学 ) 逆規定確率的推測記述記述統計学調査対象集団 = 母集団のデータを要約し母集団の情報を数学的に記述することが中心で古典統計学とも呼ばれる国勢調査で用いられる統計手法が代表例推測統計学または推計学母集団から無作為抽出した標本集団の要約値から母集団の要約値を確率的に推測しそれによって母集団の様子を数学的に記述することが中心で近代統計学とも呼ばれる科学実験や世論調査で用いられる統計手法が代表例医学薬学分野の研究 ( 臨床試験臨床研究等 ) では主として推測統計学が用いられるがこの分野独特の特徴がある 1-2

医学薬学分野の研究は準母集団を対象にする点が特徴母集団準母集団非無作為抽出逆規定標本集団医学薬学分野の研究では特定の疾患の患者を母集団にすることが多い患者全体を正確に特定することは事実上不可能母集団から標本集団を無作為抽出することも不可能ある医療施設をたまたま受診した患者をとりあえず標本集団にする標本集団の背景因子 ( 集団の特徴を表す項目性別年齢等 ) を調査背景因子から母集団となるべき集団 = 準母集団を逆規定論文の最初に載せる患者背景表は準母集団を規定するためのもの準母集団と本当の母集団は微妙にずれる同じような研究を行なっても準母集団がずれると結果もずれる医学薬学分野の研究の特徴限界 1-3

1.2 データの要約方法データの要約はグラフ化から度数体重図 1.1 度数分布図データを要約する時はまず初めにデータを見やすいようにグラフ化するそれには横軸にデータの値を取り縦軸にそのデータの数をプロットした度数分布図 (frequency distribution) を用いる一般的な度数分布図ではデータの値をいくつかの区間に区切りその区間の中に入るデータの数を柱状グラフとしてプロットする < 度数分布図を描くメリット> データを感覚的に把握することができる百聞は一見にしかず! データの内容についてある程度の情報を得ることができるデータの解析方法について有益なヒントが得られる 1-4

度数分布図を理想化したものが正規分布 σ=10 度数 μ=60 図 1.2 正規分布体重度数分布においてデータの数無限大区切り幅無限小とすると理想的には正規分布 (normal distribution ガウス分布 ) になる < 正規分布の特徴 > 平均値を中心にして左右対称平均値の度数が最も多く平均値から離れるほど度数が減るベル型の分布数学的な取り扱いが比較的簡単現実のデータの度数分布を描くと多くのものが近似的に正規分布になる厳密に言うと現実には有り得ない理想分布理想気体のようなもの 1-5

最初の要約値は度数分布の中心を表す平均値度数分布を眺めながらデータ内容を把握するのに適した要約値を検討する最初の要約値として普通は度数分布の中心を表す値である平均値 (mean) を求める平均値 :m= x= x 1 + +x i + +x n = 1 n x x n n i = i=1 n x i :i 番目のデータ < 平均値の特徴 > 分布の重心を表す全てのデータを均等に反映する正規分布では分布の中心を表す次の要約値はデータのバラツキ具合を表す標準偏差次の要約値として普通は度数分布の幅つまりデータのバラツキ具合を表す値である標準偏差 (SD:Standard Deviation) を求める偏差 ( バラツキの定義 ): d i =x i m n 2 平方和 :SS=S x x = d i = (x i m) 2 i=1 分散 :V = SS n = d i 2 n = (x i m) 2 n 標準偏差 : s=sd= V = SS n = d i 2 n = (x i m) 2 n 正規分布は例数平均値標準偏差によって分布の形が完全に決まるそして現実のデータの度数分布は近似的に正規分布になるそのため普通は例数平均値標準偏差によってデータを要約しデータに含まれる情報を把握する 1-6

< 標準偏差の特徴 > データ 1 個あたりのバラツキ具合を表す正規分布では平均値から分布の変曲点までの距離になる( 図 1.2 参照 ) 正規分布では平均値 ± 標準偏差の間に全データの約 68% が含まれる正規分布では平均値 ±2 標準偏差の間に全データの約 95% が含まれる推測統計学では標本集団の要約値から母集団の要約値を推測することが重要母集団のデータ多数データの数学的要約記述記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出標本集団のデータ少数データの数学的要約記述推測統計学 ( 近代統計学 ) 逆規定確率的推測記述推測統計学の目的は標本集団の要約値を求めることではなく標本集団の要約値から母集団の要約値つまり母数 (parameter) を推測すること常識的には次のようにして近似的に推測できると考えられる母平均 ( 母集団の平均値 ):μ m: 標本平均 ( 標本集団の平均値 ) 母分散 ( 母集団の分散 ):σ 2 V : 標本分散 ( 標本集団の分散 ) 母標準偏差 ( 母集団の標準偏差 ):σ SD: 標本標準偏差 ( 標本集団の標準偏差 ) 母数はギリシャ文字で表す習慣があるしかし母分散は V に相当するギリシャ文字がないため σ 2 で表すところが実際には母分散と母標準偏差は次の式の方が近似が良い 1-7

母分散 :σ 2 SS n 1 =V * : 不偏分散 ( 偏らない分散 ) 母標準偏差 :σ V * =SD * : 不偏標準偏差 ( 偏らない標準偏差 ) 平均値の定義式から平均値と n 個のデータの間には 1 次従属関係があるこの関係から平均値を固定した時 n 個のデータの中で自由に変動できるデータの個数つまり独立変数の数は (n-1) 個になりこれが自由度になるバラツキを生み出すのは独立変数だからバラツキの合計つまり平方和 SS を自由度 (n-1) で割り 1 自由度あたりのバラツキにした方が近似が良い概念的には次のように理解するとわかりやすいかも母集団の分布は左右に広く広がっている分布の左右の端の部分は度数が少ないため標本集団に抽出される可能性が低いそのため標本集団の分布は左右の端が少し切れている母集団の標準偏差を推測する時は標本集団の標準偏差よりも少し大きな値にした方が近似が良い平方和 SS を n で割る代わりに (n-1) で割った値を不偏標準偏差にする推測統計学では特に指定しない限り V は不偏分散を表し SD は不偏標準偏差を表すそしてこれは標本集団のバラツキ具合の要約値ではなく母集団のバラツキ具合の要約値の推測値を意味する正確には母数は要約値というよりも母集団の性質を左右する定数のことであり母数によって確率変数の挙動が決定される厳密に言うと不偏分散の平方根は不偏標準偏差にならないしかし不偏標準偏差を正確に計算するのは非常に面倒なので普通は不偏分散の平方根で母標準偏差を近似的に推測する 1-8

標準誤差は母平均値の推測誤差を表す推測統計学独特の要約値例数 n 例を無作為抽出して標本平均 m を無限回求める SD m = σ n =SE 度数 σ SD μ x m 2 =55 m=μ m 1 =60 母集団のデータの分布標本平均の分布図 1.3 母集団の分布と標本平均の分布 m 標準偏差と標準誤差 (SE:Standard Error) の混同は統計学 3 大間違いの 1 つ < 標準誤差の求め方 > (1) 母集団から n 例の標本集団を無作為抽出する (2) 標本平均を求めそれを m 1 として標本平均の度数分布図にプロットする (3) n 例の標本集団を母集団に戻す (4) 母集団からまた n 例の標本集団を無作為抽出する (5) 標本平均を求めそれを m 2 として標本平均の度数分布図にプロットする (6) (1) から (3) を無限回繰り返す (7) すると図 1.3 のような標本平均の度数分布図ができあがる図 1.3 の標本平均の度数分布について次のことが成り立つ母集団のデータがどんな分布をしていてもこの度数分布は漸近的に(n が多いほど ) 正規分布に近似する中心極限定理 ( 推測統計学の基本定理 ) 標本平均の平均値は母平均と一致する μ= m 1-9

μ: 母平均 m: 標本平均の平均値標本平均の標準偏差は次のような値になる標準誤差 SD m = σ n SD n =SE SD m : 標本平均の標準偏差 σ: 母標準偏差 n: 標本集団の例数 SD: 不偏標準偏差 SE: 標準誤差標準偏差がデータのバラツキ具合を表す要約値であるのに対して標準誤差は標本平均のバラツキ具合を表す要約値これは母平均を標本平均によって推測する時の推測誤差の大きさを表す推測統計学独特の値である < 標準誤差と標準偏差の使い分け> 80 mean±se mean±sd 60 重量 40 20 0 2 4 週図 1.4 体重の推移 A 錠 B 錠図 1.5 錠剤の重量図 1.4 のように母平均の変化とその推測誤差範囲を表したい時は標準誤差 μ=m±se : μ を m で推測すると SE 程度の推測誤差があるという意味図 1.5 のようにデータのバラツキ具合を表したい時は標準偏差 m±sd : データには m を中心にして SD 程度のバラツキがあるという意味一般には要約値つまり統計量の標準偏差を標準誤差と呼ぶしかし普通は平均値について議論することが多いので単に SE と書けば平均値の標準誤差つまり SEM(Standard Error of Mean) を指す 1-10

1.3 推定の考え方推定は定量試験検定は定性試験統計学的推論推定定量試験母数を推測 ph 計に相当検定定性試験母数が基準値と等しいかどうかを式で推測リトマス試験紙に相当推測統計学は推定 (estimate) と検定 (test) の 2 本柱で成り立っていて定量試験である推定の方が重要しかし実際の研究現場では推定よりも検定の方が頻繁に利用されているこれは推定は記述式の回答が得られるのに対して検定は式の回答が得られることに大きな原因があると思われる記述式試験よりも式試験の方が採点が楽! 点推定はピンポイントの推測区間推定は幅を持たせた推測 (1) 点推定母平均 :μ m: 標本平均母標準偏差 : σ SD= V = SS n 1 : 不偏標準偏差点推定 (point estimation) は母平均を標本平均で母標準偏差を不偏標準偏差で推測するピンポイント推測 1-11

(2) 区間推定 σ SD n SE= SD n n 例を無作為抽出して標本平均を無限回求める 1-α 区間推定 (interval estimation) はある程度の幅を持たせて母数を推測する < 母平均の区間推定法 > μ 母集団の分布 t(n-1,α) SE m L 図 1.6 区間推定の模式図 m=μ m U μ L m μ U 標本平均の分布と信頼区間 t(n-1,α) SE 標本平均の分布は近似的に正規分布になり標本平均の平均が母平均 μ に標本平均の標準偏差が標準誤差 SE になる μ±2 SE の範囲に標本平均の約 95% が含まれるある標本平均 m が μ±2 SE の範囲に含まれる確率は約 95% 逆に m±2 SE の範囲に μ が含まれる確率も約 95% μ=m±2 SE μ L =m-2 SE μ U =m+2 SE μ L ~μ U :95% 信頼区間または信頼限界 ( 母平均が 95% の確率で含まれる区間 ) μ L :95% 信頼区間下限 μ U :95% 信頼区間上限 95%: 信頼係数厳密に言うと SE に掛ける係数 2 は自由度 (n-1) と信頼係数によって値が少し変わるこの係数を t 値と 1-12

いい自由度 (n-1) 信頼係数 100(1-α)% の時の t 値を t(n-1,α) と書く μ=m±t (n 1,α) SE μ L =m t (n 1, α) SE,μ U =m+t(n 1, α) SE t (60,0.05)=2, t (60,0.01)=2.66, t(,0.05)=1.96 等標準誤差 SE は不偏標準偏差 SD を n で割った値だから例数が多くなるほど小さくなるしたがって信頼区間を狭くして母平均の値を精度良く推測するためにはデータ数を多くするのが一番効率的下手な鉄砲も数射ちゃ当たる! 推定は漁師 (Fisher!) が水面に映った魚 (Poisson!) の影 m を見て魚 μ を捕まえるようなもの点推定は銛で一突きの方法であり区間推定は幅のある投網を打つことに相当する銛は手軽に扱えるが魚に当たる確率は低い投網を打つには技術を要するが魚を捕まえる確率は高くなるそこで普通は点推定で母数を推定しておき重要な時だけ区間推定を行うのが一般的標準偏差は点推定だけ行うのが普通 1-13

1.4 有意性検定の考え方検定は定性試験だから定量試験である推定結果から判定可能 SD=10 母集団の推測分布標本集団の度数分布 μ m=60 0 =50 μ L μ U 95% 信頼区間図 1.7 信頼区間と有意性検定検定は式の定性試験だから最初に問題を設定する例えば体重の医学的な正常値を 50kg とすると問題 : 日本人の平均体重は 50kg か? この 50kg は検定の基準値 μ 0 でありこの値は医学的に意義のある値を設定する例えば医学的な正常値治療前の平均値等この問題を検討するために日本人全体から無作為に 100 名の標本集団を抽出して体重を測定したところ平均値が 60kg 標準偏差 ( 不偏標準偏差 ) が 10kg だったとすると 95% 信頼区間 :μ=60±2 10 100 =60±2 μ=58 62 この推定結果から日本人の平均体重 = 母平均 μ は 95% の確率で 58~62kg の間にあるつまり μ は 95% 以上の確率で 50kg ではないと言えるしたがって 1-14

統計学的結論 : 日本人の平均体重は 50kg ではない問題の答えはという結論が 95% 以上の確率で正しく間違っている危険性は 5% 以下であるこの状態のことを有意水準 (significance level)5% で有意または危険率 (critical rate)5% で有意と表現する例えば 95% 信頼区間が 49~71kg だったとすると μ はひょっとすると 50kg かもしれず 95% 以上の確率で 50kg ではないと言い切れないしたがって統計学的結論 : 日本人の平均体重は 50kg ではないと断定できない問題の答えは保留この状態のことを有意水準 5% で有意ではないと表現するこの結論は統計学的結論 : 日本人の平均体重は 50kg である問題の答えはとは違うことに注意! 例えば 95% 信頼区間が 49~51kg だったらこの結論を採用しても良い保留というと何となく非科学的な感じがするかもしれないが不確かなデータから得られた結果を解釈する時は確定的なことを断言する方がかえって非科学的になる得られたデータから結論できる限界を明確にすることが科学的 1-15

推定を利用した検定を母集団側から見て手順化したものが有意性検定 σ H 0 : μ=μ 0 SD n SE= SD n n 例を無作為抽出して標本平均を無限回求める標本平均を t 値に変換する t= m μ 0 SE SE t =1 μ=μ 0 母集団の分布 α/2 α/2 α/2 α/2 p/2 m L m=μ 0 m U -t(n-1,α) 0 t(n-1,α) t(n-1,α) SE t 分布 t o μ L m μ U 標本平均の分布と信頼区間図 1.8 有意性検定の模式図母集団は永遠に不明のため標本集団のデータから母数を推測しそれによって推定や検定の原理を考える方が研究者にとってはわかりやすいしかし母集団は変動せず標本集団のデータが変動するため母集団を基準にして推定や検定の原理を考える方が数学者にとってはわかりやすい < 有意性検定 (test of significance) の手順 > (1) 問題を設定する問題 : 日本人の平均体重は 50kg か? μ=μ 0 =50? (2) 帰無仮説 (null hypothesis) と対立仮説 (alternative hypothesis) を設定する帰無仮説 H 0 : 日本人の平均体重は 50kg である μ=μ 0 または δ=μ-μ 0 =0 対立仮説 H 1 : 日本人の平均体重は 50kg ではない μ μ 0 または δ=μ-μ 0 0 1-16

(3) 有意水準 = 危険率 α(α エラー ) を決める 1. 統計学の基本的な概念有意水準を 5% にする α=0.05 信頼係数 (1-α)=0.95 (4) 母集団から n 例の標本集団を無作為抽出する日本人全体から 100 名の人を無作為抽出標本集団 (5) 標本集団のデータを測定して要約値を求める 100 名の体重を測定標本平均 m=60 不偏標準偏差 SD=10 (6) 帰無仮説が正しいと仮定した時の母集団を想定しその母集団から n 例の標本集団を無作為抽出して標本平均を求めそれを無限回繰り返した時の標本平均の分布を描く図 1.8 の母集団の分布と標本平均の分布 μ=μ 0 =50 σ SD=10 SE=1 (7) その標本平均の分布で母平均を中心にして標本平均の (1-α) が含まれる範囲を求めるこの時範囲から外れる左右の端の α/2 の部分を棄却域という図 1.8 の標本平均の分布で標本平均の 95% が含まれる範囲 2 SE=2 より下限 m L =48 上限 m U =52 下側棄却域 : 48 以下上側棄却域 : 52 以上 ( 図 1.8 の標本平均の分布の薄い灰色部分 ) 95% が含まれる範囲の幅は 95% 信頼区間と同じ ( 推定の原理 ) 信頼区間は 60±2 SE より下限 μ L =58 上限 μ U =62 (8) 実際の標本平均 m が棄却域に入っているかどうかを調べる方法 1:m と棄却域の上限または下限を比較する図 1.8 よりこの方法は母平均の 95% 信頼区間 58~62 に基準値 50 が入るかどうかを調べることと同じであることがわかる 60 は上側棄却域の下限 52 よりも大きいから棄却域に入っている 1-17

方法 2:(m-μ 0 ) を SE 単位で測った値 t o =(m-μ 0 )/SE が (m U -μ 0 ) を SE 単位で測った値 (m-μ 0 )/SE よりも大きいかどうか調べる標本平均から μ 0 を引きそれを SE で割った値を t とすると t は図 1.8 の一番右側のような t 分布になるこの t 分布で (m L -μ 0 )/SE=-t(n-1,α) (m U -μ 0 )/SE=t(n-1,α) これは信頼区間を求める時に SE に掛ける係数 t(n-1,α) 2 である t o =(m-μ 0 )/SE=(60-50)/1=10>2 で 2 よりも大きいから棄却域に入っているデータから平均値を引いて標準偏差で割るとデータの分布の平均値が 0 に標準偏差が 1 になるこれをデータの標準化という t 値は (m-μ 0 ) というシグナルを SE というノイズで割った S/N 比と解釈することも可能方法 3: 図 1.8 の t 分布において t o から右側の濃い灰色の部分の面積 ( 確率 )=p/2 を計算し (t 値の p 値変換 ) それが α/2 よりも小さいかどうか調べる実際には t o から右側の分布の面積を 2 倍した値を有意確率 p 値といいこの値が α よりも小さいかどうか調べる t o =10 から右側の分布の面積 2=p=10-16 <0.05 だから棄却域に入っている (9) m が棄却域に入っている時帰無仮説が正しい確率は α 以下になり対立仮説が正しい確率は (1-α) 以上になるそこで有意水準 α で有意として対立仮説を統計学的結論として採用する有意水準 5% で有意統計学的結論 : 日本人の平均体重は 50kg ではない (10) m が棄却域に入っていない時は帰無仮説が正しい確率が α よりも大きくなるそこで有意水準 α で有意ではないとして統計学的結論を保留する有意水準 5% で有意ではない統計学的結論 : 保留 (11) 統計学的結論を科学的に評価して実質科学的結論を下す有意の時母集団の平均体重の推測値 60kg は基準値 50kg に比べて 10kg 重いこれは医学的に見ると意義のある差である 1-18

医学的結論 : 日本人の平均体重は 50kg ではなくそれよりも重い有意ではない時母集団の平均体重の推測値 60kg は基準値 50kg に比べて 10kg 重いこれは医学的に見ると意義のある差だが推測値の信頼性が低いため確実なことは言えない医学的結論 : 日本人の平均体重は 50kg よりも重い可能性があるがデータの信頼性が低いので結論は保留する 1-19

有意差ありは実質科学的に差があるという意味ではない n=4000000 SD=10 SE=0.005 95% 信頼区間 50.001 ~ 50.019 n=15 SD=20 SE=5.2 95% 信頼区間 48.9 ~ 71.1 m=50.01 μ 0 =50 図 1.9 有意でも実質科学的には無意味な差 μ 0 =50 m=60 図 1.10 実質科学的に意味があっても有意ではない差有意数学的に意味が有るつまり統計学的結論の信頼性が高い有意ではない数学的に意味が無いつまり統計学的結論の信頼性が低いはっきり言えば統計学的結論を保留する有意水準 =(1- 信頼係数 )= 危険率間違っている危険性がこの値以下の統計学的結論だけを採用することを表す統計学的結論の合格水準有意差あり= 実質科学的に有意義な差があるや有意差なし= 実質科学的に有意義な差はない= 等しいという解釈は大いなる誤解このような誤解症状は有意症 (significantosis) とか有意症症候群 (significant syndrome) と呼ばれる難治性疾患の一種であり各種学会や厚生労働省等で大流行しているこの疾患の予防策の第一歩は有意差ありや有意差なしという誤解されやすい用語を使わず差は有意であるや差は有意ではないという用語を使うことである 1-20

統計学の役目はデータの要約と要約値の数学的な信頼性を評価すること標本集団のデータ要約値 ( 統計量 ) 検定有意である要約値の実質科学的評価有意ではない再実験統計学的結論保留実質科学的結論統計学の守備範囲実質科学の守備範囲統計学の役目はデータを要約して要約値が数学的にどの程度信頼できるかを確率的に評価しそれらの情報を実質科学的に評価してもらうために研究者に提供することであるその要約値が実質科学的に有意義かどうかを評価するのはあくまでもその分野の研究者の役目である統計学の守備範囲と実質科学の守備範囲を混同しないこと! 1-21

1.5 統計的仮説検定の考え方 1. 統計学の基本的な概念統計的仮説検定は検出差を設定して有意ではない時も結論を採用する δ*=5 μ L m μ U 95% 信頼区間に μ 0 が含まれない有意水準 5% で有意 μ μ 0 =50 μ 0 -δ*=45 μ L μ 0 =50 m μ U μ 0 +δ*=55 図 1.11 信頼区間と統計的仮説検定 95% 信頼区間に μ 0 が含まれる有意水準 5% で有意ではない μ<μ 0 +δ*=55 有意性検定は検定結果が有意の時だけ結論を採用し有意ではない時は結論を保留するこの曖昧さを改善するために開発された手法が統計的仮説検定 (statistical hypothesis testing) 例えば第 3 節の有意性検定と同じ問題を設定し日本人全体から 100 名の標本集団を抽出して体重を測定したところ平均値が 51kg 標準偏差( 不偏標準偏差 ) が 10kg だったとすると問題 : 日本人の平均体重は 50kg か? 95% 信頼区間 :μ=51±2 10 100 =51±2 μ=49 53 95% 信頼区間に基準値 50kg が含まれているため有意水準 5% で有意ではない統計学的結論 : 日本人の平均体重は 50kg ではないと断定できないため結論保留ここで体重の医学的な許容範囲または誤差範囲を ±5kg 以内とするつまり ±5kg よりも小さい体重の変動は医学的に意義がなく無視できるとすると 45~55kg 以内の体重は実質的に 50kg と変わらないことになる 49~53kg という信頼区間はこの許容範囲にすっぽりと入っているから次のような結論が 95% 以上の確率で正しいことになる 1-22

統計学的結論 : 日本人の平均体重は 45kg よりも重く 55kg よりも軽い = 日本人の平均体重は実質的に 50kg と等しい問題の答えはこの結論は統計学的結論 : 日本人の平均体重は 50kg である問題の答えはとは違うが医学的には実質的に同じ意味になる ±5kg は医学的な許容範囲であり ( 最小 ) 検出差 (scientific significant difference) と呼ばれる統計的仮説検定は検出差つまり実質科学的な許容範囲または誤差範囲と信頼区間つまり数学的な誤差範囲を利用して検定結果が有意ではない時も結論を採用することができる 1-23

推定と検出差を利用した検定を母集団側から見て手順化したものが統計的仮説検定 δ* δ* SE H 0 : μ=μ 0 α/2 m L t(n-1,α) SE p/2 m U α/2 t(n-1,2β) SE SE μ L μ 0 m μ U SE H 1 : μ=μ 0 - δ* H 1 : μ=μ 0 +δ* β β μ 0 - δ* m L m U μ 0 +δ* 図 1.12 統計的仮説検定の模式図 < 統計的仮説検定の手順 > (1) 問題を設定する問題 : 日本人の平均体重は 50kg か? μ=μ 0 =50? (2) 帰無仮説と対立仮説と検出差を設定する帰無仮説 H 0 : 日本人の平均体重は 50kg である μ=μ 0 または δ=μ-μ 0 =0 1-24

対立仮説 H 1 : 日本人の平均体重は 45kg または 55kg である μ=μ 0 ±δ*=μ 0 ±5 または δ=μ-μ 0 =±δ*=±5 有意性検定の対立仮説日本人の平均体重は 50kg ではないは帰無仮説の否定であり具体的な仮説ではないそれに対して上記の対立仮説は具体的な仮説である点に注意 (3) 有意水準 α(α エラー ) と検出力 =1-β(β エラー ) を決める有意水準を 5% にする α=0.05 信頼係数 (1-α)=0.95 検出力を 80% にする (1-β)=0.8 β=0.2 (4) 母集団から n 例の標本集団を無作為抽出する日本人全体から 100 名の人を無作為抽出標本集団 (5) 標本集団のデータを測定して要約値を求める 100 名の体重を測定標本平均 m=51 不偏標準偏差 SD=10 (6) 帰無仮説が正しいと仮定した時の母集団と対立仮説が正しいと仮定した時の母集団を想定しその母集団から n 例の標本集団を無作為抽出して標本平均を求めそれを無限回繰り返した時の標本平均の分布を描く図 1.12 の 3 種類の標本平均の分布 μ 0 =50 μ 0 -δ*=45 μ 0 +δ*=55 SE=1 (7) 帰無仮説が正しいと仮定した時の標本平均の分布で分布の左右の端にそれぞれ α/2 の面積の棄却域を設定する図 1.12 の標本平均の分布で標本平均の 95% が含まれる範囲 2 SE=2 より下限 m L =48 上限 m U =52 下側棄却域 : 48 以下上側棄却域 : 52 以上 ( 図 1.12 の中央の標本平均の分布の薄い灰色部分 ) この時図 1.12 の左側の標本平均の分布で m L =48kg 以上の範囲の面積 ( 確率 ) は β になり 1-25

右側の標本平均の分布で m U =52kg 以下の範囲の面積も β になるこれら 2 つの範囲は対立仮説の棄却域に相当する対立仮説の棄却域は左右の標本平均の分布の片側にしかなくその面積は β/2 ではなく β になるこれは μ=μ 0 -δ* と μ=μ 0 +δ* はどちらか一方しか起こらないため β を 2 つに分ける必要がないからである 95% 信頼区間は 51±2 SE より下限 μ L =49 上限 μ U =53 (8) 実際の標本平均値 m が棄却域に入っているかどうかを調べる方法 1:m と棄却域の上限または下限を比較する 51 は上側棄却域の下限 52 よりも小さいから棄却域に入っていない方法 2:μ 0 と m の距離 (m-μ 0 ) が (m U -μ 0 ) よりも大きいかどうか調べる 51-50=1 は 52-50=2 よりも小さいから棄却域に入っていない方法 3:t 分布において t o から右側の確率 =p/2 を計算して 2 倍しそれが α よりも小さいかどうか調べる t o =1 から右側の分布の面積 2=p=0.3198>0.05 だから棄却域に入っていない (9) m が棄却域に入っている時は有意水準 α で有意として帰無仮説を否定した仮説を統計学的結論として採用する有意水準 5% で有意統計学的結論 : 日本人の平均体重は 50kg ではないこれは対立仮説日本人の平均体重は 45kg または 55kg であるの採用ではない点に注意! (10) m が棄却域に入っていない時は有意水準 α で有意ではないとして対立仮説を否定した結論を統計学的結論として採用する有意水準 5% で有意ではない統計学的結論 : 日本人の平均体重は 45kg よりも重く 55kg よりも軽い (11) 統計学的結論を科学的に評価して実質科学的結論を下す 1-26

有意の時母集団の平均体重の推測値 51kg は基準値 50kg に比べて 1kg 重いこれは医学的に見ると意義のない差である医学的結論 : 日本人の平均体重は 50kg ではないが実質的には 50kg と変わらない有意ではない時母集団の平均体重は 45kg よりも大きく 55kg よりも小さいこれは医学的に見ると実質的に 50kg と等しい医学的結論 : 日本人の平均体重は実質的に 50kg と等しい統計的仮説検定には 2 種類のエラーがある真実統計的結論有意 :μ μ 0 有意ではない : μ-μ 0 <δ* H 0 :μ=μ 0 α 1-α H 1 :μ=μ 0 ±δ* 1-β β α:α エラーまたは第 1 種のエラーまたはアワテの言い過ぎ帰無仮説 μ=μ 0 が正しい時にアワテて μ μ 0 と言い過ぎてしまう確率偽陽性率 β:β エラーまたは第 2 種のエラーまたはボンヤリの見逃し対立仮説 μ=μ 0 ±δ* が正しい時にボンヤリしていて μ-μ 0 <δ* と見逃してしまう確率偽陰性率 1-β: 検出力対立仮説 μ=μ 0 ±δ* が正しい時に μ μ 0 と違いを検出する確率感度普通は α=0.05 β=0.2 つまり有意水準を 5% 検出力を 80% 程度にするしかし α エラーと β エラーは同等なので本当は α=β にするのが合理的である 1-27

検定には片側検定と両側検定がある次のような限定した問題の場合対立仮説が単純になり帰無仮説が正しいと仮定した時の標本平均の分布と対立仮説が正しいと仮定した時の標本平均の分布は図 1.13 のようになる問題 : 日本人の平均体重は 50kg よりも重いか? μ>μ 0 =50? 帰無仮説 H 0 : 日本人の平均体重は 50kg である μ=μ 0 または δ=μ-μ 0 =0 対立仮説 H 1 : 日本人の平均体重は 55kg である μ=μ 0 +δ*=μ 0 +5 または δ=μ-μ 0 =+δ*=+5 δ* SE H 0 : μ=μ 0 t(n-1,2α) SE p m U α t(n-1,2β) SE μ L μ 0 m μ U SE H 1 : μ=μ 0 +δ* β m U μ 0 +δ* 図 1.13 統計的仮説検定の模式図 ( 片側検定 ) 1-28

図 1.13 のように帰無仮説が正しいと仮定した時の標本平均の分布の片側だけに棄却域を設定する検定を片側検定 (one-taild test) といい図 1.12 のように分布の両側に棄却域を設定する検定を両側検定 (two-taild test) という < 片側検定の特徴 > 有意水準 α を分布の片側だけに割り振るため棄却域の下限値 m U が両側検定の m U よりも少し小さくなる統計学の教科書などに載っている t 分布表は普通は両側検定用なので片側検定の時は t(φ,2α) を用いる必要がある検定の基本は片側検定であり問題に合わせて適切な検定統計量を選択すれば全ての検定は片側検定として実施可能区間推定にも片側信頼区間と両側信頼区間がある片側信頼区間は下限を-- にして上限を μ U するか下限を μ L にして上限をにするしかし片側信頼区間は不自然で使いづらいので普通は両側信頼区間を用いる F 検定は t 検定の両側検定と同等の片側検定 σ SD n SE= SD n n 例を無作為抽出して標本平均を無限回求める標本平均を F 値に変換する F=( m μ 2 0 SE ) p/2 p μ=μ 0 m=μ 0 m 0 F 母集団の分布標本平均の分布 F 分布図 1.14 標本平均の分布と F 分布問題 : 日本人の平均体重は 50kg か? μ=μ 0 =50? この問題を検定したい時 t 値を平方した F 値を検定統計量にすれば t 検定の両側検定と同 1-29

等の検定を片側検定として行うことが可能このように F 値を利用した検定のことを F 検定という F 検定は分散分析でも用いられる両側検定は標本平均の分布の両側に棄却域を設定する検定であり母平均が基準値と異なっているかどうかつまり母平均が基準値よりも小さいかそれとも基準値よりも大きいかという 2 種類の仮説を検定するものではないので注意! 検定の基本は片側検定なので母平均が基準値よりも大きいか? という問題を検定したい時は片側の t 検定を用い母平均が基準値と異なっているか? という問題を検定したい時は片側の F 検定を用いるのがお薦め 1-30

統計的仮説検定は事前に試験の必要例数を計算しなければらない図 1.12 より統計的仮説検定では δ*={t(n-1,α)+t(n-1,2β)} SE という関係があるこの式と SE=σ/ n から標本集団の例数を理論的に求めることが可能それを必要例数の計算式といいこの式を利用して試験計画の段階で必要例数を求める n= [ {t(,α)+t (, 2β)} σ δ * ] 2 σ: 母集団の標準偏差推測値予備試験や先行研究の結果から推測 σ は事前の推測値のため実際に標本集団のデータから推測した母標準偏差推測値とは異なる時があるそこで試験終了後実際の例数と母標準偏差推測値から実際の検出差 δ を計算しそれが事前に設定した検出差 δ* 以下であるかどうかを検討するこれを検出力分析 (power analysis) という δ={t(n 1, α)+ t(n 1,2β)} SE SE= SD n 簡単に言えばこれは統計的仮説検定は信頼区間つまり数学的な誤差範囲を検出差つまり実質科学的な誤差範囲以下にしなければならないという意味である信頼区間の幅は SE に比例し SE は n に反比例して小さくなるため信頼区間を検出差以下にするのに必要な例数つまり標本集団の例数を理論的に求めることが可能になる 1-31

検定結果だけから実質科学的な判断をするのは危険! δ* (1) (2) (3) (4) (5) μ 0 -δ* (6) μ L m μ U μ 0 μ 0 +δ* 図 1.15 検定結果と信頼区間検定結果推定結果実質科学的な判断 (1) 有意ではない μ μ 0 (2) 有意ではない μ=μ 0 ~μ 0 +δ* 母平均は基準値とほぼ等しいこの結果だけでは判断できない検出力をもっと高くする必要がある ( 例数を増やす ) (3) 有意 μ 0 <μ<μ 0 +δ* 母平均は基準値と実質的に変わらない (4) 有意 μ μ 0 +δ* (5) 有意 μ μ 0 +δ* 母平均は基準値と実質的に変わらない可能性が高い母平均は基準値よりも大きい可能性が高い (6) 有意 μ 0 +δ*<μ 母平均は基準値よりも大きい図 1.15 と上表から実質科学的な判断は定性試験である検定結果よりも定量試験である推定結果に基づいた方が良いことと検定結果だけから実質科学的な判断をするのは危険であることがわかるこのことから検定廃止論を主張する統計学派が存在する実際生物学的同等性試験では推定結果を重視し検定結果は参考程度である 1-32

第 1 章演習問題第 1 問次の文章について正しいものにはを間違っているものにはを付けよ (1) 推測統計学は近代統計学と呼ばれることもある ( ) (2) 標準偏差はデータのバラツキ具合を表し標準誤差と呼ばれることもある ( ) (3) 検定は厳密な結論が得られるため検定を行えば推定を行う必要はない ( ) (4) 検定の有意水準は試験計画段階で決めておく必要がある ( ) (5) 有意差ありとは医学的に有意義な差があるという意味である ( ) 第 2 問次の文章の括弧の中に下記の罫線枠の中から適当な語句を選んで入れよ推測統計学は標本集団の要約値から ( 1 ) の要約値つまり母数を確率的に推測するがその推測方法には ( 2 ) と ( 3 ) の 2 種類がある ( 2 ) は母数がどのくらいの値なのかを推測する手法であり ( 4 ) に相当するそれに対して ( 3 ) は母数が実質科学的に有意義な基準値と等しいかどうかを式で推測する手法であり ( 5 ) に相当する母集団標本集団武装集団推定検定不安定定量試験定性試験共通 1 次試験第 3 問次の文章の括弧の中に適当な語句を入れよ統計的仮説検定では母平均と基準値が等しいという ( 1 ) が正しいにもかかわらずあわてて母平均と基準値は異なると言い過ぎてしまう確率 α のことを α エラーまたは ( 2 ) または ( 3 ) といいこれは診断学における ( 4 ) に相当するそれに対して母平均は基準値に ( 5 ) をプラスまたはマイナスした値と等しいという ( 6 ) が正しいにもかからわずぼんやりして母平均は基準値 ±( 5 1-33

) の範囲内であると差を見逃してしまう確率 β のことを β エラーまたは ( 7 ) といいこれは診断学における ( 8 ) に相当するそして (1-β) のことを ( 9 ) といい診断学における ( 10 ) に相当する第 4 問次の条件で行う試験について必要例数を求めよまたその試験の結果について検出力分析を行い試験の検出力が事前の条件を満足しているかどうかを検討せよ試験内容 : ある疾患について評価項目の平均値を基準値と比較する試験 (1 群試験 ) 試験条件 : 有意水準 5% 検出力 80% 評価項目の検出差 2 母標準偏差推測値 5 試験結果 : 例数 61 例評価項目の不偏標準偏差 6 t(,0.05)=1.96, t(,0.4)=0.842, t(60,0.05)=2, t(60,0.4)=0.848 第 5 問有意性検定と統計的仮説検定の違いを説明し両者の長所と短所について論ぜよ 1-34