禁無断転載第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものはばらつきを持っています収集したデータを分析していくためにはこのばらつきがどのような分布にな

第 3 章統計的手法に用いられる分布第節我々の身の回りにある代表的分布と性質. 分布の表わし方我々の身の回りにある全てのものはばらつきを持っています収集したデータを分析していくためにはこのばらつきがどのような分布になっているかを明確に表現し分析比較を行えるようにしなければなりませんこの手法を覚えるようにしましょう () 分布の示し方収集した分布の全体的状態を目視で確認比較するためにはデータの分布について度数表を作成しヒストグラム (histogram) にすることが基本です実務的にはヒストグラムが作成できるほどデータが収集できている場合にはかなりの分析が可能となります () 分布の特性の分析比較分布の特性を分析比較するためには分布の特性を数量化する必要がありますこの代表的なものにはそのデータの集団を代表する値すなわち中心的な値とそれに対するばらつきの程度があります一般に中心的な値中心値 ( メディアン ) 算術平均などばらつきの程度分散標準偏差など (3) 統計的方法での分布の表わし方分布を統計的方法で分析比較できるようにするためには確率 (probability) の分布で表すことです確率とはある事象が起こりえる確からしさであり 0~ の範囲で表しますその意味は確率絶対に起きる確率 0.5 起きる確率が/である確率 0 絶対に起きないとなります確率の分布は扱う対象が計量値 (variable) 計数値 (discrete value) に応じて以下のように表されます -6-

確率確率) 計量値それぞれの値に対する確率を示す曲線は図 3- のようになりますこの分布を示す関数 f(x) は確率密度関数 (probability desity fuctio) と呼びますこの関数が作る全体の面積はとなります ò + - f ( x) = (3.) 区間 a~b に入る確率は b ò f ( x) = P( x a x b) (3.) a 計量値分布する値 ( 測定値など ) 図 3-- 計量値の確率分布 ) 計数値それぞれの値に対する確率の分布は図 3- のようになりますこの各回数個数の確率の和はとなります å i P = (3.3) i 計数値分布する値 ( 個数など ) 図 3-- 計数値の確率分布. 代表的分布と性質 () 分布の分類と代表的分布計量値計数値の代表的な分布は以下のようになります計量値 ( 長さ重量などの連続した値 ) の分布正規分布計数値 ( 個数不良点数などの数えることのできる値正の整数 ) の分布項分布ポアソン分布以下正規分布項分布ポアソン分布の性質を解説します () 正規分布 (ormal distributio) 理論上実用上とも最も重要な分布です自然界社会に存在するもので無作為にばら -7-

つくものは基本的に本分布に従います分布関数は下記で示されます平均 μ 標準偏差 σとすると ( x - m) y = f ( x) = exp[ - ( ) ] (3.4) ps s ) 本分布に従うもの本分布に従うものには下記がありますランダムに分布する長さ重量等で例として人の身長体重等真と値と収集したデータとの差等で例として測定誤差等標本の分布( 母集団が正規分布以外でも ) 項分布等が極限でとる分布等 ) 規準化 ( - m) 規準化 (ormalizatio) とは一般の正規分布に対して変換 : u = x を行い平均 s 0 標準偏差に変換することをいいますなお規準化された分布関数は N(0, ) で表します規準化された正規分布において標準偏差をσとすると ±uσ 内 (u は整数 ) に分布する確率は以下のようになります u=± ± ±3 以内に入る確率 -σ ( 値 ) +σ 確率 0.683 -σ ( 値 ) +σ 0.954-3σ ( 値 ) +3σ 0.997 0.5 0.34 0.34 0.36 0.36 0.0 0.0 Z 0-5 -4-3 - - 0 3 4 5 図 3--3 標準正規分布 3) 本分布の代表的性質 -8-

独立に正規分布に従う X( 平均 x 分散 σ ) と Y( 平均 y 分散 σ ) について確率変数 Z=X+Y の分布は正規分布 ( 平均 x + y 分散 σ +σ ) に従います (3) 項分布回の試行である事象が発生する確率がpであるときに試行を独立に回繰り返したとき ( ベルヌーイの試行 ) その事象が発生する回数 xの分布を表しますこの場合着目した事象の発生する回数がxとなる確率は P x ( ) ( )! p x!( - x)! ( p) x -x x ( -x) = x p - p = - (3.5) となります ) 本分布に従うものサイコロを回ふったときある目がでる回数の分布不良率 pの無限母集団から大きさのサンプルを抽出したときサンプル中の不良品個数の分布等 ) 本分布の性質本分布の性質としては以下があります平均値は p 標準偏差は p( - p) となります p 5 p 0.5 のときには正規分布として近似して考えることができます図 3--4 に試料の大きさが 50 で事象の発生確率が 0. 0.3 0.5 0.7 0.9 の場合の項分布の確率分布を示します 0. 発生確率 (Px) 0.5 0. 0.05 事象の発生確率 (p) 0. 0.3 0.5 0.7 0.9 0 0 0 0 30 40 50 試行回数 () 図 3--4 項分布 -9-

- 補足 - 項分布の正規分布近似 ( ラプラスの定理 ) について X,X,,X を二項分布 Bi(,p) にしたがう確率変数とするとき x + x + x p( - p) - p は正規分布 N(0,) に法則収束しますすなわち lim P( a x + x x p( - p) - p b) = ò b a e p - x dx となります ( ラプラスの定理 ) ( 注 ) 法則収束とは P(X=x)=0 なるすべての x について lim P( X x) = P( X x) のとき {X} は X に法則収束すると言います [ 証明 ] 中心極限定理すなわち, X lim P( s x - m y s = は正規分布 N(0,) に法則収束することを用います - - = ò y x m y) e - p dx において X = X + X + X s = p( - p) を代入すると証明できますまた, このときの確率密度関数もを十分大きくとれば正規分布に近づきますつまり æö - x x -x limç p ( - p) = e x p p( - p) è ø が成り立ちます次にこのことを少々証明がややこしいですが見てみることにしましょうスターリングの公式を用います + = p - J! e e 0 J スターリングの公式により -0-

ö x -x p x ( - p) -x p ( - p) = æ ç è xø ( ) p x( - x) ( ) ( x - x このとき x = p + t p( - p) とおきテイラーの定理よりとを用いますのとき log( p p ) x = -( p + t p( - p) log( + t - ) x p ( p) log( ) - x = -t p( - p) - ( - p) t - -x = -( ( - p) - t = t p( - p) - pt p( - p) log( - t ) log( p ) ( - p) ( - p) p p( - p)( + t )( + t p ( - p) log( ) = - log ( - x) s s) = s - + であるこ ( p) p p log p( p) ( t t ) ( t t î íì - - = - - + - + - p p ( - p) p ( - p) )} よって log ö ç p è xø æ x -x ( - p) = -log p - log p( - p) - t (4) ポアソン分布ポアソン分布 (Poisso distributio) とは項分布で p=mを一定にしておいてを無限大にしたときの極限の分布です回の試行で発生する確率が極めて小さい事象が非常に大きな数の独立な繰り返しの下で発生する回数の分布を表します事象の発生する回数 xの確率は P x -m x e m = (3.6) x! で表されます --

) 本分布に従うもの安定した工程の下での一定の大きさのサンプル中の欠点数一定時間内のシステムや機械の偶発的な故障等の点数一定時間内に発生する電話の呼び出し等の発生件数一定期間内の交通事故の死者の数等 ) 本分布の性質平均値分散ともm=p となります X Y がそれぞれポアソン分布 P(λ) P(μ) に従う独立な分布の場合確率変数 X +Y はポアソン分布 P(λ+μ) に従う参考のため図 3--5 に試行回数 () が 0 平均値(m=p) が 0.5 3 5 0 の場合のポアソン分布の例を示します 0.7 事象の発生する回数の確率 (Px) 平均値 (m=p) 0.5 3 5 0 0 0 5 0 5 0 試行回数 () 図 3--5 ポアソン分布の例第節統計量の分布と特性. 統計量とは () 母集団と試料通常我々が必要とする情報は実際に対象としているもの ( 母集団と呼びます ) から得ることはできませんこれは実際に対象としているものがあまりにも膨大であったりまたデータなどを得る手段自体がないなどからですしたがって実際の測定実験などを行うために母集団から抽出 ( サンプリングと呼びます ) したもの ( 試料と呼びます ) で進めますこの母集団と試料を整理すると以下のようになります --

サンプリング ( サンプリングとは ) 母集団から適当な試料 ( 標本 ) を抽出すること ( サンプリング手法 ) 無作為抽出母集団が均一の場合群に分けて抽出母集団が不均一の場合測定実験など試料試料から母集団の情報を得る母集団母集団から必要とする情報を得ることは困難 ( データが膨大など ) 図 3-- 母集団と試料 ) 母集団 (populatio) 実際の調査研究の対象となるものを示します通常集団として大き過ぎたりデータを得る手段がないなどのため母集団から直接必要とする情報は得ることはできませんなお母集団には以下のように有限母集団と無限母集団があります有限母集団単位体の数が有限量無限母集団単位体の数が無限 ( 例 ) 製品の製造工程 TV 番組の視聴率世界の人々の身長体重等 ) 試料 (sample) 母集団からその特性を調べるために抜き取ったもの ( 標本サンプル ) を呼びますなお母集団から抜き取った個以上の単位の組単位体の数を試料の大きさと呼びます試料の例としては工程ごとの抜き取りサンプル TV 視聴率調査のモニタ家庭等があります () 区別が必要な母数と統計量母集団の特性を示す統計上の値例えば平均分散標準偏差などは母平均母分散母標準偏差などと呼びますまたこれらをまとめて母数 (populatio parameter) と呼びますこれに対して試料から直接得られる平均分散標準偏差などは統計量 (statistics value) と呼びます留意すべきことは母数と統計量は明確に区別して扱う必要があることです真に必要な情報は母数なのですが実際には統計量から推測することになりますこの場合必ず誤差が入っているので明確に区別して扱う必要があります -3-

母集団サンプリング試料真の情報 ( 知りたい情報 ) 未知母数実験測定など扱える情報統計量 ( 知りたい情報 ) 母平均母分散母標準偏差など母数に対して必ず誤差がついている試料から得られた平均分散標準偏差など母数と統計量は明確に区別して扱う必要がある図 3-- 母数と統計量. 統計量の分布と基本的特性我々が直接扱えるのは通常母集団からサンプリングした試料から得られる統計量ですところが知りたい真の情報は母集団の特性を示す母数ですこのため試料の統計量から母集団の特性を推定することになりますこのとき必要なことはこの統計量の分布と基本的特性です () 統計量の分布が意味するものは母数に対して統計量には誤差が付いていますこれはたとえ同じ母集団の試料でも複数回サンプリングして得られたそれぞれの複数の試料の統計量はそれぞれ異なることから明らかです母数を推定するためには統計量にどのような誤差の付き方をしているかを知ることすなわち統計量がどのように分布しているかを知ることが必要です一般には母集団は正規分布 ( 項で後述します ) をしている母集団は無限母集団で試料の抽出はランダムサンプリングを行ったという前提で扱います試料の統計量を分析母集団の母数を推定するためには統計量の分布を知ることが必要統計量の分布母数に対して統計量への誤差の付き方 ( 前提 ) - ランダムな分布とランダムなサンプリング母集団は正規分布をしている母集団は無限母集団で試料はランダムサンプリングで抽出した図 3--3 統計量の分布を知る必要性 -4-

() 試料平均 ( x ) の分布母集団の平均値が μ 標準偏差が σ とすると試料の大きさから得られる平均値 ( x ) と標準偏差 (s) の分布は以下のようになります平均値の平均値 ( x ) μ( 母集団の平均値 ) 平均値の標準偏差 (s) s ( 母集団の標準偏差の倍 ) 留意点はの正規分布となります平均値の標準偏差が倍となる大数の法則 (law of great umbers): 試料の大きさが増加すると母平均に近づく母集団が正規分布でなくても試料平均値の分布は正規分布となる中心極限定理 (cetral limit theorem) (3) 試料分散 (s ) の分布母集団の平均値が μ 標準偏差が σ の場合試料の大きさから得られる分散 (s) の分布は分散の平均値 ( x ) ( - ) s 分散の標準偏差 (s) ( -) s の分布となります正規分布とはならないことに注意してください留意点は分散の推定値 ( 母集団の分散に最も近い値 ) は ( s -) です試料の分散 s ではありません ( 誤りやすいので注意をして下さい ) ( -) 理由 : 試料の大きさから得られる分散は s であるためなお最も母集団の分散に近い値とされる ( と呼びます s -) 試料から求める分散は通常不偏分散を用いますを不偏分散 (ubiased variece) -5-

不偏分散 : V = s = ( -) S f ( 偏差平方和 / 自由度 ) (3.7) ここで φ=- を自由度とよびます自由度 φ が無限大の時には V = s ( 母分散 ) となります 3. 統計量の分布関数と基本的特性 () カイ二乗分布母集団の分散について検定推定を行うときに用いる分布にカイ二乗分布 (chi-square distributio) があります ) 定義大きさの試料について偏差平方和 Sを母分散 σ で割った値の和 c ü å å í ì - S ( xi - x) ( xi x) = = = ý s i s i î s (3.8) þ について χ は自由度 φ=- のカイ二乗分布となります x なお試料平均ではなく母平均を用いた統計量 : = å - ( i m) c は自由度 φ= s のカイ二乗分布となります i 確率密度 0.8 0.6 0.4 自由度 3 5 7 0. 0 0 5 0 5 χ 図 3--4 カイ乗分布 ) 特性母集団として仮定している正規分布の母平均や母分散の値に係らず -6-

カイ二乗分布 ( s S の分布 ) はが等しければ同じとなります本分布の平均は分散はですが大きくなると中心が右側に移り偏平となります加法性があります χ +χ は自由度 φ +φ のカイ二乗分布となります 3) 応用母分散に対する検定推定に用いられます - 補足 - カイ二乗分布の数式表示とガンマ関数カイ二乗分布は数式では f f - -c ( c ) e ( c ) = f G( f ) f χ 0 (3.9) で表されますここで Γ(λ) はガンマ関数ですガンマ関数はあらゆる実数 λ(λ > 0 ) について, 次の積分によって定義されます ò l- -x x e 0 l (3.0) G( ) = dx ガンマ関数は λ! を解析接続した関数でありこれを部分積分すると Γ (λ ) = (λ - ) Γ (λ - ), λ (3.) という関係が導かれます特に λ が正の整数のときは, Γ (λ ) = (λ- )! (3.) が成り立ちますここで Γ() = 0!= ですから自然数 λ に対して Γ(λ+) =λ! (3.3) が成り立つことがわかります少し難しくなりますが解析接続により Γ(λ) を λ = 0,-, -,... を除く複素数全体で定義された有理型関数に拡張することができますこのことからガンマ関数を自然数の階乗を複素関数に拡張したものと捉えることができますガンマ関数はふつうこの拡張されたものを指していますガンマ関数の関数としての性質は零点を持たないことがあります点 λ =- ( N) において一位の極を持ちますそしてその留数は Re s( (-),-) =! G (3.4) となりますまたガンマ関数は無限乗積を用いて表示することができますこの表示は実際に複素数を用いた時の計算に有効とされていますまた数値解析では主にこれを用いて近似を行っています λ を非正整数でない複素数とすれば -7-

G( e ) = -gl Õ l = l ( + ) l - e l (3.5) ここで γ はオイラーの定数 ( オイラーマスケローニ定数 (Euler-Mascheroi costat) オイラーの γ (Euler s gamma) とも呼ばれますこの値はおよそ 0.577... です ) を表します以下にいくつかのガンマ関数の例を上げます ()t 分布 t distributio 母分散が未知の場合に母平均の検定推定を行う場合に用いる分布です ) 定義大きさの試料平均に対して ( x - m) t = ( ここで s ( e ) S s e = V = ) とするとき f t は自由度 :φ=- の t 分布となります ) 特性自由度によって形が変わる左右対称であるのとき正規分布となりますなお自由度が 30 以上であれば正規分布で近似できます 0.5 確率密度 0.4 0.3 0. 自由度 3 5 30 0. 0-4 - 0 4 t 図 3--5 t 分布 -8-

3) 応用母分散が未知のときの母平均の検定推定に用いますなお母分散が既知のときは正規分布で検定推定を行います () F 分布 (F distributio) 等分散性の検定に用いる分布に F 分布があります ) 定義分散が等しい正規分布の母集団から大きさと大きさの試料から求めた不偏分散を S S V = V = として -) -) ( ( V V F = とするとき F は自由度 φ =- φ =- の F 分布となります尚 F ( f, f, a) = F ( f, f, -a) です (α: 信頼度 ) ) 特性同一の母分散に対する独立な分散の比は F 分布に従います χ χ をそれぞれ自由度 φ φ のカイ二乗分布に従う独立な確率変数とすれば c f F = は F 分布となります c f ある分布 T が t 分布 t() に従うとすれば T は F 分布 ( ) に従います -9-

.5 確率密度 0.5 自由度 4 6 0 自由度 = 0 0 3 4 F 図 3--6 エフ分布 3) 応用等分散性の検定に用います第 3 節分布における確率の求め方統計的手法を用いるためにはそれぞれの分布における発生確率を求める必要があります各分布にはそれぞれ表が用意されていますまたパソコンの一般的な表計算ソフトであるエクセルには統計関数が準備されていますそれぞれの分布についてその分布表の使い方エクセルの統計関数の扱い方について以下解説します. 正規分布 () 正規分布表を使う場合始めに規準化します平均値 0 標準偏差がとなる正規分布に対応するように ( x - m) u = ± s の変換を行い u0 の値を求めます次に u0 の値での正規分布表の値を見ますその表に示す値が ± から u0 の値までの区間に入る両側の確率となりますしたがって片側の確率を求める場合には /とします () エクセルの統計関数を使う場合統計関数 NORMDIST(x, 平均, 標準偏差, 関数形式 ) を用いますここで -30-

x: 関数に代入する値を指定します平均 : 対象となる分布の算術平均 ( 相加平均 ) を指定します標準偏差 : 対象となる分布の標準偏差を指定します関数形式 : 計算に使用する指数関数の形式を論理値で指定します TRUE を指定すると累積分布関数 FALSE を指定すると確率密度関数の値が計算されます < 例題 > ある自動車の機械部品の長さが平均 6.3cm 標準偏差 3.6cm の分布をしていることがわかっているこのとき機械部品の長さが 3.0cm 以上となる確率を求める ( 解答 ) ) 表を使う場合 u0 の値は u0=(3.0-6.3)/3.6=.58 表 3- 正規分布表 ( 片側の確率 ) の値は 0.057 これは u0 までの片側の確率 (u0 ~ の範囲にある確率 ) であるから求める確率はそのままとなる ) エクセルを使う場合 NORMDIST(x, 平均, 標準偏差, 関数形式 ) として x=3.0 平均 =6.3 標準偏差 =3.6 関数形式 =TRUE( 累積分布関数 ) を入力します得られる値は 0.9433745 となります得られた値は - から 3.0cm すなわち 3.0cm 以下となる確率となりますから 3cm 以上となる確率は -0.9433745=0.05667755 となります表から得られた値とエクセルの統計関数を用いた値は少し違いがありますが本来厳密なものではありませんのでこの程度の差は問題となることはありません -3-

表 3- 標準正規確率表 ( 片側確率 ) Z 0.00 0.0 0.0 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.4960 0.490 0.4880 0.4840 0.480 0.476 0.47 0.468 0.464 0. 0.460 0.456 0.45 0.4483 0.4443 0.4404 0.4364 0.435 0.486 0.447 0. 0.407 0.468 0.49 0.4090 0.405 0.403 0.3974 0.3936 0.3897 0.3859 0.3 0.38 0.3783 0.3745 0.3707 0.3669 0.363 0.3594 0.3557 0.350 0.3483 0.4 0.3446 0.3409 0.337 0.3336 0.3300 0.364 0.38 0.39 0.356 0.3 0.5 0.3085 0.3050 0.305 0.98 0.946 0.9 0.877 0.843 0.80 0.776 0.6 0.743 0.709 0.676 0.643 0.6 0.578 0.546 0.54 0.483 0.45 0.7 0.40 0.389 0.358 0.37 0.96 0.66 0.36 0.06 0.77 0.48 0.8 0.9 0.090 0.06 0.033 0.005 0.977 0.949 0.9 0.894 0.867 0.9 0.84 0.84 0.788 0.76 0.736 0.7 0.685 0.660 0.635 0.6.0 0.587 0.56 0.539 0.55 0.49 0.469 0.446 0.43 0.40 0.379. 0.357 0.335 0.34 0.9 0.7 0.5 0.30 0.0 0.90 0.70. 0.5 0.3 0. 0.093 0.075 0.056 0.038 0.00 0.003 0.0985.3 0.0968 0.095 0.0934 0.098 0.090 0.0885 0.0869 0.0853 0.0838 0.083.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.07 0.0708 0.0694 0.068.5 0.0668 0.0655 0.0643 0.0630 0.068 0.0606 0.0594 0.058 0.057 0.0559.6 0.0548 0.0537 0.056 0.056 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455.7 0.0446 0.0436 0.047 0.048 0.0409 0.040 0.039 0.0384 0.0375 0.0367.8 0.0359 0.035 0.0344 0.0336 0.039 0.03 0.034 0.0307 0.030 0.094.9 0.087 0.08 0.074 0.068 0.06 0.056 0.050 0.044 0.039 0.033.0 0.08 0.0 0.07 0.0 0.007 0.00 0.097 0.09 0.088 0.083. 0.079 0.074 0.070 0.066 0.06 0.058 0.054 0.050 0.046 0.043. 0.039 0.036 0.03 0.09 0.05 0.0 0.09 0.06 0.03 0.00.3 0.007 0.004 0.00 0.0099 0.0096 0.0094 0.009 0.0089 0.0087 0.0084.4 0.008 0.0080 0.0078 0.0075 0.0073 0.007 0.0069 0.0068 0.0066 0.0064.5 0.006 0.0060 0.0059 0.0057 0.0055 0.0054 0.005 0.005 0.0049 0.0048.6 0.0047 0.0045 0.0044 0.0043 0.004 0.0040 0.0039 0.0038 0.0037 0.0036.7 0.0035 0.0034 0.0033 0.003 0.003 0.0030 0.009 0.008 0.007 0.006.8 0.006 0.005 0.004 0.003 0.003 0.00 0.00 0.00 0.000 0.009.9 0.009 0.008 0.008 0.007 0.006 0.006 0.005 0.005 0.004 0.004 3.0 0.003 0.003 0.003 0.00 0.00 0.00 0.00 0.00 0.000 0.000. カイ二乗分布 () カイ二乗分布表を使う場合 S c = のχ 0 の値を求めます s 発生する確率を設定し χ 0 でのχ 表の値を見ますその値が+ からの χ 0 までの区間の片側の確率です (χ は負の値を取り得ないため片側の確率となります ) () エクセルの統計関数を使う場合統計関数 CHIDIST(x, 自由度 ) を用いますここで -3-

x: 関数に代入する値を指定します自由度 : 対象となる分布の自由度を指定します < 例題 > 母集団の分散 (σ ) がとわかっている場合試料の大きさ 4 のサンプルで偏差平方和 (S)38 となることが確率 0.05 以上であり得るかを調べよ ( 解答 ) ) 表を使う場合 χ0 を求めると χ 0 =38 =3.8 確率 ( 有意水準 )0.05 で自由度 :φ=4-=3 の表 3- のχ 表を見ると 35.7 従って χ 表の値より小さいため発生する確率は 0.05 より大きいと言えます ) エクセルを使う場合 CHIDIST(x, 自由度 ) として x=3.8 自由度 =3 を入力します得られる値は 0.04375 となります得られた値はから 3.8 すなわち 3.8 以上となる確率となりますから 3cm 以上となる確率は -0.9433745=0.05667755 となり発生する確率は 0.05 より大きいと言えますなおこのような場合別の統計関数 CHIINV( 確率, 自由度 ) を使うこともできますこの場合確率 =0.05 自由度 =3 を入力すると得られる値は 35.746 すなわち χ0 が 35.746 より大きければ発生する確率は 0.05 より小さい 35.746 より小さければ発生する確率は 0.05 より大きいとなりますから確率 0.05 より大きいと言えます表から得られた値とエクセルの統計関数を用いた値は少し違いがありますが本来厳密なものではありませんのでこの程度の差は問題となることはありません -33-

表 3- カイ二乗分布表 α ν 0.99 0.98 0.95 0.9 0.8 0.7 0.5 0.3 0. 0. 0.05 0.0 0.0 0.00 0 0 0 0.0 0.06 0.5 0.45.07.64.7 3.84 5.4 6.63 0.83 0.0 0.04 0. 0. 0.45 0.7.39.4 3. 4.6 5.99 7.8 9. 3.8 3 0. 0.8 0.35 0.58.0.4.37 3.66 4.64 6.5 7.8 9.84.34 6.7 4 0.3 0.43 0.7.06.65.9 3.36 4.88 5.99 7.78 9.49.67 3.8 8.47 5 0.55 0.75.5.6.34 3 4.35 6.06 7.9 9.4.07 3.39 5.09 0.5 6 0.87.3.64. 3.07 3.83 5.35 7.3 8.56 0.64.59 5.03 6.8.46 7.4.56.7.83 3.8 4.67 6.35 8.38 9.8.0 4.07 6.6 8.48 4.3 8.65.03.73 3.49 4.59 5.53 7.34 9.5.03 3.36 5.5 8.7 0.09 6. 9.09.53 3.33 4.7 5.38 6.39 8.34 0.66.4 4.68 6.9 9.68.67 7.88 0.56 3.06 3.94 4.87 6.8 7.7 9.34.78 3.44 5.99 8.3.6 3. 9.59 3.05 3.6 4.57 5.58 6.99 8.5 0.34.9 4.63 7.8 9.68.6 4.7 3.6 3.57 4.8 5.3 6.3 7.8 9.03.34 4.0 5.8 8.55.03 4.05 6. 3.9 3 4. 4.77 5.89 7.04 8.63 9.93.34 5. 6.98 9.8.36 5.47 7.69 34.53 4 4.66 5.37 6.57 7.79 9.47 0.8 3.34 6. 8.5.06 3.68 6.87 9.4 36. 5 5.3 5.98 7.6 8.55 0.3.7 4.34 7.3 9.3.3 5 8.6 30.58 37.7 6 5.8 6.6 7.96 9.3.5.6 5.34 8.4 0.47 3.54 6.3 9.63 3 39.5 7 6.4 7.6 8.67 0.09 3.53 6.34 9.5.6 4.77 7.59 3 33.4 40.79 8 7.0 7.9 9.39 0.86.86 4.44 7.34 0.6.76 5.99 8.87 3.35 34.8 4.3 9 7.63 8.57 0..65 3.7 5.35 8.34.69 3.9 7. 30.4 33.69 36.9 43.8 0 8.6 9.4 0.85.44 4.58 6.7 9.34.77 5.04 8.4 3.4 35.0 37.57 45.3 8.9 9.9.59 3.4 5.44 7.8 0.34 3.86 6.7 9.6 3.67 36.34 38.93 46.8 9.54 0.6.34 4.04 6.3 8..34 4.94 7.3 30.8 33.9 37.66 40.9 48.7 3 0..9 3.09 4.85 7.9 9.0.34 6.0 8.43 3.0 35.7 38.97 4.64 49.73 4 0.86.99 3.85 5.66 8.06 9.94 3.34 7. 9.55 33. 36.4 40.7 4.98 5.8 5.5.7 4.6 6.47 8.94 0.87 4.34 8.7 30.68 34.38 37.65 4.57 44.3 5.6 6. 3.4 5.38 7.9 9.8.79 5.34 9.5 3.79 35.56 38.89 4.86 45.64 54.05 7.88 4.3 6.5 8. 0.7.7 6.34 30.3 3.9 36.74 40. 44.4 46.96 55.48 8 3.56 4.85 6.93 8.94.59 3.65 7.34 3.39 34.03 37.9 4.34 45.4 48.8 56.89 9 4.6 5.57 7.7 9.77.48 4.58 8.34 3.46 35.4 39.09 4.56 46.69 49.59 58.3 30 4.95 6.3 8.49 0.6 3.36 5.5 9.34 33.53 36.5 40.6 43.77 47.96 50.89 59.7 40.6 3.84 6.5 9.05 3.34 34.87 39.34 44.6 47.7 5.8 55.76 60.44 63.69 73.4 50 9.7 3.66 34.76 37.69 4.45 44.3 49.33 54.7 58.6 63.7 67.5 7.6 76.5 86.66 60 37.48 39.7 43.9 46.46 50.64 53.8 59.33 65.3 68.97 74.4 79.08 84.58 88.38 99.6 70 45.44 47.89 5.74 55.33 59.9 63.35 69.33 75.69 79.7 85.53 90.53 96.39 00.4.3 80 53.54 56. 60.39 64.8 69. 7.9 79.33 86. 90.4 96.58 0.9 08..3 4.8 90 6.75 64.63 69.3 73.9 78.56 8.5 89.33 96.5 0. 07.6 3. 9.7 4. 37. 00 70.06 73.4 77.93 8.36 87.95 9.3 99.33 06.9.7 8.5 4.3 3. 35.8 49.5 3.t 分布 ()t 分布表を使う場合 ( x - x) t = ± の t 0 の値を求めます ( ) s e t 0 の値でのt 分布表の値を見ますその値が ± からの t 0 の値までの区間に入る両側の確率です () エクセルの統計関数を使う場合統計関数 TDIST(x, 自由度, 尾部 ) を用いますここで x: 関数に代入する値を指定します -34-

自由度 : 対象となる分布の自由度を指定します尾部 : 片側分布か両側分布を数値で指定しますを指定すると片側分布の値が計算されますを指定すると両側分布の値が計算されます < 例題 > ある自動車の機械部品の長さが平均 (μ)6.3cm の分布をしていることがわかっているこのとき試料の大きさ ()0 試料標準偏差(s)3.6cm で試料平均 ( x ) が 8.0cm 以上となる確率が 0.05 以上であるかを調べよ ( 解答 ) ) 表を使う場合 t 0 の値は t 0 =(8.0-6.3)/(3.6/ 0)=.493 自由度 :φ=0-=9 確率( 片側有意水準 ):P=0.05 で表 3-3 t 分布表を見る t 分布表の値は.6 であり t0 より大きい (t0 の方が確率が大きい ) 従って試料平均が 8.0cm 以上となる確率は 0.05 より大きい ) エクセルの統計関数を使う場合 TDIST(x, 自由度, 尾部 ) として x=.493 自由度 =9 片側分布なので尾部 =を入力します得られる値は 0.0848 となります得られた値はから 8.0 すなわち 8.0 以上となる確率が 0.0848 ということですから発生する確率は 0.05 より大きいと言えますなおこのような場合別の統計関数 TINV( 確率, 自由度 ) を使うこともできますただし TINV は両側分布の値を示しますから片側分布の値の場合にはその倍の値を指定しますこの場合確率 =0.05 =0.0 自由度 =9 を入力すると得られる値は.8333 すなわち t0 が.8333 より大きければ発生する確率は 0.05 より小さい.8333 より小さければ発生する確率は 0.05 より大きいとなりますから確率 0.05 より大きいと言えます表から得られた値とエクセルの統計関数を用いた値は少し違いがありますが本来厳密なものではありませんのでこの程度の差は問題となることはありません -35-

表 3-3 t 分布表有意水準自由度両側 0. 0.05 0.0 0.0 片側 0.05 0.05 0.0 0.005 6.3.7 3.8 63.66.9 4.30 6.96 9.9 3.35 3.8 4.54 5.84 4.3.78 3.75 4.60 5.0.57 3.36 4.03 6.94.45 3.4 3.7 7.89.36 3.00 3.50 8.86.3.90 3.36 9.83.6.8 3.5 0.8.3.76 3.7.80.0.7 3..78.8.68 3.05 3.77.6.65 3.0 4.76.4.6.98 5.75.3.60.95 6.75..58.9 7.74..57.90 8.73.0.55.88 9.73.09.54.86 0.7.09.53.85.7.08.5.83.7.07.5.8 3.7.07.50.8 4.7.06.49.80 5.7.06.49.79 6.7.06.48.78 7.70.05.47.77 8.70.05.47.76 9.70.05.46.76 30.70.04.46.75 40.68.0.4.70 60.67.00.39.66 0.66.98.36.6 40.65.97.34.60.64.96.33.58-36-

4.F 分布 ()F 分布表を使う場合 F=V /V のF 0 の値を求めます発生する確率を設定し F 0 でのF 分布表の値を見ますその値が+ からの F 0 までの区間の片側の確率です (Fは負の値を取り得ないため片側の確率となります ) F 分布表はF>となる値の表であるため該当がない場合は F ( f, f, a) = F ( f, f, -a) で変換して見ます () エクセルの統計関数を使う場合統計関数 FDIST(x, 自由度, 自由度 ) を用いますここで x: 関数に代入する値を指定します自由度 : 対象となる分布の自由度を指定します自由度 : 対象となる分布の自由度を指定します < 例題 > ある母集団から抜き取ったサンプルが試料の大きさ 6 不偏分散 3 であった同一の母集団 ( 分散が等しい ) から再度抜き取った試料の大きさ 3 のサンプルの不偏分散が以下となることが確率 0.05 以上であり得るかを調べよ ( 解答 ) ) 表を使う場合 F 0 =3 =.50 確率 0.05 で自由度 :φ =6-=5 φ =3-= の表 3-4- のF 表を見ると.6 (.6<F< にある確率が 0.05 ) 従って F 表の値より小さいため発生する確率は 0.05 より大きいと言える ) エクセルの統計関数を使う場合 FDIST(x, 自由度, 自由度 ) として x=.50 自由度 =5 自由度 = 指定します得られる値は 0.0587 となります得られた値はから.50 すなわち.50 以上となる確率が 0.0587 ということですから発生する確率は 0.05 より大きいと言えますなおこのような場合別の統計関数 FINV( 確率, 自由度, 自由度 ) を使うこともできますこの場合確率 =0.05 自由度 =5 自由度 = を指定すると得られる値は -37-

.6685 すなわち F0 が.6685 より大きければ発生する確率は 0.05 より小さい.6685 より小さければ発生する確率は 0.05 より大きいとなりますから確率 0.05 より大きいと言えます表から得られた値とエクセルの統計関数を用いた値は少し違いがありますが本来厳密なものではありませんのでこの程度の差は問題となることはありません表 3-4- F 分布表 ( 有意水準 α=0.05) 自由度自由度 3 4 5 6 7 8 9 0 5 0 30 6.4 99.5 5.7 4.6 30. 34 36.8 38.9 40.5 4.9 43 43.9 45.9 48 50. 54.3 8.5 9 9.6 9.5 9.3 9.33 9.35 9.37 9.38 9.4 9.4 9.4 9.43 9.45 9.46 9.5 3 0.3 9.55 9.8 9. 9.0 8.94 8.89 8.85 8.8 8.79 8.76 8.74 8.7 8.66 8.6 8.53 4 7.7 6.94 6.59 6.39 6.6 6.6 6.09 6.04 6 5.96 5.94 5.9 5.86 5.8 5.75 5.63 5 6.6 5.79 5.4 5.9 5.05 4.95 4.88 4.8 4.77 4.74 4.7 4.68 4.6 4.56 4.5 4.36 6 5.99 5.4 4.76 4.53 4.39 4.8 4. 4.5 4. 4.06 4.03 4 3.94 3.87 3.8 3.67 7 5.59 4.74 4.35 4. 3.97 3.87 3.79 3.73 3.68 3.64 3.6 3.57 3.5 3.44 3.38 3.3 8 5.3 4.46 4.07 3.84 3.69 3.58 3.5 3.44 3.39 3.35 3.3 3.8 3. 3.5 3.08.93 9 5. 4.6 3.86 3.63 3.48 3.37 3.9 3.3 3.8 3.4 3. 3.07 3.0.94.86.7 0 4.96 4. 3.7 3.48 3.33 3. 3.4 3.07 3.0.98.94.9.85.77.7.54 4.84 3.98 3.59 3.36 3. 3.09 3.0.95.9.85.8.79.7.65.57.4 4.75 3.89 3.49 3.6 3. 3.9.85.8.75.7.69.6.54.47.3 3 4.67 3.8 3.4 3.8 3.03.9.83.77.7.67.63.6.53.46.38. 4 4.6 3.74 3.34 3..96.85.76.7.65.6.57.53.46.39.3.3 5 4.54 3.68 3.9 3.06.9.79.7.64.59.54.5.48.4.33.5.07 6 4.49 3.63 3.4 3.0.85.74.66.59.54.49.46.4.35.8.9.0 7 4.45 3.59 3..96.8.7.6.55.49.45.4.38.3.3.5.96 8 4.4 3.55 3.6.93.77.66.58.5.46.4.37.34.7.9..9 9 4.38 3.5 3.3.9.74.63.54.48.4.38.34.3.3.6.07.88 0 4.35 3.49 3..87.7.6.5.45.39.35.3.8...04.84 4.3 3.47 3.07.84.68.57.49.4.37.3.8.5.8..0.8 4.3 3.44 3.05.8.66.55.46.4.34.3.6.3.5.07.98.78 3 4.8 3.4 3.03.8.64.53.44.37.3.7.4..3.05.96.76 4 4.6 3.4 3.0.78.6.5.4.36.3.5..8..03.94.73 5 4.4 3.39.99.76.6.49.4.34.8.4..6.09.0.9.7 6 4.3 3.37.98.74.59.47.39.3.7..8.5.07.99.9.69 7 4. 3.35.96.73.57.46.37.3.5..7.3.06.97.88.67 8 4. 3.34.95.7.56.45.36.9.4.9.5..04.96.87.65 9 4.8 3.33.93.7.55.43.35.8..8.4..03.94.85.64 30 4.7 3.3.9.69.53.4.33.7..6.3.09.0.93.84.6 40 4.08 3.3.84.6.45.34.5.8..08.04.9.84.74.5 60 4 3.5.76.53.37.5.7..04.99.95.9.84.75.65.39 0 3.9 3.07.68.45.9.8.09.0.96.9.87.83.75.66.55.5 3.84 3.6.37...0.94.88.83.79.75.67.57.46-38-

表 3-4- F 分布表 ( 有意水準 α=0.0) 自由度自由度 3 4 5 6 7 8 9 0 5 0 30 405 4999 5403 565 5764 5859 598 598 60 6056 6083 606 657 609 66 6366 98.5 99 99.7 99.5 99.3 99.33 99.36 99.37 99.39 99.4 99.4 99.4 99.43 99.45 99.47 99.5 3 34. 30.8 9.46 8.7 8.4 7.9 7.67 7.49 7.35 7.3 7.3 7.05 6.87 6.69 6.5 6.3 4. 8 6.69 5.98 5.5 5. 4.98 4.8 4.66 4.55 4.45 4.37 4. 4.0 3.84 3.46 5 6.6 3.7.06.39 0.97 0.67 0.46 0.9 0.6 0.05 9.96 9.89 9.7 9.55 9.38 9.0 6 3.75 0.9 9.78 9.5 8.75 8.47 8.6 8. 7.98 7.87 7.79 7.7 7.56 7.4 7.3 6.88 7.5 9.55 8.45 7.85 7.46 7.9 6.99 6.84 6.7 6.6 6.54 6.47 6.3 6.6 5.99 5.65 8.6 8.65 7.59 7.0 6.63 6.37 6.8 6.03 5.9 5.8 5.73 5.67 5.5 5.36 5. 4.86 9 0.56 8.0 6.99 6.4 6.06 5.8 5.6 5.47 5.35 5.6 5.8 5. 4.96 4.8 4.65 4.3 0 0.04 7.56 6.55 5.99 5.64 5.39 5. 5.06 4.94 4.85 4.77 4.7 4.56 4.4 4.5 3.9 9.65 7. 6. 5.67 5.3 5.07 4.89 4.74 4.63 4.54 4.46 4.4 4.5 4. 3.94 3.6 9.33 6.93 5.95 5.4 5.06 4.8 4.64 4.5 4.39 4.3 4. 4.6 4.0 3.86 3.7 3.36 3 9.07 6.7 5.74 5. 4.86 4.6 4.44 4.3 4.9 4. 4.0 3.96 3.8 3.66 3.5 3.7 4 8.86 6.5 5.56 5.04 4.69 4.46 4.8 4.4 4.03 3.94 3.86 3.8 3.66 3.5 3.35 3 5 8.68 6.36 5.4 4.89 4.56 4.3 4.4 4 3.89 3.8 3.73 3.67 3.5 3.37 3..87 6 8.53 6.3 5.9 4.77 4.44 4. 4.03 3.89 3.78 3.69 3.6 3.55 3.4 3.6 3..75 7 8.4 6. 5.8 4.67 4.34 4. 3.93 3.79 3.68 3.59 3.5 3.46 3.3 3.6 3.65 8 8.9 6.0 5.09 4.58 4.5 4.0 3.84 3.7 3.6 3.5 3.43 3.37 3.3 3.08.9.57 9 8.8 5.93 5.0 4.5 4.7 3.94 3.77 3.63 3.5 3.43 3.36 3.3 3.5 3.84.49 0 8. 5.85 4.94 4.43 4. 3.87 3.7 3.56 3.46 3.37 3.9 3.3 3.09.94.78.4 8.0 5.78 4.87 4.37 4.04 3.8 3.64 3.5 3.4 3.3 3.4 3.7 3.03.88.7.36 7.95 5.7 4.8 4.3 3.99 3.76 3.59 3.45 3.35 3.6 3.8 3..98.83.67.3 3 7.88 5.66 4.76 4.6 3.94 3.7 3.54 3.4 3.3 3. 3.4 3.07.93.78.6.6 4 7.8 5.6 4.7 4. 3.9 3.67 3.5 3.36 3.6 3.7 3.09 3.03.89.74.58. 5 7.77 5.57 4.68 4.8 3.85 3.63 3.46 3.3 3. 3.3 3.06.99.85.7.54.7 6 7.7 5.53 4.64 4.4 3.8 3.59 3.4 3.9 3.8 3.09 3.0.96.8.66.5.3 7 7.68 5.49 4.6 4. 3.78 3.56 3.39 3.6 3.5 3.06.99.93.78.63.47. 8 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.3 3. 3.03.96.9.75.6.44.06 9 7.6 5.4 4.54 4.04 3.73 3.5 3.33 3. 3.09 3.93.87.73.57.4.03 30 7.56 5.39 4.5 4.0 3.7 3.47 3.3 3.7 3.07.98.9.84.7.55.39.0 40 7.3 5.8 4.3 3.83 3.5 3.9 3..99.89.8.73.66.5.37..8 60 7.08 4.98 4.3 3.65 3.34 3..95.8.7.63.56.5.35..03.6 0 6.85 4.79 3.95 3.48 3.7.96.79.66.56.47.4.34.9.03.86.38 6.63 4.6 3.78 3.3 3.0.8.64.5.4.3.5.8.04.88.7-39-