統計学の基礎から学ぶ実験計画法ー1

Similar documents
情報工学概論

EBNと疫学

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

基礎統計

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

講義「○○○○」

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

第7章

スライド 1

スライド 1

Microsoft PowerPoint - 測量学.ppt [互換モード]

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - sc7.ppt [互換モード]

統計的データ解析

不偏推定量

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - stat-2014-[9] pptx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - Statistics[B]

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

経済統計分析1 イントロダクション

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

モジュール1のまとめ

0415

Medical3

Microsoft PowerPoint - statistics pptx

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

_KyoukaNaiyou_No.4

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft Word - Stattext12.doc

Probit , Mixed logit

スライド 1

Microsoft PowerPoint - statistics08_03.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

様々なミクロ計量モデル†

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

カイ二乗フィット検定、パラメータの誤差

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

統計Ⅰ 第1回 序説~確率

Microsoft PowerPoint - A1.ppt [互換モード]

untitled

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

PowerPoint プレゼンテーション

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

数値計算法

青焼 1章[15-52].indd

Microsoft PowerPoint - e-stat(OLS).pptx

PowerPoint プレゼンテーション

Microsoft PowerPoint - Inoue-statistics [互換モード]

データ解析

Microsoft PowerPoint - 資料04 重回帰分析.ppt

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

ベイズ統計入門

Microsoft Word - Stattext07.doc

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Microsoft Word - å“Ÿåłžå¸°173.docx

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

スライド 1

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

PowerPoint Presentation

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

untitled

Microsoft Word - Stattext13.doc

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

相関係数と偏差ベクトル

Microsoft Word - 保健医療統計学112817完成版.docx

数値計算法

Microsoft PowerPoint - Quality11.ppt

学習指導要領

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft Word - Stattext11.doc

PowerPoint プレゼンテーション

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

日心TWS

Microsoft PowerPoint - データ解析基礎2.ppt

Hara-statistics

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

学習指導要領

JUSE-StatWorks/V5 ユーザーズマニュアル

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の


Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

基礎統計

Transcription:

第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3 統計量の分布と基本的特性 実験計画法を活用するために 知らなければならない統計学の基礎を確認 整理しよう

第 部統計学の基礎と 5. 基本的な統計解析手法 基本的な解析手法 5. 統計学的仮説検定 (Statistical hypothesis testing) () 仮説検定の種類 () 仮説検定の手順 (3) 仮説検定における 種類の誤り (4) 仮説検定の実際 5. 統計的推定 (Statistical Estimation) () 点推定 () 区間推定 実験計画法を活用するために 知らなければならない統計学の基礎を確認 整理しよう

第 部統計学の基礎と 5. 基本的な統計解析手法 5.3 相関と回帰 () 相関 () 回帰 基本的な解析手法 5.4 分散分析 (ANOVA:analysis of variance) 実験計画法を活用するために 知らなければならない統計学の基礎を確認 整理しよう

. 統計学とは 統計学とは - 記述統計学と推測統計学 バラツキのあるデータから 応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす 統計的手法は 実験計画 データの要約や解釈を行う上での根拠を提供する学問であり 幅広い分野で応用されている 記述統計学 (descriptive statistics) 記述統計学とは 収集したデータの要約統計量 ( 平均 分散など ) を計算して分布を明らかにする事により データの示す傾向や性質を知ること 母集団 標本という概念はない 推測統計学 (inferential statistics) 標本データから その性質を確率論的に推測する 母集団は大きく 直接 調べられない データは標本からしか得られないため 標本データから母集団を検定や推定などを行う

. 統計学の基本. 母集団とサンプル 実験 解析の最重要ポイント サンプリング ( サンプリングとは ) 母集団から 適当なサンプルを抽出すること ( サンプリング手法 ) 無作為抽出母集団が均一の場合 群に分けて抽出母集団が不均一の場合 測定 実験など サンプル 標本 サンプルから母集団の情報を得る 母集団 母集団から必要とする情報を得ることは困難 ( データが膨大など ) 母集団 : 検討 考察の対象として妥当か? サンプル : 検討 考察の対象として母集団を適切に代表しているか?

. 統計学の基本. 母集団とサンプル サンプリング 母集団 サンプル 真の情報 ( 知りたい情報 ) 母数 未知 実験 測定など 統計量 標本 扱える情報 母平均 母分散 母標準偏差など 母数に対して必ず 誤差がついている サンプルから得られた平均 分散 標準偏差など 母数と統計量は 明確に区別して扱う必要がある

用語解説 母集団 (population) ) 調査 研究の対象となる特性を持つすべてのものの集団 ) サンプルにより 処置をとろうとする集団 なお 母集団には無限母集団と有限母集団がある サンプル ( 標本 :sample) 母集団からその特性を調べる目的を持ってとったもの 標本 試料という用語は同じ意味 ランダムサンプリング (random sampling) 母集団を構成している単位体 単位量などがいずれも同じような確率でサンプルに入るようにサンプリングすること 母数 (parameter) ) 母集団分布の一族 {f(x:θ,θ,θ n } を考えるとき その値を指定すれば分布が確定するような定数 θ,θ θ n ) 広い意味では 確率分布によって定まる数値 母平均 母分散 母標準偏差などは 全て母数 統計量 (statistic) サンプル ( 標本 ) から計算される値 サンプルから得られる平均 分散 標準偏差などは統計量である

. 統計学の基本. データ (data) () データとは基礎的な事実を示すもので 処理によって意味を持つ前提で収集されたもの 対象とするもの 数字 ( 数値データ ) 言葉 ( 言語データ ) 図 表 データはそのままでは使えない統計処理をして検討 判断などを行う (* 真理の解明 主張などは データを通して行うのが基本 ) () 数値データ統計で活用するのは 主に数値データ数値データの分類 : 計量値と計数値 計量値 (continuous variable) 測定機器で測定する値長さ 重量 時間 温度など連続的な値 計数値 (discrete variable) 数えられる値部品個数 不良点数など離散的な値 ( 注 ) 本講座では 主に 計量値を対象とする

3. 集団の特性を現す統計量 3. 統計量 (statistic) とは サンプルから得たデータだけでは その集団の様子はわからないデータを処理 ( 四則演算 平方根などを用いる ) して集団の性質を表すものを統計量と言う その統計量により判断 考察などを行う

3. 集団の特性を現す統計量 3. 集団を代表する統計量 - 平均値など 集団を代表する統計量 - 異なる集団を比較する時 何で比較するか () 平均値 測定値の総和をサンプル数で割ったもの ( 集団を代表する値として最も一般的 ) x = x i n () 中心値 ( メディアン ) (3) 中点値 測定値を大きさの順に並べた時 その中央に当たる値 ( データが左右対称にばらついていない場合などに効果的 ) 測定値の最大値と最小値の算術平均

3. 集団の特性を現す統計量 3.3 ばらつきの程度を表す値 - 平方和 分散 標準偏差 集団の測定値がどのようにばらついているか ( 広がっているか ) () 平方和 () 分散 - 平均値だけで集団を見ると 勘違いが起きる (3) 標準偏差 ( 平均値 - 各測定値 ) の自乗の総和 S ( x x) i 平方和を測定値の数で割ったもの ( x i x) 母分散 : 不偏分散 ( 平均平方 ): n V ( s 分散の平方根 単位を測定値の単位に合わせる 単位は測定単位の自乗 S ) ( 母集団の分散 通常は未知 ) ( 統計量 : 母集団の分散の推定値 ) ( x i x) 母標準偏差 : サンプル標準偏差 : s n ( 母集団の標準偏差 通常は未知 ) ( 平均値の罠 ) S 自由度 : n ( x ( x i x) n i x) n 注意

補足解説 自由度 (degrees of freedom) サンプル数 (n )- で考えてよい 独立に変えることのできる変数の量 ( 誤差分散の個数に等しい ) 日本工業規格では カイ二乗分布 F 分布 t 分布などのパラメータ と定義している 自由度とはどのような意味をもつか ばらつきを作る個所の数 サンプルの情報だけからばらつきを考える場合 n=5 とすると 4 つ つまり n- ばらつきの基準となるもの ( 母平均 ) がわかっている場合 数式で考えると 母平均 5 つ つまり n (x i μ) = x i x + ( x μ) = (x i x) + x μ 期待値をとると nσ = E S + nv( x) V x = σ n であるから E S = (n )σ

用語解説 母数 統計量 母数の推定量の記号一覧表 ( 慣例 ) サンプル数 :n 平均値中央値分散 母数 - 母数の推定量 - ˆ X ~ 統計量 x 統計量の計算式 x ( メディアン ) - V ( s ) ( 不偏分散 ) V s n S x i ( x i x) n 標準偏差 ˆ s ( 標本標準偏差 ) s V s 範囲 - - R - 平方和 : S ( x x) 自由度 : n i

用語解説 確率変数 (random variable) どのような値をとるかが ある確率法則によって決まる変数 とることができる値が離散的な連続的であるかによって それぞれ離散型確率変数 連続型確率変数という 確率変数は 大文字で表記する

3. 集団の特性を現す統計量 例題 3- ある軸部品について サンプルを 0 個 取り出し 直径 (mm) を測定したら 以下の値であった 平均 ( 母平均の推定値 ) 不偏分散 ( 母分散の推定値 ) を計算せよ No 直径 (mm) 8.7 0.3 3 8.8 4 9.4 5 9.6 6 0. 7 9.0 8 9.4 9 9.9 0 9. 解答 3- ) 平均値を求める x i n x =9.4 ( 母平均と推定 ) ) 不偏分散を求める V ( s ) S ( x i x) n =0.9 ( エクセルの関数 ) =AVERAGE( 数値, 数値 ) =VAR.S( 数値, 数値 ) ( 母分散と推定 )

4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 - ばらつき ( 分布 ) の姿を表す関数 () 確率 (probability) 事象が起きる確からしさ 0 P 事象が絶対に起きない P=0 () ばらつき ( 分布 ) の姿を現すヒストグラム 事象が必ず起きる P= 事象が 回に 回起きる P=0.5 度数 各区間に入る度数を棒グラフ化 ばらつき ( 分布 ) の姿を可視化 (3) 確率密度関数 (probability density function) 特性の最大値と最小値の間を等区間 (Δt) に分割 区間 Δt 0 にしたのが 確率密度関数 :f(x) 変数 x が区間 [a,b] に入る確率 b P ( a x b) f ( x) dx f ( x) dx a 積分しないと数値が出ない関数

4. ばらつき ( 分布 ) を表す関数 4. 最も重要な正規分布 正規分布 計量値の分布 偶然のばらつきの分布は正規分布となる 確率密度関数 : y f ( x) 平均値 0 標準偏差 0.5 exp[ の正規分布 ( x ) ( ) ] 記号 N(μ σ ) 標準正規分布 :N(0 ) ( 平均値 0 標準偏差 ) 0.59(σ~ 無限大の区間に入る確率 ) 0.8 0.03 0-5 -4-3 - - 0 3 4 5 平均値と分散が決まれば 分布が決まる 変数変換して 平均値 :0 標準偏差 : とすれば 標準正規分布が適用できる -σ~σ の区間に入る確率 0.683 -σ~σ の区間に入る確率 0.954-3σ~3σ の区間に入る確率 0.997 95% の範囲 -.96σ~.96σ

4. ばらつき ( 分布 ) を表す関数 4. 最も重要な正規分布 独立な正規分布の平均値と分散の加法性 - 同時分布 独立に正規分布に従う X ( 平均 x, 分散 σ ) と Y ( 平均 y, 分散 σ ) について確率変数 Z=X+Y の分布は正規分布 ( 平均 x+y, 分散 σ + σ ) に従う 平均 x 分散 σ X + Y 平均 y 分散 σ X+Y 平均 x+y 分散 σ + σ

4. ばらつき ( 分布 ) を表す関数 4. 最も重要な正規分布 独立な正規分布の平均値と分散の加法性 - 同時分布 ( 補足 ) 独立に正規分布に従う X ( 平均 x, 分散 σ ) と Y ( 平均 y, 分散 σ ) について確率変数 Z=X-Y の分布はどうなるか 正規分布 ( 平均 x-y, 分散 σ + σ ) に従う ( 分散に引き算はない ) ( 補足 ) 部品 A(X±a) 部品 (Y±b) を組み合わせるとどうなるか A B (X+Y)±(a+b) ではない (X+Y)± a b となる ( ばらつきは分散 ( 二乗 ) で加算される )

4. ばらつき ( 分布 ) を表す関数 4.3 統計量の分布と基本的特性 統計解析の重要ポイント 母集団の母数 ( 真の値 ) を調べる ( 検定 推定する ) ためには サンプル ( 標本 ) の統計量を分析する 統計量の分布を知ることが必要 母数 ( 未知 ) サンプル ( 標本 ) 統計量サンプリング統計量 = 母数 ± ばらつき ( 分布 ) 母集団 統計量の分布 母数に対する統計量のばらつきの状況 ( 分布 ) ( 前提 ) - ランダムな分布とランダムなサンプリング 母集団は正規分布をしている 母集団は無限母集団で サンプル ( 標本 ) はランダムサンプリングで抽出した

4. ばらつき ( 分布 ) を表す関数 4.3 統計量の分布と基本的特性 統計量の分布とは サンプリング n 個 母集団 第 回目 第 回目 第 3 回目 第 4 回目 統計量 n 個の平均 x x x 3 x 4 上記のサンプリングと統計量の計算を無限回 行った場合 x --- x ばらつき ( 分布 ) の様子 統計量 ( サンプル n の平均値 ) の分布 サンプル数 :n によって分布の形状が変わる

4.3 統計量の分布と基本的特性 () サンプル平均値 ( x) の分布 母集団 ( 平均値 :μ 標準偏差 :σ) サンプルの大きさ n から得られる平均値 x とその標準偏差の分布 x サンプル平均値の平均値( ) μ( 母集団の平均値 ) サンプル平均値の標準偏差(s ) ( 母集団の標準偏差の倍 ) n n < サンプル平均値に関する法則 定理 > サンプル平均値の標準偏差が倍となる V x = σ n n 大数の法則 (law of great numbers): サンプル数が増加すると母平均に近づく 母集団が正規分布でなくてもサンプル平均値の分布は正規分布となる 中心極限定理 (central limit theorem)

4.3 統計量の分布と基本的特性 x () サンプル平均値 ( x) の分布 母集団 ( 平均値 :μ 標準偏差 :σ) サンプルの大きさ n から得られる平均値 ( x ) の分布 母分散 (σ ) が既知 平均値の分布は正規分布 検定 推定は正規分布 サンプル数が十分に多ければ (n>50 程度 ) 標本分散は母分散と同じとみなすことができる 母分散 (σ ) が未知 サンプルから得た不偏分散 (V ) を用いる 平均値の分布は t 分布 検定 推定は t 分布

4.3 統計量の分布と基本的特性 () サンプル平均値 ( ) の分布 x t 分布 ( t distribution) ( 定義 ) t ( 応用 ) ( x ) ( s ) n ここで t は自由度 :Φ=n- の t 分布をする 母分散が未知のとき 母平均に対する検定 推定に用いられる s V 確率密度 S ( サンプルの標準偏差 ) (n で正規分布 ) 0.5 0.4 0.3 0. 自由度 3 5 30 0. 0-4 - 0 4 t

4.3 統計量の分布と基本的特性 () サンプル分散 (s ) の分布 母集団 ( 平均値 :μ 分散 :σ ) 試料の大きさ n から得られる分散 (s ) の平均値とその標準偏差の分布 分散 (s ) の平均値 ( n n ) ( 注 ) 正規分布とはならない 分散(s ( n ) ) の標準偏差 n ( 留意点 ) n 分散の推定値 ( 母集団の分散 (σ ) に最も近い値 ) は ( n ) 不偏分散 (unbiased varience) s サンプルから求める分散は通常 不偏分散を用いる n S 不偏分散 : V s ( 平方和 / 自由度 ) ( n ) 自由度 :Φ=n- (n ではないことに注意 )

4.3 統計量の分布と基本的特性 (3) の分布 カイ二乗分布 (chi-square distribution) ( 定義 ) S ( xi x) ( xi x) i i 標準正規分布 (N(0,): 平均 0 標準偏差 ) の分布から n 個 ( 自由度 ) のサンプルを抜き取り 二乗の和をとった場合の分布 それぞれの正規分布が独立であり 平均 標準偏差が異なる場合 上式で表す 母平均が既知の場合分散が等しければ χ は自由度 :Φ=n のカイ二乗分布をする 母平均が未知の場合分散が等しければ χ は自由度 :Φ=n- のカイ二乗分布をする

4.3 統計量の分布と基本的特性 (4) 二つのサンプルで 不偏分散の比率 (V /V ) の分布 F 分布 (F distribution) ( 定義 ) 自由度がそれぞれ Φ Φ であるカイ二乗変数 χ χ とが互いに独立であるとき その比 F(, ) / / が F 分布とされる ここで χ χ が それぞれ正規分布の母集団からサンプルしたもので その不偏分散をs s とすれば s / F(, ) s / もし 二つの正規分布の母集団の分散が等しければ (σ =σ ) であれば 母数に関係なく 不偏分散のみの関係式となる F( s V, ) ( 分散分析で用いる ) s V

4.3 統計量の分布と基本的特性 F 分布 (F distribution) 同一母集団からの二つのサンプルで 不偏分散の比率 (V /V ) の分布 第 回目 第 回目 第 3 回目 無限回 母集団 サンプリング n 個 サンプリング n 個 統計量 n 個の不偏分散 S V n ) ( n 個の不偏分散 S V n ) 二つの不偏分散の比 ( V F V 統計量 F の分布 不偏分散の比の分布なので 正の値しかとらない ( 検定は片側検定となる ) 二つの自由度によって分布の形状が変わる

4.3 統計量の分布と基本的特性 (4) 二つのサンプルで 不偏分散の比率 (V /V ) の分布 F 分布 (F distribution) 二つの試料の不偏分散 F は自由度 :Φ =n - Φ =n - の F 分布となる ( 応用 ) S n ) ( 等分散性の検定 : 正規分布に従う つの群の 標準偏差が等しい という帰無仮説の検定 V F(,, ) F (,, ) (α: 信頼度 ) V 確率密度 S n ).5 0.5 ( として V F V 自由度 とするとき 4 6 0 自由度 = 分散分析 : 正規分布に従う複数の群 ( 標準偏差は等しいと仮定する ) で 平均が等しい ( つまり同じ母集団に由来する ) という帰無仮説の検定 0 0 3 4 F

4.3 統計量の分布と基本的特性 (4) 二つのサンプルで 不偏分散の比率 (V /V ) の分布 F 分布 (F distribution) ( 補足 ) ) 二つの確率変数 U とV がそれぞれ独立に カイ二乗分布に従うとき 二つの確率変数の比として定義される確率変数 U / F V / は 自由度 Φ Φ のF 分布に従う

4.3 統計量の分布と基本的特性 [ 統計量の分布のまとめ ] 分布応用 正規分布 t 分布 分布 F 分布 正規分布に従うつの集団の平均値の検定( 母分散が既知 ) 平均値の区間推定( 母分散既知 ) 基本となる分布統計解析は 基本的に本分布を前提とする 自由度の概念はない 正規分布に従う二つの集団の平均値の検定 ( 母分散が未知 ) 平均値の区間推定 ( 母分散未知 ) n( サンプル数 ) 無限大で正規分布 二つのグループの独立性の検定 カテゴリー別の比率が基準の比率と同じかの適合度の検定 正規分布に従う二つの集団の標準偏差の検定 3 群以上のデータがある正規分布に従うかを 回で検定 ( 分散未知 ) 分散の比較から 平均値の違いの検定 ( 分散分析 )

5. 基本的な統計解析手法 当研究所販売商品 電子書籍セット (CD 3 枚組 ) を ご覧下さい

[ まとめ ] 知りたい情報 ( 母数 : 平均値 分散 ) は サンプル ( 標本 ) を通して得る サンプルから得た統計量は 真の値 ( 母数 ) とは言えない 必ず 誤差がついている ( ばらついている ) 統計量が 真の値 ( 母数 ) に対して ばらつく様子 ( 分布関数 ) を表すのが統計量の分布関数 正規分布 t 分布 F 分布 複数の統計量の違いの有無 大小関係を調べるのが検定 真の値 ( 母数 ) を推測するのが推定

終わり