モジュール1のまとめ

Similar documents
不偏推定量

情報工学概論

基礎統計

スライド 1

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

スライド 1

Microsoft PowerPoint - 基礎・経済統計6.ppt

EBNと疫学

Microsoft PowerPoint - Statistics[B]

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

ビジネス統計 統計基礎とエクセル分析 正誤表

統計的データ解析

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

講義「○○○○」

Microsoft Word - Stattext12.doc

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - Econometrics pptx

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - sc7.ppt [互換モード]

第7章

Microsoft PowerPoint - statistics pptx

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

スライド 1

PowerPoint プレゼンテーション

Microsoft Word - Stattext13.doc

Microsoft PowerPoint - stat-2014-[9] pptx

_KyoukaNaiyou_No.4

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

経済統計分析1 イントロダクション

Microsoft PowerPoint - 資料04 重回帰分析.ppt

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

第4回

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

経営統計学

Microsoft Word - apstattext04.docx

データ解析

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft Word - Stattext11.doc

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

数値計算法

PowerPoint プレゼンテーション

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

Microsoft PowerPoint - statistics pptx

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft PowerPoint - statistics08_03.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード]

日心TWS

Microsoft Word - Stattext07.doc

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

相関係数と偏差ベクトル

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

青焼 1章[15-52].indd

untitled

0415

ベイズ統計入門

Microsoft Word - lec_student-chp3_1-representative

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

Microsoft Word - 保健医療統計学112817完成版.docx

<4D F736F F F696E74202D A6D82A982B3955D89BF82CC979D89F082C9954B977682C8939D8C768A7782CC8AEE91622E B8CDD8AB B83685D>

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

Probit , Mixed logit

PowerPoint プレゼンテーション

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

数値計算法

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

散布度

経済データ分析A

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word - apstattext05.docx

MT2-Slides-13.pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

基礎統計

Microsoft Word - Time Series Basic - Modeling.doc

untitled

Microsoft Word - 補論3.2

1.民営化

1. 期待収益率 ( 期待リターン ) 収益率 ( リターン ) には次の二つがあります 実際の価格データから計算した 事後的な収益率 将来発生しうると予想する 事前的な収益率 これまでみてきた債券の利回りを求める計算などは 事後的な収益率 の計算でした 事後的な収益率は一つですが 事前に予想できる

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

3章 度数分布とヒストグラム

統計Ⅰ 第1回 序説~確率

Transcription:

数理統計学 第 0 回

復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い

復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差 =9.5 前後 そもそも正規分布でもない 偏りがとれた > mea(jkke) [] 99.6348 標準偏差 =0 前後

R で確認 図 ( 前頁 ) の作成手順 > rorm(0,mea=50,sd=0) 正規分布から0 個のサンプル [] 56.573 75.94976 59.0753 55.89 48.9054 50.0775 46.3889 [8] 48.6459 70.34706 55.0064 > varp(rorm(0,mea=50,sd=0)) [] 00.84 > varp(rorm(0,mea=50,sd=0)) 0 個のデータの標本分散の出方をみる [] 47.787 > varp(rorm(0,mea=50,sd=0)) [] 38.887 > jkke <- replcate(0000,varp(rorm(0,mea=50,sd=0))) > jkke <- replcate(0000,var(rorm(0,mea=50,sd=0))) > par(mfrow=c(,)) 段の図の準備 > hst(jkke,ma=" 標本分散 ",breaks="fd") > hst(jkke,ma=" 不偏分散 ",breaks="fd") 注 : コマンド varp は次ページの説明を確認すること

R で確認 図 ( 前頁 ) の作成手順 分散は 平均二乗偏差 のことなので 以下のように求めるのが本来は定義にかなう mea((x-mea(x))^ ( 例 ) > x <- :5 > mea((x-mea(x))^) [] 以下を実行してコマンドにしておくと便利 varp <- fucto(x){mea((x-mea(x))^)}

別の実験 ( 万回 ) 平均 70 分散 0 データ数 5 人 全体に値が小さい 標本分散 > mea(jkke); var(jkke) [] 77.83389 [] 840.553 バイアス そもそも正規分布が当てはまらない バイアスが消えた 不偏分散 > mea(jkke); var(jkke) [] 00.094 [] 4876.46 真の分散 ( 全体の分散 )=0

標本分散 S の バイアス 以下の結論を数学的に証明できる E S バイアスがある = 不偏性がない あとの例で言うと = 5 σ = 00 だから E 4 5 S 00 80 実験結果にあっているか?

不偏分散のねらい S N N でバイアス修正 E N N S = N N N N σ = σ 故に ( 標本 ) 不偏分散 という 計算式としては シグマ二乗ハット ˆ

0 標本分散のバイアス数学的計算 50 50 真の偏差二乗和 0 0 50 0 50 0 50 データの偏差二乗和 0 0 0 0 00 0 90 E 偏差二乗和 μ = 50 σ = 00 = 0 両辺を 0 で割れ

データ数が少ないとき 違いが大きい極端なケース : データ 個の場合 言葉の定義どおりなら S 0 個のデータにはバラつきがないので分散はゼロ 母集団の分散を知りたいなら S 0 0 計算不能 個のデータでは全体のバラつきは分からないので計算できない

クイズ さいころを 5 回振って 目の数の標本分散を求める この値は.9 位になるか? から 6 まで同じ割合で出るとき 分散は.9 σ =.9 理論的には E 4 5 S.9. 34

R で確認 定義通りの標本分散を計算する関数を定義しておくと便利 > varp <- fucto(x){mea((x-mea(x))^)} > varp(:6) 確率通りの目が出ると分散は.9になる [].96667 > sample(:6,5,replace=true) 5 回振ってみる [] 6 4 6 5 5 > varp(sample(:6,5,replace=true)) 分散を出してみる [].8 > jkke <- replcate(0000,varp(sample(:6,5,replace=true))) > hst(jkke) > mea(jkke) 万回の実験結果の平均は.3になる計算結果とほぼ合っている [].3086

まとめ サンプル 母集団という観点 サンプルの平均値は 標本平均 下の二つを使え N N サンプルの分散は ( 標本 ) 不偏分散 不偏性ありバイアスなし ˆ N N 不偏性ありバイアスなし

次のテーマ - 分散 という結果の出方 カイ二乗分布入門 右の図はすべてカイ二乗分布 データを集めてヒストグラムを描いてみた > x <- rchsq(5000,df=) > x <- rchsq(5000,df=) > x3 <- rchsq(5000,df=3) > x4 <- rchsq(5000,df=4) 上の df は 自由度 これから説明する 教科書 : ページ

カイ二乗分布カイ二乗値が従う分布である カイ二乗値 :χ 標準正規分布 N 0, からとった 個の値の二乗和 Z Z + Z Z + Z + Z 3 Z + Z + Z 3 + Z 4 自由度 のカイ二乗値自由度 のカイ二乗値自由度 3のカイ二乗値自由度 4のカイ二乗値 以下同様 カイ二乗分布は正規分布から出てくる分布

R で確認 000 個 000 個 000 個 000 個 > z <- rorm(000) > z <- rorm(000) > z3 <- rorm(000) > z4 <- rorm(000) 標準正規分布から 000 個のデータをとった

R で確認 Z の分布をみる第 章の最後のテーマ Z で確かめたが Z 以下を使っても大体同じである > mea(ch); var(ch) [] 0.95806 [].75947 ch <- z^ hst(ch) 上に平均値と分散を求めている 平均値は理論と合っているか回答できるはずである

R で確認 Z + Z の分布をみる Z と Z で確かめたが 他を使っても大体同じである > mea(ch); var(ch) [].99639 [] 3.75047 > ch <- z^ + z^ > hst(ch) 上に平均値と分散を求めている 平均値は理論と合っているか回答できるはずである

R で確認 Z + Z +Z 3 +Z 4 3 個の二乗和は省略 > mea(ch4); var(ch4) [] 4.04589 [] 7.63366 > ch4 <- z^ + z^ + z3^ + z4^ > hst(ch4) 上に平均値と分散を求めている 平均値は理論と合っているか回答できるはず

カイ二乗値 の確率分布 カイ二乗分布 何個の Z を足すかによる K 個足す E V 自由度 自由度 Karl Pearso カイ二乗値 K は自由度 教科書 3 頁

もし歪み度 尖り度を知っていれば ( 章 0 ページ 章 75 ページ ) 正規分布の場合 標準値にすれば. 期待値 : E Z = 0. 分散 : V Z = E Z = 3. 歪み度 : E Z 3 = 0 4. 尖り度 : E Z 4 = 3 V Z E Z 4 E Z 3

カイ二乗分布の期待値と分散自由度 (k)=3 の場合 3 3 E Z E Z E Z Z Z E Z E k 3 3 Z V Z V Z V Z Z Z V V k

クイズ. 自由度 9 のカイ二乗分布に従う変数 W がある E W と SD W はいくらか?. 自由度 0のカイ二乗分布に従う変数 がある この期待値と分散はいくら χ 0 か? 自由度 0 のカイ二乗値を表す記号として使うことがある

回答... 4.4 8 8 9 9 9 9 9 SD V E 0 3 0 Z Z Z Z 9 3 9 Z Z Z Z... 6.3 40 40 0 0 0 0 0 SD V E 自由度 9=9 個の合計自由度 0=0 個の合計

χ 分布を活用するデータ数 0 個 母平均 50 標準偏差 0 値 μ 0 50 この期待値は 0 00 0 0 50 0 個の標準値の二乗和 自由度 0のカイ二乗分布 この期待値は 0

ここからは次回か

クイズ 日本人の成人男性の身長には正規分布 N 70, 0 が当てはまっている ( とする ) 6 人のデータをとって 不偏分散 σ を求める このとき 不偏分散の結果が 44 を超える確率はどのくらいあるだろうか?

直接的な解決法 = 実験 ( 万回 ) 分散が 44 を超えるサンプルは結構出てくる > mea(jkke); var(jkke) [] 00.39 期待値としては真の分散と ( ほぼ ) 一致 不偏 [] 4093.46 真の分散 =00 不偏性は確認結果のばらつき ( 分散 ) が 4093 平均の 倍ではない 単純にカイ二乗分布が当てはまるわけではないようだ > jkke <- replcate(0000,var(rorm(6,mea=70,sd=0))) > sum(jkke > 44) [] 088 不偏分散が 44 以上になるのは 万回中の 088 回 (0% 程度 )

カイ二乗分布応用の鍵 : 定理 4 平均値の定理 8 0 に該当 母集団 ( 正規 ) サンプル : 標準値? μ = 70 σ = 0 真の平均ではない!,,, 6 W 6 0 00 6 自由度 5 のカイ二乗値になる 教科書 4~5 頁

数学的計算平均 μ 分散 σ データ数 個で計算 データを 個とった 真の偏差二乗和これが大事ゼロ

は標準値 Z になっている これも 個の標準値 前のつづき ( 両辺を分散 σ で割る ) 個の二乗和に見えるが 実は 個の二乗和である

ˆ 教科書 6~7 頁 σ とカイ二乗分布の関係自由度 のカイ二乗値分散の値が大きく出る χ の値が大きく出る

クイズへの理論的回答 P 0 44 44 6 6 6 6 P P 0 7. テキスト巻末の数値表 3 はカイ二乗分布のパーセント点 つまり この値以上になる確率が 5% というときのこの値 を求める表である 上の確率は巻末の数値表では無理である さっきの実験結果と合っているか? R による確認 : > -pchsq(7.,df=5) [] 0.06859

V σ は実験結果で確認できるか? 44 を超えるサンプルは結構出てくる > mea(jkke); var(jkke) [] 00.39 [] 4093.46 真の分散 =00 不偏性は確認結果のばらつき ( 分散 ) が 4093 平均の 倍ではない 単純にカイ二乗分布が当てはまるわけではないようだ

回答 自由度 のカイ二乗値の期待値と分散は以下のとおり : E χ V χ = = V 0 6 0 V 5 6 4000 4000

練習問題 真の分散が σ データ数が 個として 標本分散 S の期待値を求めよ E S 標本分散 S の分散を求めよ V S 教科書 6~7 ページ