統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Similar documents
情報工学概論

Microsoft Word - å“Ÿåłžå¸°173.docx

ビジネス統計 統計基礎とエクセル分析 正誤表

基礎統計

講義「○○○○」

不偏推定量

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

_KyoukaNaiyou_No.4

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

第7章

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx

EBNと疫学

Microsoft PowerPoint - 基礎・経済統計6.ppt

スライド 1

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - stat-2014-[9] pptx

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

統計学の基礎から学ぶ実験計画法ー1

スライド 1

スライド 1

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

様々なミクロ計量モデル†

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

統計Ⅰ 第1回 序説~確率

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード]

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

Microsoft PowerPoint - statistics08_03.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

PowerPoint プレゼンテーション

統計的データ解析

数値計算法

Medical3

0415

Microsoft Word - appendix_b

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - Stattext11.doc

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

経済統計分析1 イントロダクション

untitled

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

Microsoft PowerPoint - e-stat(OLS).pptx

Probit , Mixed logit

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

Microsoft Word - Time Series Basic - Modeling.doc

Excelにおける回帰分析(最小二乗法)の手順と出力

モジュール1のまとめ

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - ch04j

日心TWS

PowerPoint プレゼンテーション

橡Taro13-EXCEL統計学.PDF

スライド 1

Microsoft PowerPoint ppt

青焼 1章[15-52].indd

Microsoft Word - Stattext13.doc

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

データ解析

Microsoft PowerPoint - A1.ppt [互換モード]

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

基礎数理 ()Aさんは確定拠出年金の加入者となった 投資商品は収益率がそれぞれ独立な正規分布 N(7, σ ), N(, σ y ) に従う,Y から選択することとした の過去 8 年間の収益率の実績は {8,,,5,,-,6,}(%) Y の過去 6 年間の収益率の実績は {,,,4,,}(%)

Microsoft PowerPoint - statistics-12B.pptx

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

ベイズ統計入門

JUSE-StatWorks/V5 ユーザーズマニュアル

Microsoft Word - 保健医療統計学112817完成版.docx

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

ii 3.,. 4. F. ( ), ,,. 8.,. 1. (75% ) (25% ) =7 24, =7 25, =7 26 (. ). 1.,, ( ). 3.,...,.,.,.,.,. ( ) (1 2 )., ( ), 0., 1., 0,.

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft Word - Stattext07.doc

OpRisk VaR3.2 Presentation

Microsoft PowerPoint - Econometrics pptx

数値計算法

スライド 1

Microsoft PowerPoint - JAIMAセミナー(MCM) ppt [互換モード]

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

【補足資料】確率・統計の基礎知識

第4回

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

カイ二乗フィット検定、パラメータの誤差

Transcription:

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw

正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST ( x, μ, σ, FALSE ) 累積分布関数???(-_-;) 初等関数で書けない ( が数値計算は可能 ) NORM.DIST ( x, μ, σ, TRUE ) 平均 : 分散 : ( 標準偏差 :σ)

正規分布の特徴 2 項分布の極限 観測誤差の分布 中心極限定理 平均は n で正規分布に従う 平均に関して左右対称 再生性 正規分布 ( 復習 )

前回の演習 1. X~N(20, 25) のとき P[X>25] を求めよ P[X>25]=1-P[X 25]~0.159 =1-NORMDIST(25,20,SQRT(25),TRUE)

前回の演習 2. X~N(20, 25) のとき P[X 15] を求めよ P[X 15]~0.159 =NORMDIST(15,20,SQRT(25),TRUE)

前回の演習 3. X~N(20, 25) のとき P[15 X 25] を求めよ P[15 X 25]=P[X 25]-P[X 15]~0.683 =NORMDIST(25,20,SQRT(25),TRUE) -NORMDIST(15,20,SQRT(25),TRUE) σ σ

前回の演習 4. X~N(20, 100) のとき P[10 X 30] を求めよ P[10 X 30]=P[X 30]-P[X 10]~0.683 =NORMDIST(30,20,SQRT(100),TRUE) -NORMDIST(10,20,SQRT(100),TRUE) σ σ

前回の演習 5. X~N(20, 225) のとき P[5 X 35] を求めよ P[5 X 35]=P[X 35]-P[X 5]~0.683 =NORMDIST(35,20,SQRT(225),TRUE) -NORMDIST(5,20,SQRT(225),TRUE) σ σ

前回の演習 6. X~N(30, 225) のとき P[15 X 45] を求めよ P[15 X 45]=P[X 45]-P[X 15]~0.683 =NORMDIST(45,30,SQRT(225),TRUE) -NORMDIST(15,30,SQRT(225),TRUE) σ σ

前回の演習 7. X~N(25, 100) のとき P[15 X 35] を求めよ P[15 X 35]=P[X 35]-P[X 15]~0.683 =NORMDIST(35,25,SQRT(100),TRUE) -NORMDIST(15,25,SQRT(100),TRUE) σ σ

前回の演習 3. X~N(20, 25) のとき σ=5 だから P[15 X 25]=P[20-5 X 20+5] =P[μ-σ X μ+σ] 4. X~N(20, 100) のとき σ=10 だから P[10 X 30]=P[20-10 X 20+10] =P[μ-σ X μ+σ] 5. X~N(20, 225) のとき σ=15 だから P[5 X 35]=P[20-15 X 20+15] =P[μ-σ X μ+σ] 6. X~N(30, 225) のとき σ=15 だから P[15 X 45]=P[30-15 X 30+15] =P[μ-σ X μ+σ] 7. X~N(25, 100) のとき σ=10 だから P[15 X 35]=P[25-10 X 25+10] X~N(μ, σ 2 ) のとき P[μ-σ X μ+σ] ~0.683 =P[μ-σ X μ+σ]

前回の演習 X~N(μ, σ 2 ) のとき P[μ-3σ X μ+3σ] は? 例えば X~N(20,100) として P[-10 X 50]~0.9973 =NORMDIST(50,20,10,TRUE) -NORMDIST(-10,20,10,TRUE) 3σ 3σ

標準正規分布 N(0,1) 正規分布 μ=0, σ 2 =1(σ=1) の正規分布を標準正規分布と呼ぶ X~N (μ, σ 2 ) のとき 次の確率変数 Zは標準正規分布となる

標準正規分布 N(0,1) 正規分布 密度関数 = NORM.DIST ( x, 0, 1, FALSE ) = NORM.S.DIST ( x, FALSE ) 累積分布関数 = NORM.DIST ( x, 0, 1, TRUE ) = NORM.S.DIST ( x, TRUE )

3σ 範囲 正規分布 1σ 範囲 :P[μ-σ X μ+σ] =P[-1 Z 1]=0.6827 2σ 範囲 :P[μ-2σ X μ+2σ]=p[-2 Z 2]=0.9545 3σ 範囲 :P[μ-3σ X μ+3σ]=p[-3 Z 3]=0.9973 4σ 範囲 :P[μ-4σ X μ+4σ]=p[-4 Z 4]=0.9999 正規分布の場合 99.7% のサンプルは 3σ 範囲内 3σ 3σ

確率 実現値を求める 正規分布 確率 p が与えられたとき P[-r Z r]=p を満たす r は? Z~N(0,1) 例えばp=0.9のとき 下図 90% のサンプルが入っているような範囲をみつけたい??

確率 実現値を求める 正規分布 確率 p が与えられたとき P[-r Z r]=p を満たす r は? P[-r Z r]=1-p[z -r]-p[z<r] だから P[Z -r](=p[z<r])=(1-p)/2 となるrを求めればよい P[Z -r]=5% P[Z<r]=5%??

確率 実現値を求める 正規分布 確率 p が与えられたとき P[-r Z r]=p を満たす r は? 正規分布の累積分布関数が書けないので P[Z -r]=(1-p)/2の解 r も初等関数で表せないが 数値計算は可能 =NORM.S.INV( 確率 ) ( 標準正規分布の累積分布関数の逆関数 ) NORM.S.INV(0.05) =-1.64485 1.64485??

確率 実現値を求める 正規分布 確率 p が与えられたとき P[-r Z r]=p を満たす r は? r=norm.s.inv( (1-p)/2 ) 90% のサンプルが入っている範囲は -1.64485 Z 1.64485-1.64485 1.64485

標準正規分布 N(0,1) 正規分布 密度関数 = NORM.S.DIST ( x, FALSE ) 累積分布関数 = NORM.S.DIST ( x, TRUE ) 累積分布関数の逆関数 確率から実現値を求める = NORM.S.INV ( p )

t 分布 T(ν) t 分布 ν( ニュー ; ギリシャ文字 ): 自由度 サンプルサイズ-1 νを大きくするとn(0,1) に近づく Wikipedia:t 分布 平均 :E[X]=0 分散 :V[X]=ν/(ν-2) (ν>2)

考案した人 t 分布 William Sealy Gosset a.k.a. Student 1876-1937 ペンネームから Student の t 分布 とも呼ばれる 名付けたのは Fisher サンプルサイズが少なくてもなるべく正確な統計にしたい http://ja.wikipedia.org/wiki/%e3%82%a6%e3%82%a 3%E3%83%AA%E3%82%A2%E3%83%A0%E3%83%BB %E3%82%B4%E3%82%BB%E3%83%83%E3%83%88

t 分布 t 分布 次の確率変数 T の分布 n 個の (μ, σ) 正規分布に従う確率変数 X1~Xn の標本平均 n 個の (μ, σ) 正規分布に従う確率変数 X1~Xn の ( 不偏 ) 標準偏差

t 分布 T(ν) 密度関数 t 分布 = T.DIST(x, ν, FALSE) 累積分布関数 = T.DIST(x, ν, TRUE) 累積分布関数の逆関数 = T.INV( p, ν ) 信頼区間を求めるときに出てきた関数

正規分布の期待値の区間推定 分散が未知の場合 :CONFIDENCE.T 信頼区間 : c= ー t U / n U:( 不偏 ) 標準偏差 ( 不偏分散の平方根 ); サンプルから計算 n : サンプルサイズ t :=-T.INV( (1-α)/2, ν ) α : 信頼度 ν: 自由度 =n-1 =CONFIDENCE.T( 1-α, U, n ) 分散未知な正規分布の平均の信頼幅 (Confidence Interval) 1-α : 有意水準 =1- 信頼度 (95% 0.05 90% 0.01)» 2で割らないことに注意

正規分布の期待値の区間推定 分散が既知の場合 :CONFIDENCE.NORM 信頼区間 : c= ー zσ/ n σ : 標準偏差 ( 母分散の平方根 ) n : サンプルサイズ =-z*σ/sqrt(n) z= NORM.S.INV( (1-α)/2 )» α : 信頼度 =CONFIDENCE.NORM( 1-α, σ, n ) 分散既知な正規分布の平均の信頼幅 (Confidence Interval) 1-α : 有意水準 =1- 信頼度 (95% 0.05 90% 0.01)» 2で割らないことに注意

この講義で学習したこと レポート 論文での研究 分析手法 分析プラン : テーマ 仮説 分析ポイント 統計での分析手法 サンプルデータの扱い 度数分布 ( ヒストグラム ) 特徴量 ( 平均 中央値 標準偏差 分散 ) サンプルデータの分布の推定 分布の種類を推定 離散 二項分布 / 幾何分布 / ポアソン分布 / 連続 指数分布 / 正規分布 / 点推定と区間推定 ( 信頼区間 ) 正規分布のサンプルのみ 分布が与えられたときの確率の計算

多くの分布 この講義で学習しなかったこと ロングテール / ヘビーテールに属する分布 世の中のいろいろな現象は裾の重い分布 これらの現象に裾の軽い分布を適用すると 滅多に起こらない方の確率を過小評価することになる パレート分布 対数正規分布 ワイブル分布 ( 一部 ) t 分布 etc. 統計学の手法 * 検定 * 多変量解析 ベイズ統計 機械学習 etc.

今日の演習 資料ページに戻る