Microsoft PowerPoint - 基礎・経済統計6.ppt

Similar documents
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - 測量学.ppt [互換モード]

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

3章 度数分布とヒストグラム

情報工学概論

基礎統計

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

3章 度数分布とヒストグラム

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - statistics pptx

_KyoukaNaiyou_No.4

様々なミクロ計量モデル†

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

不偏推定量

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

モジュール1のまとめ

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

Microsoft Word - lec_student-chp3_1-representative

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

講義「○○○○」

Probit , Mixed logit

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - Stattext07.doc

Microsoft PowerPoint ppt

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft PowerPoint - Statistics[B]

経営統計学

スライド 1

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft Word - 補論3.2

untitled

Microsoft PowerPoint - 第3回2.ppt

統計学の基礎から学ぶ実験計画法ー1

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

数値計算法

散布度

Microsoft Word - NumericalComputation.docx

データの種類とデータの分布

第4回

Microsoft PowerPoint 確率レジュメA

Microsoft Word - å“Ÿåłžå¸°173.docx

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

Microsoft Word - apstattext04.docx

Microsoft Word - Stattext12.doc

テレビ講座追加資料1105

EBNと疫学

データ解析

基礎統計

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft PowerPoint - statistics08_03.ppt [互換モード]

スライド 1

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - Inoue-statistics [互換モード]

第7章

Microsoft Word - Stattext11.doc

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

対数正規分布

パソコンシミュレータの現状

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

DVIOUT-mem

PowerPoint Presentation

青焼 1章[15-52].indd

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

画像類似度測定の初歩的な手法の検証

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

画像処理工学

スライド 1

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - -

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft Word - 微分入門.doc

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

学習指導要領

Medical3

stat-base_ppt [互換モード]

2013年度 九州大・理系数学

統計学的画像再構成法である

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

情報量と符号化

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Transcription:

. 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別 : 男に という値を割り振り, 女には 0 を割り振る < 質的尺度の数値化 > ある夫婦の子供の数 :0,,,3,4, < 元々離散 > これらが確率的に決まる場合 連続値なら連続確率変数 離散値なら離散確率変数 度数分布表の応用による確率の表現 度数分布表 データ {4,3,6,5,3,6,4,,,5,,} 階級 階級値相対度数累積相対度数 /6 /6 0.5~.5.5~.5 /6 /6.5~3.5 3 /6 3/6 3.5~4.5 4 /6 4/6 4.5~5.5 5 /6 5/6 5.5~6.5 6 /6 6/6 さいころの確率の 確率分布表 区間 確率変数値 確率 累積確率 0.5~.5 /6 /6.5~.5 /6 /6.5~3.5 3 /6 3/6 3.5~4.5 4 /6 4/6 4.5~5.5 5 /6 5/6 5.5~6.5 6 /6 6/6 3 4 度数分布表, ヒストグラムを応用した確率のグラフ表現 階級は区間と対応 相対度数と確率を対応させて考える 累積相対度数を累積確率に対応させる この対応をつかって確率に対する 度数分布表, 累積度数分布表, ヒストグラム, 累積ヒストグラム などを考える それぞれの呼び方は確率を前につけて, 確率分布表, 累積確率分布表, 確率ヒストグラム などとよぼう. また, この 確率分布表 を元にその平均, 分散を求める. 確率分布に対する平均, 分散 データの度数分布表を元に計算する平均, 分散は標本平均, 標本分散と以後呼ぶ 5 3. 確率関数 3. 概念 離散確率変数に限定 離散確率変数の分布を特定する方法は? 飛び飛びの値それぞれになる確率を示す 確率関数 i, L, v i, つまり, 確率変数 は 個の飛び飛びの値をとるとする. v ( ( ( i P vi p p 0 確率関数を表にすると 確率分布表 になる. 6

3. 確率関数とヒストグラム 確率関数のグラフ ある値をとる確率 ( 全事象のうちある値をとる割合 確率関数はある意味で 確率ヒストグラム の極限 ヒストグラムの縦軸として相対度数 ( 全標本のうちある階級に属する割合 ではなく確率をとり, 階級幅をどんどん縮めると確率関数のグラフが得られる. 例はサイコロの目 確率 0. 0.5 0. 0.5 0.5 0. 0.075 3 4 5 6 7 3 4 5 6 HL 値 3. の詳しい説明 ヒストグラムの確率版 確率変数値がある区間 ( a, ] ( 階級 に属する確率をもとにヒストグラムを書く a < に対する縦軸の値は, P[ a < ] となる. a,の間隔をどんどん狭めていく. さいころの場合は, P[ a < ] は P ( に近づく,,3,4,5,6 に関しては/6, それ以外は0となる. つまり, 確率関数のグラフになる. 7 8 4. 確率分布関数 4. 概念 離散確率変数でも連続確率変数でも定義可 確率変数 の分布関数 F( F ( P( 離散確率変数の場合 以下の値をとる確率の合計 F( p( v I ( p( v I v i i ( v i vi vi i 0 9 4.. 確率分布関数と 累積確率分布表 確率分布関数はある値 以下の確率の合計 確率分布関数の表を作成すると 累積確率分布表 ができる. 累積確率分布表 から 累積確率ヒストグラム を作成する. それは, 確率分布関数のグラフとは違う, 区間幅を狭めることによって, 累積確率ヒストグラム を確率分布関数にいかようにも近づけうる. 0 4. の説明 累積相対度数分布の確率版 確率変数値がある区間 ( a, ] ( 階級 に属する確率をもとに相対度数分布を書き, それを累積することで累積相対度数分布を求める. a < に対する縦軸の値は, P( となる. a,の間隔をどんどん狭めていく. がに近づいていく P が縦軸の値になる ( 累積相対度数の確率版の極限が分布関数 4. の説明グラフ サイコロの目の累積相対度数グラフ ( 下は累積度数多角形 と分布関数グラフ 0. 0. 3 4 5 6 0. 確率 - 3 4 5 6 7 HL 値 0 40 60

4.3 確率分布関数と区間確率 累積相対度数分布からある階級の相対度数を求める ある階級の累積相対度数ーその直前の階級の累積相対度数 類推 P( a < P( P( a F( F( a つまり, ある区間の確率 < ある階級の相対度数 > は, 分布関数の区間の上限の時の値 < その階級の累積相対 > ー区間下限の時の値 < その直前の階級の累積相対 > できまる. 3 5. 確率密度関数 5. 連続確率変数と確率ヒストグラム 離散確率変数についてはヒストグラムに対応するものとして, 確率関数のグラフが考えられた 連続確率変数とは確率分布関数が連続のもの 連続確率変数ではどうだろうか? 離散の場合と同様にやってみると P ( を得る しかし, P ( は連続確率変数の場合は0 つまり, 連続確率変数の場合は, 確率関数は0の値しかとらない. その意味でヒストグラムの極限は横軸に一致する.-> 困った! 4 連続確率変数の場合 ( 0になる F( Pr[ ] はに関して連続である. それを利用するために, 正の小さい数 εに対して F( ε Pr[ ε ] を考える. F( F( ε Pr[ ] Pr[ ε ] Pr[ ε < ] Pr[ ] 0 となる. ところが,F( の連続性から, lim{ F( F( ε } 0となるので, 上の式の最左 ε 0 辺も lim Pr[ ] Pr[ ]. 0 0 ε P 5 5. 連続確率変数と修正ヒストグラム ヒストグラムの場合, 棒グラフの面積の合計はではない. ヒストグラムの面積の合計がになるようにしよう. ( 階級幅 棒の高さ の合計 になるようにする 相対度数の合計 棒の高さ 相対度数 / 階級幅にすればよい. そうすれば, ある階級の累積相対度数は, その階級までのヒストグラムの棒の面積の合計 修正ヒストグラムと呼ぼう 6 5. 連続確率変数と修正ヒストグラム 連続確率変数の場合 修正ヒストグラムの確率版 P( a < が a < のときの, 縦軸 棒の高さ a 幅を0に近づけたときの極限 修正ヒストグラムの極限グラフ P( a < つまり, 横軸がのとき, 縦軸が lim a a これを確率密度関数のグラフと呼ぶ 5.3 確率密度関数の概念 確率密度関数 P ( ( ( a < F( F( a f f lim lim F ( a a a a なぜ密度か? P( a < は確率を区間の長さ 次元面 a 積で割っているので確率の密度と考えられる. a,をに近づけているのでという点での確率密度 7 8 3

5.4 確率と確率密度関数 ( 5.4 確率と確率密度関数 ( 修正ヒストグラムの棒の面積のある階級まで合計と, 一つ前の階級までの棒の面積の合計の差がある階級の相対度数 ( 確率 この考え方を修正ヒストグラムの極限である確率密度関数に適用しようー > 右図の灰色の面積が P( a < 0.5 0.5 0. 0.075 3 4 5 6 f x 0. 0. -4 - a 4 9 灰色の面積は密度関数の定積分で表せるから, P( a < P( a f ( d a また, とすると, P f d F a ( ( ( では, 離散確率変数に確率密度関数はあるか? 離散の場合, ヒストグラムの極限は確率関数 確率密度関数は修正ヒストグラムの極限 離散の場合, 修正ヒストグラムは, 確率 / 階級幅 ありえる値のところでは, 確率関数が正の値をとるので, 階級幅を 0 に近づけると, 修正ヒストグラムの極限 確率密度は無限大 よって, 離散の場合, 確率密度関数は存在しない. 0 6.5 確率関数と密度関数の基本性質 確率関数の場合 確率によるヒストグラムの極限だから関数値 ヒストグラムの高さの合計は確率の合計 確率関数の合計は f ( v i 確率密度関数の場合 ヒストグラムの面積がになるようにした修正ヒス トグラムの極限だから, 密度関数の面積合計も f d F F P P ( ( ( ( ( 0 6. 分布の代表値 データの場合のアナロジー 相対度数によるヒストグラム 代表値 確率分布によるヒストグラム 代表値 分布の代表値 分布の平均 ( 母平均 または期待値 分布の分散 ( 母分散 分布のパーセント点 6. 分布の平均 ( 母平均, 期待値 6. 分布の分散 ( 母分散 分布の重心 計算法 離散確率変数の場合 とりうる値に対してその値になる確率 ( その値に対する確率関数の値 をかけたものの合計 [ ] µ µ vip( vi vi p( vi 連続確率変数の場合 [ ] µ µ f ( d 3 確率分布の散らばりの指標 計算法 離散確率変数の場合 V [ ] σ ( vi p( vi 連続確率変数の場合 V [ ] σ ( f ( d 4 4

6.3 確率変数から新たな確率変数を作る 確率変数 の関数もまた確率変数確率変数 g( ができる たとえば, 3 + e.となったときの この確率変数 3 + e の値は 3 + e e + この確率変数 g( の分布関数は, F ( ( P( g( P g ( g ( F ( g ( 期待値計算 (vi を g(vi, をに置き換える [ g( ] g( vi p( v i [ g( ] g( f ( d 5 6.3 期待値, 分散の演算 ( 期待値の性質 離散の場合 [ ] ( vi p( vi 連続の場合 i [ ] ( f ( d f ( d f ( d µ 0 v p ( vi p( vi µ 0 6 6.3 期待値, 分散の演算 ( 期待値の演算,Yは確率変数,a,は確率変動しないとする [ a + Y ] a[ ] + [ Y ] 分散の演算 V ( a + a V ( と Y が独立の場合 V ( a + Y a V ( + V ( Y 6.4 分布のパーセント点 確率変数 の分布のα% 点 F( P( α / 00 となるの値 分布の中央値 ( メジアン F P 0. となるの値 ( ( 50 7 8 7. 正規確率変数と正規分布 7. 独立な変数の和の分布 ( 独立な確率変数の和の分布を考える,, L, を独立で期待値 [ i ] 0, 分散 V ( i の確率変数の列とする 例えば, コインを繰り返し投げる場合,i 回目に投げたときに表がでると, 裏がでると-の値をとるような確率変数を i とする. この場合, 平均 0で分散がの確率変数列になる このとき, S + + L+ は [ S ] ( ( 0 V ( S ( ( 7. 独立な変数の和の分布 ( Sをその標準偏差 で割る V S V S / [ ] ( ( 一般的にある確率変数をその標準偏差で割って得られる確率変数は分散, 標準偏差ともに. S は平均 0, 分散 の確率変数. さらに を大きくしていくと 0. S の密度関数はきれ + L+ 0 + L+ いな釣り鐘型をする. a -4-4 V + + V 4 + 43 + 9 30 0. f x 5

S の修正確率ヒストグラムの推移 0.5 0. 0.5 0. 0. 0. -6-4 - 4 6-4 - 4 0 0. 0. 0. 0. -4-4 -4-4 00 000 3 正規確率変数に近づく について ( 修正ヒストグラムでの階級の決め方 Sの値はが奇数の場合奇数,が偶数の場合は偶数になる. 従って,Sの値の間隔は. 取りうる値同士の真ん中に階級の境目を持ってくる. P S P < S + ( ( S P 連続補正の根拠 S + P < 3 正規確率変数に近づく について ( 別の階級の決め方では? P( S P( / < S + / S / S + / P P < つまり階級幅を半分で考える. この場合は, P S 0 P / < S / ( ( 0 3 つまり, 修正ヒストグラムは, そこでは0. 33 S の修正確率ヒストグラムの推移連続補正しない場合 0.5 0. 0. -6-4 - 4 0. -4-4 0. -4-4 0. -4-4 34 正規確率変数に近づく について (3 連続補正に対応しない階級幅の取り方をすると, 修正ヒストグラムは極限は連続な密度関数にならない. 連続確率分布での近似は出来ない. 今回は, S の離散確率分布ががどんどん大きくなるにつれて連続確率分布に近づくことを示したいので, このような修正ヒストグラムではその様子はわからない. 同時になぜ連続補正が必要かも示している. 35 7. 独立な変数の和の分布 (3 S の極限分布 標準正規分布とよぶ (N(0, と書く 密度関数 f ( e π このような分布を持つ確率変数をZとする. 一般の正規分布 平均 μ, 分散 σ ( 標準偏差 σ の正規分布 ( N( µ,σ は確率変数 σ Z + µ の分布 ( µ σ f ( e πσ 36 6

修正確率ヒストグラムの極限が例の密度関数になっている 0. 0. -4-4 3,0,00,000 について修正ヒストグラムの上部のみを重ねて描いた 0. 0. -4-4 00,000 の修正ヒストグラムと前ページの関数を重ねて書いた 37 7. 正規分布表 逆に平均 μ, 標準偏差 σの正規分布は標準正規分布の確率変数 Zを使って σ Z + µ で表せるから, Z はN(0, の分布となる. σ 従って, ( µ s µ µ P s P P Z s σ σ σ となり, s 確率は標準正規分布の確率変数が以下 σ になる確率 教科書 p.79の標準正規分布表を使えば計算可 38 注意 正規分布は平均の値を軸にして左右対称な密度関数を持つ 故に, 平均の値を軸にして左右対称な確率分布関数を持つ よって, P( Z a P( Z a P( Z a または, P( Z a P( Z a P( Z a 例えば, P( Z P( Z P( Z P( Z < P( Z 39 7.3 偏差値の意味 正規分布している変数の場合, 偏差値が特定の値以下である確率は標準正規分布表から求められる. 偏差値 S S 0 + 50 σ 仮定の下では S Z 0 + 50 よって偏差値は仮定の下で平均 50, 標準偏差 0の正規分布 従って, S ( 50 50 50 P S P P Z 0 0 0 40 例 ある変数が正規分布に従っているとして, その偏差値が65 以下になる確率は, 65 50 P Z P( Z.5 0. 933 0 逆にいうと偏差値 65を上回る確率は6.68% まあ, 一人一人の試験の点をみたときそれが, 正規分布に従う確率変数であることは少ないですが... 4 7