経済統計分析1 イントロダクション

Similar documents
Medical3

基礎統計

Microsoft PowerPoint - e-stat(OLS).pptx

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

スライド 1

スライド 1

Microsoft Word - å“Ÿåłžå¸°173.docx

統計的データ解析

Medical3

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

情報工学概論

Microsoft PowerPoint - Statistics[B]

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - Econometrics pptx

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft PowerPoint - sc7.ppt [互換モード]

EBNと疫学

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft Word - Stattext12.doc

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - statistics pptx

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - stat-2014-[9] pptx

Probit , Mixed logit

PowerPoint プレゼンテーション

講義「○○○○」

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

モジュール1のまとめ

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Microsoft PowerPoint - 資料04 重回帰分析.ppt

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

第7章

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

カイ二乗フィット検定、パラメータの誤差

PowerPoint プレゼンテーション

Excelにおける回帰分析(最小二乗法)の手順と出力

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext13.doc

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

不偏推定量

Microsoft Word - apstattext04.docx

Microsoft Word - HM-RAJ doc

Microsoft Word - 補論3.2

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - 測量学.ppt [互換モード]

13章 回帰分析

様々なミクロ計量モデル†

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

数値計算法

Microsoft PowerPoint - statistics pptx

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

経済統計分析1 イントロダクション

Microsoft PowerPoint - ch04j

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - apstattext03.docx

Microsoft Word - lec_student-chp3_1-representative

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

Microsoft Word - 保健医療統計学112817完成版.docx

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Microsoft Word - appendix_b

Microsoft Word - mstattext02.docx

Microsoft Word - reg2.doc

ANOVA

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

ベイズ統計入門

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft Word - reg.doc

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft PowerPoint - Inoue-statistics [互換モード]

数値計算法

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

クロス集計表の作成 2 つのカテゴリ変数をもつデータがあるとする ( 例 )AGE( 年齢 ),EXPOSURE( 曝露の有無 ) と DISEASE( 病気の有無 ) についての 40 人のデータ タブ区切りテキストファイル

環境水の分析

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

1.民営化

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

Microsoft PowerPoint - A1.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft Word - Time Series Basic - Modeling.doc

MedicalStatisticsForAll.indd

MT2-Slides-13.pptx

データ解析

基礎統計

EBNと疫学

基礎数理 ()Aさんは確定拠出年金の加入者となった 投資商品は収益率がそれぞれ独立な正規分布 N(7, σ ), N(, σ y ) に従う,Y から選択することとした の過去 8 年間の収益率の実績は {8,,,5,,-,6,}(%) Y の過去 6 年間の収益率の実績は {,,,4,,}(%)

一元配置分散分析法 F 検定と Welch 検定 一元配置分散分析で一般的に使用される F 検定は すべてのグループが共通だが未知の標準偏差 (σ) を共有するという仮定に基づきます 実際には この仮定が当てはまることはまれで その結果 タイプ I 過誤率の制御が難しくなります タイプ I の誤りと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

Transcription:

1 経済統計分析 9 分散分析

今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2

仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から, 実現する確率 (p 値 ) が求まる 手続き 1. 仮説を立てる. 2. 有意水準を決める. 3. 検定統計量 (test statistics) を計算する. 4. p 値を求めて, 棄却 / 受容を判定する. 3

Χ 2 分布 Chi-squared 自由度 m のカイ 2 乗分布 m 個の独立した標準正規分布に従う確率変数の 2 乗和の分布 互いに独立な標準正規分布に従う確率変数を Z 1, Z 2, Z 3 とおくと. Z 12 + Z 22 + Z 3 2 は自由度 3 のカイ 2 乗分布に従う 4 http://www.ias.tokushima-u.ac.jp/linguistik/2005/joho/joho2005_chi.html

F 分布 自由度 m 1, m 2 の F 分布 自由度 m 1 のカイ 2 乗分布に従う確率変数を m 1 で割ったものと, 自由度 m 2 のカイ 2 乗分布に従う確率変数を m 2 で割ったものの比は自由度 m 1, m 2 の F 分布に従う いま, 確率変数 U 1 が自由度 m 1 のカイ 2 乗分布に従い, 確率変数 U 2 が自由度 m 2 のカイ 2 乗分布に従うとすると, カイ 2 乗分布,F 分布の出番 2 乗して和をとっている 分散に関係しそう U / m 1 1 m1, m2 F U2 / m は自由度の分布に従う 2 分散の比を調べたりしそう 5

適合度検定 ( 例 ) サザエさん症候群 (Blue Monday) の検定 吉田耕作 直感的統計学 p.285-286 曜日ごとの丌良率を, 各曜日に100 個ずつ取り出して調べてみた 曜日 月曜 火曜 水曜 木曜 金曜 合計 丌良数 10 3 0 0 2 15 丌良率が曜日によって異なるかどうかを有意水準 5% で検定しよう. 検定のイメージ 丌良率が曜日によって同じ ( 帰無仮説 ) なら, 同じ回数だけ起こるはずしかし, サンプル誤差はありうるから, 少しはずれるかもしれない丌良率が曜日によらないなら, 毎日丌良品が3 個 (=15/5) あるはずそれぞれの曜日の ずれ の和の大きさで判断しよう ずれ をそのまま足すと, 正と負が相殺してしまう 2 乗和をとる. 6

適合度検定 ( 例 ) 実際の手続き 曜日 月曜 火曜 水曜 木曜 金曜 合計 丌良数 10 3 0 0 2 15 理論値 3 3 3 3 3 誤差 2 7 2 0 2 3 2 3 2 1 2 揃え 7 2 /3 0 2 /3 3 2 /3 3 2 /3 1 2 /3 22.66 7 理論値と実現値の差を理論値で割ったものを 2 乗して足す ずれ の総和とみなすことができる もし帰無仮説が正しければ, この ずれ和 は自由度 4 のカイ 2 乗分布に従うことが分かっている カイ 2 乗分布は 2 乗和で定義されていたことを思い出そう. 自由度 4 のカイ 2 乗分布の上側 5% 点は 9.488 帰無仮説を棄却 曜日によって丌良率が異なる という仮説を棄却

適合度検定 目的 状況 度数データが不えられているとき, 理論的度数分布と一致するかどうかを検定する 母集団が k 個のカテゴリに分類できる n 個からなるサンプルのうち, カテゴリ i に属する個数を X i と書く カテゴリ i に属する理論的な確率を p i と書く つまり, カテゴリ i の理論的度数は np i となる 検定統計量 Q k i1 X 2 i npi 2 np i ( k1) 8

適合度検定 ( 練習問題 ) 丌良品個数が次のようであったら, 曜日効果は認められるか 曜日 月曜 火曜 水曜 木曜 金曜 合計 丌良数 8 4 2 2 4 9 検定統計量は 6 となり, 帰無仮説を棄却しない.

独立性の検定 ( 例 ) 教授はエライか検定 吉田耕作 直感的統計学 p.302-303 教授の階級と査読付き論文数の同時度数分布 ( 人 ) を作ってみた 論文数と教授の階級が関係ないかどうか検定しよう 検定のイメージ 10 本数 講師 助教授 准教授 正教授 合計 0 8 18 16 6 48 1~2 0 2 2 2 6 3~4 0 0 3 0 3 5 以上 0 0 1 2 3 合計 8 20 22 10 60 論文数が階級によって同じ ( 帰無仮説 ) なら, 分布が同じになるはず 適合度検定と似たような発想で.

独立性の検定 ( 例 ) 実際の手続き 階級に関わらず, 論文数の分布が周辺分布に等しいと仮定すると理論的な度数分布は 本数 講師 助教授 准教授 正教授 合計 0 6.40 16.00 17.60 8.00 48 1~2 0.80 2.00 2.20 1.00 6 3~4 0.40 1.00 1.10 0.50 3 5 以上 0.40 1.00 1.10 0.50 3 合計 8 20 22 10 60 適合度検定と同じく, 仮説的な度数分布との差の 2 乗を理論値で除したものの 2 乗和をとったものが検定統計量 = 13.204 自由度 9 のカイ 2 乗分布に従うから, 有意水準 1% で帰無仮説を受容 11

独立性の検定 目的 状況 2 次元の度数データが不えられているとき, 理論的度数分布と一致するかどうかを検定する 母集団が k m 個のカテゴリに分類できる ( 分割表 と呼ぶ ) n 個からなるサンプルのうち, カテゴリ (i, j) に属する個数を X i,j と書く カテゴリ (i, j) に属する理論的な確率を p i p j と書く 分布が独立であれば, 同時確率は周辺確率の積となる 周辺確率は周辺度数から求める つまり, カテゴリ (i, j) の理論的度数は n p i p j となる 検定統計量 12 m k X 2 i j npi p j j1 i1 i j, 2 Q ( k 1)( m 1) np p

独立性の検定 ( 練習問題 ) 管理職のレベルと高血圧の関係が以下のようであるとき, 職階と高血圧は独立に分布しているといえるか 自由度 2 のカイ 2 乗分布の上側 5% 点は 5.991. 吉田耕作 直感的統計学 p.300 重役級 部長級 課長級 合計 高血圧 80 140 80 300 正常 40 160 400 600 合計 120 300 480 900 13 検定統計量は 144 で, 帰無仮説を棄却.

分散分析 ( 例 ) 貯蓄率は職業によって異なるか? 中村ほか 統計入門 pp.224-226 貯蓄率を職業別に尋ねてみた 貯蓄率が職業によって異なるかどうかを検定してみよう [ 注意 ] 今回はカテゴリではなくて連続変数を扱っていますよ. 検定のイメージ 14 職業 A 21 21 15 13 B 16 20 20 18 23 23 C 15 18 16 16 15 貯蓄率が平均的に等しければ ( 帰無仮説 ), 職業別の平均からの分散と, 全体の平均からの分散は等しくなるはず 平均からの乖離が正規分布に従うなら,F 分布が利用できる F 分布は分散の比で定義されたことを思い出そう.

分散分析 ( 例 ) 職業ごとの平均値を出してみると 職業 平均 A 17.5 21 21 15 13 B 20.0 16 20 20 18 23 23 C 16.0 15 18 16 16 15 職業ごとに平均値が異なるとすると, 偶然変動の 2 乗和は 95. 全体の平均は18なので, 全体的な変動の2 乗和は,140 職業ごとの変動の2 乗和は 4(-0.5) 2 + 6(2.0) 2 + 5(-2.0) 2 = 45 全変動 (140)= 職業変動 (45)+ 偶然変動 (95) F = (45/2)/(95/12) = 2.84 15 職業 平均 A 17.5 3.5 3.5-2.5-4.5 B 20.0-4.0 0.0 0.0-2.0 3.0 3.0 C 16.0-1.0 2.0 0.0 0.0-1.0

1 元配置分散分析 ANOVA: Analysis of Variance 目的 状況 サンプルがいくつかのカテゴリに分類されるとき, カテゴリごとの平均値が全て等しいかどうかを検定する カテゴリ i には観測値が n i 個だけあり, カテゴリは m 個ある. 総数は n カテゴリ i の j 番目の観測値の値は x ij と書く 標本平均を上付き線で表す 変動の分解 : 誤差の 2 乗和 16 全変動 : 全体の平均との偏差 2 乗和 全変動 級間変動 n i m x 2 ij X i1 j1 n i m m Xi X ni X i X i1 j1 i1 2 2 級間変動

1 元配置分散分析 変動の分解 級内変動級内変動 このとき, 全変動 = 級内変動 + 級間変動 帰無仮説 全ての平均が等しい 級間の分散 = 級内の分散 検定統計量 n i m x 2 ij Xi i1 j1 各観測値が独立に正規分布に従うと仮定するとき, 級間変動 / ( m 1) F比 F( m 1, n m) 級内変動 / ( n m) 17

分散分析表 分散分析表平方和自由度分散 F 比 m 級間 2 m - 1 SA S V A / V A ni X i X V E A i1 m 1 m n 級内 i S 2 n - m SE E xij X i VE i1 j1 n m m n i 全体 2 ij S x X i1 j1 MS-Excelで分散分析を行うと, このような出力が得られる. 自分で変動を計算して,F 検定してもよいんですよ (fdist 関数,finv 関数 ). やってみよう ( 練習問題 ). 18

MS-Excel で分散分析 MS-Excel 2007 でやってみた データ データ分析 分散分析 : 一元配置 出力 ( 桁だけそろえた ) 分散分析 : 一元配置 概要グループ 標本数 合計 平均 分散 行 1 4 70 17.5 17 行 2 6 120 20 7.6 行 3 5 80 16 1.5 19 分散分析表 変動要因 変動 自由度 分散 観測された分散比 P- 値 F 境界値 グループ間 45 2 22.500 2.842 0.098 3.885 グループ内 95 12 7.917 合計 140 14

2 元配置分散分析 1 元配置分散分析ではカテゴリが 1 種類 2 元配置分散分析ではカテゴリが 2 種類 2つのカテゴリで定義されるcellごとに級内変動を計算検証するモデルを X e ij Ai Bi ij とすると, 偶然誤差は x Xˆ x X X X ij ij ij i,.., j このばあいでも, 総変動は, それぞれのカテゴリについての級間変動と, 上で定義した偶然誤差 ( 級内変動 ) の和に分解される 20 でも, 計量経済学では, 分散分析はあんまり用いられない気がする ダミー変数で回帰すればいいような?