Microsoft PowerPoint - statistics pptx

Similar documents
Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - Statistics[B]

基礎統計

EBNと疫学

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft Word - Stattext12.doc

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - Econometrics pptx

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

ビジネス統計 統計基礎とエクセル分析 正誤表

情報工学概論

Medical3

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - e-stat(OLS).pptx

統計的データ解析

Microsoft Word - Stattext11.doc

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - ch04j

講義「○○○○」

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft Word - Stattext13.doc

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - apstattext05.docx

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

第7章

Microsoft Word - apstattext04.docx

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft PowerPoint - A1.ppt [互換モード]

経済統計分析1 イントロダクション

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

統計学の基礎から学ぶ実験計画法ー1

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

数値計算法

PowerPoint プレゼンテーション

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

Medical3

不偏推定量

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

untitled

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 )

PowerPoint プレゼンテーション

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

青焼 1章[15-52].indd

スライド 1

モジュール1のまとめ

MT2-Slides-13.pptx

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

JUSE-StatWorks/V5 ユーザーズマニュアル

スライド 1

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

_KyoukaNaiyou_No.4

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

厚生労働科学研究費補助金(循環器疾患等生活習慣病対策総合研究事業)

Microsoft Word - appendix_b

データ科学2.pptx

. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)

Microsoft Word - å“Ÿåłžå¸°173.docx

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - データ解析基礎2.ppt

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

0415

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

< E188CA8C9F8FD88A65955C2E786C73>

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Microsoft PowerPoint - statistics pptx

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

平成13-15年度厚生労働科学研究費補助金

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

様々なミクロ計量モデル†

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 基礎・経済統計6.ppt

1

Microsoft PowerPoint - 08economics4_2.ppt

Microsoft Word - apstattext03.docx

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft Word - reg2.doc

<8C6F8DCF8CA48B86985F8F D342D E656339>

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

第1回

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

Transcription:

統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/

講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword: 仮説検定, 帰無仮説, 対 仮説, 有意 準, 検定統計量, 棄却域 参考書 砂. 75 90 居. 9 屋. 93 5

母比率の差の検定 (), つの地域において,9 歳の 性を対象に配偶者の有無を調査したところ次の結果が得られた 地域 と地域 の婚姻率には差があるといえるだろうか 有意 準 5% で検定しなさい 婚姻率には差があるといえるだろうか の婚姻率と の婚姻率の差の検定 地域 の真の婚姻率を を検定 H H 0 : :, 地域 を とおくとき との婚姻率に差はない との婚姻率に差はある 3

配偶者がいる人の割合 [%]( 女性 ) 9 歳 4 歳 9 歳 34 歳 39 歳 44 歳 49 歳 54 歳 59 歳 64 歳 新潟県.7 8.9 50.7 67.0 7.7 76.6 8. 8.6 8.6 77.0 富 県. 7.3 5.3 69.5 75.3 79.6 83. 84.0 8.3 78.0 川県.6 7.0 50.4 68.6 73.8 76.5 80.5 8.7 80. 76.4 福井県. 8. 5. 7. 78.5 80.8 8.8 84.6 8.4 76.6 梨県 0.9 7.4 50.6 68.8 73.8 76.8 80.4 8.3 79.6 76. 野県.8 7.5 50.9 68.3 73.9 77.8 8. 8.9 8. 78.8 岐 県.6 8.7 53. 70.3 76.0 79.0 8.9 83.7 8.7 78.9 静岡県.3 9.4 53.5 68.4 73.8 75.5 79.3 8.9 80.5 76.7 愛知県.9 7.7 54. 70.5 75. 77.4 80.0 8.5 80.8 77.7 三重県. 0.5 5.9 70.4 75.0 77.9 8. 83.7 8.6 78.7 滋賀県.6 7.6 5.5 70.7 77. 80.3 84.6 84.9 84.0 80. 国勢調査 ( 総務省 )00 年 4

母比率の差の検定 () 集団 地域 の9 歳 性婚姻率 母比率 : 母分散 : 試 回数 回の 項分布,, 集団 地域 の 9 歳 性婚姻率 母平均 : 母分散 : 標本抽出標本抽出 サンプル サイズ 80 サンプル サイズ 0 それ以外 = 0,,,,,, 結婚している = 標本比率 標本の婚姻率 標本比率 標本の婚姻率 i j 90 80 0.5 66 0 0.55 5

6 母比率の差の検定 (3) N N, ~,, ~ N V V V E, ~ 0, ~, N 標準化するとを検定するために, ( 比率の差 ) の分布を考える H 0 : 0 V V V 注意 差の分散は分散の和になる標本 率の分布 ( 中 極限定理 )

7 母比率の差の検定 (4) 合併標本比率 のもとでの検定統計量は以上より, より計算する. ( 合併標本比率 ) はただし, の分散を次のように書き換えることができる を定義 を仮に正しいと考えて, 合併標本比率 0 : : 0 0 j i H H と を合わせた婚姻率 ( 地域の区別なく求める標本 率 ) C z L 0 C z U 棄却域は両側にとる 0, ~ N

8 母比率の差の検定 (5) 0.849 0.0589 0.05 0.48 0.5 0 80 0.55 0.5 : 検定統計量 つの地域で婚姻率に差があるとはいえない 結論 を採択しない を棄却しない 判定 検定統計量は棄却域に入らないので :, : H 0 H 0.5 300 56 0 80 66 90 : j i 合併標本比率両側検定なので絶対値で棄却域を考える

練習問題 () サッカー 本代表のある国際 会における試合の視聴率は関東地区で 33 %, 関 地区で 7 % だった 関東と関 で視聴率に差があったと えるか 有意 準 5% で検定しなさい ただし, 標本サイズはどちらの地区も,000 であるとする 9

0

母平均の差の検定

母平均の差の検定 () 営の就職斡旋業者が 社に登録した の 年間の転職者数と, 登録してから実際に内定するまでの期間は以下の表のようになった 内定までの期間に男 差はあるだろうか. 有意 準 5% で検定しなさい ( 男 の内定までの平均期間を利 して有意差を検定 ) 期間 [ ] サンプルサイズ 平均 標準偏差 男性 = 353 34 4 性 = 87 9 39

求職期間の男女別分布 0.40 求職期間の分布 0.30 女性 相対度数 0.0 男性 男性女性 0.0 0.00

母平均の差の検定 () 集団, の平均は異なっているか? 集団 男性 転職者内定までにかかった期間 母平均 母分散 : : 集団 性 転職者内定までにかかった期間 母平均 母分散 : : 標本抽出 標本抽出 サンプル サイズ 353 サンプル サイズ 87,,,,,, 分に きいサイズの標本 34, 4 9, 39 x y 4

5 母平均の差の検定 (3) 男女それぞれの内定期間の標本平均は以下の分布にしたがう 母平均の差を調べるために, 標本平均の差がどのような分布かを調べる. を検定すればよい したがって, 内定期間に差があるかどうかを検証するにはもし, 男性 女性の内定期間の母平均が全く同じならば 0 : 0 : 0 H H N N, ~,, ~ 中心極限定理 V V E E E が十分に大きいとき ) は次の正規分布にしたがう ( このとき標本平均の差, N, ~ ( 両側検定 ) 差の分散 は 分散の和 になる

6 母平均の差の検定 (4) y x y x y x H N 0 0 : 0, ~,,, 検定統計量を正しいと仮定するとを標準化する. に置き換えてをが十分に大きいとき検定統計量棄却域 検定統計量検定統計量およびならば ) 棄却域は両側検定なので,( 有意水準が y x y x.96.96 5%

母平均の差の検定 (5) 情報の整理 353, 87, 34, 4, 4, 39 x y 棄却域 検定統計量 x y 34 9 4 39 353 87 5 9.0 5 5.387.78 判定検定統計量は棄却域に るので, 帰無仮説を棄却して, 対 仮説を採択する 結論 : 内定期間は男 で有意に異なる 7

練習問題 (3) 白砂.8 下表は の のカロリー摂取量を, 宅 と 宅外 に分けて調査した結 果である この結果から, 宅 は 宅外 より, のカロリー摂取量が多いと えるか 有意 準 % で検定 ( 右 側検定 ) しなさい 宅 宅外 サンプル サイズ = 400 = 400 標本平均 84 kcal 85 kcal 標本標準偏差 54 kcal 7 kcal x y 仮説 H H 0 : : 0 0 8

情報の整理 仮説の設定 棄却域 検定統計量 検定 結論 9

母平均の差の検定 (6) つの正規 集団の 分散が未知でサンプルサイズが きくない場合の 平均の差の検定 ある地域の持家世帯における 住宅あたり延べ 積 m は 集団 の標本 : 990 年 ( = 9), 平均 90 m, 標準偏差 38 m 集団 の標本 : 00 年 ( = 33), 平均 97 m, 標準偏差 40 m であった この 0 年間で住宅の延べ 積は変化したと えるか 延べ 積は正規分布にしたがい, と の 分散が等しいと仮定して有意 準 5% で両側検定をしなさい H 0 : 0を検証するために の分布を考える必要がある V サンプルサイズが小さいので 等分散の仮定 を x に, を が仮に成立しているとすると y に置き換えて分析できない 0

母平均の差の検定 (7) yy xx S S の推定等分散 j j yy i i xx S S, に置き換えるとを の分布自由度検定統計量 t ~ なのでのとき yy xx S S E

母平均の差の検定 (8) 数値例 9, 33, 90, 97, 38, 40 S xx 9 38 4043, S 33 40 500 S x Syy xx 4043 500 9 33 yy x 963 60 y 57. y 検定統計量 9 90 97 33 7 0.064857. 7 9.948 0.704 棄却域 t 0.05,60 または t 0.05,60 判定 結論 t 0.05,60.000 より, 検定統計量は棄却域に入らない 帰無仮説を棄却できないので, 対立仮説を採択しない 0 年間で住宅の延べ 積が変化したとは えない

練習問題 (4) 勤続年数について つの業種の 40 歳代の労働者それぞれを調査したところ以下の結果が得られた 集団 の標本 : 製造業 ( = 4), 平均. 年, 標準偏差 3.6 年 集団 の標本 : 情報通信業 ( = 3), 平均 4.5 年, 標準偏差 3.4 年であった 業種によって勤続年数に違いがあるかどうか, 有意 準 5% で両側検定をしなさい S S 4, 3,., 4.5, 3.6, 3.4 xx yy 臨界値は t x 4 3 Sxx Syy y 45, 0.05.04 3.6 3.4 x 98.08 54.3 98.08 54.3 4 3 y 55.4 45.756 3

4

対応のある 組の平均の差の検定 () 例. ある 場における製造製品は, 最終的には従業員による 作業によって完成する いま, 製造過程を 幅に 直し効率化を図った か 後, 製造過程の 直し前後の従業員の作業効率性 ( 時間当たり製造個数 ) を調査したところ以下が得られた id 直し後 直し前差 id 直し後 直し前差 d d 5 3 8 69 79-0 90 95-5 9 5 08 7 3 58 44 4 0 04 0 4 7 4 3 40 35 5 5 4 0 3 6 7 6 96 95 3 98 83 5 7 3 3 0 4 07 5 8 50 5-5 50 37 3 9 8 4 4 6 40 3 9 0 37 4-5 7 07 93 4 96 85 8 5 7-80 64 6 9 78 63 5 3 50 40 0 30 57 47 0 4 09 07 3 6 6 0 5 3 95 8 6 43 43 0 平均 6.6 0.0 6.5 7 34 3 3 標準偏差 5.4 3. 7.8 差の定義 d i 製造過程の 直しによって従業員の作業効率は まったと えるか? 有意 準 5% で仮説検定する i i 5

対応のある 組の平均の差の検定 () 集団 ( 直し後 ) 母平均 母分散 集団は正規分布を想定 集団 ( 直し前 ),,,,, d, d,,, : : d d d : 差の平均 : 差の標準偏差 母平均 母分散 : : 検定統計量 : H d d : 0 のもとで ~ 自由度 のt 分布 0 d d 6

対応のある 組の平均の差の検定 (3) 仮説 H H 0 : : 0 0 効率性が まったかどうかを検証するので, 右 側検定を う 検定統計量 H 0 : 0 のもとで d d d d ~ 自由度 のt 分布 棄却域 t 0.05, d d t : 自由度 の分布における片側 5% 臨界値 0.05, t 判定 検定統計量が棄却域に るとき,H 0 を棄却,H を採択 7

対応のある 組の平均の差の検定 (4) 情報の整理 3, d 6.548, d 7.835 d 6.548 3 検定統計量 4. 64 7.835 d 棄却域 臨界値は t 0. 697 より.05,30.697 d d 判定 検定統計量 4.64 は臨界値.697 よりも きいので棄却域に る H 0 を棄却し,H を採択する 対応のない 組の平均の差と なした場合の検定と 較 対応のあるデータは同 個体の 較をしているので, 個 差が消える ( ばらつきが さくなる ) d / が さい 検定統計量は きな値となる 6.58 0.03 6.548 検定統計量. 059 ( 有意でない ) 5.4 3.3 38.39 x y 3 3 グループごとに集計しているためばらつきが きい 8

練習問題 (5) 売業に勤める 0 歳代男性労働者 7 を対象にリーマンショック前後 (008--009 年 ) の か 当たり残業時間を調べたところ 008 年平均 5.9 時間 009 年平均.7 時間であった 時点の差の平均は 4. 時間, 差の標準偏差は.7 時間であった リーマンショック前後で残業時間に変化があったかどうかを, 有意 準 5% で両側検定しなさい ヒント: d d 4..7 7 9

まとめ 検定統計量 ~ 分布 率の差の検定 H 0 : 0 ~ N 0, 平均の差の検定対応のないグループの 較 H0 : 0 x y ~ N 0, 標本 ~ 自由度 の t 分布 標本, 分散未知 平均の差の検定対応のあるグループの 較 H0 : 0 d d ~ 自由度 のt 分布 30