Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Similar documents
ビジネス統計 統計基礎とエクセル分析 正誤表

基礎統計

EBNと疫学

Microsoft Word - Stattext12.doc

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - e-stat(OLS).pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - Stattext13.doc

Microsoft PowerPoint - sc7.ppt [互換モード]

情報工学概論

統計的データ解析

青焼 1章[15-52].indd

Microsoft Word - Stattext11.doc

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - statistics pptx

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft Word - apstattext04.docx

第7章

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - apstattext05.docx

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

データ科学2.pptx

Medical3

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

講義「○○○○」

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft Word - å“Ÿåłžå¸°173.docx

Medical3

Microsoft Word - appendix_b

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

様々なミクロ計量モデル†

Microsoft PowerPoint DegreesOfFreedom.ppt [互換モード]

MT2-Slides-13.pptx

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - Econometrics pptx

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

スライド 1

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - Statistics[B]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

モジュール1のまとめ

不偏推定量

PowerPoint プレゼンテーション

Microsoft PowerPoint - 基礎・経済統計6.ppt

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

研修コーナー

パーキンソン病治療ガイドライン2002

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

経済統計分析1 イントロダクション

数値計算法

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

<8C6F8DCF8CA48B86985F8F D342D E656339>

Microsoft PowerPoint - statistics pptx

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

スライド 1

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

問 題

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft Word - Stattext07.doc

Microsoft Word - lec_student-chp3_1-representative

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

untitled

カイ二乗フィット検定、パラメータの誤差

測量士補 重要事項「標準偏差」

Microsoft PowerPoint - 測量学.ppt [互換モード]

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 )

経営統計学

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

DVIOUT

解析センターを知っていただく キャンペーン

13章 回帰分析

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

<4D F736F F D20837D834E838D97FB8F4B96E291E889F090E091E682528FCD81698FAC97D1816A>

数値計算法

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

3 数値解の特性 3.1 CFL 条件 を 前の章では 波動方程式 f x= x0 = f x= x0 t f c x f =0 [1] c f 0 x= x 0 x 0 f x= x0 x 2 x 2 t [2] のように差分化して数値解を求めた ここでは このようにして得られた数値解の性質を 考

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

第90回日本感染症学会学術講演会抄録(I)

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

Transcription:

第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して, 実際に使えるようにしておくことが重要です 仮説検定 観測された標本に基づき, 母集団に対するある仮説が成り立つかどうかを判断することを検定, または仮説検定といいます 特に, 統計学に則った検定という意味を込めて, 統計的仮説検定ということもあります ここでは, 検定の基本的な事項について説明します 7-1-1 仮説検定の考え方 たとえば, 次のような例を考えてみましょう 7129 例 7.1 小売業を営む A 社のある店舗における, これまでの 1 日の売上高は平均値が 250.0 ( 万円 ), 標準偏差は 30.0( 万円 ) の正規分布 N (250.0, 30.0 2 ) でほぼ近似できるものとします A 社ではこれまで比較的広い地域へのチラシ広告配布を実施していましたが, その効果に疑問があがっていました そこで, 配布地域を近隣の地域に限定し, 代わりにポイントカードで一定数の買い物をした顧客に対して優待券 ( クーポン ) を発行して, その効果を検証することになりました その効果が現れると考えられる十分な日数を置いてから,1 日の売上高について,n = 15 日分のデータを観測したところ, 次のような結果となりました

7777777識編, 広告戦略を変更したことによって, 売上高に変化が生じたと言えるでしょうか? このような問題に答えるには, 統計的なばらつきを考慮に入れた判断が必要です 15 日の売上実績を見ると, 従来の平均値である 250.0( 万円 ) よりも少ない日もあれば, 多い日もあります 一方, この 15 日の売上データの平均をとってみると,X = 268.7 ( 万円 ) となります 従来の 250.0( 万円 ) よりも大きい数字になっていますが, これはたまたま得られた偶然の数値であり, 平均値は 250.0( 万円 ) から変化していないと考えるべきでしょうか それとも, 平均値が 250.0( 万円 ) から変化したと結論付けるべきでしょうか このような課題に答えるのが, 仮説検定です 一般に, 仮説検定は背理法による手続きをとり, ある仮説のもとで計算される理論値に対し, 実測値を照らし合わせたときに矛盾があるかどうかを検討します このように, 母集団第に対して設定される検証対象の仮説を帰無仮説といい,H 0 で表します 帰無という言葉は, 7 章さて文字どおり 無に帰したい という意味合いが込められており, 仮説検定は, 帰無仮説が統計的に否定されることを目的としています 一方, 帰無仮説が成り立たないときに成り立つ仮説を対立仮説といい,H 1 で表します ふたたび, 先の具体例で話を進めましょう いま, 上の例の 15 日間のデータの不偏分散を計算してみると,s 2 = 926.71 となり, この値から計算される標準偏差は s = 30.44 です 従来の売上が従うとされている正規分布の標準偏差 30.0 とほとんど変わらないので, ここでは簡単に, 標準偏差は変化していないと仮定します ここで, 広告戦略を変更したことによって売上高の分布が正規分布 N (250.0, 30.0 2 ) から変化したかどうかを検証するため, 変更後の平均値 μ に対して, 帰無仮説をと設定します これに対し, 対立仮説は, 広告戦略の変更によって売上の平均が変化したという仮説になるので, となります もし, 観測した 15 日分のデータが変わらず, 帰無仮説 H 0 に従うのであれば, 正規分布 N (250.0, 30.0 2 ) から自然に生起する標本が実際に観測されるでしょう 一方, もし正規分布 N (250.0, 30.0 2 ) からは, きわめて小さい確率でしか生起しないような特異な観測値が得られているのであれば, 平均値は 250.0 から変化していると結論付けることが自然でしょう 7130 知

第7章57766そこで, 帰無仮説 H 0 が成り立つもとでの統計量の確率分布を考え, 実際に観測された統計量がその分布に従っているかどうかについて, 確率の低さという観点から判断を下すことを考えてみます 帰無仮説 H 0 が正しい場合の統計量 Y の確率分布を定めることができるものとしましょう このような統計量は, 検定に用いるための統計量という意味で検定統計量とも呼ばれます この検定統計量の確率分布に対し, 下側確率 100(α/2)% のパーセント点を u 1, 上側確率 100(α/2)% のパーセント点を u 2 とすると, となります f(y) u 1 u 2 y 図 7.1: 帰無仮説が成り立っているときの統計量 Y の標本分布 7131 α を十分小さくとるとき, 観測された標本から計算された統計量 y が y < u 1 または u 2 < y を満たすなら, その結果は帰無仮説 H 0 が正しいもとではきわめて起こりにくい ( 確率 α 以下 ) と考えられます そこで, 帰無仮説 H 0 は正しくない と判定し ( 帰無仮説を棄却する といいます ), 対立仮説 H 1 が正しい と結論付けられます 対立仮説 H 1 のほうが正しいとして採用することを, 対立仮説を採択する といいます このとき, 判断の基準として設定する確率 α は有意水準と呼ばれ, 分析の前に設定されますが, 慣習としては α = 0.05(5%) や α = 0.01(1%) が使われます 一般的な仮説検定の結論の述べ方としては, 有意水準 α で, 帰無仮説 H 0 は棄却され, 対立仮説 H 1 が正しいと言える という表現になります また, 帰無仮説 H 0 が棄却される範囲の y < u 1 または u 2 < y は棄却域と呼ばれます 一方, 統計量 y が u 1 y u 2 を満たしているなら, そのような y は, 帰無仮説 H 0 のもとで 1 - α という高い確率で起こり得る結果ですから, 帰無仮説 H 0 が間違っているとは言えません この場合は, 帰無仮説 H 0 を棄却できず, 帰無仮説が間違っているとは言えない という結論になります まとめると, 統計的仮説検定の手順は以下のようになります

7777777識編仮説検定の手続き (1) 1. 検証したい帰無仮説 H0 と対立仮説 H1, 並びに有意水準 α を設定する 2. 帰無仮説 H 0 のもとで, 統計量 Y の標本分布を定め, 棄却域を求める 3. 実際に観測された標本から統計量 Y の実現値 y を計算する 4. y が棄却域に入っているかどうかによって判定し, 結論を述べる (a) y が棄却域に入っていれば, 有意水準 α で, 帰無仮説 H 0 は棄却され, 対立仮説 H 1 が正しいと言える と結論付ける (b) y が棄却域に入っていなければ, 有意水準 α で, 帰無仮説 H 0 は棄却されず, 対立仮説 H 1 が正しいとは言えない と結論付ける 以上が, 一般論としての仮説検定の手続きですが, この手続きは p 値という概念を用いてもよいでしょう いま, 観測された標本から計算される統計量 y が, 帰無仮説 H 0 のもとで, どの程度, 出現しやすい値であるのかを示す尺度を考えてみましょう 帰無仮説 H 0 のもとで成り立つ標本分布 f (y ) の期待値を E [Y ] として,y E [Y ] に対しては, 第7 章を,y < E [Y ] に対しては, を考えると, これは y よりも大きな値, または小さな値が出てくる確率 を意味します これを, 統計量 Y の実現値 y の p 値 (p-value) といいます 得られた標本から計算される統 計量 y に対して, この p 値が非常に小さい場合, このような y は 帰無仮説 H 0 のもとでは, めったに起こり得ないことが起こった と解釈することができます f(y) 図 7.2: 検定統計量 y の p 値 (p-value) p-value =P{y< Y} y 7132 知

第7章57766先の検定の手続きでは, 下側確率 100(α/2)% のパーセント点を u 1, 上側確率 100(α/2)% のパーセント点を u 2 とし, y < u 1 または u 2 < y となる領域 を棄却域としました 検定統計量の値がこの棄却域にあれば, 帰無仮説 H 0 を棄却し, 対立仮説 H 1 を採択することになります 一方, 検定統計量 y の p 値が α/2 より小さいことと,y が棄却域に存在することは等価です したがって, 統計的仮説検定の手順は以下のようにしても結果は等価です 仮説検定の手続き (2) 1. 検証したい帰無仮説 H 0 と対立仮説 H 1, 並びに有意水準 α を設定する 2. 帰無仮説 H 0 のもとで, 統計量 Y の標本分布を定める 3. 実際に観測された標本から統計量 Y の実現値 y を計算する 4. y の p 値と α/2 の大小関係によって結果を判定し, 結論を述べる (a) y の p 値が α/2 よりも小さければ, 有意水準 α で, 帰無仮説 H 0 は棄却され, 対立仮説 H 1 が正しいと言える と結論付ける (b) y の p 値が α/2 よりも大きければ, 有意水準 α で, 帰無仮説 H 0 は棄却されず, 対立仮説 H 1 が正しいとは言えない と結論付ける 7-1-2 両側検定と片側検定 本章の冒頭にあげた例 7.1 では, 広告戦略を変更したことによって, 売上高の平均値に変化が生じたかどうか? が問題でした つまり, 売上高の平均値は上がったかもしれないし, 下がったかもしれない という状況で検定を考えているわけです そのため, 棄却域を y < u 1 または u 2 < y となる領域 と, 検定統計量の確率分布の両側にとっています このような検定を両側検定といいます 一方, 例 7.1 において, 広告戦略を変更したことによって, 売上高の平均値が向上したかどうか? という疑問について, 仮説検定によって結論付けたい場合があります この場合, 帰無仮説 H 0 は変わらず, 7133 ですが, 対立仮説は, 広告戦略の変更によって売上の平均が向上したという仮説になるので, となります この場合, 平均値が大きくなったかどうかに焦点があるため, 帰無仮説の棄却域は u < y のように片側だけに設定されます このような検定を片側検定といいます

7777777識編図 7.3: 片側検定の棄却域 両側検定と片側検定は, 明らかにしたい対立仮説の置き方によって適切に使い分ける必要 があります 7-1-3 仮説検定の誤り 先にも述べましたが, 仮説検定は背理法をもとにした判断に基づいており, その際の矛盾 は 確率的に可能性が低い という意味で示されるものです 有意水準 α よりも低い可能 性がある帰無仮説は棄却しようという発想のため, この判断は小さい確率で誤っている可能性があります つまり, 本当は帰無仮説 H 0 が正しいにもかかわらず, たまたま標本から計算される統計量の値が棄却域に落ちてしまう場合には, 検定の結果は誤りとなります このような検定結果の誤りを第 1 種の誤りといいます この誤りの確率は, 有意水準として設定した α であり, これを小さくするためには有意水準 α を小さくするしかありません 一方で, 対立仮説 H 1 が正しいにもかかわらず, 検定統計量が棄却域に落ちず, 帰無仮説 H 0 が棄却されないという誤りも起こり得えます このような誤りを第 2 種の誤りといいます この誤りは, 対立仮説が正しかったときの統計量の確率分布に依存します 例 7.1 で言えば, 売上の母平均が大きく変化していれば, 第 2 種の誤りは小さくなるでしょう 逆に, 売上の母平均の変化が微小であれば, 第 2 種の誤りは大きくなってしまいます 片側検定を行う際に, 対立仮説が真である場合を考えてみましょう 帰無仮説 H 0 のもとで統計量 Y が従う確率分布を f 1 (y) とし, 対立仮説 H 1 が正しいもので真の統計量の確率分布を f 2 (y) とします このとき, 棄却域は帰無仮説 H 0 が成り立つと仮定した確率分布 f 1 (y) に対して, 有意水準 α を満たすように設定されます 一方, 真の確率分布は f 2 (y) に従っているので, 図 7.4 に示す斜線部分の確率 β が第 2 種の誤りの確率となります f(y) u 第7 章y 7134 知