Microsoft Word - econome4.docx

Similar documents
Microsoft PowerPoint - e-stat(OLS).pptx

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

スライド 1

スライド 1

Microsoft Word - econome5.docx

ビジネス統計 統計基礎とエクセル分析 正誤表

1.民営化

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - ch04j

基礎統計

Microsoft Word - appendix_b

統計的データ解析

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

EBNと疫学

13章 回帰分析

Microsoft Word - å“Ÿåłžå¸°173.docx

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

tshaifu423

スライド タイトルなし

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft Word - reg2.doc

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft PowerPoint - sc7.ppt [互換モード]

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

Microsoft PowerPoint ppt

Medical3

データ解析

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

経営統計学

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

PowerPoint プレゼンテーション

Microsoft Word - reg.doc

情報工学概論

Microsoft Word - Stattext13.doc

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - Econometrics pptx

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

13章 回帰分析

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

不偏推定量

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

モジュール1のまとめ

Medical3

Probit , Mixed logit

基礎統計

第4回

横浜市環境科学研究所

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - Statistics[B]

Excelによるデータ分析

Microsoft PowerPoint - Econometrics

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - SDA2012kadai07.doc

Microsoft Word - Stattext11.doc

学習指導要領

経済統計分析1 イントロダクション

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

Excelにおける回帰分析(最小二乗法)の手順と出力

Microsoft PowerPoint - Econometrics

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Excelを用いた行列演算

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

<4D F736F F D20837D834E838D97FB8F4B96E291E889F090E091E682528FCD81698FAC97D1816A>

講義「○○○○」

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

学習指導要領

学習指導要領

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

Microsoft PowerPoint - statistics pptx

様々なミクロ計量モデル†

PowerPoint プレゼンテーション

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

経済統計分析1 イントロダクション

Microsoft Word - Stattext12.doc

相関係数と偏差ベクトル

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

回帰分析 単回帰

Microsoft PowerPoint - 測量学.ppt [互換モード]

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

重回帰式 y= x x 2 重症度 5 TC TC 重症度

カイ二乗フィット検定、パラメータの誤差

初めてのプログラミング

構造方程式モデリング Structural Equation Modeling (SEM)

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft Word - regression.doc

第7章

6. 消費関数と 乗数効果 経済統計分析 (2017 年度秋学期 )

学習指導要領

Transcription:

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 3 単回帰分析 Tips 前回講義では, データの散らばり具合を表す偏差平方和, 分散や標準偏差, また 2 変数の関係を表す相関係数を,Excel で数回のステップに分けて求めました. 考え方を学ぶといううえでは計算手順を確認することは必要なことですが, 毎回, 同じように計算をしていては時間がもったいないですね.Excel には便利な関数があって, 前回講義で学んだ 4 つの指標を簡単に計算することができます. 詳しくは, 講義中に習った Excel のヘルプで調べることができます. 表 3-1 便利な Excel 関数 関数 簡単な使い方 偏差平方和 DEVSQ =DEVSQ(C4:C10) と入力すると,C4 から C10 のセルにあるデータの偏差平方和が計算される. 分散 VARP =VARP C4:C10) と入力すると,C4 から C10 のセルにあるデータの分散が計算される. 標準偏差 STDEVP =STDEVP(C4:C10) と入力すると,C4 から C10 のセルにあるデータの標準偏差が計算される. 相関係数 CORREL =CORREL(C5:C28,D5:D28) と入力すると,C5 から C28 のセルにあるデータと D5 から D28 のセルにあるデータの相関係数が計算される. 注 ) 詳しい使い方は,Excel 画面の右上にある 質問を入力して下さい に調べたい関数や求めたい指標を入力して検索してみよう. 3-1 回帰分析とは 前回, コンビニ M&M の浦安地域マネージャーのあなたは, 浦安市に新規出店して十分に売上げがあるのか ( 消費者がどのくらい購買意欲 (= 支出 ) があるのか ) を考えるため, 家計可処分所得と家計消費支出の散布図を描き検討しました. また, その相関係数は 0.9951 と非常に大きく, 可処分所得が増加すると家計消費支出が増加する傾向が強いことが分かりました. そこで, あなたは将来の売上げを考えるうえで参考となる将来の家計消費支出を回帰分析で予測することにしました. 回帰分析とは,2 変数 X, Z のデータがあるとき,Z を X で定量的に説明する回帰式 ( あるいは, 回帰方程式 ) とよばれる式を求めることを目的とします. 前回の作業で描いた散布図は, 家計可処分所得と家計消費支出の 2 種類のデータが平面上に点となって散らばっていました. 簡単にいうと, 回帰方程式は, その散らばっている無数の点を最もよく表現できる直線のことです. 図 3-1 散布図と回帰方程式 家計消費計 家計可処分所得 1

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 前々回, 検討したように, 消費支出は, 消費支出 C は所得 Y に依存するが, 限界消費性向は 1 未満の正の数である という仮説をたてて, 次式のように線形関数に特定化しました. 消費支出 C のように 説明される変数 は被説明変数 ( あるいは従属変数や内生変数 ) とよばれ, 所得 Y のように 説明する変数 は説明変数 ( あるいは独立変数や外生変数 ) とよばれます. また,a は切片,b は傾きといい, 所得 Y が 1 単位の増加に対する消費支出 C の増分を示す限界消費性向を表しています. 回帰式 :, 0 01 (1) しかし,(1) 式の消費関数には, 定量的に把握することができないデータ ( 夏のすごしやすさや花粉症のひどさのこと ) の影響が考慮されていません. そこで,i 番目の観測データ (Ci, Yi) では把握できないバラツキ ( 誤差 ) である εi を考慮したモデルが, 次式の確率モデルです. この方程式は母回帰式 ( あるいは, 母回帰方程式 ) とよばれ,a や b は母回帰係数とよばれます. 母回帰式 :, 0 01 (2) 説明変数 Yi や誤差項 εi が, 以下の 4 つの条件, 条件 1:Yi は確率変数ではなく, 確定した値をとる. 条件 2:εi は確率変数で期待値 0.E(εi)=0,i=1,2,,n. 条件 3: 異なった誤差項は無相関. すなわち,i j であれば,εi と εj の共分散は 0. 条件 4: 誤差項の分散が一定で σ 2. を満たすとき, 消費支出 Ci の期待値は, 次式のようになります. (3) すなわち, 説明変数や誤差項が 1~4 の条件を満たすと考えられるとき, それぞれの観測データで把握することができないバラツキ ( 誤差 ) をならした平均的な直線は, 回帰式にほかならないということです. 3-2 最小二乗法 誤差項 εi は,(2) 式を変形した次式から, 消費支出の観測値 Ci と回帰式 (a+byi) から計算される理論値 ( あてはまり値 ) を差し引いた数値であることが分かります. 誤差項は, 散布図では下図の縦矢印部分で表され, 残差とよばれます. 誤差項 : (4) C 図 3-2 回帰方程式と残差 (Y 1,C 1 ) 残差 (Y 3,C 3 ) 残差残差 (Y 2,C 2 ) 回帰方程式残差 (Y 4,C 4 ) 観測データの平均値 ( Y, C ) Y 回帰式は, この残差が最も小さくなるような母回帰係数 a, b として求められます. ただし,(4) 式で表される残差は, プラスやマイナスの両方があり相殺されることがあるため, 回帰式は残差を二乗したものの合計が最も小さくなるように求められます. この方法を最小二乗法といいます. さて, この最小二乗法をつかって, 母回帰係数をどうやって求めればいいのか? みなさんが苦手な微分を使います ^^; 講義時間が足りませんので, ここでは具体的な求め方のステップだけ紹介するにとどめておきます. 詳しく知りたい方は, 計量経済学や多変量解析のテキストをじっくり読んで下さい. STEP1: 残差平方和を求める母回帰係数 a, b で偏微分したものを 0 とする ( 一階条件 ). 2

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. STEP2: 正規方程式 (a と b に関する連立方程式 ) から a, b を算出する. 以上の STEP から母回帰係数の最小二乗推定値が次式のように計算されます. 母回帰係数の推定値 : (5) ここで, 母回帰係数 ( 推定値 ) の分母にある偏差平方和は前回学んだ方法で計算でき, 分子にある偏差積和は次式で計算できます. なお,, は C バー Y バー と読み,C,Y の平均値を表します.(5) 式から分かるように, 回帰式は必ず観測データの平均値, を通ります. 偏差積和 : (6) 作業 1.econome4.xlsx を DL して,****data04.xlsx と名前を変えて各自の UF の計量分析フォルダの中にセーブしてください.sheet name 家計消費支出 ( その3) で, ステップ1~8の順番で作業を行って, 母回帰係数 ( 推定値 ), を求めなさい.**** は 学籍番号 +.(2 点 8) 作業 2.****data04.xlsx の sheet name 家計消費支出 ( その 3) において, 作業 1 で推定した母回帰係数を使い, 家計消費の理論値 ( あてはまり値 ) を求めなさい (9 に記入 ). また, 家計消費支出と家計可処分所得の散布図に観測値と理論値をプロットしなさい.(2 点, 図 :5 点 ) 観測値は, 実際に観測された値のことである. 理論値は, 理論上の推計値である. 回帰方程式を用いて計算される., の小文字 i は同一のデータセットを表す.1980 年から 2003 年までの各年の所得 Y と消費 C が観測されたとする., は,,,,,,, を表す. この例では,, が i 年の所得の観測値を, が i 年の消費の観測値を表す., は Y ハット C ハット と読み,Y, C の理論値を表す., は Y バー C バー と読み,Y, C の平均値を表す. 3

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 3-3 回帰分析の意味 ( 重要です ) それでは, 作業 1~2 で推定した回帰式 ( 下式 ) を使って, コンビニ M&M の浦安地域マネージャーの業務に役立ててみよう. 前回の作業では, 家計消費計 と 家計可処分所得 の関係を調べることが目的でした. マネージャーとしては, 新規出店を検討している浦安地域の消費動向が将来どうのように変化するか気になるところです. ここでは, 説明変数の 家計可処分所得 で, 被説明変数の 家計消費計 を説明していました. すなわち, 将来の 家計可処分所得 が分かれば, 将来の 家計消費計 を予測することができるわけです. 推定した回帰式 : 23804 0.9711 回帰式からは重要な情報が読み取れます. 回帰式の 0.9711 という値は, 家計可処分所得 (Y) が 1 単位増加 したとき, 家計消費計 (C) が 0.9711 だけ増加する ということを表しています. 家計可処分所得と家計消費計はともに 10 億円単位の値でしたので, 家計可処分所得が 1 単位 ( すなわち 10 億円 ) 増加するとき, 家計消費計は 0.9711 単位 ( すなわち 9.711 億円 ) 増加すると読み取れます. このように, 回帰式 ( 回帰係数 ) を推定すれば, 説明変数 ( 家計可処分所得 ) の値を代入することで, 被説明変数 ( 家計消費計 ) を予測することができます. これって, かなりすごいことですよね? いっちょ, 株とか土地の価格予測モデルを考えて なんてこともできるかも ^^; 作業 3.rep04.docx を DL して,****rep04.docx と名前を変えて各自の UF の計量分析の中にセーブしてください. **** は 学籍番号 +. 作業 1 で推定した回帰係数を使って答えてください.(5 点 3) (1) 家計可処分所得が 3,500,000 億円 ( 単位に注意 ) のとき, 家計消費計はいくらになりますか? 計算の仕方も説明してください. (2) 家計可処分所得が 1,000 億円 ( 単位に注意 ) 増加するとき, 家計消費計はいくら増減しますか? 計算の仕方も説明してください. (3) 家計可処分所得が 5,000 億円 ( 単位に注意 ) 減少するとき, 家計消費計はいくら増減しますか? 計算の仕方も説明してください. ただし, 被説明変数の予測値 ( 理論値 ) の精度が低ければ, 予測には使えないですよね ( よく外れる天気予報は当てになりませんよね?). この点を少し考えてみましょう. 3-4 回帰式の精度 回帰式は, 観測データさえあれば, 最小二乗法の考え方で求めることができます. しかし, 求めた回帰式が優れているかどうかはきちんと確認する必要があります. 下図を見比べてみて下さい, 何か違いがありませんか? 図 3-3 2 種類の観測データと回帰式 2,500 2,500 2,000 C = 0.9331Y + 77.966 2,000 C = 0.6307Y + 352 家計消費計 1,500 1,000 家計消費計 1,500 1,000 500 500 0 0 500 1,000 1,500 2,000 2,500 家計可処分所得 0 0 500 1,000 1,500 2,000 2,500 家計可処分所得 右図と比べると, 左図のほうの点と回帰式がよりマッチしている ( 回帰式の周りに無数の点が集まっている ). 左図のように, 点 ( 観測データ ) と回帰式がマッチしているほど, 回帰式の精度が高いといいます. しかし, 回帰式の精度をグラフからマッチしているかどうか目で見て判断していては, グラフを見る人の主観が入ってしまいます. そこで, データの散らばり具合を表す客観的な指標として標準偏差や相関係数などを考えたように, 回帰式の精度を表す客観的な指標としては重相関係数や決定係数 ( あるい 4

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. は, 寄与率 ) があります. 重相関係数は, 消費支出の観測値 C と回帰式から計算される理論値 Ĉ の相関係数のことで, 次式で計算できます.( 一般的に, 理論値やパラメータの推定値にはハット記号が使われます ) 重相関係数 : (7) 前回講義で学んだ相関係数の公式とは若干異なっていることに注意して下さい.( 共分散が偏差積和へ, 標準偏差が偏差平方和へ変わっています ) 重相関係数は, 観測値と理論値の相関係数である. このため, 回帰式の精度が高いほど 1 に近づき, 精度が悪くなるほど 0 に近づく. 回帰式の精度を表す 2 つ目の指標である決定係数は, 重相関係数の二乗に等しい. 決定係数は消費支出の観測値 Ci の平均値まわりでの変動和 ( 総変動という ) と, 理論値 Ĉ のその平均まわりでの変動和 ( 回帰変動という ) の比率に等しく, 回帰式が観測値をどのくらい説明しているかを表している. 総変動のうち, 回帰変動で説明できないものは残差による変動になる. したがって, 次式のように式変形できる. 決定係数 : (8) 総変動, 残差変動 : (9) 決定係数は, 観測値を理論値がどれだけ説明しているかを表し, 回帰式の精度が高いほど 1 に近づき, 精度が悪くなるほど 0 に近づく. 決定係数が 1 のとき, 観測値は回帰式によって 100% 説明されている. 作業 4.****data04.xlsx の sheet name 家計消費支出 ( その4) で, 作業 1 で推定した母回帰係数 aˆ, b ˆ を利用して ( 作業 1 が完了していればすでに貼り付けてある ), 回帰式の決定係数をステップ3~8の順番で求めなさい. 回帰式の精度について, 計算した決定係数を用いてコメント欄に説明しなさい.(2 点 8) 5

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 3-5 説明変数の採択判断は? すでに学んだ相関係数から, 家計消費支出と家計可処分所得の間には強い正の相関関係があることがわかりました. そこで, 家計可処分所得を説明変数とする線形関数で家計消費支出を説明する回帰分析を行った結果, その回帰式は決定係数が高く, 説明力が高いことがわかりました. 決定係数が高いということは, モデルの説明力が高いということを意味しています. しかし, 決定係数は,( 今回は説明変数が 1 つの単回帰分析でしたが ) モデルに含まれている説明変数が本当に必要なのか, それとも必要でないのかについての情報は与えてくれません. 回帰分析では, 回帰係数を推定するだけでなく, その説明変数が被説明変数に影響を及ぼしているのか ( すなわち, 回帰係数が 0 ではない値をとること ) についての検定を行わなくてはなりません. 特に, この検定は複数の説明変数を採用した重回帰分析 ( 次回から学びます ) で重要になります. 3-6 t 検定 回帰係数は, 説明変数が被説明変数をどのように説明しているのか ( 値の正負や大きさ ) を表す重要なパラメータです. ですから, 最小二乗法で推定された回帰係数が信頼できるのか, もしかすると真の値が 0 ではないのか ( 説明変数が被説明変数に全く影響を及ぼさないのではないか ) を検定することは非常に重要です. 一般的に, 仮説の検定では, 望ましくない, 検定で否定されることを期待される仮説内容を帰無仮説 ( きむかせつ ) とし, その仮説を棄却して無に帰すようにして検証します. また, 対立仮説としては望ましい仮説内容をたてます. 回帰分析では, 説明変数が被説明変数を説明することができているのか, すなわち, 回帰係数が 0 ではないことを検証することになります. したがって, 帰無仮説は, 説明変数が被説明変数を全く説明していない ( 影響を及ぼさない ) という意味の 回帰係数が 0 に等しい を仮説とし, 対立仮説としては, 説明変数が被説明変数を正負やその大きさは分からないが説明しているという意味の 回帰係数が 0 と等しくない を仮説とします. なお, 回帰係数の符号条件が分かっている場合には, 下表 2 や 3 のように対立仮説をたてることもできます. 下表の帰無仮説や対立仮説は回帰係数が θ に一致するかどうかを検証するように, より一般的に書いてありますが, θ=0 とすれば通常の回帰係数の検定になります. 帰無仮説 H0 対立仮説 H1 表 3-2 帰無仮説と対立仮説 回帰係数は θ に等しい. 1( 両側検定 ) 回帰係数は θ と等しくない. 2( 右片側検定 ) 回帰係数は θ より大きい. 3( 左片側検定 ) 回帰係数は θ より小さい. θ=0 のとき, 通常の回帰係数の検定. 仮説の検証には, 次式から計算される t 統計検定量 (t 値 ) が使われます.( 詳しい計算方法は 7 ページ以降を読んでください ) t 値 : (19) 帰無仮説 H0( 回帰係数は 0 に等しい ;θ=0) が正しいとき, すなわち, 説明変数が被説明変数を系統的に説明できないということが正しいならば, 回帰係数の推定値 bˆ は 0 近辺の値をとるため,t 値も 0 近辺の値をとります. 一方, 対立仮説 H1( 回帰係数は 0 と等しくない ) が正しいならば, 回帰係数の推定値 bˆ は 0 ではない値をとるため,t 値も 0 ではない値をとることになります. また, 回帰係数の推定値 bˆ がその標準誤差 ˆ に比べて大きな値をとればとるほど,t 値は絶対値で大きな値となっていきます.t 値が 0 から離れれば離れるほど, 回帰係数の推定値 bˆ は 0 近辺の値をとるという帰無仮説 H0 にとって不利な証拠となり, 帰無仮説 H0 を棄却する根拠となります. 難しく説明しましたが ^^;, 一般に,t 値の絶対値が ( 概ね )2 以上であれば回帰係数は有意である ( その回帰係数は 0 ではない, すなわち, 回帰式にその説明変数が必要である ) と判断されます. ただし, 回帰式を推計するときにつかうデータセットの個数が 20 前後の少ないときには t 分布表を使って判断する必要があります. なお,t 値が大きければ, その回帰係数が 0 ではない可能性が高いことを示しているに過ぎません, 推定された回帰係数が真の値である可能性が高いことを表していることではないことに注意して下さい. t 値 表 3-3 t 検定 仮説は t 値の絶対値が 2 以上 回帰係数は 0 ではない ( 帰無仮説は棄却される ) t 値の絶対値が 2 未満 回帰係数が 0 の可能性がある ( 帰無仮説を棄却できない ) 6

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. Tips 前回講義では, 母回帰係数や重相関係数 決定係数を,Excel で数回のステップに分けて求めました. 考え方を学ぶといううえでは必要なことですが, 毎回, 同じように計算をしていては時間がもったいないですね. そこで,Excel にある便利な関数を紹介しますので, このさい覚えちゃいましょう ~. 表 3-4 便利な Excel 関数 関数 簡単な使い方 母回帰係数 INTERCEPT =INTERCEPT(D5:D28,C5:C28) と入力すると,D5 から D28 の切片 のセルにあるデータを被説明変数とし,C5 から C28 のセルにある データを説明変数とした線形回帰の母回帰係数 ( 切片 ) が計算され る. 母回帰係数 LINEST =LINEST(D5:D28,C5:C28) と入力すると,D5 から D28 のセ の傾き ルにあるデータを被説明変数とし,C5 から C28 のセルにあるデー タを説明変数とした線形回帰の母回帰係数 ( 傾き ) が計算される. 重相関係数 CORREL =CORREL(C5:C28,D5:D28) と入力すると,C5 から C28 のセルにあるデータと D5 から D28 のセルにあるデータの相関係数が計算される. 決定係数 RSQ =RSQ(D5:D28, C5:C28) と入力すると,D5 から D28 のセルにあるデータを被説明変数とし,C5 から C28 のセルにあるデータを説明変数とした線形回帰の決定係数が計算される. 注 ) 詳しい使い方は,Excel 画面の右上にある 質問を入力して下さい に調べたい関数や求めたい指標を入力して検索してみよう. もう一つ, 単相関分析の簡単なやり方も習得しましょう. まず, 二変数の散布図を作成します. 次に, 散布図の一つのポイントを右クリックするとメニューリストが出ますので, 近似値曲線の追加をクリックしてください. すると, 下図のウイザードが出てきてきます. 種類を線形近似として, オプションから グラフに数式を表示する と, グラフに R-2 乗値を表示する を指定すると, 理論式と単回帰の結果が表示されます. 簡単な分析にはこれが使えます. 図 3-4 便利な Excel 関数 7

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 参考 : 大学院への進学を考えている人は読んでね t 値の計算方法 t 値は下式から計算することが出来ます. 分子にある回帰係数の推定値についての計算方法はすでに学んだ計算と同じです. 分母にある 回帰係数の標準誤差 の計算は以下の通りです. t 値 : 回帰係数の推定値 回帰係数の標準誤差 (5) 式で推定される母回帰係数は, 母集団に含まれている観測された標本 ( サンプル ) を使って最小二乗法で推定されたもの ( 平均値 ) なので, ある程度のバラツキを持っています. 最小二乗法から計算される母回帰係数を の関係を使って式変形すると, 母回帰係数 : との偏差積和 の偏差平方和 (10) が得られます. すなわち, 母回帰係数は εi の確率変数の影響を受けているため, 母回帰係数も確率変数としてバラツキが存在します. ここで, 最小二乗法の前提条件 1~4 を思い出すと, 条件 2 確率変数 εi は期待値 0(E(εi)=0) なので, が確率変数でなければ ( 条件 1), 第 2 項の期待値は 0 となります. (11) すなわち, 母回帰係数 の期待値は b となります. さらに, 次の条件を追加すると, 条件 5: 誤差項 εi は正規分布. 母回帰係数は, 確定値 b と正規分布に従う確率変数 εi 項の和で表すことができます. したがって, 母回帰係数の分布は,, (12) の正規分布に従うことになります ( 時間がないので証明は省略. 詳しく知りたい方は, 計量経済分析や多変量解析のテキストをじっくり読みましょう ). 母回帰係数の推定値のバラツキ ( 標準偏差 ) は標準誤差と呼ばれ, 母回帰係数の分散の平方根に等しくなります. 母回帰係数の分散に含まれる誤差 εi の分散が分かれば, 母回帰係数の分散 ( あるいは標準偏差 ) の真の値は計算できます. しかし, 観測値が母集団の一部であるため, 母集団の誤差の分散 ( 真の値 ) は知ることができません. このため, 母集団の誤 2 差の分散の代わりに推計される誤差, すなわち残差の分散 ˆ が利用されます. 2 回帰係数 bˆ の分散 : 2 回帰係数 bˆ の標準誤差 : 2 (13) (14) 母回帰方程式が次式で表されると, 母回帰方程式 : (15) 8

: 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 参考 : 大学院への進学を考えている人は読んでね すでに学んだ標準偏差の公式から, 母集団の誤差の標準偏差は次式で表されます. 母集団の誤差の分散 : 母集団の真の誤差 データセットの個数 (16) しかし, 母集団の真の回帰係数が分からないのと同じように, 母集団の誤差の標準偏差も分かりません. 最小二乗法から推計された回帰式を利用すれば, 理論値と観測値の差から残差 ( 推定値としての誤差 ) を計算することができます. 残差 : (17) 残差の分散や標準偏差は, 残差 ei を使って計算できます. 残差の平均値は 0 なので, 残差の偏差平方和は となります. 母集団の場合にはサンプル数 n で割ることで分散を計算できましたが, 残差 ei を計算する際に,2 つの母回帰係数を必要とし, その計算に自由度を 2 つ使ってしまったので, 分母はサンプル数 n から 2 を差し引いたものとなり, その分だけ計算される誤差の分散は大きくなります. ( 推定値の ) 誤差の分散 : 観測値 理論値 データセット個数 回帰係数の個数 (18) 回帰係数の標準誤差は,(18) 式から計算される推定値としての誤差 ( すなわち残差 ) の分散の平方根を (14) 式に代入することで得られます. 作業 5.****data04.xls の sheet name 家計消費支出 ( その 5) で,Tips の方法 ( 次ページ ) で母回帰係数, を推定し (12), 推定値としての誤差の分散 ( 残差の分散 ) を 3~5 のステップで求めなさい. 作業 6.****data04.xls の sheet name 家計消費支出 ( その 5) で, 母回帰係数の t 値を 6~9 の順番で求め, その回帰係数が採用されるかどうかを 10 で答えなさい.(2 点 5) t 分布と棄却域について下図には帰無仮説 H0( 回帰係数は0に等しい ) が正しいときのt 分布が描かれています.(19) 式から分かるように, 帰無仮説 H0 ( 回帰係数は0に等しい ) が正しいときはt 値が0になります. したがって, 実際に計算されるt 値が0 近辺の値となる領域 (1 -α)(t 分布図の真ん中部分 ) に含まれなければ, 帰無仮説 H0 が棄却されることになります. このαは有意水準と呼ばれ, 通常 5%(0.05) や 1%(0.01) が使われます. は有意水準 αのときt 分布図の両側にある領域 αの確率をあたえるt 値の臨界点であり,t 値が絶対値で 以上の値をとるとき, 帰無仮説 H0( 回帰係数は0に等しい ) が棄却されます. なお, 有意水準 αのときのt 値の臨界点 は計量経済学や統計学などのテキストに表としてまとめてあります. 図 3-5 t 分布と棄却域 H 0 :β=0 の時の t 分布 有意水準 α/2 有意水準 α/2 有意水準 α の時の H 0 棄却域 t α/2 0 t α/2 有意水準 α の時の H 0 棄却域 t 9