事例研究(ミクロ経済政策・問題分析III) -規制産業と料金・価格制度-

Similar documents
卒業論文

Microsoft PowerPoint - Econometrics pptx

% 10%, 35%( 1029 ) p (a) 1 p 95% (b) 1 Std. Err. (c) p 40% 5% (d) p 1: STATA (1). prtesti One-sample test of pr

Stata11 whitepapers mwp-037 regress - regress regress. regress mpg weight foreign Source SS df MS Number of obs = 74 F(

Microsoft Word - å“Ÿåłžå¸°173.docx

スライド 1

AR(1) y t = φy t 1 + ɛ t, ɛ t N(0, σ 2 ) 1. Mean of y t given y t 1, y t 2, E(y t y t 1, y t 2, ) = φy t 1 2. Variance of y t given y t 1, y t

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

統計的データ解析

80 X 1, X 2,, X n ( λ ) λ P(X = x) = f (x; λ) = λx e λ, x = 0, 1, 2, x! l(λ) = n f (x i ; λ) = i=1 i=1 n λ x i e λ i=1 x i! = λ n i=1 x i e nλ n i=1 x

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - ch04j

Microsoft Word - 計量研修テキスト_第5版).doc

Microsoft Word - 計量研修テキスト_第5版).doc

PowerPoint プレゼンテーション

Medical3

こんにちは由美子です

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

ビジネス統計 統計基礎とエクセル分析 正誤表

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

s = 1.15 (s = 1.07), R = 0.786, R = 0.679, DW =.03 5 Y = 0.3 (0.095) (.708) X, R = 0.786, R = 0.679, s = 1.07, DW =.03, t û Y = 0.3 (3.163) + 0

回帰分析 単回帰

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

情報工学概論

BR001

Excelにおける回帰分析(最小二乗法)の手順と出力

経済統計分析1 イントロダクション

PowerPoint プレゼンテーション

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

基礎統計

こんにちは由美子です

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

1.民営化

Microsoft PowerPoint - ch03j

第11回:線形回帰モデルのOLS推定

Probit , Mixed logit

Stata 11 Stata ts (ARMA) ARCH/GARCH whitepaper mwp 3 mwp-083 arch ARCH 11 mwp-051 arch postestimation 27 mwp-056 arima ARMA 35 mwp-003 arima postestim

EBNと疫学

Microsoft Word - reg2.doc

経済統計分析1 イントロダクション

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

様々なミクロ計量モデル†

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

13章 回帰分析

サーバに関するヘドニック回帰式(再推計結果)

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - 計量研修テキスト_第5版).doc

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

Microsoft Word - Stattext12.doc

ごみ有料化の方法 2 3 1

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft Word - eviews6_

Microsoft PowerPoint - sc7.ppt [互換モード]

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - 計量研修テキスト_第5版).doc

統計学の基礎から学ぶ実験計画法ー1

Microsoft Word - 計量研修テキスト_第5版).doc

Microsoft Word - 教育経済学:課題1.docx

回帰分析 重回帰(1)

講義「○○○○」

回帰分析 重回帰(3)

Microsoft PowerPoint - ICS修士論文発表会資料.ppt

第7章

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

PowerPoint プレゼンテーション

Microsoft Word - eviews1_

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

日心TWS

.001 nonsmoker smoker 0 Density 5.0e infant birthweight (grams) Graphs by 1 if mother smoked 図 2. 新生児体重のヒストグラム (

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

.. est table TwoSLS1 TwoSLS2 GMM het,b(%9.5f) se Variable TwoSLS1 TwoSLS2 GMM_het hi_empunion totchr

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

不均一分散最小二乗法の仮定では 想定しているモデルの誤差が時間やサンプルを通じて一定であるとしている 次のような式を想定する 誤差項である ut の散らばり具合がサンプルを通じて一定であるという仮定である この仮定は均一分散と呼ばれる 不均一分散とは その仮定が満たされない場合で 推計した係数の分散

青焼 1章[15-52].indd

Microsoft Word - econome4.docx

Microsoft PowerPoint - A1.ppt [互換モード]

The effect of smoking habit on the labor productivities

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

博士学位請求論文審査報告書 申請者 : 植松良公 論文題目 :Statistical Analysis of Nonlinear Time Series 1. 論文の主題と構成経済時系列分析においては, 基礎となる理論は定常性や線形性を仮定して構築されるが, 実際の経済データにおいては, 非定常性や

日本内科学会雑誌第102巻第4号

Microsoft Word - Stattext13.doc

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

Microsoft PowerPoint - 測量学.ppt [互換モード]

と入力する すると最初の 25 行が表示される 1 行目は変数の名前であり 2 列目は企業番号 (1,,10),3 列目は西暦 (1935,,1954) を表している ( 他のパネルデータを分析する際もデ ータをこのように並べておかなくてはならない つまりまず i=1 を固定し i=1 の t に関

Microsoft Word - appendix_b

データ解析

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Transcription:

事例研究 ( ミクロ経済政策 問題分析 III) - 規制産業と料金 価格制度 - ( 第 7 回 手法 (3) 応用データ解析 / 基礎的手法 ) 2010 年 6 月 2 日 戒能一成

0. 本講の目的 ( 手法面 ) - 応用データ解析の手順や基本的な作業の流れ (Strategy) を理解する - 特にグラフ化や統計検定などの手法を用いた データ解析手法の選択と検定 確認について理解する ( 内容面 ) - 計量経済学 統計学を実戦で応用する際の基礎的留意点を理解する (1) 2

1. 制度の効果を測るには 1-1. 政策分析の基本手順 - 料金 価格制度やその変更が及ぼす効果を推計するためには 以下の 2つの作業が必要 1) 制度変更による経済データへの影響経路と 因果関係 寄与度の推定 ( モデル構築 ) 制度変更がどのような変化をもたらすか? 2) 制度の創設 変更と同時に生じた経済データの 有意な変化 の計測 ( モデル実証 ) 数量 価格や費用は本当に変化したか? ( 変化していれば余剰分析が応用可能 ) 3

1. 制度の効果を測るには 1-2. 政策分析の条件 (1) - 制度 ( 変更 ) の効果推計に際し充足すべき条件 1) 他の条件一定 Ceteris Paribus 制度変更以外の外的要因変化の影響が 可能な限り十分除去されていること 2) 政策影響の独立性 Unconfoundness 制度 ( 変更 ) の影響が 制度の実施 / 非実施と独立と見なせること ( 影響の均質性 ) 3) 対照群 時間の存在 Overlap 制度 ( 変更 ) が非実施の群 時間があること4

1. 制度の効果を測るには 1-3. 政策分析の条件 (2) - 制度 ( 変更 ) の効果推計に際し充足すべき条件 分析手法 手順の選択や精度を規定時間 0 1 t ( 制度変更 ) n (2010) 対象 対照時系列比較? 外的要因除去が必要 X1 y10 y11 y1t ( 変更 ) y1n ( 変更 ) 対照群横断比較? 独立性が必要 ( 影響の均質性 ) X2 y20 y21 y2t ( 変更 ) y2n ( 変更 ) X3 y30 y31 y3t ( -- ) y3n( -- ) X4 y40 y41 y4t ( -- ) y4n( -- ) 異質性が存在 外的要因 ( 毎年度変化 ) の影響が存在 5

1. 制度の効果を測るには 1-4. 制度影響モデルの仮構築 (1) - 問題とする財サービスの費用 価格 料金 数量などについて 制度が及ぼす影響経路 内容を 経済理論に基づく簡単な影響モデルで記述 費用 料金 価格 数量の変化 - 当該変化において 外的要因が存在する場合 ( 後で取除くことを目的に ) 外的要因の影響経路と内容を加味したモデルを構築 需要変化 ( 率 ) 一般物価 金利 他の制度 6

1. 制度の効果を測るには 1-5. 制度影響モデルの仮構築 (2) - 制度影響モデル ( 例 : 投資影響による費用変化 ) - C(t) = Cfix(t,H) + cval(t) * Q(t) + ε (t) Y(t) = α 1(or α 0) + β * X(t) + ε (t) - Cfix(H) = Cfixpo(H(1or0)) + Cfixtr - cval(t) = cfuel(t) + cwaste(t) C(t): t 期実質総費用, Q(t): t 期供給量, ε (t): 誤差項 Cfix(t,H): t 期固定費 Cfixpo(H(1or0)) 政策実施 (H(1)) 以降の実質減価償却費 + 同利払費変化 ( 政策影響部分 ) Cfixtr 過去 10 年平均実質固定費 ( 不変 ) cval(t) : t 期可変費原単位 cfuel(t),cwaste(t) 実質単位燃料費 ゴミ処理費 ( 外部要因 ) 7

1. 制度の効果を測るには 1-6. 制度影響モデルの実測 修正 - 1-4. で構築した制度影響モデルを 実際の統計データを用いて実測する - 実際の統計処理はパッケージ ソフトで実施する (STATA, EViews, ) 重要なのは 必要とされる前提条件に応じた適切な手法の選択と 検定結果などの解釈 - 明らかに理論と矛盾する結果が出た場合には 1-4. に戻って制度影響モデルを再考する (ex. 正の価格弾力性, 負の所得効果 ) 8

2. 応用データ解析の基礎 (1): 線形回帰モデル 2-1. 線形回帰モデルとは - 最も簡単な線形回帰モデルは 被説明変数 ( 例 : 費用 ) を説明変数 ( 前期固定資産 燃料費 ) で最小二乗法により回帰分析したモデル y = α + x β + ε y * = α * + x β * α * = y x β * β * = (x x) -1 x y ζ *2 = (y -y * ) (y -y * )/(n-k) yi y*i=α*+xiβi* ε~n(0, ζ* 2 ) xi - 最も簡単で扱いやすい手法だが 9

2. 応用データ解析の基礎 (1): 線形回帰モデル 2-2. 線形回帰モデルと前提条件 (1) - 線形回帰モデルが適用できる前提条件は 4つ #1: 線形性 Linearity - 適切な変換で y = α +x β +ε 型になること 適用困難例と対処 - yが離散値 (0, 1), 切断値 ( yi yi > 0 ) ダミー変数 切断変数モデル回帰 平均措置効果 (ATE; matching 他 ) - y がCES 型 (= (K δ +L δ ) γ ) 等連続非線形 非線形回帰 ( 数値解析法 ) 10

2. 応用データ解析の基礎 (1): 線形回帰モデル 2-3. 線形回帰モデルと前提条件 (2) #2: 説明変数の外生性 Strict Exogeniety - 説明変数 X が誤差項 ε と独立であること E( ε i X ) = 0 ( i = 1 to n ) 適用困難例と対処 - 説明変数 X が誤差項 ε と相関あり ( X と Y が需給均衡 同時決定の場合など ) 操作変数法 Instrumental Variable X とは相関があるが ε とは相関が ない変数 Z を探して併用回帰 11

2. 応用データ解析の基礎 (1): 線形回帰モデル 2-4. 線形回帰モデルと前提条件 (3) #3: 説明変数の非多重共線性 No Multicolinarity - 説明変数 xi が他の xj (i j) の組合わせで表現できないこと rank X kxn X nxk = k 適用困難例と対処 - 説明変数 X の間での相関高 主成分回帰 一部変数除去 (= モデルの見直し ) (ex. ダミー変数は全ての分類に設定できない 少なくとも分類の 1 つは他の補集合 ) 12

2. 応用データ解析の基礎 (1): 線形回帰モデル 2-5. 線形回帰モデルと前提条件 (4) #4: 誤差項の均一分散性 Homoskedasticity - 誤差項 ε の分散は全て ζ 2 で共分散なし E(ε ε X) = ζ 2 I - 通常さらに誤差項 ε は正規分布 N(0, ζ 2 I) と仮定する 適用困難例と対処 - 分散が不均一 不均一分散回帰 Heterosked. robust - 系列相関あり [ 重要 ] 時系列分析法 Time Series Analysis 13

2. 応用データ解析の基礎 (1): 線形回帰モデル 2-6. 線形回帰モデルと実用上の問題 - 現実の料金 価格制度の分析という視点からは 線形回帰モデルの前提条件が成立しない場合多 #1 線形性 : 成立しない場合有 ( 凸 / 凹型 Convex/Concave, 離散型など ) #2 説明変数の外生性 : ( 回避可能 ) #3 説明変数の非多重共線性 : ( 回避可能 ) #4 誤差項の均一分散性 : ほぼ確実に成立せず ( 殆どの場合 時系列相関 あり, 粘着性など ) 分析手法として時系列分析 パネルデータ分析が有効 ( 後述 ) 14

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-1. 決定係数 自由度修正済決定係数 - 決定係数 R 2 ; 最も一般的な精度指標 - 推計式 y * = α * + x β * が 実際の y の変動のどの程度を説明しているかを表す係数 0 R 2 1, R 2 =1 (y-y * ) 2 /(y (I-x(x x) -1 x)y) - 但し 説明変数 X をたくさん使うと R 2 は実際の精度と無関係に大きくなるので 自由度修正済決定係数 R 2 (Adjusted R 2 ) が用いられる Adj. R 2 = 1 (n-1)/(n-k)(1 R 2 ) n: 試料数 k: 説明変数数 Adj.R 2 1 15

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-2. グラフ化 (= 可視化 ) による考察の重要性 (1) - 記述統計量 (=X,Yの平均 分散等) と決定係数のみに頼ると危険 必ずグラフ化 (= 可視化 ) すべき - Anscombe ( 73) Yni = 3.0 + 0.5Xi Adj.R 2 =0.666 i Xi Y1i Y2i Y3i 1 10.0 8.04 9.14 7.46 2 8.0 6.95 8.14 6.77 3 13.0 7.58 8.74 12.74 4 9.0 8.81 8.77 7.11 5 11.0 8.33 9.26 7.81 6 14.0 9.96 8.10 8.84 7 6.0 7.24 6.13 6.08 8 4.0 4.26 3.10 5.39 9 12.0 10.84 9.13 8.15 10 7.0 4.82 7.26 6.42 11 5.0 5.68 4.74 5.73 平均 9.00 7.50 7.50 7.50 分散 3.32 2.03 2.03 2.03 16

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-3. グラフ化 (= 可視化 ) による考察の重要性 (2) - Y2: 前提 #1( 線形 ) に問題有 ( 要変数変換 ) Y2i = -6.00 + 2.78 Xi 0.13 Xi 2 + ε i Adj.R 2 = 0.999 - Y3: 前提 #1, #4( 均一分散 ) に問題有 ( 特異値 ) Y3i = +4.01 + 0.35 Xi + 4.24 DM#10 + ε i Adj.R 2 = 0.999 17

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-4. 統計検定の基礎 (1) - ある 2つの値の間に差があるかを判定するには条件を揃えた上で当該試料の ばらつき と比べ 差 が十分大きい(= A1 A0 ) かを判定する - 仮に試料の ばらつき ( 標準偏差などの指標 ) と比べ A1-A0 が小さければ差があるとは言えず A(t) 平均 A0 ( 評価時点 ) 平均 A1 σ A1 A0 t 18

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-5. 統計検定の基礎 (2) - 統計検定の多くは 検定したい内容を否定する仮説 ( 帰無仮説 : Ho) を敢えて設けた上で 当該帰無仮説が統計的に見て 真 である確率が十分に小さいといえるか否かを判定 帰無仮説が 真 の確率が十分小 内容を否定する仮説が 棄却 - つまり 背理法 - 通常 95% 有意 (= 確率 5% 以下, * ) が 稀に 99% 有意 ( 同 1% 以下, ** ) が用いられる 19

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-6. 統計検定の基礎 (3) - 95% 片側検定の場合 確率(= 確率密度積分値 ) が2.5% となる点 Z (0.025) に対し帰無仮説に対応する検定統計値 Z (= 試料の ばらつき に対する検定対象値の比 ) の大小を判定 - Z < Z (0.025) なら帰無仮説が 真 の確率大 d ( 帰無仮説が真である ) 確率密度 ( 片側 ) d ( 帰無仮説が真である ) 確率密度 ( 両側 ) z 保留域 (= ) z z 棄却域 (= ) z 保留域 (= ) z z 棄却域 (= ) 確率密度積分値 (= 確率 ) 片側 2.5% 確率密度積分値 (= 確率 ) 両側 5.0% 0 (=Z (0.500) ) (Z (0.500) ~Z (0.025) ) ( Z (<0.025) ) 0 (=Z (1.00) ) Z (0.025) (Z (1.00) ~Z (0.05) ) Z (0.05) Z (<0.05) 20

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-7. 回帰係数の有意性の検定 ( β 0? ) - (Student) t- 検定 ; β 0? [ 重要 ] tk = β * k / ( σ *2 (x x) -1 kk ) 0.5 (t 値 ) 回帰係数 k 回帰係数 k に対応する試料のばらつき具合 tk ~ t(n-k) 自由度 n-k の t 分布, 片側 - 結果を p 値 (tk に対応する確率 ) で表すこと多し - 確率密度の総和 ( 不定積分 ) は 1 - 確率密度の + からの積分値 (= 確率 ) が 2.5%(95% 片側の場合) となる臨界点 t (0.025) に対し 仮説 ( 帰無仮説 ) に対応した tk の大小を判定 - tk t (0.025) (= 帰無仮説 真 の確率 5%) の場合帰無仮説を棄却 (= ) - tk <t (0.025) の場合帰無仮説を保留 (= 帰無仮説 真 の確率 > 5%, ) 0 (=t (0.500) ) d ( 帰無仮説が真である ) 確率密度, t 分布 tk 保留域 (= ) tk tk 棄却域 (= ) t (0.025) ( 片側 95%) 確率密度積分値 (= 確率 ) 片側 2.5% t (n-k) t 検定統計値 21

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-8. 回帰係数の信頼区間推定 - 95% 水準での t 検定の考え方を拡張して 逆に回帰係数 β *k が信頼できる確率 95% の範囲 (= β * k との差が 0 と言える確率が片側 2.5% 以上の範囲 信頼区間 ) を推計できる - β * k(±5%) = β * k ± t (0.025) * ( σ *2 (x x) -1 kk ) 0.5 d ( 帰無仮説が真である ) 確率密度, t 分布 β* k : β* k =0 β* k(±5%) = t (0.025) * ( σ *2 (x x) -1 kk ) 0.5 確率密度積分値 (= 確率 ) 片側 2.5% t (n-k) 0 (= t 0.500 ) t (0.025) t 検定統計値 22

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-9. 平均値の差の検定 ( β =0 の際, α 1 α 0?) - Welch-t 検定 ; α 1 α 0? tw = (α 1 α 0) / ( σ * 1 2 /N 1 + σ * 0 2 /N 0 ) 0.5 平均値の差 / 状態 1 0 の ばらつき の合成値 tw ~ t(v) 自由度 v の t 分布, 片側 v = (ζ 1 /N 1 +ζ 0 /N o ) 2 / (ζ 12 /(N 12 (N 1-1)) + ζ 02 /(N 02 (N 0-1))) 0.5 y N0 個 標準偏差 σ0 N1 個 標準偏差 σ1 d ( 帰無仮説が真である ) 確率密度, t 分布 平均 α0 tw 保留域 (= ) tw tw 棄却域 (= ) α1 確率密度積分値 (= 確率 ) 片側 2.5% 0 β=0 y はほぼ一定で推移 T ( 時間 ) t (0.025) ( 片側 95%) t 検定統計値 t (n-k) 23

3. 応用データ解析の基礎 (2): 線形回帰と検定 3-10. 平均値の差の検定の応用 ( 簡易定常化法 ) - 分析対象 y が複数の説明変数 X から影響を受けている場合でも β i β others ならば (X i の y への影響が他の X より卓越する場合 ) y/x 1 はほぼ一定となり Welch t- 検定が使える y = α + X i *β i + X j *β j + ε y/x i = β i + X j /X i *β j + α /X i + ε /X i << β i y/x i = β i + ε (= X j /X i *β j + α /X i + ε /X i ) ほぼ一定なら Welch t- 検定が適用可 24

4. 応用データ解析の基礎 (3): 実戦編 4-1. 回帰分析と結果の解釈 (1) STATA - 例 : 酒類消費量 ( 家計調 県庁所在地別 2008) まず P-Qグラフ ( 価格 - 数量 ) を書いてみる 25

4. 応用データ解析の基礎 (3): 実戦編 4-2. 回帰分析と結果の解釈 (2) STATA - 焼酎購入量 ( 家計調 県庁所在地別 2008) lsaq: 消費量 ( 対数, l) lsap: 価格 ( 対数, /l) lexp: 消費支出 ( 対数 ) lpdp: 人口密度 ( 対数 ) lbeep,lsesp,hhpsp: ヒ ール 清酒 発泡酒価格 ( 対数 ). reg lsaq lsap lbeep lsesp lhpsp lexp lpdp 適切な代替財は? Source SS df MS Number of obs = 47 F( 6, 40) = 7.15 Model 2.67358707 6.445597846 Prob > F = 0.0000 Residual 2.49448231 40.062362058 R-squared = 0.5173 Adj R-squared = 0.4449 Total 5.16806938 46.112349334 Root MSE =.24972 βi ( 係数 ) t 値 p 値 lsaq Coef. Std. Err. t P> t [95% Conf. Interval] lsap -1.427614.3314886-4.31 0.000-2.097578 -.7576508 lbeep 3.301218 1.130336 2.92 0.006 1.016723 5.585713 lsesp.3204504.3194426 1.00 0.322 -.3251671.966068 lhpsp -.5590815.7909589-0.71 0.484-2.157669 1.039506 lexp -.6802628.4823904-1.41 0.166-1.65521.2946847 lpdp -.1579981.0537782-2.94 0.005 -.2666878 -.0493084 _cons 2.657071 10.10848 0.26 0.794-17.77292 23.08706 26

4. 応用データ解析の基礎 (3): 実戦編 4-3. 回帰分析と結果の解釈 (3) STATA - 焼酎購入量 ( 家計調 県庁所在地別 2008) lsaq: 消費量 ( 対数, l) lsap: 価格 ( 対数, /l) lexp: 消費支出 ( 対数 ) lpdp: 人口密度 ( 対数 ) lbeep: ヒ ール価格 ( 対数 ). reg lsaq lsap lbeep lexp lpdp 二乗和 k, n-k 平均二乗和 推計式説明分 残差分 Source SS df MS Number of obs = 47 F( 4, 42) = 10.56 Model 2.59129468 4.647823671 Prob > F = 0.0000 Residual 2.5767747 42.061351779 R-squared = 0.5014 Adj R-squared = 0.4539 Total 5.16806938 46.112349334 Root MSE =.24769 t 値 p 値 lsaq Coef. Std. Err. t P> t [95% Conf. Interval] F 検定結果 R 2 Adj.R 2 残差平方和 lsap -1.452444.32794-4.43 0.000-2.114253 -.7906338 lbeep 3.232778 1.085017 2.98 0.005 1.043126 5.42243 lexp -.7018367.4758033-1.48 0.148-1.662047.2583733 lpdp -.1476392.0525584-2.81 0.008 -.2537063 -.041572 _cons.0037443 9.692547 0.00 1.000-19.55661 19.5641 βi ( 係数 ) σ 2 (xx) -1 ( 標準誤差 ) 95% 信頼区間上限 下限 27

4. 応用データ解析の基礎 (3): 実戦編 4-4. 回帰分析と結果の解釈 (4) STATA - 焼酎購入量 ( 家計調 県庁所在地別 2008) 理論と整合するか? (1) e qx,px + e qx,py + e qx,i = 0 ( 需要関数の同次性条件 ) Min(-2.11+1.04-1.66) Max(-0.79+5.42+0.26). reg lsaq lsap lbeep lexp lpdp = -2.73 ~+4.89 Source SS df MS Number of obs = 47 F( 4, 42) = 10.56 Model 2.59129468 4.647823671 Prob > F = 0.0000 Residual 2.5767747 42.061351779 R-squared = 0.5014 Adj R-squared = 0.4539 Total 5.16806938 46.112349334 Root MSE =.24769 βi ( 係数 ) t 値 p 値 lsaq Coef. Std. Err. t P> t [95% Conf. Interval] lsap -1.452444.32794-4.43 0.000-2.114253 -.7906338 lbeep 3.232778 1.085017 2.98 0.005 1.043126 5.42243 lexp -.7018367.4758033-1.48 0.148-1.662047.2583733 lpdp -.1476392.0525584-2.81 0.008 -.2537063 -.041572 _cons.0037443 9.692547 0.00 1.000-19.55661 19.5641 95% 信頼区間上限 下限 28

4. 応用データ解析の基礎 (3): 実戦編 4-5. 回帰分析と結果の解釈 (5) STATA - 焼酎購入量 ( 家計調 県庁所在地別 2008) 理論と整合するか? (2) 人口密度を外すと e qx,px + e qx,py + e qx,i = 0 ( 需要関数の同次性条件 ) Min(-2.42+1.05-1.85) Max(-1.07+5.75+0.21). reg lsaq lsap lbeep lexp = -3.22 ~ +4.89 Source SS df MS Number of obs = 47 F( 3, 43) = 9.87 Model 2.10718286 3.702394287 Prob > F = 0.0000 Residual 3.06088652 43.071183408 R-squared = 0.4077 Adj R-squared = 0.3664 Total 5.16806938 46.112349334 Root MSE =.2668 βi ( 係数 ) t 値 p 値 lsaq Coef. Std. Err. t P> t [95% Conf. Interval] lsap -1.741788.3353633-5.19 0.000-2.418113-1.065464 lbeep 3.405312 1.16685 2.92 0.006 1.052134 5.75849 lexp -.8154809.5106551-1.60 0.118-1.845315.2143532 _cons -.4769214 10.43869-0.05 0.964-21.52855 20.5747 95% 信頼区間上限 下限 29

4. 応用データ解析の基礎 (3): 実戦編 4-6. 回帰分析と結果の解釈 (6) STATA - 不均一分散最小二乗法 (Heterosked. robust) 回帰係数 β i は同じ 標準誤差が異なる. hettest ( 分散均一性検定が棄却 : 清酒の例 ) Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of lsesq chi2(1) = 17.26 Prob > chi2 = 0.0000. regress lsesq lsesp lexp lpdp, robust Linear regression Number of obs = 47 F( 3, 43) = 4.26 Prob > F = 0.0101 R-squared = 0.1756 (x x) -1 x Ωx(x x) -1 Root MSE =.49607 Robust lsesq Coef. Std. Err. t P> t [95% Conf. Interval] lsesp -.7272809.4543773-1.60 0.117-1.64362.1890582 lexp 2.65602 1.511482 1.76 0.086 -.3921736 5.704214 lpdp -.0517519.0654726-0.79 0.434 -.1837901.0802862 _cons -30.95186 23.00742-1.35 0.186-77.35076 15.44703 30