１．民営化 - PDF 無料ダウンロード

参考資料最小二乗法数学的性質経済統計分析 3 年度秋学期回帰分析と最小二乗法被説明変数の動きを説明変数の動きで説明 = 回帰分析説明変数がつ単回帰説明変数がつ以上重回帰被説明変数従属変数係数定数項傾き説明変数独立変数残差... で説明できる部分説明できない部分説明できない部分が小さくなるように回帰式の係数を推定する有力な方法 = 最小二乗法

最小二乗法による回帰の考え方回帰直線回帰直線を標本のなるべく近くに通す近くを観測点の軸方向の距離 = 残差で測る全体として垂直方向の距離を最小化するには? ŷ 残差 T ようにを最小化する { } を定める残差の総和を最小化 - 正負が相殺される残差の絶対値の総和を最小化 - 数学的に扱いにくい 3 残差の乗の総和残差平方和を最小化最小二乗法 3 最小二乗法単回帰説明できない部分 = 残差の乗の総和残差平方和を最小化するように係数を求める Min 残差の乗の総和最小化の一階条件本の方程式本の方程式個の未知数方程式を解いてを求める 4

3 5 最小二乗法単回帰残差の平方和を最小化最小化の一階条件 Min 3...... T 3 式 = 正規方程式を解いてを最小化するを求める 6 正規方程式よりに代入して最小二乗推定量 3...... T つの未知数に方程式本 : これを解けばが得られる } { T T T T T T 5... var cov...4 ただし

最小二乗法の代数学的性質最小二乗法により求めた { } は以下の性質を持つ推定された回帰直線は標本平均点を通る残差の平均はゼロ 3 残差は説明変数と無相関 cov 4 残差はの推定値と無相関 cov 注定数項を含まない推定ではは成立しない 7 最小二乗法の代数学的性質図示参考残差がと負に相関 34 残差はが大きいほど負の残差が出やすくなっている = 回帰直線のまわりに偏りなく分布残差の総和ゼロ回帰直線は標本平均点を通る最小二乗法ではこうならない 8 4

5 9 最小二乗法の代数学的性質証明の証明 4 より明らかの証明より残差の総和は 34 の証明 3 よりしたがって 67 を用いれば.... 6.. 7 ] [ 平方和分解の平均回りの変動平方和は説明変数の変動によって説明される部分と説明できない残差の平方和とに分解される証明 67 より右辺第項はゼロだから 8 式が導かれる E T 総平方和 Toal um of quares 説明された平方和 Eplained um of quares 残差平方和 esidual um of quares 8 ] [ ] [

決定係数決定係数 = の総変動 T のうち説明された部分 E の比率がに近いほど推定式の説明力が高い E T T 9 との相関係数 r r 決定係数と相関係数の関係は r 決定係数 = 相関係数の二乗は相関係数と同じく変数間の直線的関係の強さを表す決定係数と相関係数図示決定係数 = 相関係数の二乗は直線的関係の強さを表す非線形の関係を検出する力はない厳密な正の相関 r = = 5 3 厳密な負の相関 r = = 3 5 5 厳密な次の関係 r = = = -5 5 5 = +.7 5 =.7 5 5 5 強い正の相関 r =.96 =.9 = +.7 + 5 5 5 4 完全な無相関 r = = 5. 5 5 ではの変動の 9% がの変動で説明されている =.9 = は必ずしもの間に何の関係もないことを示すわけではない 5では厳密な次関係があるが = である = の時はとなる 6

外れ値の影響最小二乗法外れ値異常値の影響が大きい推定法 { } 最小二乗法 = 残差平方和を最小にするようにを求める著しく大きな残差があるとその影響を受けやすい 5 大きな 7 を消すためにが上昇 5 5 外れ値により標本平均点が移動 7 7 7 最小二乗法による回帰線は標本平均点を通る残差の総和ゼロという性質がある著しく大きな残差があるとの制約を満たすために回帰線はそうした外れ値に引きずられてしまう標本 7を除く平均 4 6 8 3 外れ値の影響例問題ない推定 9 6 3..5.667 3 3 6 9 5 非線型の関係 8 5 3..5.667 3 6 9 5 右の数値例はすべて同じ最小二乗推定量を生む推定された値だけを見ていては誤った結論を出す可能性 3 外れ値の影響 4 外れ値の影響 9 6 3..5.667 3 3 6 9 5 5 9 6.667 3 6 4 8 3..5 外れ値の影響や関数形の誤りを避けるためにデータをプロットする残差のふるまいを調べる 3 特殊な出来事が生じた期間等はサンプルから外す等が大切 4 7

最小二乗法重回帰重回帰 = 説明変数がつ以上ある回帰分析説明変数がつの場合被説明変数説明変数残差定数項係数で説明できる部分 = の推定値 ŷ 説明できない部分最小二乗法 : 説明できない部分残差の乗の和残差平方和 = が最小になるように係数を決定 5 最小二乗法の考え方重回帰の場合回帰平面説明変数がつの場合基本的な考え方は単回帰の場合と同じ ŷ 回帰平面を標本のなるべく近くに通す近くを観測点の軸方向の距離 = 残差で測る一定例えば = の平面で切った場合の傾き数学的に扱いやすいように残差の乗の和残差平方和を最小にする最小二乗法 6 8

9 7 最小二乗法重回帰説明できない部分 = 残差の乗の総和残差平方和を最小化するように係数を求める最小化の一階条件 3 本の方程式 3 本の方程式 3 個の未知数方程式を解いてを求める Min 残差の乗の総和 8 最小二乗推定量の導出重回帰説明変数がつの場合推定する回帰式残差残差平方和最小化最小化の一階条件 : をで微分して = と置く正規方程式 Min T

9 最小二乗推定量の導出重回帰係数の最小二乗推定量正規方程式を解いてただし重回帰係数の意味重回帰分析の係数他の説明変数の影響を除いた上で当該説明変数が被説明変数に及ぼす影響を示す他の説明変数を一定としたままその説明変数だけが変化した場合の影響を示す = 偏微分係数がに与える影響を除いた上でがに与える影響 = が一定のままだけ変化した場合のへの影響が一定のままだけ変化した場合のへの影響

最小二乗法の代数学的性質重回帰最小二乗法による重回帰 k k についても単回帰と同様に以下の性質を持つ証明は略推定された回帰式は標本平均点... k を通る残差の平均はゼロ 3 残差は説明変数 i i = k と無相関 4 残差はの推定値 k k cov i i i... k k k と無相関 cov 注定数項 a を含まない推定ではは成立しない最小二乗法の代数学的性質図示回帰平面残差の総和ゼロ 34 残差は { } = 回帰平面に対して偏りなく分布回帰平面は標本平均点を通る

平方和分解と決定係数重回帰重回帰についても単回帰と同様の平均回りの変動総平方和は説明変数 i =... k の変動によって説明される部分と説明できない残差の平方和とに分解される T E 総平方和 Toal um of quares 説明された平方和 Eplained um of quares 残差平方和 esidual um of quares したがっての総変動のうち説明された部分の割合を示す決定係数も同様に定義できる E T T 3 自由度修正済決定係数決定係数は説明変数を追加するごとに必ず増大する本来関係ないような変数を追加しても必ず増大するこのため説明変数の数が異なるモデルの説明力を比較するには自由度修正済み決定係数が用いられる / T k T / T の自由度 T の自由度説明変数の数 k 定数項を含むを増やしたとき自由度の低下を補うだけの残差平方和の減少がなければは低下する. このほか説明変数の数が異なるモデルの選択基準として良く用いられるものとして赤池情報量基準 AIC とシュワルツ基準 C がある k k AIC ln C ln ln T T T T T これらは値が小さいほど良くいずれも説明変数の増加にペナルティーを課している 4

自由度の意味自由度 = 全体の標本数 T から標本に課されている制約の数を除いたもの自由な標本の数単回帰の自由度回帰直線を決定するためには最低個の標本が必要自由に動ける標本は T- 個重回帰の自由度説明変数が 3 つ定数項含むの場合回帰平面を決定するためには最低 3 個の標本が必要自由に動ける標本は T-3 個説明変数が k 個定数項含むの場合回帰式を決定するためには k 本の正規方程式が必要 = 最低 k 個の標本が必要自由に動ける標本は T-k 個 5 自由度の意味図示標本数 = の場合標本数 =3 の場合標本数 = の場合 4. 4. 4. 3. 3. 3........ -4-4 6 -.. -4-4 6 -.. -6-4 - 4 6 -. -. -. -. 直線を決定するのに最低個の標本が必要 = 回帰直線は必ず個の標本上を通るように決定直線は自由に動く余地なし自由度 = 直線の決定に最低必要な標本数個よりも個余分な自由な標本を利用標本個分だけ直線は自由に動く余地自由度 = 直線の決定に最低必要な標本数個よりも 8 個余分な自由な標本を利用標本 8 個分だけ直線は自由に動く余地自由度 =8 自由度が大きい = 最低必要な標本数よりも多くの標本の情報を用いて推定推定精度が高くなる 6 3

自由度の意味自由度 = 統計量を求めるのに用いられる標本数から標本に課されている制約の数を除いたもの自由な標本の数残差平方和の自由度 k 個の推定パラメターを持つ回帰の場合残差は k 本の正規方程式を満たすという制約があるしたがって T 個の残差のうち T k 個が決まれば残りの k 個はこれら k 本の制約を解くことにより決定されるすなわち自由に動ける残差の数は T k 個である総平方和 T の自由度総平方和 T を求めるには標本平均が与えられる必要があるこれは総平方和を計算する際にはすでにに T という制約がかかっていることを意味するしたがって T の自由度は標本数からこの制約を除いた T である 7 4