Excelにおける回帰分析(最小二乗法)の手順と出力

Similar documents
スライド 1

スライド 1

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - e-stat(OLS).pptx

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

Microsoft PowerPoint - 資料04 重回帰分析.ppt

68 A mm 1/10 A. (a) (b) A.: (a) A.3 A.4 1 1

経済統計分析1 イントロダクション

Microsoft Word - appendix_b

201711grade2.pdf

PowerPoint プレゼンテーション

Microsoft PowerPoint - Econometrics pptx

Excelfl—‘ãŁª’Í-flO“Z


第 4 章事業収支シミュレーション 1. シミュレーションの作成 本章では アンケート調査結果から得られた9 月収支差プラスの事業所データ 4 をもとに その平均像をもとにした事業所 1か月当たりの事業実態のシミュレーションを試みることとする 試算にあたっては 利用者数の設定から 単月ベースの事業所

1 0/1, a/b/c/ {0, 1} S = {s 1, s 2,..., s q } S x = X 1 X 2 X 3 X n S (n = 1, 2, 3,...) n n s i P (X n = s i ) X m (m < n) P (X n = s i X n 1 = s j )

ii 3.,. 4. F. ( ), ,,. 8.,. 1. (75% ) (25% ) =7 24, =7 25, =7 26 (. ). 1.,, ( ). 3.,...,.,.,.,.,. ( ) (1 2 )., ( ), 0., 1., 0,.

2 / 29

経済統計分析1 イントロダクション

Excelによるデータ分析

回帰分析 重回帰(1)

回帰分析 単回帰

Microsoft PowerPoint - Econometrics

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

不偏推定量

chapter5

交通インフラのストロー効果と地域間格差

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Probit , Mixed logit

L P y P y + ɛ, ɛ y P y I P y,, y P y + I P y, 3 ŷ β 0 β y β 0 β y β β 0, β y x x, x,, x, y y, y,, y x x y y x x, y y, x x y y {}}{,,, / / L P / / y, P

R R 16 ( 3 )

第7章

Microsoft PowerPoint - ch04j

スライド 1

ビジネス統計 統計基礎とエクセル分析 正誤表

研修コーナー

統計的データ解析

tnbp59-21_Web:P2/ky132379509610002944

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

パーキンソン病治療ガイドライン2002

ID POS F

日本内科学会雑誌第97巻第7号

13章 回帰分析


1 1.1 Excel Excel Excel log 1, log 2, log 3,, log 10 e = ln 10 log cm 1mm 1 10 =0.1mm = f(x) f(x) = n

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

Microsoft Word - econome5.docx

日本内科学会雑誌第98巻第4号

( )/2 hara/lectures/lectures-j.html 2, {H} {T } S = {H, T } {(H, H), (H, T )} {(H, T ), (T, T )} {(H, H), (T, T )} {1

š ( š ) ,400, , ,893, ,743, ,893, ,893, ,658,475 35,884,803 2,167,037 7,189,060 55,417,575 81,08

_0212_68<5A66><4EBA><79D1>_<6821><4E86><FF08><30C8><30F3><30DC><306A><3057><FF09>.pdf

情報工学概論

Microsoft Word - 表紙.docx

Microsoft Word doc

講義「○○○○」

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - Stattext12.doc

1.民営化

EBNと疫学

x y 1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... x ( ) 2

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Word ›žŠpŁÒ-flO“Z

.3. (x, x = (, u = = 4 (, x x = 4 x, x 0 x = 0 x = 4 x.4. ( z + z = 8 z, z 0 (z, z = (0, 8, (,, (8, 0 3 (0, 8, (,, (8, 0 z = z 4 z (g f(x = g(

untitled


年計グラフ作成システム

2 log 3 9 log 0 0 a log log 3 9 y 3 y = = 9 y = 2 0 y = 0 a log 0 0 a = a 9 2 = 3 log 9 3 = 2 a 0 = a = a log a a = log a = 0 log a a =. l

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

第11回:線形回帰モデルのOLS推定

dicutil1_5_2.book

2 G(k) e ikx = (ik) n x n n! n=0 (k ) ( ) X n = ( i) n n k n G(k) k=0 F (k) ln G(k) = ln e ikx n κ n F (k) = F (k) (ik) n n= n! κ n κ n = ( i) n n k n

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

第13回:交差項を含む回帰・弾力性の推定

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - Econometrics

【補足資料】確率・統計の基礎知識

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

春期講座 ~ 極限 1 1, 1 2, 1 3, 1 4,, 1 n, n n {a n } n a n α {a n } α {a n } α lim n an = α n a n α α {a n } {a n } {a n } 1. a n = 2 n {a n } 2, 4, 8, 16,

snkp-14-2/ky347084220200019175

PowerPoint”ÀŒ±−‹ŠpŁÒ-fl²‡«flO

PowerPoint プレゼンテーション

untitled

Microsoft Word - eviews6_

基礎統計


切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

( š ) œ 525, , , , ,000 85, , ,810 70,294 4,542,050 18,804,052 () 178,710 1,385, , ,792 72,547 80,366

151021slide.dvi

,

iR-ADV C2230/C2220 製品カタログ

211 ‚æ2fiúŒÚ

Medical3

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - sc7.ppt [互換モード]

> > <., vs. > x 2 x y = ax 2 + bx + c y = 0 2 ax 2 + bx + c = 0 y = 0 x ( x ) y = ax 2 + bx + c D = b 2 4ac (1) D > 0 x (2) D = 0 x (3

( )

ad bc A A A = ad bc ( d ) b c a n A n A n A A det A A ( ) a b A = c d det A = ad bc σ {,,,, n} {,,, } {,,, } {,,, } ( ) σ = σ() = σ() = n sign σ sign(

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

Transcription:

Microsoft Excel Excel 1 1 x y x y y = a + bx a b a x 1 3 x 0 1 30 31 y b log x α x α x β 4 version.01 008 3 30 Website:http://keijisaito.info, E-mail:master@keijisaito.info 1

Excel Excel.1 Excel Excel 003 [ ] [ ] 1 [ ] [OK] Microsoft Office Excel CD. [Excel ] Excel y x Excel (http://keijisaito.info/arc/excel/ols data.xls) y x α x β 1 [ ] y x F9 [ ] [ ] [ ] [ ].3 [ ] [ ] [ ] [OK] [ ] 1 Excel 007 Microsoft Office [Excel ] Excel [ ] [ ] Excel 007 [ ] [ ]

[Excel ] Y 1 X 3 Y $B$10:$B$60 X $C$10:$D$60 $K$10 4 5 6 [OK] 概要 回帰統計 重相関 R 0.951759 重決定 R 0.905845 補正 R 0.901838 標準誤差 8.616 観測数 50 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 33538.4 16769.1 6.088953 7.68E-5 残差 47 3486.04 74.17106 合計 49 3704.46 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 切片 1.9617 9.35308.34811 0.0317974 3.146194 40.77814 3.146194 40.77814 x α 3.091 0.30515 13.89456.9143E-18.739174 3.666649.739174 3.666649 x β 4.609189 0.505876 9.111303 5.9088E-1 3.591498 5.6688 3.591498 5.6688 [Excel ] 3 Excel 16 4 [ ] 5 $ Excel $ $ : 6 $K$10 3

3 Excel [ ] y n i y i x y = a + bx y = a 1 + bx a 1 1 1 i j x ij b b 1 j b j y ŷ y k i ŷ i (1) ŷ i = b 1 + b x i + b 3 x i3 + + b k x ik (1) (1) ŷ i y i e i 7 e i i e i ŷ i () y i y i = ŷ i + e i () 3.1 0 j x j e n n x ij e i = 0 (3) 0 8 0 [ ] V Y 6 F9 0 0 n 0 7 e ϵ e ϵ 8 e i = (y i ŷ i ) = {y i (b 1 + b x i + + b k x ik )} e i = 0 e i b j b j =0 {x ij e i } = 0 = {x ij (y i b 1 + b x i + + b k x ik )} = {x ij e i } 4

(1) b 1 1 (3) 1 e i = e i = 0 (4) e 0 e ē e e i ē 0 (1) e i ŷ i e i = [b 1 + b x i + + b k x ik ]e i = [b 1 e i + b x i e i + + b k x ik e i ] n = b 1 e i + b n x i e i + + b k n x ik e i = b 1 0 + b 0 + + b k 0 = 0 (5) ŷ e 0 0 n 0 [ x e 0] 3. () y i = ŷ i + e i n y i = ŷ i + e i (6) (4) (6) e i 0 (6) y i = ŷ i (7) y ŷ n y y y y = ŷ ŷ y = ŷ = b 1 + b x + b 3 x 3 + + b k x k (8) (8) [ y ] [ ŷ ] [ x ] y x [ ] y B6 x B67 5

[ x y ] (8) y = ŷ = b 1 (9) b 1 ȳ (9) b 1 (y i b 1 ) b 1 = y (10) 9 (10) e i b 1 y 3.3 (x, y) = (0, y 1 ) (1, y ) (1, y 3 ) (1, y 4 ) 4 x = 0 ŷ x=0 x = 1 ŷ x=1 x = 0 (x, y) = (0, y 1 ) 1 ŷ x=1 (0, y 1 ) (1, ŷ x=1 ) ŷ x=0 y 1 ŷ x=1 (10) b 1 ŷ x=1 ŷ x=1 x = 1 y ŷ x=1 = y +y 3 +y 4 3 (0, y 1 ) (1, y +y 3 +y 4 3 ) ŷ = y 1 + ( y + y 3 + y 4 3 y 1 )x (11) (11) x 1 y ( y +y 3 +y 4 3 y 1 ) (y y 1 ), (y 3 y 1 ), (y 4 y 1 ) (11) 9 (y i b 1 ) b 1 = ( y i nb 1 ) =0 b 1 = y 6

4 Excel Excel 10 4.1 R ŷ y () y i = ŷ i + e i () y ŷ () (4) e e i e 0 (7) y = ŷ (4) ē = 0 () y y i y = ŷ i y + e i [y i y] = [ŷ i y + e i ] = [ŷ i y] + [ŷ i y]e i + e i (1) (1) [ŷ i y]e i (4) (5) 0 (1) [y i y] = [ŷ i y] + e i (13) (13) [y ]=[ŷ ]+[e ] 11 y ŷ e 1 (13) (13) 1 = [yi y] [yi y] = [ŷi y] [yi y] + e i [yi y i ] (14) (14) y ŷ 13 (14) 1 0 1 14 R y ŷ 10 R R R 11 e = 0 e i e e i 1 ŷ e y 13 R 14 (9) [ŷ i y] = [y y] = 0 0 7

R = [ŷi y] [yi y] = 1 e i [yi y] = = 1 (15) 4. R R R 15 0 1 R 1 e R = 1 [yi i y] = 1 = (16) 4.3 R 0 e i 0 e i 0 e i (15) e i [y i y] 16 17 k (17) R = 1 e i (n 1) [yi y i ] (n k) = 1 (1 ) ( 1) ( ) 1 18 (17) (17) 15 Excel 0.5 Excel = ˆ 0.5 Excel =sqrt( ) 16 1 17 Adjusted-R Adj-R 18 n k (17) 1 8

R 4.4 (4) ē = 0 0 ±1 ± ± e i e 1 e i n 1 e i n 19 0 e i 0 0 e i = 0 n k (n k) 1 e i (n k) 1 3 4 = = e i (n k) = ( ) e i (n k) = ( ) (18) (19) 4.5 F 0 19 n (n 1) (http://keijisaito.info/arc/excel/variance.xls) F9 0 1 (17) [ ] [ ] 3 (standard deviation) (standard error) 4 s s 9

5 e i (10) b 1 = y [y i y] y [y i y] e i (13) [ŷ i y] [ ] [ŷ i y] (k 1) 1 (18) 6 (0) (ŷi ȳ) = (k 1) e i (n k) = (0) = = (ŷi ȳ) (k 1) e i (n k) = (1 ) (ŷi ȳ) (yi ȳ) (yi ȳ) (n k) e i (k 1) ( ) ( 1) (1) (1) (0) (1) 0 F 7 F 0 [ ] P1 F [7.68E-5] 7.68 (0.1) 5 0 5 8 7.68 (0.1) 5 5 Excel F ANOVA(analysis of variance) F F F P 6 [ ] N1 [16769.1] N [74.17106] 7 F F F (k 1, n k) F 8 Excel F [=FDIST(, (k 1), (n k)]=[fdist(6.0883,,47)] 7.68E-5 10

5 Excel Excel [ ] 係数 標準誤差 t P- 値 下限 95% 上限 95% 下限 95.0% 上限 95.0% 切片 1.9617 9.35308.34811 0.0317974 3.146194 40.77814 3.146194 40.77814 x α 3.091 0.30515 13.89456.9143E-18.739174 3.666649.739174 3.666649 x β 4.609189 0.505876 9.111303 5.9088E-1 3.591498 5.6688 3.591498 5.6688 [ Excel ] 5.1 1 1 9 [3.3 ] 0 5. [1] [] 30 [3] [4] 31 [] [4] [ ] F9 [] F4, F5 [3] B7 [4] B6 [-1 1] x α x β 0 ±1 9 10000 1 10000 30 10000 1 10000 31 ±1 Excel 0 Excel 11

5.3 t () t t = () t () t 3 t 0 t t t 0 t 0 t.5% 5% 標準正規分布とt 分布 0.5 標準正規分布 0.4 0.3 t 分布 : 自由度 0 t 分布 : 自由度 5 t 分布 : 自由度 1 0. 0.1 0-4 -3 - -1 0 1 3 4 95% t 33 t 95% t 34 t 5% t 5% t 0 t 1.7 10% t t.5 1% t 35 t 5%.5% 36 t t 3 10000 1 10000 t 33 (http://keijisaito.info/arc/excel/clt normal.xls) F9 95% ± 34 t 0 35 t t Excel [=TINV(, )] 5% 47 [=TINV(0.05, 47)].01 36 5% (significance level) 1

95% t t 5% t t 0 37 t 5.4 P t 5% t t t t t P 38 P 0 t 100 t.13 5% t 1% t 5% 1% t P 0.036 3.6% 39 5% t P 0.05 5.5,, 95% 40 41 95% 37 [5. ] [1] 0 t 38 p P 39 Excel [=TDIST(t,, =)] P [=TDIST(.13, 100, )] 0.036 40 100 % 41 95% [ ] R3 13

6 (3) 1 3 4 5 6 i = b 1 + b i + b 3 i + b 4 i + e i (3) 6.1 (3) 0mm 1mm 100mm 101mm (3) 4 43 [ ] y b j x j 1 y 44 45 x j b j x j 1% y 46 (3) b 4 1 (4) b 4 1% b 1 + b i + b 3 i + b 4 log( i ) (4) [ ] A B (5) b 1 + b i + b 3 i + b 4 i + b 5 i (5) 4 43 44 d log(y) = 1 y dy y y b y j x 45 Excel natural logarithm ln( ) Excel log( ) 10 46 x j y 14

A 0 B 1 Excel (5) A b 1 B b 1 + b 5 (6) b 1 + {b + b 6 i } i + b 3 i + b 4 i (6) (6) (5) i A b B b + b 6 (6) Excel Excel (7) 0 b 1 + b ia + b 6 ib + b 3 i + b 4 i (7) (7) A b B b 6 b 6 = b + b 6 (6) (7) A B C 3 47 [ ] j x j y ŷ e ŷ e ŷ e ( i ) ( i i ) ( i ) ( 傘の販売本数 ) 80 70 60 50 40 30 0 10 0 切片と一乗項のみでの回帰分析 グループ A の標本グループ B の標本グループ横断の回帰線 0 50 100 150 00 (1 日の降水量 ) ( 傘の販売本数 ) 80 70 60 50 40 30 0 10 0 二乗項と定数項ダミーを追加した回帰分析 グループ A の標本グループ B の標本グループ A の回帰線グループ B の回帰線 0 50 100 150 00 (1 日の降水量 ) 47 (http://keijisaito.info/econ/jp/gjk/j wage data.htm) 15

6. (3) (3) 48 (3) 49 6.3 (3) (3) b 4 b 4 0 50 51 5 48 [6.6 ] 49 50 51 5 Excel 16

6.4 Excel e ϵ (8) 0 σ 53 54 ϵ N(0, σ ) (8) (8) [ ] [ ] ϵ 55 e ϵ e x j ŷ 56 [6.1 ] [6. ] 57 ( 推定エラー ) 均一分散 ( 推定エラー ) 不均一分散 ( 推定エラー ) 回帰分析の式に問題 3 3 3 1 0-1 - -3 0 0 40 60 80 100 ( 説明変数 当てはめ値 ) 1 0-1 - -3 0 0 40 60 80 100 ( 説明変数 当てはめ値 ) 1 0-1 - -3 0 0 40 60 80 100 ( 説明変数 当てはめ値 ) 6.5 53 (19) σ (19) 54 55 ϵ (e 56 t e t 1 ) 57 Excel e t 17

Heckit 58 ( 傘の販売本数 ) 60 潜在的な標本を含めた回帰分析 ( 傘の販売本数 ) 60 観測できる標本での回帰分析 50 50 40 30 0 観測できる標本潜在的な標本全標本での回帰線 10 0 30 40 50 (1 日の降水量 ) 40 30 0 観測できる標本観測できる標本での回帰線 10 0 30 40 50 (1 日の降水量 ) 6.6 10 y x 59 ( 傘の販売本数 ) 60 正確な説明変数での回帰分析 ( 傘の販売本数 ) 60 不正確な説明変数での回帰分析 50 50 40 40 30 0 正確な説明変数 正確な説明変数での回帰線 10 0 30 40 50 (1 日の降水量 ) 30 0 不正確な説明変数 不正確な説明変数での回帰線 10 0 30 40 50 (1 日の降水量 ) 58 Excel 59 18