> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

Similar documents
まず y t を定数項だけに回帰する > levelmod = lm(topixrate~1) 次にこの出力を使って先ほどのレジームスイッチングモデルを推定する 以下のように入力する > levelswmod = msmfit(levelmod,k=,p=0,sw=c(t,t)) ここで k はレジ

DAA09

回帰分析 単回帰

1

(lm) lm AIC 2 / 1

R による共和分分析 1. 共和分分析を行う 1.1 パッケージ urca インスツールする 共和分分析をするために R のパッケージ urca をインスツールする パッケージとは通常の R には含まれていない 追加的な R のコマンドの集まりのようなものである R には追加的に 600 以上のパッ

201711grade2.pdf

Use R

dae opixrae 1 Feb Mar Apr May Jun と表示される 今 必要なのは opixrae のデータだけなので > opixrae=opixdaa$opi

J1順位と得点者数の関係分析

と入力する すると最初の 25 行が表示される 1 行目は変数の名前であり 2 列目は企業番号 (1,,10),3 列目は西暦 (1935,,1954) を表している ( 他のパネルデータを分析する際もデ ータをこのように並べておかなくてはならない つまりまず i=1 を固定し i=1 の t に関

様々なミクロ計量モデル†

Microsoft PowerPoint - Econometrics

1 15 R Part : website:

untitled

BMIdata.txt DT DT <- read.table("bmidata.txt") DT head(dt) names(dt) str(dt)

R John Fox R R R Console library(rcmdr) Rcmdr R GUI Windows R R SDI *1 R Console R 1 2 Windows XP Windows * 2 R R Console R ˆ R

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

以下の内容について説明する 1. VAR モデル推定する 2. VAR モデルを用いて予測する 3. グレンジャーの因果性を検定する 4. インパルス応答関数を描く 1. VAR モデルを推定する ここでは VAR(p) モデル : R による時系列分析の方法 2 y t = c + Φ 1 y t

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - GLMMexample_ver pptx

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A>

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

インターネットを活用した経済分析 - フリーソフト Rを使おう

tshaifu423

< F2D968382CC A837E B E9197BF2E6A7464>

R Console >R ˆ 2 ˆ 2 ˆ Graphics Device 1 Rcmdr R Console R R Rcmdr Rcmdr Fox, 2007 Fox and Carvalho, 2012 R R 2

講義のーと : データ解析のための統計モデリング. 第3回

1.2 R R Windows, Macintosh, Linux(Unix) Windows Mac R Linux redhat, debian, vinelinux ( ) RjpWiki ( RjpWiki Wiki

Microsoft Word - Matlab_R_MLE.docx

E-Views 簡単な使い方

Microsoft PowerPoint - R-intro-04.ppt

win版8日目

k2 ( :35 ) ( k2) (GLM) web web 1 :

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

関数の定義域を制限する 関数のコマンドを入力バーに打つことにより 関数の定義域を制限することが出来ます Function[ < 関数 >, <x の開始値 >, <x の終了値 > ] 例えば f(x) = x 2 2x + 1 ( 1 < x < 4) のグラフを描くには Function[ x^

スライド 1

スライド 1

PowerPoint Presentation

スーパー英語アカデミック版Ver.2

1. Stata( ステータ ) Stata は,StataCorp 社の販売している統計ソフトウェアで, 計量経済学においてもっともよく使われています 最新の計量経済学的手法の論文を執筆する際に,Stata による推定方法 ( コマンド ) も同時に発表されることがよくあり, 基本的な分析からより

13章 回帰分析

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

第2回 回帰と分散分析

初めてのプログラミング

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

2 と入力すると以下のようになる > x1<-c(1.52,2,3.01,9,2,6.3,5,11.2) > y1<-c(4,0.21,-1.5,8,2,6,9.915,5.2) > cor(x1,y1) [1] > cor.test(x1,y1) Pearson's produ

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

untitled

Microsoft PowerPoint - 統数研シンポジウム_R_ ppt

Microsoft Word - 計量研修テキスト_第5版).doc

PowerPoint プレゼンテーション

Microsoft Word - 操作マニュアル-Excel-2.doc

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

回帰分析 重回帰(1)

基礎プログラミング2015

q( ) 2: R 2 R R R R C:nProgram FilesnRnrw1030) [File] [Change Dir] c:ndatadir OK 2

1.民営化

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

基本的な利用法

2006年10月5日(木)実施

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

基本的な利用法

Microsoft PowerPoint - e-stat(OLS).pptx

プログラミング基礎

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

Microsoft Word - å“Ÿåłžå¸°173.docx

パッケージのインストール Rには 複雑な解析を便利に行うためのパッケージが容易されています ( 世界中の研究者達が提供してくれる ) 今回は例として多重比較検定用のmultcomp パッケージをインストールしてみます ( 注意 ) 滋賀県立大学のようにプロキシ経由でインターネットに接続する環境で R

スライド 1

目次 第 1 章序論 第 2 章データの概要 第 3 章 J リーグの現状 第 4 章分析 第 5 章まとめ 第 6 章今後の課題

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

一般化線形 (混合) モデル (2) - ロジスティック回帰と GLMM

QLabセットアップガイド for CL/QL/TFシリーズ

6. 消費関数と 乗数効果 経済統計分析 (2017 年度秋学期 )

1 2 Windows 7 *3 Windows * 4 R R Console R R Console ˆ R GUI R R R *5 R 2 R R R 6.1 ˆ 2 ˆ 2 ˆ Graphics Device 1 Rcmdr R Console R Rconsole R --sdi R M

28

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

エクセルに出力します 推定結果の表は r(table) という行列で保存されますので matlist r(table) コマンドで 得られたの一覧を表示させます. use clear. regress

Microsoft Word - lec_student-chp3_1-representative

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

σ t σ t σt nikkei HP nikkei4csv H R nikkei4<-readcsv("h:=y=ynikkei4csv",header=t) (1) nikkei header=t nikkei4csv 4 4 nikkei nikkei4<-dataframe(n

PowerPoint プレゼンテーション

※ ポイント ※

Prog1_12th

スライド 1

プログラミング実習I

フィルタとは

経済統計分析1 イントロダクション

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft Word - 計量研修テキスト_第5版).doc

tshaifu423

Microsoft Word - eviews1_

Microsoft Word - eviews6_

Microsoft Word - Omrono_yuserDic.doc

コンピュータ中級B ~Javaプログラミング~ 第3回 コンピュータと情報をやりとりするには?

Transcription:

R による回帰分析 ( 最小二乗法 ) この資料では 1. データを読み込む 2. 最小二乗法によってパラメーターを推定する 3. データをプロットし 回帰直線を書き込む 4. いろいろなデータの読み込み方について簡単に説明する 1. データを読み込む 以下では read.table( ) 関数を使ってテキストファイル ( 拡張子が.txt のファイル ) のデー タの読み込み方を説明する 1.1 データの用意 テキストファイルにデータを用意する 以下では usdata01.txt というファイルにある 3 列のデ ータを読み込む ( アメリカの実質個人可処分所得と実質個人消費支出 ( 単位 :100 億ドル ) のデータ 1 列目は西暦 2 列目は実質個人可処分所得 3 列目が実質個人消費支出である ) ( usdata01.txt のデータ ) 1960 157 143 61 162 146 : : : 1.2 作業ディレクトリの変更 R を起動し R の画面のメニュー バーから ファイル ディレクトリの変更 によってデータ ( usdata02.txt) が置いてあるディレクトリを指定 1.3 データの読み込み次のコマンドを実行する ( 以下を打ち込んでエンター キーを押す ) > usdata01=read.table("usdata01.txt") これは usdata01.txt にあるデータに usdata01 という名前を付けて R に読み込みという命令を実行している 実際に読み込めたかどうかを確認するには この資料は私のゼミおよび講義で R の使用法を説明するために作成した資料です ホームページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが 間違いがあるかもしれません 間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任は負いかねますのでご了承ください 1

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V3 1 1960 157 143 2 61 162 146 : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable 1 variable 2 などの略 ) 上記ではデータがテキストファイル ( 拡張子が txt のファイル ) で与えられているとしているが 場合によってはでーたが csv ファイル ( 拡張子が csv のファイル ) で与えられている場合がある この場合 1 つの方法としては csv ファイルをテキストファイルとして読み込むか または read.csv() 関数を用いて読み込むこともできる 例えばもし先ほどのデータが usdata01.csv で与えられている場合は > usdata01=read.csv("usdata01.csv") とすれば読み込める 以下の read.table() 関数についての説明は全て read.csv() 関数にも当てはまる データを読み込むときの注意事項として 数値に, ( カンマ ) が入っているとうまく読み込めなく なるので ( 例えば 1,000 などのような場合 ) 読み込むときは数値からカンマを抜いたデータにして おく 2. 最小二乗法によってパラメーターを推定する消費 (V3) を所得 (V2) に回帰する回帰分析を最小二乗法で行ってみよう 最小二乗法を R で行うには lm( ) 関数を使う > result=lm(v3~v2,usdata01) というコマンドを実行する result というのは回帰分析の結果に result という名前を付けるという事である ここでは result と名前を付けたがこの名前は自由に決められる ( 例えば estimates でも何でもよい ) 1 つ目の引数の V3~V2 は V3 を被説明変数 V2 を説明変数とする回帰分析を行うという事である 2 つめの引数として usdata01 と打ち込むのはこれらの変数が usdata01 というデータのところにある変数であるというのを R に知らせるためである 結果を出力するには summary( ) という関数を用いる > summary(result) を実行すると Call: lm(formula = V3 ~ V2, data = usdata01) 2

Residuals: Min 1Q Median 3Q Max -12.4526-4.2491-0.6491 4.9113 15.1726 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -18.785055 2.594585-7.24 5.79e-09 *** V2 0.969369 0.006476 149.68 < 2e-16 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1. 1 $ Residual standard error: 6.226 on 43 degrees of freedom Multiple R-squared: 0.9981, Adjusted R-squared: 0.998 F-statistic: 2.24e+04 on 1 and 43 DF, p-value: < 2.2e-16 のように出力される 最初の Residuals: Min 1Q Median 3Q Max -12.4526-4.2491-0.6491 4.9113 15.1726 というのは回帰分析の残差の性質を表している Min, 1Q, Median, 3Q, Max というのはそ れぞれ最小値 第 1 分位数 中央値 第 3 分位数 最大値である 次の Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -18.785055 2.594585-7.24 5.79e-09 *** V2 0.969369 0.006476 149.68 < 2e-16 *** というのは切片 (Intercept) と V2 という変数の係数の推定値がそれぞれ -18.785055, 0.969369 である事 また Std.Error, t value, Pr(> t ) はこれらの推定量の標準誤 差 t 値 t 値の P 値をそれぞれ表している また Multiple R-squared が通常の決定係数 Adjusted R-squared が自由度修正済み決定係数を表す また上記と同じ結果を出力するコマンドとして > result=lm(usdata01$v3~usdata01$v2) と打ち込んでもよい ここで usdata01$v3 というのは usdata01 にある V3 という変数であると いうのを直接示している (usdata$v2 も同様 ) よってこの場合 2 つ目の引数として usdata01 と打ち込む必要がなくなる またさらに usdata01$v3 のように V3 を指定するのに毎回前に usdata01$ を受けるのは若干面倒であるので attach() 関数を用いて あらかじめ > attach(usdata01) としておくと > result=lm(v3~v2) とするだけで上記と同じ結果が出る attach() で行った処理をもとに戻すには detach() 関数 3

を用いる 先ほどの場合 > detach(usdata01) とすれば以後は V3 や V2 だけではデータを認識せず さきほどのように usdata01$v3 と入力しなければならなくなる 3. データをプロットし 回帰直線を書き込む V2 を X 軸 V3 を Y 軸とした散布図を描くには > plot(usdata01$v3~usdata01$v2) もしくは > plot(usdata01$v2,usdata01$v3) ( 上記 2 つのコマンドでは変数の順序が逆になっていることに注意 ) もしくは (attach(usdata01) とした後であれば ) > plot(v2,v3) と入力し 実行する すると以下のような散布図が出力される usdata01$v3 usdata01$v2 さらにここに先ほど推定した回帰直線を書き込むには > abline(result) を実行すればよい すると以下のようになる 4

usdata01$v3 usdata01$v2 4. いろいろなデータの読み込み方先ほどは usdata01.txt というファイルを読みこんだ 次は usdata02.txt というファイルを読み込んでみよう usdata01.txt はいきなりデータから始まっていたが usdata02.txt は一行目に変数の名前が入っている以下のようなファイルである (usdata02.txt のデータ ) Year income consumption 1960 157 143 61 162 146 : : : このように 1 行目に変数の名前が入っているようなデータの場合 R にそれを教えてあげる必要がある このようなデータを読み込むには以下のようなコマンドを実行する > usdata02=read.table( usdata02.txt,header=t) このコマンドによる結果は > usdata02 Year income consumption 1 1960 157 143 2 61 162 146 : : : : のようになる usdata01.txt を読み込んだ時と異なり 変数には Year や income などファイルの中の名前がついている あとの分析はまったく同じである ( データの名前が usdata01 から usdata02 へ 変数名が V2 から income V3 から consumption に変わるだけ ) また最初の何行かにデータを説明するコメントが入っているようなファイルも読み込む事ができ 5

る 例えば以下の usdata03.txt を読み込んでみよう (usdata03.txt のデータ ) ## アメリカの実質個人可処分所得と実質個人消費支出 ( 単位 :100 億ドル ) Year income consumption 1960 157 143 61 162 146 62 169 153 このファイルは 1 行目にデータの説明が入っている このようなデータを読み込むには > usdata03 =read.table( usdata03.txt, header=t, skip=1) というコマンドを実行する 最後の skip = 1 という引数は 1 行目を読み込まないという事である ( ここで読み込まないデータの行数を指定する 例えば最初の 2 行を読み込まないのであれば skip=2 となる ) この場合読み込まれたデータ usdata03 は usdata02 とまったく同じである 練習問題 ファイル makerdata01.txt, makerdata02.txt, makerdata03.txt にあるデータに ついて先ほどと同じことをやってみる 6