Microsoft PowerPoint - Econometrics

Similar documents
> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

1 15 R Part : website:

Microsoft PowerPoint - Econometrics pptx

情報工学概論

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

(lm) lm AIC 2 / 1

回帰分析 単回帰

Microsoft PowerPoint - Statistics[B]

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

統計的データ解析

回帰分析 重回帰(1)

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

k2 ( :35 ) ( k2) (GLM) web web 1 :

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Use R

201711grade2.pdf

DAA09

Medical3

経済統計分析1 イントロダクション

J1順位と得点者数の関係分析

Microsoft PowerPoint - statistics pptx

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - stat-2014-[9] pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - Econometrics

EBNと疫学

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

Microsoft PowerPoint - statistics pptx

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

untitled

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Medical3

第4回

Microsoft PowerPoint - A1.ppt [互換モード]

基礎統計

Microsoft PowerPoint ppt

1 R Windows R 1.1 R The R project web R web Download [CRAN] CRAN Mirrors Japan Download and Install R [Windows 9

ビジネス統計 統計基礎とエクセル分析 正誤表

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

講義のーと : データ解析のための統計モデリング. 第3回

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

R による共和分分析 1. 共和分分析を行う 1.1 パッケージ urca インスツールする 共和分分析をするために R のパッケージ urca をインスツールする パッケージとは通常の R には含まれていない 追加的な R のコマンドの集まりのようなものである R には追加的に 600 以上のパッ

テキストファイルの入出力1

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

R John Fox R R R Console library(rcmdr) Rcmdr R GUI Windows R R SDI *1 R Console R 1 2 Windows XP Windows * 2 R R Console R ˆ R

第1回

Microsoft Word - apstattext04.docx

第2回 回帰と分散分析

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - GLMMexample_ver pptx

数値計算法

Microsoft Word - appendix_b

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

_Kobayashi

untitled

Microsoft PowerPoint - R-intro-04.ppt

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

3.Cygwin で日本語を使いたい Cygwin で以下のコマンドを実行すると それ以降 メッセージが日本語になります export LANG=ja_JP.UTF-8 これは 文字コードを日本語の UTF-8 に設定することを意味しています UTF-8 は Cygwin で標準の文字コードで, 多

図 2 エクスポートによるシェープファイルの新規保存 新規保存するファイルは, より分かりやすい名前をつけて適切なフォルダ (shape フォル ダにまとめておくのがよい ) 上に保存しておく 2 / 10

農業・農村基盤図の大字小字コードXML作成 説明書

エクセルに出力します 推定結果の表は r(table) という行列で保存されますので matlist r(table) コマンドで 得られたの一覧を表示させます. use clear. regress

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A>

Microsoft Word - mstattext02.docx

パッケージのインストール Rには 複雑な解析を便利に行うためのパッケージが容易されています ( 世界中の研究者達が提供してくれる ) 今回は例として多重比較検定用のmultcomp パッケージをインストールしてみます ( 注意 ) 滋賀県立大学のようにプロキシ経由でインターネットに接続する環境で R

Excelにおける回帰分析(最小二乗法)の手順と出力

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

win版8日目

2 と入力すると以下のようになる > x1<-c(1.52,2,3.01,9,2,6.3,5,11.2) > y1<-c(4,0.21,-1.5,8,2,6,9.915,5.2) > cor(x1,y1) [1] > cor.test(x1,y1) Pearson's produ

Chapter 1 Epidemiological Terminology

PowerPoint プレゼンテーション

PowerPoint Presentation

kantan_C_1_iro3.indd

統計学の基礎から学ぶ実験計画法ー1

MedicalStatisticsForAll.indd

第1回(全5回) Rの基礎と仮説検定

<4D F736F F F696E74202D2088E D8C768A7789C482CC8A778D5A F939D8C76835C FC96E52E >

プログラミング基礎

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft Word - 計量研修テキスト_第5版).doc

Microsoft PowerPoint - 統数研シンポジウム_R_ ppt

パソコンの中を見よう

スライド 0

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

以下の内容について説明する 1. VAR モデル推定する 2. VAR モデルを用いて予測する 3. グレンジャーの因果性を検定する 4. インパルス応答関数を描く 1. VAR モデルを推定する ここでは VAR(p) モデル : R による時系列分析の方法 2 y t = c + Φ 1 y t

2 / 18 ページ 第 13 講データの活用とデータマップの作成 13-1 ホームページの保存 ホームページ (Web ページ ) に表示される様々な情報を ファイルとして保存することができます

Microsoft Word - 計量研修テキスト_第5版).doc

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

<4D F736F F D208AC888D B836A F C91808DEC837D836A B81698AC7979D8ED A E646F6

スライド タイトルなし

PowerPoint プレゼンテーション

PowerPoint Presentation

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Transcription:

計量経済学講義 第 25 回 R による計量経済分析 Part-1 2018 年 1 月 5 日 ( 金 )1 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 432 号室 email: kkarato@eco.u-toyama.ac.jp website: http://www3.u-toyama.ac.jp/kkarato/ 1

講義の目的 より高度な計量経済分析を行うために総合 的な統計分析ソフト R の基本的な使い方を, 学びます keywords: コンソール画面, エディタ画面, スクリプト, データ ベクトル, クロス集計表, 独立性の検定, 順位相関係 数, 平均の差の検定, マン ホイットニーの U 検定 2

R とは フリーの統計解析ソフトウェア ( プログラミング言語 ) 大学の総合情報基盤センターにインストール済み プラットホーム :Linux, OS X, Windows ホームページ The R Project for Statistical Computing ( https://www.rproject.org/ ) ダウンロードとインストール The Comprehensive R Archive Network ( https://cran.rproject.org/welcome.html ) 使い方 ( 参考になるサイト ) http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html http://www.okadajp.org/rwiki/ 3

コンソール画面 コンソール画面 ここにコマンド ( 命令 ) を打ち込む 4

演算子と関数 (1) 基本演算子 + 足し算 引き算 * 掛け算 / 割り算 ^ 累乗 例. 以下の計算を実行 2 5 95 12 5 1 3 4 3 1 0.5 5

演算子と関数 (2) 2 sqrt(2) 1 e exp(1) log1 log(1) log 3 5 log(5,3) 6

演算子と関数 (3) 関数と代入 練習問題 (1) > x<- 10 > x^2 [1] 100 [1] 1 2 3 2 [2] e 0.03 1 > b<- sqrt(2) > round(b,2) [3] ln105 ln100 [1] 1.41 [4] 2 0.5x ただし, x 4 <- は代入を表す 7

エディタ (1) R の ファイル メニューの 新しいスクリプト をクリック エディタが起動 エディタに計算内容やコマンドを記述しておくと, エディタからそのコードを実行することができる エディタ画面 8

エディタ (2) エディタに記述した内容は保存しておく 例. 以下のコードをエディタに記述して保存する ( 保存するのは計算結果ではなく計算内容 ) b<- sqrt(2) round(b,2) ( コンソール画面ではなく ) エディタ画面をアクティブにした状態で ファイル メニューの 別名で保存 を選択 ファイル名を 0105.r として保存する ( 拡張子は r ) 〇〇.r は R のソースコード ファイルである ただし, 保存する場所に注意 ローカルのドライブではなく, ネットワークドライブか自分の USB メモリに保存すること 9

エディタ (3) コマンドの実行 実行したい部分を選択状態にして, 2 行まとめて実行 右クリック カーソル行または選択中の R コードを実行 または, ctrl + R のショートカットを利用する コンソール画面に結果が表示される > b<- sqrt(2) > round(b,2) カーソル行だけ実行 [1] 1.41 10

データ ベクトル (1) エディタに以下を記述 x<- c(2,4,6,8) x y<- c(7,4,12,5) x+y # xとyの和 x*y # xとyの積 データ x の作成 データ データ y の作成 x i y i x i y i i x i i の表示 の表示 の表示 : xi : yi 2,4,6,8 7,4,12,5 # 記号以下にコメント文を書くことができる Rでは# の部分を無視する c(2,4,6,8) のようにいくつかの値をひとまとめにしたものをデータ ベクトルとよぶ また,<- は代入を表している したがって, x<- c(2,4,6,8) はデータ ベクトル c(2,4,6,8) を x という文字に代入している x+y や x*y のように 長さ の等しい複数のデータ ベクトルを用いてデータ間の演算ができる 11

データ ベクトル (2) 連番データ a<- 1:10 a [1] 1 2 3 4 5 6 7 8 9 10 seq(1,10,2) [1] 1 3 5 7 9 A:B A, Bが整数のときは AからBまでの連番データを作成 seq A,B,m A, Bが整数のときは AからBまでのm個おきのデータを作成 ベクトルの 長さ length(x) [1] 4 length(a) [1] 10 length x データベクトルの長さ, データ x i の数 12

データ ベクトル (3) ベクトルの要素 x[3] [1] 6 x[x<5] [1] 2 4 x[4]<- 10 x [1] 2 4 6 10 x [ k] : xのk 番目の要素 x [ x j] : x j を満たす x 4 番目の値を10に上書き の要素を表示 ベクトル演算 > sum(x) # 合計 [1] 22 > mean(x) # 平均 [1] 5.5 > var(x) # 分散 [1] 11.66667 13

R の統計関数 14

散布図と回帰直線 (1) plot(x,y) eq<- lm(y~x) abline(eq) eq Call: lm(formula = y ~ x) Coefficients: (Intercept) x plot ( x, y) : 横軸に x, 縦軸に y の散布図を作成 y ~ x は回帰モデル y x u を意味する y ~ x の記述を formula( 式 ) とよぶ lm y ~ x は回帰モデルを最小 2乗法で推定するコマンド lm : linear model 最小 2乗法の計算結果 ( 切片と傾き ) が eq に代入されている abline eq : 計算された切片と傾きに基づいて, 回帰直線を散布図に書き込む 7.31429-0.05714 summary(eq) summary (eq) : 最小 2 乗推定の詳細な結果を表示する 15

散布図と回帰直線 (2) summary(eq) summary (eq) : 最小 2 乗推定の詳細な結果を表示する Call: lm(formula = y ~ x) Residuals: 残差 1 2 3 4-0.200-3.086 5.029-1.743 Coefficients: 推定値標準誤差 t 値 p 値 Estimate Std. Error t value Pr(> t ) (Intercept) 7.31429 4.59432 1.592 0.252 x -0.05714 0.73568-0.078 0.945 Residual standard error: 4.352 on 2 degrees of freedom 回帰の標準誤差と残差 2 乗和の自由度 Multiple R-squared: 0.003008, Adjusted R-squared: -0.4955 F-statistic: 0.006033 on 1 and 2 DF, p-value: 0.9452 決定係数, 自由度調整済み決定係数 ゼロスロープ検定の F 値, 分子 分母の自由度,F 検定の p 値 16

外部データの読み込み (1) http://www3.u-toyama.ac.jp/kkarato/2017/econometrics/ から data.csv をダウンロード 〇〇〇.docx, 〇〇〇.xlsx, 〇〇〇.txt, 〇〇〇.png のようにファイル名 〇〇〇 の後ろについている docx, xlsx, txt, png は拡張子とよばれている 拡張子はファイルの種類を識別するための文字列と思えばよい たいていのウィンドウズ PC では拡張子によって開くアプリケーションを定義づけている (docx はワード,xlsx はエクセルなど ) パソコンによっては拡張子が表示されないように設定されている その場合, コントロール パネルの エクスプローラーのオプション の 表示 において 登録されている拡張子は表示しない のチェックをはずしておく csv は comma-separated values は, いくつかのフィールドを区切り文字であるカンマ, で区切ったテキストデータおよびテキストファイル エクセルで開こうと思えば開けるが, テキスト エディター ( 例えば秀丸 ) やメモ帳でも開くことができる csv や txt などのカンマ区切りテキストファイルを R で読み込むには, read.csv コマンドを使う data<- read.csv( data.csv ) 読み込んだ data のことをデータ フレーム (data.frame) とよぶ 17

外部データの読み込み (2) data.csv は今作成しているソースコード ファイル 0105.r と同じ場所に置く ローカルドライブの ドキュメント には保存しない ネットワークドライブまたは自分のUSBメモリの適当なフォルダに保存しておく データ読み込みのコマンド data<- read.csv( data.csv ) attach(data) n<- dim(data)[1] str(data) summary(data) read. csv : csv ファイルを読み込んで データフレームを追加するコマンド クォーテーション (shift dim はデータの次元 ( 観測値の数 2) で括る ファイル名 ( 拡張子付き ) をダブル 読み込んだ内容を data というオブジェクト に代入する ( オブジェクト名は何でもよい ) attach は変数へのアクセスを簡単にするコマンド dim[1] は観測値の数を示す観測値の数を nとする str はデータの構造を一覧表示するコマンド summary はデータの要約統計量を示すコマンド 変数の数 ) を調べるコマンド 18

回帰分析 例. 配偶者間の年齢 配偶者の年齢 = a + b 本人の年齢 + u age.sp age.sf sf: self 本人 sp: spouse 配偶者 plot(age.sf, age.sp) eq<- lm(age.sf~age.sp) summary(eq) 配偶者の年齢 = b 1 + b 2 本人の年齢 + b 3 18 歳未満の子供の数 + u age.sp age.sf c18 eq<- lm(age.sf~age.sp+c18) summary(eq) 19

データ集約 (1) データ閲覧と編集 fix(data) 閲覧が終わったら, データエディタ画面を閉じる ( をクリック ) データの表示 block 居住している 地域ブロック の番号が表示される データの分布 x<- table(block) x barplot(x) table : データの度数分布を表示するコマンド barplot : 棒グラフを描画するコマンド 20

データ集約 (2) クロス集計表と独立性の検定 検証する仮説 H 0 : 居住している地域と性別の分布は独立である H 1 : 居住している地域と性別の分布は独立でない x<- table(block,sex) x chisq.test(x) block 地域ブロック sex 性別男性女性 1 2 北海道 東北 1 146 123 関東 2 304 288 中部 3 248 236 近畿 4 176 180 中国 四国 5 98 103 九州 6 120 140 tableコマンドを 2 つの変数に使うとクロス集計表が作成できる 6 2のクロス集計表なので, 独立性の検定の自由度は df = (6-1) (2-1)=5 検定統計量 ( カイ2 乗値 ) は X-squared = 4.1808,p 値は 0.5237 なので有意水準 5% で帰無仮説 H 0 を棄却できない (p 値が0.05 未満のときH 0 を棄却 ) 居住している地域と性別の分布は独立でない とは言えない地域によって男女比に偏りがあるサンプルにはなっていない 自由度 5の カイ 2乗分布 0 5 10 15 20 カイ 2乗 p 値 0.5237 21

データ集約 (3) 使用データの尺度と関係性の分析 質的データ量的データ名義尺度順序尺度間隔尺度非尺度 名義尺度クロス集計クロス集計 ( クロス集計 ) ( クロス集計 ) 質的データ 順序尺度 クロス集計順位相関係数 ( クロス集計 ) 順位相関係数 ( クロス集計 ) 順位相関係数 量的データ 間隔尺度 非尺度 ( クロス集計 ) ( 順位相関係数 ) 相関係数 ( クロス集計 ) ( 順位相関係数 ) 相関係数 ( クロス集計 ) ( 順位相関係数 ) 相関係数 22

データ集約 (4) スピアマンの順位相関係数 cor(city,wllive) cor(city,wllive,method="spearman") cor.test(city,wllive,method="spearman") city wllive 1 2 3 4 1 274 191 41 4 2 290 187 50 7 3 521 259 78 15 4 139 78 27 1 cor (x,y) は変数 x, y の相関係数を計算するコマンド method= spearman を追加すると, 順位相関係数を計算する cor.test(x,y) は相関係数がゼロであるという帰無仮説を検定するコマンド Spearman's rank correlation rho data: city and wllive S = 1735600000, p-value = 0.1567 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.03046662 23

データの制限 (1) income.sf[age.sf==40] income.sf[age.sf<40] income.sf[sex==1] income.sf[sex!=1] 年齢が40歳に等しい人の年収階級年齢が40歳未満の人の年収階級性別が男性である人の年収階級性別が男性でない人の年収階級 演算子を使った条件式の書き方変数 == a : a に等しい変数 >= a : a 以上変数 <= a : a 以下変数 > a : a より大きい変数 < a : a より小さい変数!= a : a に等しくない income.sf[age.sf>=30 & age.sf<40] income.sf[edu.sf<30 age.sf>=60] 論理演算子 a & b : a かつ b a b : a または b 30 40 50 60 70 年齢が30歳以上 かつ 40歳未満の人の年収階級年齢が30歳未満 または 60歳以上の人の年収階級 24

データの制限 (2) x<- income.sf[age.sf<40] y<- sex[age.sf<40] table(x,y) 年齢が 40 歳未満の人の 年収階級と性別のクロス集計 x<- income.sf[sex==2 & job.sf==2] y<- edu.sf[sex==2 & job.sf==2] table(x,y) 性別が女性 かつ 就労形態が 常時雇用の一般従業者の 年収階級と学歴のクロス集計 25

平均の差の検定 平均の差の検定 (Welch s t-test) x<- age.sf[ownhouse==1 & income.hh==2] y<- age.sf[ownhouse==1 & income.hh==4] t.test(x,y) 対象となる母集団 x 居住形態が持ち家かつ世帯年収が 350-550 万円未満の人の年齢 y 居住形態が持ち家かつ世帯年収が 850 万円以上の人の年齢検証する仮説 H 0 : x と y の年齢に差がない H 1 : x と y の年齢に差がある t.test : x と y の母集団分散が異なる ( 不等分散 ) という条件下での t 検定 p 値が 0.05 未満のとき H 0 を棄却 26

中央値の差の検定 マン ホイットニーの U 検定 ( ウィルコクスンの順位和検定 ) x<- job.cont[sex==1 & work.sf==1 & edu.sf==3] y<- job.cont[sex==1 & work.sf==1 & edu.sf==5] wilcox.test(x,y) 対象となる母集団 x 性別が男性かつ仕事をしており, 学歴が高校卒の人の就労継続意向 y 性別が男性かつ仕事をしており, 学歴が大学 大学院の人の就労継続意向検証する仮説 H 0 : x と y の就労継続意向に差がない H 1 : x と y の就労継続意向に差がある wilcox.test : マン ホイットニーの U 検定 ( ウィルコクスンの順位和検定 ) 標準正規分布での t 検定 p 値が 0.05 未満のとき H 0 を棄却 27