1-1
|
|
|
- れれ うみのなか
- 9 years ago
- Views:
Transcription
1 経 済 分 析 のための Stata 入 門 経 済 産 業 研 究 所 計 量 分 析 データ 室 松 浦 寿 幸 早 稲 田 大 学 大 学 院 経 済 学 研 究 科 佐 々 木 明 果 慶 應 義 塾 大 学 大 学 院 経 済 学 研 究 科 渡 辺 善 次 2006/04/01 version 最 新 版 は からダウンロード 可 能 1
2 目 次 第 1 章 Stata のはじめの 一 歩 Stata の 起 動 データの 読 み 込 み データを 保 存 する 読 み 込 んだデータを 確 認 しよう 変 数 の 加 工 と 条 件 式 Do ファイルのすすめ LOG をとる...12 第 1 章 補 論...15 補 論 1-1.データ 読 み 込 みのトラブルシューティング...15 補 論 1-2.プログラミングによる 繰 り 返 し 作 業...19 第 2 章 データベースの 作 成 データの 縦 方 向 の 結 合 (1) データの 横 方 向 の 結 合 (2) 少 数 のデータセットから 大 規 模 データに 値 を 割 り 当 てる 不 完 全 一 致 のデータセットの 接 続...25 第 3 章 記 述 統 計 による 分 析 ( 表 の 作 成 ) カテゴリー 区 分 された 変 数 ( 質 的 データ) 連 続 変 数 の 記 述 統 計 量 をみる 階 級 別 カテゴリー 変 数 の 作 成 ( 度 数 分 布 表 の 作 成 ) データのエクセルへの 移 行...41 第 4 章 回 帰 分 析 離 散 選 択 モデルの 推 定 回 帰 分 析 離 散 選 択 モデル 回 帰 分 析 結 果 の 整 理 (outreg コマンド)...51 第 5 章 パネルデータによる 分 析 パネルデータとは パネルデータによる 回 帰 分 析...58 第 5 章 補 論 重 複 データの 対 処 法...60 第 6 章 サバイバル 分 析 サバイバル 分 析 とは サバイバルデータとしての 認 証 サバイバル 分 析...64 索 引
3 第 1 章 Stata のはじめの 一 歩 1-1.Stata の 起 動 まずは Stata を 起 動 してみましょう インストール 後 に Stata を 起 動 すると 以 下 の4つのウインドウ が 現 れます 以 下 簡 単 にそれぞれのウインドウの 役 割 について 説 明 します 図 1-1 (2) Review ウインドウ メニュー (4) Results ウインドウ (3) Variable ウインドウ (1) Command ウインドウ (1) Stata Command:コマンドを 入 力 するウインドウです (2) Review: 過 去 に 実 行 したコマンドが 順 次 表 示 されていきます 表 示 されているコマンドをク リックすると Stata Command ウインドウに 表 示 されます (3) Variable: 使 用 できる 変 数 の 一 覧 が 表 示 されます (4) Stata Results:データ 処 理 の 結 果 が 表 示 されます 実 際 のデータ 処 理 にあたっては メニューから 処 理 方 法 を 指 定 したり Stata Command ウインド ウにコマンドを 直 接 入 力 したりすることで 作 業 を 進 めることになります 初 心 者 にはメニューから 処 理 方 法 を 指 定 するほうが 簡 単 ですが ここでは Command ウインドウへコマンドを 入 力 して 作 業 を 進 める 方 法 を 中 心 に 説 明 します この 方 法 で Stata を 操 作 することに 慣 れておくと プログラムを 利 用 する 際 に 移 行 しやすいからです 3
4 1-2.データの 読 み 込 み Stata では 拡 張 子 が.dta となっている Stata 形 式 ファイルしか 処 理 に 用 いることはできません そこ で まず Stata 形 式 のファイルを 用 意 する 必 要 があります しかし 通 常 処 理 の 前 段 階 における データは EXCEL 形 式 やタブ 区 切 り カンマ 区 切 り(CSV)などで 保 存 されている 場 合 がほとんどで すから ここでは これらのファイル 形 式 のデータを Stata に 読 み 込 む 方 法 を 検 討 しましょう ここでは 以 下 のような 上 場 企 業 の 財 務 データを 読 み 込 む 場 合 を 検 討 します 表 1-2 証 券 コード 漢 字 略 称 売 上 高 経 常 利 益 賃 金 俸 給 試 験 研 究 費 従 業 員 数 6502 Toshiba Mitsubishi Fuji Toyodenki Yasukawa Shinko Medensha まず 下 準 備 として 変 数 名 を 変 更 します Stata は 日 本 語 に 対 応 していませんので 変 数 名 が 日 本 語 の 場 合 文 字 化 けしてしまいます かならず 変 数 名 は 半 角 英 数 字 を 用 いてください 表 1-2のようなデータセットであれば 1 行 目 の 日 本 語 変 数 名 は 削 除 してから 読 み 込 ませてください 変 数 名 に スペースやハイフンは 使 えません R-and-D は RandD になってしまいます どう しても 使 いたい 場 合 は アンダーバー( R_and_D )を 用 いましょう code name sales Profit Wage R_and_D Labor 6502 Toshiba Mitsubishi Fuji Toyodenki Yasukawa Shinko Medensha タブ 区 切 り カンマ 区 切 り(CSV)のファイルの 読 み 込 み insheet コマンドを 用 います 表 1-2のデータが CSV ファイル(たとえば D ドライブの Data フォ ルダー 内 に profit-loss.csv というファイル 名 とします )で 保 存 されていると すると 以 下 のようなコマンドを Command ウインドウに 書 き 込 みます insheet using d: Data profit-loss.csv なお 表 頭 に 変 数 名 を 入 力 しておくと Variable ウインドウに 変 数 名 が 表 示 されます 入 力 されて いない 場 合 変 数 名 は v1 v2 v3 となります この 場 合 rename コマンドで 変 数 名 を 変 更 でき ます rename の 使 い 方 は 4
5 rename [ 旧 変 数 名 ] [ 新 変 数 名 ] となります また 複 数 のファイルの 読 み 込 みを 行 う 際 は 作 業 用 フォルダーを 指 定 することもできます たとえ ば D ドライブの Data フォルダーを 作 業 用 フォルダーとすれば 以 下 のコマンドは 上 記 の 読 み 込 みコマンドと 同 じ 意 味 になります cd d: Data insheet using profit-loss.csv また 現 在 指 定 している 作 業 用 フォルダーを 確 認 する 際 は pwd コマンドを 用 います. pwd D: Data エクセルファイルの 読 み 込 み エクセルファイルの 読 み 込 み 方 法 はいくつか 方 法 があります (1) タブ 区 切 り カンマ 区 切 り(CSV 形 式 )で 保 存 しなおして insheet コマンドで 入 力 する (2) コピー&ペーストで 貼 り 付 ける メニューの Data をクリックすると Data Editor が 開 きます あらかじめ EXCEL で 入 力 したい データを 範 囲 指 定 して コピー しておき Data Editor が 開 いている 状 態 で メニューの Edit Paste とすれば 簡 単 にデータを 読 み 込 ませることができます Do ファイルについて で 詳 述 しますが ここでは(1)の 方 法 をお 勧 めします (1)の 方 法 の 場 合 Do ファイルとして 作 業 をプログラム 化 させておくことができるので 後 になって 最 初 に EXCEL で 作 成 したデータを 補 正 したり 変 数 を 追 加 する 場 合 データの 読 み 込 み 遡 って 作 業 をやり 直 すこと ができるからです 1-3.データを 保 存 する データを 読 み 込 んだら まず Stata 形 式 でデータを 保 存 しましょう 保 存 の 仕 方 には 二 通 りあって メニューの file Save or Save as で 保 存 するか Command ウインドウで save コマンドを 入 力 してください 新 規 ファイルの 作 成 の 場 合 は 以 下 のようになります save D: Data profit-loss.dta なお 既 存 のファイルに 上 書 きする 場 合, replace オプションを 付 けます すなわち save D: Data profit-loss.dta,replace とします なお 一 度 保 存 したファイルを 開 くには use コマンドを 用 います 5
6 use D: Data profit-loss.dta 1-4. 読 み 込 んだデータを 確 認 しよう データを 保 存 したら 読 み 込 んだデータを 確 認 しましょう メニューに ワークシートの 形 をしたア イコンが 二 つあるのがわかるでしょうか? 右 側 が Data Browser です ( 図 1-4-1)ここをクリック すると ワークシートが 現 れるので データがきちんと 入 力 されているか 確 認 しましょう なお Data Browser ではエクセルのように 直 接 データを 加 工 することはできません 図 Data Browser 変 数 がたくさんある 場 合 Data Browser では データは 一 度 に 表 示 されないので スクロールさ せる 必 要 があります 面 倒 な 場 合 は 必 要 な 変 数 だけを 表 示 させたり ある 条 件 を 満 たすデータ だけを 表 示 させたりすることもできます 具 体 的 には Command ウインドウに browse sale profit と 入 力 すると sale と profit だけが 表 示 されます ( 図 1-4-2) また sale が 100,000 以 下 の 企 業 だけを 表 示 させたいときは browse if sale<= とします 条 件 式 if の 使 い 方 については 後 述 します 図
7 このほか Results ウインドウ 上 で データを 確 認 する 方 法 がいくつかあります (1) list variable1 variable2 : 変 数 (variable)の 内 容 を 表 示 list sales profit wage sales profit wage (2) describe: 標 本 数 変 数 の 属 性 を 表 示 します ( des と 省 略 可 ) 7
8 . des Contains data obs: 7 vars: 7 size: 252 (99.9% of memory free) storage display value variable name type format label variable label code int %8.0g name str10 %10s sales long %12.0g profit long %12.0g wage long %12.0g r_and_d long %12.0g R_and_D labor long %12.0g Labor Sorted by: Note: dataset has changed since last saved storage type は 変 数 の 形 式 です int は 整 数 str10 は 10bite 以 下 の 文 字 列 long は long 形 式 であることを 示 します (3) sum variable1 variable2 : 変 数 (variable)の 基 本 統 計 量 を 表 示 します. sum name sales profit Variable Obs Mean Std. Dev. Min Max name 0 sales profit name は 文 字 列 ですので 基 本 統 計 量 が 計 算 されません 1-5. 変 数 の 加 工 と 条 件 式 変 数 を 加 工 する 表 を 作 成 する 際 に 変 数 を 足 したり 引 いたり 掛 けたり 割 ったりという 作 業 が 必 要 となる 場 合 が 出 てきます そんなときに 使 えるコマンドを 整 理 しておきましょう (1) generate: 新 たな 変 数 を 作 ったり 変 数 を 加 工 する 場 合 に 使 用 (gen と 省 略 可 ) 8
9 gen newvar1 = variable1 + variable2 gen newvar2 = variable1 - variable2 gen newvar3 = variable1 * variable2 gen newvar4 = variable1 / variable2 ( 例 )generate hosdc2=hosd1 + hosd2 generate age2 = age*age (2) egen:gen コマンドには 使 えないいくつかの 関 数 を 使 うことができるコマンド egen newvar = function(variable1) function のところには 関 数 を 書 き 込 みます 利 用 できるものを 多 数 ありますが 主 なものは 以 下 のとおりです mean: 平 均 値 sum: 合 計 max: 最 大 値 min: 最 小 値 ( 例 )egen avg = mean(chol) この 例 では chol の 平 均 値 を 計 算 し その 値 を avg に 代 入 する 注 意 点 generate の sum( )は 変 数 を 上 から 順 番 に 合 計 した 値 を 順 次 表 示 していくが egen の sum( )は 変 数 をすべて 合 計 した 値 が 常 に 表 示 される gen sum1 = sum(a) egen sum2 = sum(a) A Sum1 Sum また パネルデータを 作 成 する 際 は 次 の group 関 数 が 便 利 です たとえば 以 下 のように2 年 分 の 都 道 府 県 データに 対 して group 関 数 を 使 って 新 しい 変 数 を 作 成 してみましょう Prefecture Year Hokkaido 1990 Hokkaido 1991 Aomori 1990 Aomori 1991 Iwate 1990 egen newvar = group(year) 9
10 newvar prefecture year 1 Hokkaido Hokkaido Aomori Aomori Iwate 1990 year で 特 定 されるグループについて 同 じ 数 値 が 割 り 当 てられます カッコ 内 には カテゴリー 変 数 ( 上 の 例 では prefecture)を 指 定 することもできます また カッコ 内 に 複 数 の 変 数 を 並 べる こともできます (3) replace:すでに 存 在 する 変 数 の 値 などを 書 き 換 える 時 に 用 いる replace oldvar = value1 if variable==2 variable が 2 の 場 合 oldvar の 値 を value1 に 置 き 換 える ( 例 ): 変 数 の 値 を 書 き 換 える(-8 5) replace odd = 5 if odd == -8 Odd Even Odd Even (4) 条 件 式 の 書 き 方 これまで 度 々 登 場 していますが ここで 条 件 式 の 書 き 方 についてまとめておきましょう 等 しいとき(==) replace newvar=1 if var1==0 等 しくない(!= もしくは ~=) replace newvar=1 if var1!=0 replace newvar=1 if var1~=0 大 小 関 係 (>,<,<=,>=) replace newvar=1 if var2=>0 かつ (&) replace newvar=1 if var2=>0&var1==0 または ( ) replace newvar=1 if var2=>0 var1==0 A かつ B または C かつ D replace newvar=1 if (var3== A &var4== B ) (var3== C &var4== D ) 変 数 が 文 字 列 であっても で 囲 むことで 条 件 式 に 加 えることができます 1-6.Do ファイルのすすめ 10
11 Do ファイルについてふれておきましょう Do ファイルはとは Stata のコマンドを 作 業 工 程 順 に 書 き 並 べたファイルで いくつものコマンドをまとめて 実 行 する 際 たいへん 便 利 です また 作 業 工 程 をすべて DO ファイル 上 で 記 述 する 習 慣 をつけておけば すべての 作 業 をもう 一 度 初 めからやり 直 すことができます 人 間 というものは かならずミスをする 動 物 ですから 作 業 を 繰 り 返 しているう ちに どこかでミスをしてしまうものです そんな 場 合 も 一 連 の 作 業 を Do ファイル 上 で 記 述 してお けば 元 に 戻 ってデータセットを 修 正 することができるわけです さて Do ファイルの 作 成 方 法 ですが 秀 丸 などのテキストエディターで Stata のコマンドを 書 き 込 んだファイルを 作 成 して 保 存 するときに 拡 張 子 を.do とします Stata には 専 用 の Do ファイルエ ディターがありますが 使 い 勝 手 はあまりよくありません 以 下 の 例 は これまでの 一 連 の 作 業 を DO ファイルにしたものです * do file の 例 insheet using c:\data\profit-loss.csv des list sales labor sum sales labor Do ファイルの 中 に コメントを 加 える 場 合 は 行 頭 に * をつけておきます また 変 数 の 数 がた くさんあって 改 行 したい 場 合 は 行 末 に /* 次 の 行 の 行 頭 に */ を 入 れます * Do ファイルで 改 行 したいとき insheet using c:\data\profit-loss.csv des list sales labor wage /* */ name profit Do ファイルを 実 行 するには file do で ファイルの 所 在 を 指 定 します ( 図 1-6 参 照 ) 11
12 図 1-6 Command ウインドウを 利 用 する 際 は do c: Data yomikomi.do と 入 力 します 1-7.LOG をとる さて データが 正 しく Stata に 読 み 込 まれたことが 確 認 できたら いよいよ 分 析 ですが その 前 に ログ( 作 業 記 録 )のとり 方 についてみておきましょう Stata による 作 業 結 果 は Results ウインドウに 表 示 されますが 結 果 が 長 くなるとすべてを 見 る ことができなくなります そこで Results ウインドウに 表 示 された 結 果 をファイル 上 に 記 録 する 必 要 が 出 てくるわけです ログファイルを 作 成 するには メニューの LOG アイコンをクリックします ( 図 1-7) 既 存 のログ 12
13 ファイルを 開 くことも 出 来 ますが その 際 は 結 果 を 既 存 のファイルに 付 け 足 すか(Append を 選 択 ) 上 書 きするかを(Overwrite)を 選 択 します Command ウインドウや Do ファイル 上 で 実 行 したい 場 合 は log using D: Data logwotoru.log とします 既 存 の logwotoru.log ファイルにこのコマンド 以 下 の 結 果 を 付 け 足 していき この 場 合 は log using D: Data logwotoru.log, append 上 書 きする 際 は append の 代 わりに overwrite と 記 入 します ここでは 拡 張 子 を.log としてい ますが 必 ずしも.log である 必 要 はありません どんな 拡 張 子 でもテキストファイトして 保 存 され ていますので 秀 丸 等 で 開 くことが 出 来 ます 13
14 図 1-7 Log をとる 14
15 第 1 章 補 論 補 論 1-1.データ 読 み 込 みのトラブルシューティング ここでは データ 読 み 込 みの 際 のトラブル 対 処 法 についていくつか 解 説 しておきます (1) メモリーが 足 りない! 大 容 量 のデータを 読 み 込 ませると 以 下 のようなメッセージが Results ウインドウに 表 示 され デ ータが 読 み 込 めないことがあります. use "D:\Data\daikibo-data.csv", clear no room to add more observations An attempt was made to increase the number of observations beyond what is currently possible. You have the following alternatives: 1. Store your variables more efficiently; see help compress. (Think of Stata's data area as the area of a rectangle; Stata can trade off width and length.) 2. Drop some variables or observations; see help drop. 3. Increase the amount of memory allocated to the data area using the set memory command; see help memory. r(901); このメッセージがでるのは Stata に 割 り 当 てられているメモリーよりもデータのほうが 大 きいから です このような 場 合 データを 読 み 込 む 前 に Stata に 割 り 当 てられるメモリー 領 域 を 確 保 してお く 必 要 があります たとえば 50m 割 り 振 りたい 場 合 は set memory 50m とします 一 度 読 み 込 みに 失 敗 し エラーメッセージが 出 た 後 で メモリーの 割 当 量 を 変 更 したい 場 合 は データセットをクリアーしてください 具 体 的 には Command ウインドウから 以 下 のように 入 力 します clear (2) browse や list でデータが 確 認 できるのに sum で 記 述 統 計 量 が 出 ない! 数 値 列 に 文 字 列 が 混 ざっていると データ 読 み 込 みの 際 に その 変 数 は 文 字 列 として 認 識 され てしまいます たとえば 下 図 のように 欠 損 値 が N.A. と 入 力 されている 場 合 その 変 数 は 文 字 列 となります 15
16 value1 value2 value N.A N.A N.A. このデータセットを 読 み 込 み descript コマンドで 変 数 の 属 性 を 調 べると 読 み 込 んだ 変 数 の storage type が str( 文 字 列 )になっています. des Contains data obs: 5 vars: 3 size: 52 (99.9% of memory free) storage display value variable name type format label variable label value1 str4 %8.0g value2 str4 %10s value3 str4 %12.0g Sorted by: このとき 読 み 込 んだ 変 数 について sumarize で 記 述 統 計 を 出 力 しようとすると 以 下 のように 結 果 が 出 てきません. sum name sales profit Variable Obs Mean Std. Dev. Min Max value1 0 value2 0 value3 0 このような 場 合 読 み 込 み 前 のデータに 戻 って N.A. を ピリオド. に 置 換 するか 空 白 セ ルにしてしまいましょう その 後 再 度 読 み 込 みを 実 行 してみてください また Stata 上 で 変 換 することも 出 来 ます データの 置 き 換 えコマンドある replace を 用 います replace value2=. if value2== N.A. このコマンドは value2 の 要 素 が N.A. になっているものは ピリオド. に 置 き 換 えよ と 16
17 いう 意 味 です ただし これだけの 作 業 では まだ 変 数 は 文 字 列 のままです 変 数 の 要 素 がすべ て 数 値 もしくはピリオド. になったら destring value2,replace と 入 力 します この 他 空 白 セルにゴミ(たとえば 誤 って 空 白 セルに ^ ; など)が 入 っている 場 合 も 文 字 列 になってしまいます このような 場 合 まずどこにどんなものが 入 っているのかを 探 し 出 すのは 大 変 です そこで 当 該 変 数 で sort variable(variable 内 のデータを 大 きいもの もしくはアルフ ァベット 順 に 並 び 替 える)して その 変 数 を browse してみてください 数 値 に 異 物 が 混 入 していれ ば 一 番 最 後 に 並 んでいるはずです (3) 数 値 と 文 字 列 が 組 み 合 わさった 変 数 を 分 解 したい 変 数 が 数 値 と 文 字 列 の 組 み 合 わせになっている 場 合 で それを 分 解 して 利 用 したいケースを 考 えましょう たとえば 以 下 のような 数 値 と 文 字 が 組 み 合 わさった 変 数 があったとします この 変 数 の 上 二 桁 が 業 種 コードで アルファベットが 法 人 属 性 ( 個 人 企 業 なら A 法 人 企 業 なら B) 下 一 桁 が 本 店 か(1) 支 店 か(2)を 示 しているとします code 1 58A1 2 58A2 3 58B1 4 59B2 基 本 的 には generate コマンドにオプションを 付 けて 処 理 します 1)アルファベットを 取 り 出 したいとき gen str1 corp=substr(code,3,1) 新 しい 変 数 の 属 性 変 数 code の 3 文 字 目 から 1 文 字 取 り 出 す この 場 合 1 byte の 文 字 列 2) 上 二 桁 の 数 値 を 取 り 出 したいとき gen byte industry=real(substr(code,1,2)) 新 しい 変 数 の 属 性 この 場 合 数 値 取 り 出 した 数 値 を 実 数 として 認 識 する real が 無 い 場 合 文 字 列 扱 い 結 果 は 以 下 のようになります code corp industry 1 58A1 A A2 A B1 B B2 B 59 17
18 また この 方 法 を 応 用 すれば 複 数 のコードを 結 合 させた 長 い 桁 数 の ID 番 号 を 分 解 することもで きます たとえば 以 下 のような ID 番 号 があったとします id ID の 上 二 桁 が 都 道 府 県 番 号 次 の 三 桁 が 市 区 町 村 コード 最 後 の 三 桁 が 事 業 所 コードとすると これを 分 解 する 方 法 を 考 えましょう まず この 変 数 id を 文 字 列 として 認 識 しなおします gen str10 code_str=string(id) 上 二 桁 を 取 り 出 し prefecture( 都 道 府 県 )とします gen byte prefecture=real(substr(code_str,1,2)) 同 様 の 手 順 で 市 区 町 村 コード 事 業 所 コードを 取 り 出 すことができます 18
19 補 論 1-2.プログラミングによる 繰 り 返 し 作 業 同 じような 作 業 を 何 度 も 繰 り 返 す 必 要 があるとき DO ファイルを 使 ったとしても いちいち コマ ンドを 並 べるのは 面 倒 です そんなとき プログラミングの 初 歩 的 な 知 識 があると 効 率 的 に 作 業 す ることができます 複 数 の 変 数 に 同 じ 処 理 を 適 用 したい 場 合 は for を 使 います たとえば 以 下 のデータセットの ように P.15 ページの 表 のような 欠 損 値 が N.A. と 表 示 されているデータセットがあったといま す N.A. を 欠 損 値 に 変 えるには 前 述 のように replace value1=. if value1== N.A. replace value2=. if value2== N.A. replace value3=. if value3== N.A. という 作 業 を 繰 り 返 す 必 要 があります この 一 連 の 作 業 を 繰 り 返 しコマンドをつかって 処 理 してみ ましょう for num 1/3: replace valuex=. if valuex== N.A. この for num コマンドを 使 うと Stata は X のところに 順 番 に1から3の 数 値 を 代 入 し コマンド 処 理 が 3 回 繰 り 返 します また value1, value2, value3, value4 という4つの 変 数 のそれぞれの 比 率 を 計 算 するときは gen ratio12=value1/value2 gen ratio13=value1/value3 gen ratio14=value1/value4 gen ratio23=value2/value3 gen ratio24=value2/value4 gen ratio34=value3/value4 となります これを for num コマンドを 使 うときは 以 下 のように で 繰 り 返 す 数 値 を 複 数 定 義 するこ ともできます for num 1/3 num 2/4: gen ratioxy=valuex/valuey このコマンドの 弱 点 は 数 値 を 順 番 に 代 入 するときしか 使 えない 点 です 全 く 異 なる 名 称 の 複 数 の 変 数 に 対 して 繰 り 返 し 処 理 を 行 う 場 合 は foreach コマンドを 使 います foreach v of varlist income consumption investment [ 改 行 ] { [ 改 行 ] 1 replace `v'=. if `v'== N.A. [ 改 行 ] } 2 下 線 部 1のところに 処 理 を 施 したい 変 数 を 並 べます 下 線 部 2には 繰 り 返 し 処 理 を 施 したいコ マンドを 書 きます このコマンドを 実 行 すると 下 線 部 2の`v のところに 1の 変 数 が 順 番 に 代 入 されていきます 19
20 第 2 章 データベースの 作 成 第 2 章 では 複 数 のデータセットをまとめて 一 つのデータセットにする 方 法 について 検 討 します データの 接 続 方 法 としては A B C D E をそれぞれ 異 なるデータセットの 入 ったファイルとすると き 以 下 のようなパターンが 考 えられます 縦 に 接 続 する 場 合 (2-1) A B 横 に 接 続 する 場 合 : 完 全 一 致 (2-2) A C 片 方 のデータセットの 一 部 が 複 数 に 対 応 する 場 合 (2-3) A D 横 に 接 続 する 場 合 : 不 完 全 一 致 (2-4) A E 以 上 の(1)~(4)を 例 をあげながら 検 討 してみましょう 20
21 2-1.データの 縦 方 向 の 結 合 (1) まず はじめに 複 数 の 個 体 ごとのデータファイルを 結 合 する 方 法 を 考 えます 例 として 都 道 府 県 ごとにファイルされたデータを 一 つにまとめる 方 法 について 考 えましょう Hokkaido.dta Prefecture Year Production ( 省 略 ) Aomori.dta Prefecture Year Production ( 省 略 ) この2つのファイルを 結 合 させる 場 合 append コマンドを 用 います 使 用 方 法 としては 一 方 のファイルを 開 いた 状 態 で もう 一 方 のファイルを append で 呼 び 出 します 具 体 的 には 以 下 のようになります (2つのファイルは D:\Data にあるとします ) cd D: Data use Hokkaido.dta append Aomori.dta save Production80-00.dta 完 成 したファイルは 以 下 のようになります Prefecture Year Production ( 省 略 ) ( 省 略 ) append を 使 う 際 の 注 意 点 として 必 ず 共 通 の 変 数 には 同 じ 変 数 名 を 付 けておいてください 21
22 2-2.データの 横 方 向 の 結 合 (2) 次 に 複 数 の 個 体 のデータが 変 数 ごとに 各 々のファイルに 収 録 されている 場 合 に データを 結 合 させる 例 を 考 えてみましょう 例 として 都 道 府 県 別 の 生 産 額 のデータに 都 道 府 県 別 の 賃 金 のデ ータを 接 続 する 方 法 を 考 えます Wage.dta Production.dta prefecture wage ( 省 略 ) prefecture production ( 省 略 ) まず 接 続 する2つのファイルをキーとなる 変 数 で sort しておく 必 要 があります Wage.dta からみ てみましょう ( 二 つのファイルは D ドライブの Data フォルダーにあるものとします ). cd D:\Data (D ドライブ Data フォルダーに 移 動 ). des Contains data from D:\Data\Wage.dta obs: 47 vars: 2 21 Apr :58 size: 423 (99.9% of memory free) storage display value variable name type format label variable label prefecture byte %8.0g wage float %9.0g Sorted by: この 場 合 Sorted by の 後 ろに 何 も 示 されていないので まだ sort されていないことがわかり ます そこで sort prefecture 22
23 と Command ウインドウに 入 力 し データをソートしてから もう 一 度 des で 確 認 すると 以 下 のよう になります. des Contains data from D:\Data\Wage.dta obs: 47 vars: 2 21 Apr :58 size: 423 (99.9% of memory free) storage display value variable name type format label variable label prefecture byte %8.0g wage float %9.0g Sorted by: prefecture この 状 態 で save しておきます save Wage.dta,replace 上 書 きすることになるので replace を 忘 れずに 同 様 に Production.dta も prefecture で sort し save しておきます これで 準 備 完 了 です 二 つのファイルのうち どちらを 先 に 呼 び 出 して 構 いませんが Production.dta を 先 に 呼 び 出 すことにしましょう use Production.dta データを 接 続 するには merge コマンドを 使 います merge コマンドは merge [キー 変 数 ] using [ 接 続 するファイル 名 ] となります 今 の 場 合 接 続 のキーとなる 変 数 は prefecture 接 続 するファイルは Wage.dta です ので 以 下 のようになります merge prefecture using Wage.dta うまくいけば データセットは 以 下 のようになります 23
24 prefecture wage production _merge ( 省 略 ) ここで _merge という 新 しい 変 数 が 生 成 されていますが これについては 後 述 します なお 続 け て 他 のデータセットを merge する 場 合 は _merge を drop しておいてください 2-3. 少 数 のデータセットから 大 規 模 データに 値 を 割 り 当 てる さて 2-2のケースでは 接 続 する2つのファイルの 長 さは 等 しくなっていました しかし 現 実 の ニーズとしては 2-1で 作 成 した 都 道 府 県 年 次 項 目 のファイルに 年 次 別 の 全 国 一 律 のデ ータ たとえば 物 価 指 数 を 接 続 するといった 作 業 が 必 要 になることもあります このような 場 合 は どうしたらいいのでしょうか? 例 として 以 下 のような 年 次 別 の 全 国 平 均 の 物 価 指 数 を2-1で 作 成 したデータセットに 接 続 す る 方 法 について 考 えましょう Price.dta Year Price ( 省 略 ) 接 続 方 法 は 基 本 的 に2-2と 同 じで まず 接 続 する 際 のキーとなる 変 数 で 接 続 する2つの ファイルが sort されているかどうか 確 認 します この 場 合 は 年 次 を 示 す Year がキー 変 数 となり ます 問 題 がなければ 一 方 のデータを 開 いた 状 態 で merge を 行 います use Production80-00.dta merge year using Price.dta 結 果 は うまくいけば 以 下 の 表 のようになります Year が 同 一 のところには 必 ず 同 じ Price の 値 が 入 っていることが 確 認 できます 24
25 Prefecture Year Production Price ( 省 略 ) ( 省 略 ) 不 完 全 一 致 のデータセットの 接 続 (1)~(3)までのデータセットでは 2つのデータセットに 含 まれるキーとなる 変 数 が 完 全 な 対 応 関 係 がありました しかし 実 際 には 以 下 のようなキーとなる 変 数 が 部 分 的 にしか 対 応 していない ケースがままあります 以 下 のような 例 を 考 えましょう even.dta odd.dta number Even number Odd この2つのファイルのキーとなる 変 数 は number です ですが 2つのファイルに 重 複 する 変 数 は 5 だけです このケースで number をキーに merge すると 以 下 のようになります use even.dta merge number using odd.dta number Even Odd _merge この 場 合 even.dta と odd.dta の number 変 数 で 共 通 なのは 5 のみなので キーとして 指 定 した 変 数 が 共 通 する 場 合 のみ 同 じ 行 に odd.dta が 接 続 され 異 なる 場 合 には 異 なる 行 に odd.dta を 接 続 さ れます 25
26 なお merge コマンドを 実 行 すると _merge という 変 数 が 副 産 物 として 生 成 されます _merge は 二 つのデータの 結 合 状 態 を 表 します _merge=3 : キーに 指 定 した 変 数 が 結 合 前 の 二 つのファイル 双 方 に 存 在 していた 場 合 _merge=1 : キーにした 変 数 が merge 実 行 前 に 開 いていたファイルのみに 存 在 していた 場 合 _merge=2 : キーにした 変 数 が merge 実 行 時 に 呼 び 出 しファイルのみに 存 在 していた 場 合 even.dta と odd.dta の 接 続 を 例 にすると となります even.dta と odd.dta の 両 方 のファイルに 含 まれていたデータ:_merge=3 even.dta のみに 含 まれていたデータ:_merge=1 odd.dta のみに 含 まれていたデータ:_merge=2 26
27 第 3 章 記 述 統 計 による 分 析 ( 表 の 作 成 ) 3-1.カテゴリー 区 分 された 変 数 ( 質 的 データ) カテゴリー 区 分 されたデータとは 主 に 質 的 ( 離 散 )データを 指 します 一 般 的 には その 区 分 か 数 値 なのか 文 字 なのかは 問 われません 大 きく 分 けると1 順 位 尺 度 と2 名 義 尺 度 の2 種 類 の 尺 度 により 区 分 されます 順 位 尺 度 は 例 えば 銀 行 の 預 金 格 付 けのように 信 用 度 の 高 い 順 から AAA ~C まで 区 分 されるように 順 位 を 表 わす 質 的 データになります 名 義 尺 度 は 性 別 ( 男 女 )や 結 婚 の 有 無 ( 既 婚 未 婚 既 婚 暦 有 独 身 他 )などのように 特 性 を 表 わす 質 的 データです 以 下 のデータセット 例 から STATA による 記 述 統 計 の 取 り 方 をみましょう ( 特 に 記 載 のない 限 り3-1~3-2を 通 じて 以 下 の 同 一 データセット 例 を 使 ってコマンド 例 を 紹 介 することとします ) で 扱 う 共 通 データセット 例 id time yesno age family y x1 x id と time はデータをパネルデータの 構 成 を 表 わす 変 数 yesno はカテゴリー 区 分 された 変 数 その 他 は 連 続 変 数 とする (1) 表 の 作 成 まず tab コマンドを 使 ってカテゴリー 変 数 の 分 布 を 見 ましょう 一 変 数 だけに 着 目 する 場 合 度 数 相 対 度 数 累 積 相 対 度 数 が 確 認 できます. tab yesno yesno Freq. Percent Cum , , Total 3, ここに 条 件 式 (if)を 加 え 範 囲 を 指 定 することも 可 能 です また plot オプションを 加 えると 相 対 度 数 を 視 覚 的 に 確 認 することもできます 27
28 . tab yesno if time==1,plot yesno Freq ************************************* ***************************************************** Total 1,168 さらに 二 つの 変 数 を 指 定 して 分 布 を 確 認 することもできます 特 に 指 定 がない 場 合 度 数 のみが 表 示 されます 相 対 度 数 を 確 認 するには 行 ごとの 相 対 度 数 (col) 列 ごとの 相 対 度 数 (row)の 表 示 をオプションで 指 定 する 必 要 があります また 度 数 表 示 を 省 略 し 相 対 度 数 のみ 確 認 したい 時 には nofreq のオプションを 指 定 します. tab yesno time,row nofreq time yesno Total Total また 二 つの 変 数 を 指 定 する 時 all オプションで 分 布 の 情 報 も 得 られます. tab yesno time,all row nofreq time yesno Total Total Pearson chi2(2) = Pr = likelihood-ratio chi2(2) = Pr = Cram>'s V = gamma = ASE = Kendall's tau-b = ASE = (2)ラベルの 設 定 28
29 カテゴリー 区 分 された 変 数 には ラベルを 設 定 することができます 銀 行 の 格 付 けのように 複 数 のカテゴリー(AAA~C)が 存 在 する 時 推 定 のための 便 宜 上 各 カテ ゴリーに 数 値 を 与 えることがあります(たとえば AAA を 1 AA を 2 など) ただしこの 時 分 布 を 示 す 記 述 統 計 を 取 ると 数 値 に 変 換 されたカテゴリーが 示 されるため カテゴリー 区 分 が 多 けれ ば 多 いほど 数 値 の 与 え 方 について 混 乱 してしまいます ラベルを 設 定 することで その 混 乱 を 回 避 することができます 以 下 では 3-1.(1)の yesno 変 数 について 例 示 しましょう 下 の 例 の 下 線 部 分 に 適 当 なラベル 名 を 設 定 し 続 いて1カテゴリー 項 目 2" " 内 に 項 目 ラベ ル 名 を 指 定 し 12を1セットとして 必 要 なカテゴリー 項 目 分 のセット 数 だけ 記 述 します ただし 必 ずしも 全 カテゴリー 項 目 にラベルを 作 る 必 要 はありません label define yesnolabel 0 "no" 1 "yes" label value yesno yesnolabel ここには 指 定 されたラベルに 置 き 換 えられる 変 数 名 を 指 定 します ラベルを 設 定 したことで 2-1.(1)の 表 は 以 下 のように 表 示 されます yesno Freq. Percent Cum no 1, yes 2, Total 3, 以 下 に 示 すように ラベルを 設 定 しなかったカテゴリー 項 目 に 対 し add オプションを 使 うことでラ ベル 項 目 を 追 加 することが 可 能 です 下 線 部 分 には 追 加 先 の 既 存 ラベル 名 を 指 定 します label define yesnolabel 2 "nuetral" 3 "no answer", add label value yesno yesnolabel また 一 度 設 定 したラベルを 削 除 したい 場 合 は drop オプションを 使 用 します label drop yesno 複 数 の 変 数 にラベル 設 定 しているときに すべてのラベルを 一 挙 に 削 除 したい 場 合 は 変 数 名 を _all とします すなわち 以 下 のコマンドを 入 力 します label drop _all 29
30 3-2. 連 続 変 数 の 記 述 統 計 量 をみる (1)sum コマンドによる 表 示 5 種 類 の 基 本 的 な 統 計 量 ( 度 数 平 均 標 準 偏 差 最 小 値 最 大 値 )を 見 る 場 合 は sum コマンド が 便 利 です 条 件 式 を 加 えることも 可 能 です. sum y if yesno==1 Variable Obs Mean Std. Dev. Min Max y 通 常 統 計 量 は 桁 数 の 表 示 が 統 一 されていません 桁 数 表 示 を 統 一 するには format コマンドを 使 います fo rmat ( 桁 数 表 示 指 定 をしたい) 変 数 名 %w.df format コマンドライン 中 w に 表 示 幅 の 指 定 数 を d に 小 数 点 以 下 の 桁 数 を 記 入 します 例 えば 小 数 点 2 桁 まで 表 示 するとき 以 下 のように format コマンドの 利 用 により 前 ページと 桁 表 示 の 違 いが 確 認 できます. format y %9.2f. sum y if yesno== 1, format Variable Obs Mean Std. Dev. Min Max y こ の 例 では 変 数 y の 全 体 を 9 桁 で 小 数 点 以 下 を 2 桁 の 数 値 で 表 示 せよ というコマンドを 意 味 します ( 2)tabstat コマンドによる 表 示 上 の5 種 類 以 外 の 記 述 統 計 を 見 るには tabstat コマンドが 便 利 です 具 体 的 には 次 の 統 計 量 を 見 ることが 可 能 です statname definition mean mean count count o f nonmissing observations n same as count sum sum max maxim um min minimum range range = m ax - min 30
31 sd standard deviation var variance cv semean coefficient of variation (sd/mean) standard error of mean = sd/sqrt(n) skewness skewness kurtosis kurtosis median p1 median (same as p50) 1st percentile p5 5th percentile p10 10th percentile p25 25th percentile p50 p75 50th percentile (same as median) 75th percentile p90 90th percentile p95 95th percentile p99 99th percentile iqr q interquartile range = p75 - p25 equivalent to specifying "p25 p50 p75" どの 統 計 量 を 表 示 するかを stat( ) の( ) 内 に 指 定 する 必 要 がありますが この 記 述 がない 場 合 は 平 均 値 (mean)のみが 表 示 されます tabstat コマンドでは 得 られる 統 計 量 が 増 えるだけでなく カテゴリー 別 に 記 述 することも 可 能 となります 以 下 では 条 件 式 (if)を 指 定 し カテゴリー 別 (by) に 表 示 した 例 を 示 しましょう. tabstat y if yesno==1,by(time) stat(mean n sd sum max min range) Summary for variables: y by categories of: time time mean N sd sum max min range Total 複 数 の 変 数 に 関 する 記 述 統 計 をとることもできます ここでは 行 ごとの 各 変 数 が 表 示 されるよう col(variable)と 指 定 しています col(stat)とすると 行 ごとに 統 計 量 が 表 示 されます ここでは 表 側 が 表 示 されませんが コマンドラインで 記 述 した 順 番 に 表 示 されています 31
32 . tabstat age family y x1 x2,by(time) stat(mean n sd) col(variable) nototal Summary statistics: mean, N, sd by categories of: time time age family y x1 x 上 の 例 では コマンドの 最 後 に nototal というオプションがつけてあります このオプションをつない と 各 変 数 について 全 カテゴリー 合 計 の 統 計 量 ( 平 均 標 本 数 標 準 偏 差 )も 一 緒 に 表 示 されま す (3)table コマンドによる 表 示 table コマンドでは 特 に 指 定 がない 場 合 には 各 データ 値 に 対 する 度 数 が 表 示 されるため 3-1.(1)の tab コマンドに 類 似 しています 違 いは table コマンドでは 行 ごと(col) 列 ごと(row) の 合 計 値 を 表 示 しないという 点 です 合 計 値 を 表 示 するには row col オプションを 加 える 必 要 が あります 例 ) table yesno time, row col これで tab yesno time と 同 一 の 表 が 作 成 されます ただし tab コマンドは 各 データ 値 ごとの 度 数 が 表 示 されるため 連 続 変 数 には 向 かないのに 対 し table コマンドでは 以 下 のようにカテゴリー 変 数 に 対 応 した 連 続 変 数 の 統 計 量 を 得 ることも 出 来 ます データセット 全 体 の 統 計 量 を 得 るには row オプションで 全 データを 対 象 とした 統 計 量 を 得 るのが 良 いでしょう また format( )オプションにより データの 桁 表 示 指 定 が 可 能 です ( ) 内 の 桁 数 指 定 方 法 などは3-2.(1)をご 参 照 ください 32
33 . table time, c(mean y sd y mean x1 sd x1) format(%9.2f) row time mean(y) sd(y) mean(x1) sd(x1) Total カテゴリー 変 数 を 指 定 した 後 c( )の( ) 内 に1 得 たい 統 計 量 の 種 類 2 変 数 名 の12を1セッ トとして5セットまで 指 定 できます 1には 以 下 の 統 計 量 を 指 定 可 能 です freq mean sd sum rawsum count n max min median p1 p2 : p50 : p98 p99 iqr (for frequency) (for mean of varname) (for standard deviation) (for sum) (for sums ignoring optionally specified weight) (for count of nonmissing observations) (same as count) (for maximum) (for minimum) (for median) (for 1st percentile) (for 2nd percentile) (for 50th percentile -- same as median) (for 98th percentile) (for 99th percentile) (for interquartile range) カテゴリー 別 に 連 続 変 数 の 統 計 量 を 得 られるという 点 は2-2.(2)の tabstat と 同 じ 機 能 です 特 徴 として tabstat は 同 時 に 出 力 可 能 な 変 数 が 多 いという 利 点 があり table は 表 側 が 表 示 さ れるため 視 覚 的 に 判 別 しやすい 表 を 出 力 できる 利 点 があります さらに table では by( ) オプションを 指 定 することで2 段 階 のカテゴリー 分 類 をすることが 可 能 です 33
34 . table time, c(mean y sd y mean x1 sd x1) by(yesno) yesno and time mean(y) sd(y) mean(x1) sd(x1) no yes (3) データを 記 述 統 計 量 で 構 成 されるデータセットに 変 換 する collapse コマンドは データを 記 述 統 計 量 で 構 成 されるデータセットに 置 き 換 えます (そのため collapse コマンドで 指 定 しなかったデータは 全 て 消 失 する 点 に 注 意 が 必 要 です ) collapse ( ) var ( ) 内 に 以 下 の 統 計 量 を 指 定 します 指 定 のない 場 合 は 平 均 値 で 計 算 されます statname definition mean means sd standard deviations sum sums rawsum sums ignoring optionally specified weight count number of nonmissing observations max maximums min minimums median medians p1 1st percentile p2 2nd percentile : 3rd -- 49th percentiles p50 50th percentile (same as median) : 51st -- 97th percentiles p98 98th percentile p99 99th percentile iqr interquartile range var の 部 分 に 変 数 名 を 指 定 します また by( ) オプションによりカテゴリー 別 に 記 述 統 計 量 を 作 成 できます ここには 複 数 の 変 数 を 指 定 することが 可 能 です ためしに 複 数 年 度 の 企 業 別 財 務 データから 企 業 別 の 平 均 値 を 抽 出 する 方 法 を 見 てみましょ う 今 データセットには 以 下 のように 企 業 の ID 番 号 (id) 年 次 (year) 従 業 者 数 (labor) 賃 金 (wage)のデータが 含 まれているとします 34
35 . list fid year labor wage fid year labor wage ( 省 略 ) ( 省 略 ) ( 省 略 ) データセットの 概 要 は. des Contains data obs: 2,910 vars: 6 size: 75,660 (99.3% of memory free) storage display value variable name type format label variable label year int %8.0g fid long %12.0g labor long %12.0g slsprofit float %9.0g wage float %9.0g rdsls float %9.0g Sorted by: ここで 企 業 ごと(fid) 従 業 者 数 賃 金 の 平 均 値 を 求 めたいとします collapse (mean) labor wage,by(fid) データセットは 以 下 のような 形 に 変 更 されます 35
36 . des Contains data obs: 4 vars: 3 size: 72 (99.9% of memory free) storage display value variable name type format label variable label fid int %8.0g labor double %12.0g (mean) labor wage float %9.0g (mean) wage Sorted by: fid 確 かに 標 本 数 が 減 少 しています ただし データセットは 置 き 換 わりますが Stata Result 画 面 に 表 が 表 示 されるわけではありません 統 計 量 を 確 認 するには 別 途 list コマンドにより 画 面 表 示 をするか browse コマンドによりデータ 表 示 をする 必 要 があります collapse コマンドと browse コマンドを 使 うことで 簡 単 にエクセルなどの 表 計 算 ソフトにデータを 移 し 変 えることが 可 能 となります 上 記 の 作 業 結 果 を list すると 以 下 のようになります. list labor wage labor wage by()オプションを 使 う 際 に 複 数 の 変 数 を 指 定 することも 可 能 です たとえば 市 区 町 村 別 のデ ータセットがあったとして 個 々のデータは 都 道 府 県 コード(prefecture)と 市 区 町 村 コード(city) で 識 別 されているとします 36
37 Prefecture city Production ( 省 略 ) ( 省 略 ) このよう 複 数 の 変 数 で 識 別 さているデータセットの 場 合 by オプションで 複 数 の 変 数 を 指 定 しま す collapse (sum) production, by(prefecture city) また collapse コマンドを 使 うとデータセット 自 体 が 入 れ 替 わってしまいます そこで 同 じデータ セットで 何 度 も collapse コマンドを 使 って 複 数 のデータセットを 作 成 する 場 合 は 処 理 前 にデータ を 保 存 し collapse で 処 理 した 後 に 再 度 データを 呼 び 出 す 必 要 があります このような 場 合 には preserve コマンドと restore コマンドが 便 利 です preserve は データセットをメモリー 上 に 保 存 (ファイルの 上 書 き 新 規 作 成 は 行 わない)し restore は preserve でメモリー 上 に 保 存 したデータセットを 呼 び 出 してくれます 次 の 例 では collapse の 前 後 に preserve と restore を 入 れて collapse 後 に 変 更 になったデータセットを restore により collapse 以 前 のデータに 復 元 する 処 理 を 確 認 したものです 37
38 . preserve. collapse (mean) labor wage,by(fid). des Contains data obs: 4 collapse により 標 本 数 が 減 少 vars: 3 size: 80 (99.9% of memory free) storage display value variable name type format label variable label fid long %12.0g labor double %12.0g (mean) labor wage float %9.0g (mean) wage restore preserve 以 前 のデータセットを 復 元. des Contains data obs: 36 collapse 処 理 の 前 の 標 本 数 に 戻 る vars: 4 size: 648 (99.9% of memory free) storage display value variable name type format label variable label year int %8.0g fid long %12.0g labor long %12.0g wage float %9.0g list year fid labor wage
39 3-3. 階 級 別 カテゴリー 変 数 の 作 成 ( 度 数 分 布 表 の 作 成 ) 度 数 分 布 表 などを 作 成 する 場 合 連 続 変 数 を 階 級 別 のカテゴリー 変 数 ( 階 級 値 )に 置 き 換 える 必 要 があります たとえば 電 機 メーカーの 財 務 データを 使 って 従 業 員 階 級 別 の 度 数 分 布 表 の 作 成 方 法 を 考 えましょう 最 終 的 に 作 成 したい 表 は 以 下 のような 従 業 員 数 階 級 別 の 企 業 数 を 表 示 した 表 になります 従 業 員 数 階 級 企 業 数 Percent 累 積 ~ ~ ~ Total この 表 を 作 成 するためには 各 企 業 を 従 業 員 数 階 級 ごとに 振 り 分 けなければなりません この 作 業 をオーソドックスに 進 めるとなると 以 下 のように replace コマンドを 繰 り 返 し 実 行 することになり ます gen newvar=. replace newvar=x1 if var<=x1 replace newvar=x2 if var>x1&var<=x2 replace newvar=xn if var>x1&var>x2&var>x3&var> この 作 業 を replace コマンドを 使 って 地 道 に 作 業 するのはかなり 面 倒 です そこで 以 下 の recode 関 数 を 用 います gen newvar=recode(var, x1,x2,x3,,xn) ただし x1<x2<x3< <xn とします このコマンドは 上 記 ののコマンド 群 と 同 義 になります 上 の 具 体 例 のように 規 模 別 に 99 人 以 下 100 人 以 上 999 人 1000 人 以 上 のカテゴリー 変 数 を 作 成 したい 場 合 gen labor_category=recode(labor, 99, 999,1000) とします このコマンドは 以 下 の 作 業 と 同 じ 結 果 になります gen labor_category=. replace labor_category =99 if labor<=99 replace labor_category =999 if labor>99&labor<=999 replace labor_category =1000 if labor>999 従 業 員 数 のように 整 数 値 であれば 問 題 ないですが 比 率 のように 実 数 値 の 場 合 は 注 意 が 必 要 で す たとえば パート 従 業 員 比 率 のカテゴリーを 作 成 する 場 合 は 39
40 gen part_category=recode(ratio_part, 0.25, 0.5,0.75,1) とします このコマンドは 以 下 の 作 業 と 同 じ 結 果 になります gen part_category=. replace part_category =0.25 if ratio_part<=0.25 replace part_category =0.5 if ratio_part>0.25&ratio_part<=0.5 replace part_category =0.75 if ratio_part>0.5&ratio_part<=0.75 replace part_category =1 if ratio_part>0.75 例 として 電 気 機 器 メーカー334 社 の 従 業 者 数 の 度 数 分 布 表 を 作 成 しましょう まず データの 記 述 統 計 量 を sum で 確 認 しましょう. su labor 0 Variable Obs Mean Std. Dev. Min Max labor 次 に この 334 社 のデータを 3 階 級 の 階 級 値 に 置 き 換 えた 変 数 を 作 成 します. gen labor_category=recode(labor,99,999,1000) これを tabulate で 表 示 すると 以 下 のような 度 数 分 布 表 が 完 成 します. tabulate labor_category labor_categ ory Freq. Percent Cum Total
41 3-4.データのエクセルへの 移 行 論 文 を 書 く 際 には Stata で 作 成 した 表 などを Result ウインドウのログではなく EXCEL 等 で 整 形 して 利 用 することが 多 いかと 思 います Stata では 結 果 表 や 元 データの 一 部 を EXCEL に 貼 り 付 けたり 全 データシートを EXCEL 形 式 に 変 換 することができます (1) 作 表 結 果 の 貼 り 付 け Result Window の 画 面 をカット&ペーストすることで 簡 単 に 作 表 結 果 を EXCEL に 移 行 することがで きます まず Result Window の 結 果 をマウスで 領 域 指 定 します 次 に 右 クリックして 図 3-1の ように Copy Table を 選 択 します 図 3-1 次 に EXCEL を 開 き 貼 り 付 け を 行 うと 図 3-2のように 表 をそのまま EXCEL 上 で 復 元 するこ とができます 図 3-2 (2)データの 貼 り 付 け データの 一 部 を EXCEL に 移 行 させる 際 まず browse コマンドにより 移 行 させたいデータを stata browser に 表 示 させます 例 えば browse labor if labor<10000 表 示 される stata browser の 範 囲 を 選 択 しコピーします( 図 3-3) EXCEL を 開 き 貼 り 付 け を 41
42 行 うと EXCEL 上 に 復 元 されます( 図 3-4) 図 3-3 図 3-4 (2)データの 形 式 変 換 Stata 上 でデータを 加 工 した 後 その 現 状 の 加 工 済 データのまま EXCEL 形 式 で 保 存 しておきたい 時 などには outsheet コマンドを 用 いて 全 データもしくは 指 定 変 数 系 列 を 形 式 変 換 させます outsheet using data, replace 同 名 の 既 存 ファイルに 上 書 きする 場 合 の 指 定 ( 指 定 しない 際 には, replace を 除 く) 新 たに 保 存 するファイル 名 この 時 データはタブ 区 切 り 形 式 で data.out として 保 存 されます これを EXCEL 形 式 まで 変 換 するには まず EXCEL の ファイル の 開 く から.out として 保 存 されたファイルを 指 定 します テ キストファイル ウィザードが 開 くので カンマやタブなどの 区 切 り 文 字 によってフィールドごとに 区 切 られたデータ を 指 定 すると EXCEL 形 式 でデータを 確 認 できます outsheet using data, replace comma とすると タブ 区 切 りではなくコンマ 区 切 り 形 式 で data.out ファイルが 保 存 されます replace 以 降 に nonames を 加 えると 変 数 コード 行 を 除 いたファイルが 保 存 されます 42
43 第 4 章 回 帰 分 析 離 散 選 択 モデルの 推 定 本 節 では 回 帰 分 析 および 離 散 選 択 モデルの 推 定 を 説 明 します ほとんどの 回 帰 分 析 が コマンド 名 [ 被 説 明 変 数 ] [ 説 明 変 数 ] の 順 に 並 べてリターンキーを 押 せば 結 果 が 出 力 されます コマンドによっては オプションをつけ ることも 可 能 です その 際 は 通 常 説 明 変 数 の 後 ろに カンマをつけてその 後 ろにオプションを 指 定 します コマンド 名 [ 被 説 明 変 数 ] [ 説 明 変 数 ], [オプション] また サンプルを 限 定 して 分 析 する 場 合 条 件 式 if でサンプルを 絞 ることができます コマンド 名 [ 被 説 明 変 数 ] [ 説 明 変 数 ] if condition== 回 帰 分 析 本 節 では 最 も 単 純 な 最 小 二 乗 法 ( 以 下 OLS)による 回 帰 分 析 を 説 明 します 本 章 の 冒 頭 で 説 明 したとおり コマンド 名 被 説 明 変 数 説 明 変 数 の 順 に 並 べれば 回 帰 分 析 を 行 うことができます 最 も 単 純 な 消 費 関 数 を 例 に 挙 げて OLS を 説 明 します 推 計 式 は Cons = 定 数 項 + t Y t + ε です Cons t はt 期 の 消 費 Y t は t 期 の 所 得 ε t 誤 差 項 です year cons Y t 43
44 OLSの 基 本 式 reg 被 説 明 変 数 説 明 変 数 if 条 件 式, (option) この 式 が 最 も 基 本 的 な OLS を 実 行 するコマンドです Stata では option で 指 定 をしなければ 自 動 的 に 回 帰 式 に 定 数 項 が 含 まれます したがって 何 も 条 件 やオプションをつけないで 先 の 消 費 関 数 を 推 計 するコマンドは となります reg cons y Source SS df MS Number of obs = F( 1, 18) = Model e e+10 Prob > F = Residual R-squared = Adj R-squared = Total e e+09 Root MSE = cons Coef. Std. Err. t P> t [95% Conf. Interval] y _cons Stata では 何 も 指 定 しない 場 合 説 明 変 数 に 自 動 的 に 定 数 項 が 含 まれてしまいます 定 数 項 を 外 して 推 計 したい 場 合 には nocons オプションを 指 定 します reg cons y, nocons (1) ラグ 付 き 変 数 の 取 り 扱 い(システム ファンクションの 利 用 ) 先 述 の 推 計 式 にラグ 付 き 変 数 を 含 める 場 合 例 えば Cons t = 定 数 項 + Yt + Yt 1 + ε t とする 場 合 変 数 Y の1 期 ラグ 付 き 変 数 が 必 要 となります この 時 システム 変 数 [_n-1]を 利 用 す るとよいでしょう 変 数 Y t-1 を 以 下 のように 作 成 し 上 式 を 推 定 することができます gen y1=y[_n-1] reg cons y y1 44
45 (2) 質 的 変 数 の 取 り 扱 い 回 帰 分 析 においては 質 的 な 情 報 を 扱 う 際 には その 変 数 をそのまま 用 いるのではなく ダミー 変 数 と 呼 ばれる 0/1 の 変 数 に 置 き 換 えて 分 析 されることがしばしばあります 単 純 なダミー 変 数 であ れば たとえば 性 別 の 違 いを 分 析 に 取 り 込 みたい 場 合 以 下 のような 手 順 を 踏 みます データセ ットでは 性 別 は sex(1のとき 男 性 2 は 女 性 )となっているとすると gen d_male=0 replace d_male=1 if sex==1 reg wage age education d_male となります d_male は 男 性 のとき1を 示 す 変 数 です この 係 数 は 賃 金 の 男 女 差 を 示 すことになり ます なお ダミー 変 数 を 作 成 する2つのコマンドは 以 下 の 一 文 にまとめることもできます gen male=sex==1 連 続 変 数 からダミー 変 数 を 作 成 する 場 合 は まず 38 ページで 説 明 した 方 法 でカテゴリー 変 数 を 作 成 します 次 に 新 たに 作 成 したカテゴリー 変 数 (ここでは labor_category としましょう )をも とにダミー 変 数 を 作 成 するには 以 下 のようなコマンドを 使 います tabulate labor_category, generate(empcat) このコマンドにより empcat1, empcat2, empcat3, empcat4 の4つの 変 数 が 生 成 されます 37 ページの 例 と 同 じデータセットでダミー 変 数 を 作 成 してみましょう. tab labor_category,generate(empcat) labor_categ ory Freq. Percent Cum Total describe で 確 認 すると 新 しい 変 数 が 生 成 されていることがわかります 45
46 . des Contains data obs: 334 vars: 6 size: 11,022 (99.9% of memory free) storage display value variable name type format label variable label id long %12.0g labor long %12.0g labor_category float %9.0g empcat1 byte %8.0g labor_category== empcat2 byte %8.0g labor_category== empcat3 byte %8.0g labor_category== 新 しい 変 数 empcat1,empcat2, empcat3 は 0 1で 構 成 されていることがわかります. sum empcat* Variable Obs Mean Std. Dev. Min Max empcat empcat empcat ここで 作 成 した 企 業 規 模 ダミー 変 数 を 回 帰 分 析 で 取 り 扱 うには reg y x1 x2 x3 empcat1 empcat2 とします ダミー 変 数 は すべて 説 明 変 数 に 挿 入 すると 定 数 項 と 多 重 共 線 性 を 引 き 起 こしうまく 推 定 できないので ここでは empcat3 を 省 いています Stata では 質 的 変 数 をダミー 変 数 に 自 動 的 にダミー 変 数 に 置 き 換 えて 回 帰 分 析 を 実 行 するコ マンドも 備 え 付 けてあります ただし この 方 法 は 標 準 的 な 最 小 二 乗 法 (reg コマンドによる 分 析 ) にしか 用 いることが 出 来 ませんので 注 意 が 必 要 です (3)xi:reg コマンド 基 本 式 は 以 下 のようになります xi:reg 被 説 明 変 数 説 明 変 数 i.カテゴリー 変 数 46
47 コマンドとして xi:reg を 入 力 し ダミー 変 数 を 作 成 したいカテゴリー 変 数 の 前 に i.をつけます(i の 後 にピリオドを 忘 れないよう 注 意 ) このコマンドは 質 を 表 すカテゴリー 変 数 に 対 して 自 動 的 にカテゴリー 毎 のダミー 変 数 を 作 成 して くれるコマンドです 具 体 例 として 以 下 の 推 計 式 を 考 えます 賃 金 (wage)= 定 数 項 + 年 齢 (age) + 大 学 院 卒 ダミー(D[education=1]) + 大 学 卒 ダミー(D[education=2]) + 短 大 卒 ダミー(D[education=3]) + 高 卒 ダミー(D[education=4]) ここで education は 大 学 院 卒 なら1 大 学 卒 なら2 短 大 卒 なら3 高 卒 なら4を 示 すカテゴリー 変 数 であるとします このカテゴリー 毎 にダミー 変 数 を 作 って 説 明 変 数 に 加 えたい 場 合 xi:reg を 用 いると 自 動 的 にカテゴリー 毎 にダミー 変 数 を 作 って 推 計 してくれます 今 回 のケースであれば 以 下 のようにコマンドを 入 力 します xi:reg wage age i.education 推 計 結 果 は 以 下 のように 表 示 されます i.education _Ieducation_1-4 (naturally coded; _Ieducation_1 omitted) Source SS df MS Number of obs = F( 4, 49) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = wage Coef. Std. Err. t P> t [95% Conf. Interval] age _Ieducatio~ _Ieducatio~ _Ieducatio~ _cons この 計 算 結 果 は Edum1 は 大 学 院 卒 =1 その 他 =0 のダミー 変 数 (Edum2 は 大 学 卒 =1 その 他 =0 のダミー 以 下 続 く)としたおときに reg wage age Edum1 Edum2 Edum3 Edum4 という 回 帰 式 と 同 じ 結 果 をもたらします (4)areg コマンド 47
48 xi:reg の 類 似 のコマンドとして areg コマンドがあります xi:reg コマンドを 用 いると すべてのダミー 変 数 の 係 数 が 表 示 されますが 必 ずしもダミー 変 数 の 係 数 が 必 要 でない 場 合 があります その 際 areg コマンドを 用 いると 同 じ 計 算 を Speedy に 実 行 してくれます 賃 金 を 従 業 員 の 年 齢 学 歴 で 分 析 する 例 を 見 ましょう 先 の 例 を 用 いて 推 計 する 場 合 には 以 下 のようにコマンドを 入 力 します areg 被 説 明 変 数 説 明 変 数, absorb(カテゴリー 変 数 名 ) xi:reg コマンドとの 違 いは 自 動 的 に 作 成 されたダミー 変 数 の 個 々の 係 数 パラメータの 値 や t 値 な どを 推 計 結 果 として 表 示 しない 点 です 推 計 結 果 は 以 下 のように 表 示 されます Number of obs = 54 F( 1, 49) = Prob > F = R-squared = Adj R-squared = Root MSE = lwage Coef. Std. Err. t P> t [95% Conf. Interval] age _cons education F(3, 49) = (4 categories) 推 計 結 果 の 一 番 下 に 出 ている F 検 定 の 結 果 は Edum1 ~ Edum4 のパラメータが 同 時 に 0 にな るかどうかを 検 定 した 結 果 を 表 しています xi:reg コマンドでは F 検 定 が 行 われない 代 わりに 個 別 のダミー 変 数 のパラメータや t 値 が 表 示 されています 説 明 変 数 として 用 いた age の 係 数 パラメ ータが areg コマンドを 用 いた 場 合 と 同 じになることを 確 認 してください 4-2. 離 散 選 択 モデル Stata は 個 票 データ 処 理 に 強 みを 発 揮 しますが 個 票 データの 中 には アンケート 調 査 のようなデ ータが 使 われている 場 合 も 見 受 けられます 本 節 では そのようなデータを 分 析 する 離 散 選 択 モ デル( 質 的 変 量 モデル)を 紹 介 します (1)プロビット 分 析 質 的 データを 被 説 明 変 数 とするモデルの 代 表 的 な 分 析 手 法 がプロビット 分 析 です プロビットモデ ル ロジットモデルは 回 帰 分 析 の 考 え 方 を 応 用 した 確 率 モデルに 基 づく 分 析 手 法 であるため 本 章 の 冒 頭 で 説 明 したとおり コマンド 名 被 説 明 変 数 説 明 変 数 の 順 に 並 べれば 分 析 を 行 うことが できます プロビット 分 析 では 以 下 のコマンドを 用 いて 分 析 します 48
49 probit 被 説 明 変 数 説 明 変 数 以 下 では 50 人 の 既 婚 女 性 の 労 働 に 関 するデータを 例 にして 説 明 します 推 計 式 は 以 下 のようなものを 想 定 します Work = C18 + AGE + AGE^2 + ED + HI 変 数 の 説 明 は 以 下 のとおり Work : 0= 就 労 していない 1= 就 労 している C18 : 18 歳 未 満 の 子 供 の 数 AGE : 年 齢 ED : 教 育 年 数 HI : 夫 の 収 入 このモデルをプロビット 分 析 する 場 合 以 下 のようにコマンドを 入 力 します probit Work C18 Age Age2 ED HI 推 計 結 果 は 以 下 のように 表 示 されます Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Probit estimates Number of obs = 50 LR chi2(5) = Prob > chi2 = Log likelihood = Pseudo R2 = work Coef. Std. Err. z P> z [95% Conf. Interval] c age age ed hi -4.96e _cons 通 常 の 回 帰 分 析 では 係 数 は 説 明 変 数 が1 増 えると 被 説 明 変 数 がどの 程 度 変 化 するか という 限 界 効 果 として 解 釈 できますが probit モデルの 場 合 そのような 解 釈 はできません probit モ 49
50 デルで 限 界 効 果 を 導 くには 通 常 多 少 の 計 算 を 必 要 としますが Stata では dprobit コマンドを つかってプロビットモデルにおける 限 界 効 果 を 表 示 することができます コマンドはプロビット 分 析 と 同 じく 以 下 のように 書 きます dprobit Work C18 Age Age2 ED HI さらに Stata では 順 序 プロビットモデルも oprobit コマンドを 使 って 推 計 することができます 順 序 プロビットモデルの 場 合 も 同 様 に oprobit Work C18 Age Age2 ED HI と 書 くことになります (2)ロジット 分 析 プロビット 分 析 では 確 率 分 布 として 正 規 分 布 を 用 いてきましたが ロジスティック 分 布 を 用 いるロジ ット 分 析 も 質 的 変 量 データの 分 析 にしばしば 用 いられます 先 ほどの 例 に 対 してロジット 分 析 を 行 う 場 合 以 下 のようなコマンドを 入 力 します logit Work C18 Age Age2 ED HI 推 計 結 果 は 以 下 のように 表 示 されます Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logit estimates Number of obs = 50 LR chi2(5) = Prob > chi2 = Log likelihood = Pseudo R2 = work Coef. Std. Err. z P> z [95% Conf. Interval] c age age ed hi -8.43e _cons
51 4-3. 回 帰 分 析 結 果 の 整 理 (outreg コマンド) 複 数 の 回 帰 分 析 結 果 を journal スタイルでまとめるのは 結 構 面 倒 な 作 業 です こんなとき outreg コマンドを 用 いると 便 利 です outreg コマンドは ado ファイルで 提 供 されています まず 以 下 の WEB ページから outreg.ado ファイルをダウンロードしてください internet explorer にプログラムが 表 示 されたら そのページを テキスト 形 式 で 名 前 をつけて 保 存 してください さらに 拡 張 子 を.ado に 変 更 してください ダウンロードしたファイルは stata をインストールしたときに 生 成 される ado フォルダーの 下 の personal フォルダーに 移 してください ado ファイルの 使 い 方 は User s Guide も 参 考 にしてください reg コマンドの 実 行 後 に outreg using filename.doc と 分 析 結 果 の 出 力 先 を 指 定 すると filename.doc というファイルが 生 成 さます 次 の 例 では 県 民 経 済 計 算 ( 経 済 企 画 庁 平 成 2 年 )の 47 都 道 府 県 の 貯 蓄 額 (save)と 所 得 (income)を 使 った 回 帰 分 析 の 結 果 を outreg コマンドによって save.doc ファイルに 出 力 しています * 回 帰 式 1. reg save income Source SS df MS Number of obs = F( 1, 45) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = save Coef. Std. Err. t P> t [95% Conf. Interval] income _cons outreg using save.doc 51
52 * 回 帰 式 2. reg save Source SS df MS Number of obs = F( 0, 46) = 0.00 Model 0 0. Prob > F =. Residual R-squared = Adj R-squared = Total Root MSE = save Coef. Std. Err. t P> t [95% Conf. Interval] _cons outreg using save.doc,append こうして 生 成 された save.doc ファイルの 中 身 は 以 下 のとおりです (1) (2) save save income (8.45)** Constant -3, , (3.46)** (18.92)** Observations R-squared Absolute value of t statistics in parentheses * significant at 5%; ** significant at 1% これをコピーしてEXCELに 貼 り 付 けると 以 下 のような journal フォーマットの 表 が 得 られます (1) (2) save save income (8.45)** Constant -3, , (3.46)** (18.92)** Observations R-squared Absolute value of t statistics in parentheses * significant at 5%; ** significant at 1% 52
53 第 5 章 パネルデータによる 分 析 5-1.パネルデータとは パネルデータとは 同 一 の 主 体 / 個 体 ( 個 人 家 計 企 業 など)を 複 数 の 時 点 について 観 測 したも のです STATA では 個 体 を 認 識 する 変 数 を 行 方 向 に 並 べ 個 体 ごとの 同 一 変 数 の 異 時 点 の 観 測 値 が 列 方 向 行 方 向 のどちらに 並 ぶかにより データの 構 成 が 大 きく 異 なります LONG 形 式 : 複 数 の 個 体 のデータの 集 合 が 縦 方 向 に 接 続 されたデータ WIDE 形 式 : 複 数 の 個 体 のデータ 系 列 が 横 方 向 に 接 続 されたデータ LONG 形 式 のデータ( 例 ) fid year labor slsprofit head-q ( 以 下 省 略 ) WIDE 形 式 のデータ( 例 ) fid labor1994 labor1995 labor1996 labor1997 labor Long 形 式 のデータ 作 成 同 一 個 体 を 追 跡 調 査 している 調 査 統 計 に 対 し 同 一 変 数 に 関 する 一 連 の 調 査 結 果 であっても 時 点 ごとに 個 別 データシートが 存 在 する 場 合 があります このような 時 append コマンドによりパ ネルデータセットを 構 築 することができます ただし 各 データシートにおいて 時 点 を 識 別 する 変 数 が 各 シートに 含 まれている 必 要 があるのに 注 意 が 必 要 です append コマンドの 扱 いは 2-1. データの 縦 方 向 の 結 合 をご 参 照 ください Wide 形 式 のデータ 作 成 53
54 Wide 形 式 では 各 個 体 の 識 別 変 数 に 対 応 して 全 変 数 が 横 に 並 ぶことになります そのため 新 たなデータセットの 追 加 などには merge コマンドにより 対 応 することができます merge コマン ドの 扱 いは 2-2.データの 横 方 向 の 結 合 を 参 照 してください Long 形 式 と Wide 形 式 の 特 性 パネル 計 量 分 析 を 行 うには データセットが 必 ず Long 形 式 となっている 必 要 があります ただし データの 扱 いは Wide 形 式 である 方 が 便 利 な 時 もあります 例 えば GDP 主 要 項 目 の GDP 成 長 率 への 寄 与 度 を 算 出 したい 場 合 異 なる 変 数 の 異 なる 時 点 を 抽 出 して 計 算 する 必 要 があります id year GDP C I 0001 : ( 省 略 ) : : : a b c : d e f : 0002 : ( 省 略 ) : : : g h i : j k l : ( 以 下 省 略 ) ここで 2000 年 の C( 民 間 最 終 消 費 支 出 )の GDP 成 長 率 への 寄 与 度 を 測 るとき 4-1.(1)のシステ ムファンクション[_n-1]を 用 いて gen new_var_name == ( C - C[_n-1])/GDP[_n-1] if year==2000 と 計 算 式 を 指 定 することができます この 時 固 体 0001 については 2000 年 消 費 の GDP 成 長 率 寄 与 度 = ( e - b ) a として 正 しく 計 算 されることになります しかし 個 体 0002 は 1996 年 から 1999 年 のデータが 欠 損 し ていることから (k-h)/g が 計 算 されます これは 対 1995 年 変 化 率 を 算 出 していることになり 本 来 示 されるべき 値 ( 欠 損 値 ".")を 得 ることができません 後 述 の5-1.(3)で 紹 介 するデータ オ ペレータ ファンクションにより 個 体 別 に 正 しく 計 算 することが 可 能 ではありますが 複 雑 な 計 算 式 の 場 合 や 全 期 間 に 対 して 時 系 列 の 寄 与 度 データが 必 要 なのではなく ある 一 時 点 の 寄 与 度 の み 抽 出 した 場 合 などは データセットが Long 形 式 ではなく Wide 形 式 となっていると 便 利 です(デ ータ 形 式 の 変 換 は 5-1.(1)をご 参 照 ください) id GDP1999 GDP2000 C1999 C : a b c d 0002 : e f g h ( 以 下 省 略 ) 上 のようにデータセットが Wide 形 式 の 時 gen new_var_name = ( C C1999)/GDP1999 で 個 体 別 に 2000 年 の 正 しい 消 費 の GDP 成 長 率 寄 与 度 を 計 れることとなります balance パネルと unbalance パネル balanced panel とは 使 用 するデータセットの 各 個 体 の 変 数 が 全 期 間 揃 っている( 欠 損 値 を 含 54
55 まない)パネルデータセットであることを 言 います 反 対 に ある 個 体 のある 時 点 のデータが 欠 損 し ている 場 合 は unbalanced panel と 言 います (1)パネルデータ 形 式 を 変 換 する パネルデータの LONG 形 式 WIDE 形 式 変 換 を reshape コマンドにより 行 うことができ ます 5-1.パネルデータとは のデータ 形 式 別 のパネルデータセット 例 を 用 いて 見 てみましょ う long 形 式 wide 形 式 の 変 換 reshape wide labor slsprofit, i(fid) j(year) 変 換 対 象 の 変 数 wide に 続 いて 変 換 したい 変 数 名 を 記 入 します 個 体 ごとに 時 間 を 通 じて 一 定 の 変 数 (たとえば 表 の 変 数 のうち head-q のように 個 体 ごとにみると 一 定 になっている 変 数 )は 記 入 する 必 要 はありません ただし 個 体 により 時 間 により 異 なる 値 をもつ 変 数 がデータセットに 含 まれている ( 表 の labor や slsprofit のような 変 数 )にも 関 わらず 変 換 対 象 の 変 数 として 記 述 から 漏 れてい る 時 データ 形 式 変 換 は 行 われずエラー 表 示 が 返 されます コマンドライン 中 の wide 以 下 には time variant( 時 間 について 可 変 )な 変 数 は 全 て 記 入 するようにしましょう 変 換 の 軸 となる 個 体 を 表 わす 変 数 fid と 時 間 を 表 わす 変 数 year の 全 データが 一 対 一 の 関 係 であれば 問 題 なく 変 換 されます 誤 植 などにより 重 複 してデータが 存 在 する 場 合 ( 例 えば fid 番 号 5948 の 1999 年 のデータが1つ 以 上 存 在 する 場 合 など)は 変 換 されず year not unique within fid; there are multiple observations at the same year within fid. Type "reshape error" for a listing of the problem observations. r(9); のようなエラーが 表 示 されます このような 場 合 の 対 処 方 法 は 第 5 章 の 補 論 を 参 照 してください なお unbalanced panel である 場 合 データ 変 換 に 特 に 問 題 は 生 じません 欠 損 しているデータ については. の 欠 損 を 表 わす 記 述 が 自 動 的 に 置 き 換 わります wide 形 式 long 形 式 の 変 換 reshape long labor slsprofit, i(fid) j(year) 変 換 するデータセットには 変 換 対 称 として 指 定 する 変 数 名 (ここでは labor, slsprofit)と そ の 変 数 名 に 数 値 が 続 く 変 数 (ここでは labor1994, labor11995, )が 存 在 する 必 要 があります 指 定 変 数 名 に 続 く 数 値 が j( ) で 指 定 した 時 間 軸 変 数 の 値 として 変 換 されます 全 ての 変 数 が 正 しく 存 在 する 時 ( 共 通 した 変 数 名 があり その 各 変 数 名 に 共 通 した 数 値 系 列 が 続 いている 場 合 ) 細 かい 指 定 を 省 略 し reshape long と 記 入 するだけで データ 形 式 が 変 換 されます 55
56 (2)パネルデータとしての 認 証 パネルデータによる 分 析 を 行 う 際 STATA にデータセットがパネルデータであるという 情 報 を 伝 え る 必 要 があります tsset var1 var2 var1 には 主 体 を 表 わす 変 数 名 を var2 には 時 間 軸 を 表 わす 変 数 名 を 記 述 します. tsset fid year panel variable: fid, 1909 to time variable: year, 1994 to 2002 パネルデータであることを 伝 えたら パネルデータの 形 状 を xtdes コマンドにより 確 認 できます. iis fid. tis year. xtdes 1 fid: 1909, 1993,..., n = 334 year: 1994, 1995,..., 2002 T = 9 Delta(year) = 1; ( )+1 = 9 (fid*year does not uniquely identify observations) Distribution of T_i: min 5% 25% 50% 75% 95% max Freq. Percent Cum. Pattern まで 連 続 している 標 本 が 256 社 (other patterns) XXXXXXXXX 1 ここには 個 体 識 別 変 数 (fid)が 1909~ までの 値 の 334 社 のデータが 1994~2002 年 の 9 時 点 分 あることを 示 しています また 変 数 fid と year が 一 対 一 の 関 係 でないことも (fid*year does not uniquely identify observations)で 示 しています そのため デー タの 重 複 を 修 正 しなくては Wide 形 式 に 変 換 することも 回 帰 分 析 することもできないことが 分 56
57 かります 2 ここには データの 欠 損 に 関 する 情 報 が 得 られます 95%のデータは 9 時 点 のデータがあるこ とを 示 していますが 5%のデータは 7 時 点 のデータであることが 示 されています よって こ のデータセットは unbalanced panel であることが 分 かります 3 2の 情 報 を より 詳 しく 示 しています 256 サンプルはデータは 全 期 間 連 続 しており 27 サンプ ルは1 期 目 のデータが 欠 損 していることを 示 しています Pattern の 列 にしめされる 1 はデー タ 存 在 していることを 示 し. はデータが 存 在 していないことを 示 しています (3)データ オペレータ ファンクション tsset の 設 定 により STATA が 時 系 列 の 概 念 を 認 識 できるようになると 遅 延 演 算 子 などのオペレ ーション ファンクションを 利 用 することが 可 能 となります l. ファンクション 時 系 列 方 向 のデータを 含 むデータを 扱 う 際 l. を 変 数 の 前 に 付 けるこ とでラグ 付 変 数 として 認 識 されます labor labor(t) l.labor labor(t-1) l2.labor labor(t-2) : : f. ファンクション f. を 変 数 の 前 に 付 けることで 一 期 前 の 値 を 参 照 します f.labor labor(t+1) f2.labor labor(t+2) : : d. ファンクション d. を 変 数 の 前 に 付 けると 前 期 値 との 差 分 変 数 として 認 識 します d.labor labor(t)-labor(t-1) これらのオペレーション ファンクションは 個 体 ごとの 時 系 列 を 参 照 して 算 出 されます その 点 が 変 数 システムファンクション[_n-1]などと 異 なり パネルデータを 扱 う 際 の 極 めて 利 便 性 の 高 いフ ァンクションと 言 えます 以 下 に l.ファンクションとシステムファンクション[_n-1]との 違 いを 例 示 しましょう 57
58 . tsset fid year. gen test1=l.labor. gen test2=labor[_n-1]. list fid year labor test1 test ( 省 略 ) test2 では 個 体 変 数 別 に データが 作 成 がされない ( 省 略 ) 様 子 がわかります ( 以 下 省 略 ) データ オペレータ ファンクションにより Long 形 式 でもデータの 扱 いが 容 易 になりますが 5-2. で 紹 介 する 回 帰 分 析 に オペレータ ファンクション 付 の 変 数 を 直 接 組 み 込 むことはできません 回 帰 分 析 でラグ 付 変 数 などを 使 用 したい 場 合 は まず 一 度 gen コマンドで 新 たな 変 数 を 作 成 し その 新 変 数 を 使 って 回 帰 分 析 を 試 みましょう 5-2.パネルデータによる 回 帰 分 析 パネル 計 量 分 析 を 行 う 際 データの 特 性 (i: 個 体 を 表 わす 変 数 t: 時 間 を 表 わす 変 数 )に 関 する 情 報 が 必 要 です 5-1.(2)で 指 定 した tsset から 変 更 がなければ 回 帰 分 析 を 行 うコマンドラ インごとに i や t を 指 定 する 必 要 はありません ただし データを 加 工 したことで 新 たな 個 体 認 識 変 数 や 時 間 変 数 が 作 成 された 場 合 などは データ 特 性 が 変 更 された 情 報 を STATA に 伝 えなけれ ばなりません iis varname tis varname iis コマンドは 新 たな 個 体 認 識 の 変 数 の 指 定 tis は 新 たな 時 間 変 数 の 指 定 を 行 います この 時 tsset で 伝 えていた 情 報 は 残 されないため 元 の 特 性 を 用 いて 分 析 し 直 したい 時 には 特 性 変 数 の 再 指 定 をする 必 要 があります 以 下 では 実 際 に 回 帰 分 析 を 行 う 手 順 を 概 説 します ここでは 説 明 変 数 に 強 外 生 性 を 仮 定 し O LSにより 一 致 推 定 量 を 得 られるものとして 固 定 効 果 モデルと 変 量 効 果 モデルを 紹 介 します 説 明 変 数 に 内 生 変 数 が 含 まれる 場 合 などや ダイナミックなモデルを 想 定 する 際 に 操 作 変 数 法 (xtivreg)などによる 推 定 を 行 うことがありますが 詳 しくは 各 自 マニュアルをご 参 照 ください な お パネル 分 析 におけるGMM 推 定 量 や より 高 度 な 推 定 量 などは STATA にプログラムが 内 蔵 さ れていなくても 研 究 者 などが 個 人 的 に 作 成 したプログラムを 一 般 公 開 している 場 合 もありますの 58
59 で すぐに 諦 めずに 一 度 < >で 検 索 してみることをお 勧 めします (1) 線 形 回 帰 分 析 ( 変 量 効 果 モデル 固 定 効 果 モデルなど) xtreg depvar indepvar,xx depvar 部 分 に 被 説 明 変 数 を indepvar 部 分 に 被 説 明 変 数 ( 複 数 記 入 可 )を 記 入 します,xx の xx 部 分 には 以 下 の 得 たい 推 定 量 を 記 入 します 無 記 入 の 場 合 は 変 量 効 果 モデル re が 推 定 されます be fe re between-effects estimator fixed-effects estimator GLS random-effects estimator (2)ハウスマン 検 定 STATA には 固 定 効 果 モデルと 変 量 効 果 モデルの 推 定 量 を 比 較 して 個 体 効 果 が 説 明 変 数 と 相 関 をもつかどうかのハウスマン 検 定 を 以 下 の 手 順 で 行 うことができます xtreg depvar indepvar, fe est store fixed xtreg depvar indepvar, re hausman fixed. なお 下 線 部 分 には 適 当 な 変 数 名 を 指 定 します (3) 非 線 形 回 帰 分 析 ここでは 非 線 形 回 帰 モデルとして プロビット ロジットとトービット モデルのコマンドだけ 簡 単 に ご 紹 介 します オプションなどの 詳 しい 解 説 はここでは 省 略 しますので 必 要 に 応 じてマニュアル をご 参 照 ください プロビット モデル xtprobit depvar indepvar, i(id) ロジット モデル xtlogit depvar indepvar, i(id) トービット モデル xttobit depvar indepvar, i(id) ll(#) ここで ll(#)は 左 に 切 断 されたデータを 意 味 し # に 切 断 点 を 記 入 します 右 に 切 断 されたデータ の 場 合 は ul(#)を 記 入 します 右 にも 左 にも 切 断 されていたデータを 推 定 するには ll(#)と ul(#)を 両 方 記 入 しましょう 59
60 第 5 章 補 論 重 複 データの 対 処 法 下 記 のデータのように 1991 年 の id=5 のデータのように 一 つのデータセットの 中 に 2 つのデー タが 入 っている 場 合 を 考 えて 見 ましょう id year value このデータを 無 理 やり パネルデータとして 認 識 させようとしても. tsset id year repeated time values within panel というメッセージが 返 ってきます また reshape で wide データに 変 換 しようとすると. reshape wide value,i(id) j(year) (note: j = ) year not unique within id; there are multiple observations at the same year within id. Type "reshape error" for a listing of the problem observations. r(9); というエラーメッセージが 返 ってきます ここで reshape error と 入 力 すると id=5 が 重 複 しているこ とがわかります. reshape error (note: j = ) i (id) indicates the top-level grouping such as subject id. j (year) indicates the subgrouping such as time. The data are in the long form; j should be unique within i. There are multiple observations on the same year within id. 60
61 The following 2 out of 11 observations have repeated year values: id year (data now sorted by id year) こういった 問 題 への 対 処 法 としては EXCEL 等 で 作 成 した 元 のデータセットに 戻 って 作 成 方 法 に 間 違 いがなかったかを 調 べるか duplicatees コマンドを 用 いて 重 複 しているデータの 片 方 を 強 制 的 に 削 除 してしまう 方 法 が 考 えられます duplicates コマンドは report オプションをつけると 重 複 状 況 を 表 示 させることができま す copies 1となっている 行 は 重 複 のないデータの 数 2は 重 複 するペアの 数 が 表 示 されます. duplicates report id year Duplicates in terms of id year copies observations surplus 重 複 しているペアの 片 方 を 削 除 するには drop オプションを 使 います. duplicates drop id year,force duplicates in terms of id year (1 observation deleted) このコマンドの 後 に データセットを browse すると 次 の 表 のように 重 複 データが 強 制 的 に 削 除 差 入 れていることがわかります 61
62 id year value
63 第 6 章 サバイバル 分 析 6-1.サバイバル 分 析 とは サバイバル 分 析 とは 誤 解 を 恐 れずに 言 えば 分 析 上 興 味 のあるイベントの 発 生 の 有 無 を 表 す 変 数 と そのイベントが 発 生 するまでの 時 間 を 表 す 変 数 との 関 係 を 分 析 する 手 法 です この 手 法 は 生 物 学 の 分 野 で 応 用 開 発 が 進 められたものですが 近 年 では 事 業 所 の 存 続 閉 鎖 に 関 す る 分 析 など 経 済 学 へも 応 用 されています 同 様 の 研 究 テーマに 用 いられるその 他 の 手 法 として は 存 続 退 出 の2 者 択 一 によるプロビット モデルが 挙 げられますが プロビット モデルを 用 いた 分 析 の 場 合 いつ 参 入 したかといった 過 去 の 履 歴 が 考 慮 できないという 欠 点 があり その 欠 点 を 補 う 目 的 でサバイバル 分 析 が 用 いられます 6-2.サバイバルデータとしての 認 証 STATA においてサバイバル 分 析 を 行 う 場 合 には パネル 分 析 と 同 様 まずサバイバル 分 析 を 行 うことを STATA に 認 識 させる 必 要 があります サバイバル 分 析 に 用 いられるデータには 大 きく 分 けて 以 下 の 二 つがあります Survival-time data: 観 察 された 個 体 の ID 期 間 を 表 す 変 数 failure or censoring を 示 す 変 数 の 三 つの 要 素 が 入 ったデータ Count-time data :Survival-time data の 集 計 版 failure or censoring を 示 す 変 数 時 点 t における failure or censoring であった 個 体 総 数 の 二 つの 要 素 が 入 ったデータ Survival-time data を 用 いる 場 合 は stset コマンド Count-time data を 用 いる 場 合 は ctset コマンドを 用 いて STATA に 認 識 させます stset [timevar], fail(failvar) ctset [timevar], fail(failvar) [timevar]には 時 間 を 表 す 変 数 を (failvar)には 分 析 上 興 味 があるイベントを 表 すダミー 変 数 (failure=1,cencsoring=0)を それぞれ 指 定 します サバイバル 分 析 では (failvar)で 指 定 し た 変 数 を 非 説 明 変 数 として 認 識 します stset を 使 用 した 場 合 には 様 々なオプションが 利 用 可 能 です 例 えば origin(time originvar)と 指 定 すると イベントが 発 生 するまでの 時 間 (t)をt=timevar-originvar として 計 算 してくれます origin の 他 にも 様 々なオプションがありますが ここでは 説 明 を 省 略 します 各 自 STATA マニュ アル(Version.8 なら Survival analysis and epidemiological tables )を 参 照 してください 63
64 ここで 企 業 倒 産 をイベント(failvar)とする 以 下 のような Survival-time data を 考 えてみましょ う id year died closeyear origin slsprofit llabor wage_f ( 省 略 ) ( 省 略 ) ( 以 下 省 略 ) id は 企 業 id year はデータ 年 次 died は 企 業 倒 産 の 有 無 を 表 すダミー 変 数 ( 倒 産 =1) closeyear は 倒 産 年 次 origin は 設 立 年 次 slsprofit は 売 上 高 利 益 率 llabor は 従 業 員 数 の 対 数 値 wage_f は 平 均 賃 金 の 対 数 値 です この Survival-time data を STATA に 認 識 させるため 以 下 のように 指 定 します stset closeyear, fail(died) origin(time origin) オプションで origin(time origin) と 指 定 しているので 企 業 倒 産 と 企 業 の 生 存 年 数 (closeyear-origin)の 関 係 を 分 析 することを STATA に 認 識 させたことになります 6-3.サバイバル 分 析 分 析 上 興 味 のあるイベントが 少 なくとも t 期 間 以 降 に 発 生 する 確 率 を 示 す 関 数 を 生 存 関 数 (あるいはハザード 関 数 )と 呼 びます サバイバル 分 析 では ハザード 率 ( 次 の 瞬 間 に 分 析 上 興 味 があるイベントが 起 こる 確 率 )を 被 説 明 変 数 ハザード 率 に 影 響 を 与 える 変 数 を 説 明 変 数 とし こ の 生 存 関 数 (あるいはハザード 関 数 )がどのような 要 因 によって 変 化 するかを 推 定 するものです STATA では 複 数 の 推 定 方 法 に 対 してコマンドが 用 意 されています (1)Cox の 比 例 ハザードモデル(Cox Proportional Hazard Models) 詳 しい 説 明 は 他 の 教 科 書 に 委 ねますが ハザード 関 数 にはベースライン ハザードと 呼 ばれる 様 々な 要 因 を 取 り 除 いた 場 合 の 全 サンプルに 共 通 するハザード 率 が 含 まれます Cox は ベース ライン ハザードの 分 布 が 推 定 に 影 響 しないような 推 定 方 法 を 考 案 しました そのため ベースライ ン ハザードの 分 布 の 形 を 特 定 せずにハザード 関 数 を 推 定 するモデルを Cox の 比 例 ハザードモデ ル(Cox Proportional Hazard Models)と 呼 びます Cox の 比 例 ハザードモデルを 推 定 する 場 合 には 以 下 のコマンドを 用 います stcox 説 明 変 数,オプション 前 述 のとおり stset コマンドで 被 説 明 変 数 (failvar)を 認 識 させていますので ここでは 被 説 明 64
65 変 数 を 指 定 する 必 要 はありません 先 ほどの 企 業 倒 産 のデータを 使 って 実 際 に Cox モデルを 推 定 してみましょう 推 定 を 行 うため に 以 下 のようにコマンドを 入 力 します stcox slsprofi llabor wage_f 推 定 の 結 果 は 以 下 のように 出 力 されます failure _d: died analysis time _t: (closeyear-origin) origin: time origin Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Refining estimates: Iteration 0: log likelihood = Cox regression -- Breslow method for ties No. of subjects = 2039 Number of obs = 2039 No. of failures = 90 Time at risk = LR chi2(3) = Log likelihood = Prob > chi2 = _t Coef. Std. Err. z P> z [95% Conf. Interval] slsprofit llabor wage_f (2) 分 布 を 仮 定 した 推 定 ベースライン ハザードの 分 布 の 形 を 仮 定 してハザード 関 数 を 推 定 する 場 合 以 下 のコマンドを 用 います streg 説 明 変 数,dist( 分 布 名 ) dist( 分 布 名 )の 代 表 的 な 例 として 以 下 のようなものがあります 65
66 dist(weibull) :ベースライン ハザードにワイブル 分 布 を 仮 定 dist(exponential): 指 数 分 布 を 仮 定 (3)Kaplan-Meier 分 析 生 存 関 数 (あるいはハザード 関 数 )をノンパラメトリックに 推 定 する 方 法 として Kaplan-Meier 分 析 があります 詳 しい 説 明 は 他 の 教 科 書 に 委 ねますが 各 期 におけるイベントの 発 生 確 率 を 掛 け 合 わせたものを 生 存 関 数 (Kaplan-Meier 推 定 量 )として 時 間 の 変 化 とともに 生 存 確 率 がどのよ うに 変 化 するかを 分 析 する 手 法 です 生 存 確 率 と 時 間 の 関 係 (Kaplan-Meier survivor curve) をグラフにする 場 合 以 下 のコマンドを 用 います sts graph sts graph, na 二 行 目 は 累 積 のグラフを 書 く 場 合 に 用 います 先 ほどの 企 業 倒 産 のデータを 使 って Kaplan-Meier survivor curve を 書 く(sts graph)と 以 下 のように 出 力 されます 66
67 索 引 all, 29 _merge, 24 A add, 29 append, 21 Append, 13 areg, 47 B balance パネル, 54 browse, 6 C col, 28, 32 collapse, 34 Copy Table, 41 Cox の 比 例 ハザードモデル, 64 ctset, 63 D d., 57 Data Browser, 6 Data Editor, 5 describe, 7 destring, 17 Do ファイル, 11 dprobit, 50 drop, 29 duplicatees, 61 E egen, 9 EXCEL, 41 F f., 57 for, 19 for num, 19 foreach, 19 format, 30, 32 G generate, 8 I iis, 58 insheet, 4, 5 K Kaplan-Meier 分 析, 66 L l., 57 list, 7 LONG 形 式, 53 M merge, 23 N nofreq, 28 nototal, 32 O oprobit, 50 67
68 outreg, 51 outsheet, 42 overwrite, 13 Overwrite, 13 P preserve, 37 probit, 49 pwd, 5 R recode, 39 reg, 44 rename, 4 replace, 5, 10 reshape, 55 restore, 37 Results ウインドウ, 12 row, 28, 32 S save, 5 set memory, 15 stat, 31 Stata 形 式, 4 stcox, 64, 65 streg, 65 stset, 63 sum, 8 T table, 32 tabstat, 30, 33 tis, 58 tsset, 56 U unbalance パネル, 54 use, 6 W WIDE 形 式, 53 X xi:reg, 46 xtdes, 56 xtreg, 59 あ エクセルファイル, 5 か 回 帰 分 析, 43 階 級 別 カテゴリー 変 数, 39 カテゴリー, 27 カンマ 区 切 り, 4 繰 り 返 し, 19 さ 最 小 値, 30 最 大 値, 30 サバイバル 分 析, 63 システム 変 数, 44 質 的 ( 離 散 )データ, 27 質 的 変 数, 45 条 件 式, 10 相 対 度 数, 27, 28 た 縦 方 向 の 結 合, 21 タブ 区 切 り, 4 ダミー 変 数, 45 度 数, 27, 30 度 数 分 布 表, 39 は ハウスマン 検 定, 59 68
69 パネルデータ, 53 標 準 偏 差, 30 プロビット, 48 平 均, 30 変 量 効 果 モデル, 59 保 存, 5 ま メモリー, 15 文 字 列, 15, 17 や 横 方 向, 22 ら ラベル, 29 離 散 選 択, 48 累 積 相 対 度 数, 27 ログ( 作 業 記 録 ), 12 69
1級 ワンポイント
日 本 情 報 処 理 検 定 協 会 主 催 情 報 処 理 技 能 検 定 試 験 ( 表 計 算 ) ワンポイント 1 級 ( Microsoft Excel 2010 対 応 ) 2012 年 4 月 日 本 情 報 処 理 検 定 協 会 練 習 をはじめる 前 に... 3 試 験 前 にすること... 4 受 験 番 号 名 前 の 入 力... 4 試 験 本 番... 4 注 意
第1回
やすだ 社 会 学 研 究 法 a( 2015 年 度 春 学 期 担 当 : 保 田 ) 基 礎 分 析 ( 1): 一 変 量 / 二 変 量 の 分 析 SPSSの 基 礎 テ キ ス ト pp.1-29 pp.255-257 デ ー タ の 入 力 [ デ ー タ ビ ュ ー ] で Excelの よ う に 直 接 入 力 で き る [ 変 数 ビ ュ ー ] で 変 数 の 情 報 を
計算式の取り扱い
4.データ 入 力 と 表 計 算 4-1 計 算 式 の 取 り 扱 い 1) 数 式 の 基 本 Excelのような 表 計 算 ソフトでは セルに 入 力 されたデータ( 定 数 )を 計 算 式 ( 数 式 )によって 計 算 することで さまざまな 処 理 が 行 えます 数 式 バーには 数 式 の 内 容 が 表 示 されます セルには 計 算 結 果 が 表 示 されます 数 式 の
1. 表 から 値 を 抽 出 する 説 明 1.1. 表 から 値 を 抽 出 するための 関 数 について 説 明 します LOOKUP VLOOKUP HLOOKUP 関 数 は 検 索 値 に 対 応 する 値 を 検 索 値 を 含 む 一 覧 表 から 抽 出 し てくれる 関 数 です
Lookup 関 数 Vlookup 関 数 Index 関 数 等 で 表 からデータを 抽 出 する1 目 次 Rev070924 こうすればできる 研 究 所 1. 表 から 値 を 抽 出 する 説 明... 3 2. Lookup 関 数 1( 検 査 値 配 列 を 選 択 )... 5 3. Lookup 関 数 2 検 査 値 検 査 範 囲 対 応 範 囲 を 選 択 して 扶 養
情報処理技能検定試験 表計算2級 手順書
日 本 情 報 処 理 検 定 協 会 主 催 情 報 処 理 技 能 検 定 試 験 ( 表 計 算 ) ワンポイント 2 級 (Microsoft Excel 2010 対 応 ) 2012 年 4 月 日 本 情 報 処 理 検 定 協 会 練 習 をはじめる 前 に 3 試 験 前 にすること 4 受 験 番 号 名 前 の 入 力 4 試 験 本 番 4 注 意 すること 4 試 験 後
返還同意書作成支援 操作説明書
返 還 金 同 意 書 等 作 成 支 援 操 作 説 明 書 当 EXCELを 使 用 することにより 以 下 のものを 作 成 できます 返 還 同 意 書 保 険 者 別 返 還 金 額 一 覧 表 返 還 内 訳 表 返 還 集 計 表 1 返 還 金 同 意 書 等 作 成 支 援 (EXCEL 形 式 )を 開 きます 2 タイトル 画 面 が 数 秒 間 表 示 されますので 注 意
POWER EGG V2.01 ユーザーズマニュアル ファイル管理編
POWER EGG V2.0 ユーザーズマニュアル ファイル 管 理 編 Copyright 2009 D-CIRCLE,INC. All Rights Reserved 2009.4 はじめに 本 書 では POWER EGG 利 用 者 向 けに 以 下 の POWER EGG のファイル 管 理 機 能 に 関 する 操 作 を 説 明 しま す なお 当 マニュアルでは ファイル 管 理 機
もくじ 0.はじめに 1 1. 用 紙 をスキャナで 用 紙 を 読 み 込 む 1 2. 書 式 定 義 2 2.1 マークした 部 分 を 個 々のデータとして 取 り 込 む 場 合 ( 複 数 回 答 対 応 ) 2 2.2 マークした 部 分 をグループ 化 して 取 り 込 む 場 合
わかる 授 業 をつくる ミニッツペーパー 利 用 マニュアル アンケート 試 験 問 題 作 成 編 ミニッツペーパーのシステムを 利 用 することで 簡 単 にアンケートや 試 験 問 題 を 集 計 することができます 東 海 大 学 教 育 支 援 センター 2011.07.04 作 成 もくじ 0.はじめに 1 1. 用 紙 をスキャナで 用 紙 を 読 み 込 む 1 2. 書 式 定
KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2
目 次 動 作 環 境 特 長 方 法 方 法 起 動 終 了 方 法 方 法 操 作 方 法 使 方 使 方 使 方 詳 細 設 定 使 方 KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2 KINGSOFT Office 2016 特 長 主 特 長 以
01_07_01 データのインポート_エクスポート_1
データのインポート/エクスポートについて 概 要 スタッフエクスプレスでは 他 のソフトウェアで 作 成 されたスタッフデータ 得 意 先 データなどを 取 り 込 む(インポートする)ことができます また スタッフエクスプレスに 登 録 済 みのデータを Excel 形 式 CSV 形 式 で 出 力 (エクスポート)す ることができます 注 意 インポートできるデータは 次 の 条 件 を 満
<4D6963726F736F667420576F7264202D20819C486F70658F6F93588ED297708AC7979D89E696CA837D836A83858341838B8169342E33566572816A2E646F63>
商 品 管 理 商 品 管 理 を 行 うためのメニューです 4.1 商 品 管 理 のサイドメニュー 商 品 管 理 には 以 下 のサイドメニューがあります 商 品 一 覧 登 録 済 みの 商 品 の 一 覧 を 表 示 します 既 に 登 録 済 みの 商 品 の 検 索 検 索 した 商 品 を 編 集 する 際 に 使 用 します 新 規 作 成 商 品 を 新 規 登 録 する 画 面
平成25年度 独立行政法人日本学生支援機構の役職員の報酬・給与等について
平 成 25 年 度 独 立 行 政 法 日 本 学 生 支 援 機 構 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 25 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 日 本 学 生 支 援 機 構 は 奨 学 金 貸 与 事 業 留 学 生 支 援
目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について... 1 1.1.EXCEL 一 括 登 録... 1 1.2.EXCEL ダウンロード... 2 1.2.1. 検 索 条 件 の 指 定 プレビュー... 3 1.2.2.EXCEL ダウンロード(データ 抽 出 あ
大 学 情 報 データベースシステム EXCEL 一 括 登 録 マニュアル 目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について... 1 1.1.EXCEL 一 括 登 録... 1 1.2.EXCEL ダウンロード... 2 1.2.1. 検 索 条 件 の 指 定 プレビュー... 3 1.2.2.EXCEL ダウンロード(データ 抽 出 あり)... 5 1.2.3.EXCEL
TIPS - 棚 割 りを 開 始 するまで Liteを 起 動 し 企 業 情 報 の 追 加 を 行 い 棚 割 を 行 う 企 業 の 追 加 をして 下 さい 企 業 情 報 の 追 加 時 に エラーメッセージが 表 示 された 場 合 別 途 TIPS トラブルが 発 生 した 場 合
TIPS 目 次 TIPS 項 目 棚 割 りを 開 始 するまで 商 品 画 像 の 追 加 方 法 商 品 情 報 の 一 括 更 新 登 録 方 法 棚 割 情 報 の 連 携 方 法 小 売 様 棚 割 ソフトとの 棚 割 情 報 連 携 について 他 棚 割 ソフトとの 棚 割 情 報 連 携 について 棚 割 情 報 のExcel 取 込 について 棚 板 設 定 の 詳 細 商 品 設
目 次 1. 論 理 関 数 IF... 1 2. IF の 概 要... 1 3. 論 理 式 の 種 類... 2 3.1.1. 等 号... 2 3.1.2. 不 等 号... 2 4. 具 体 的 な 使 い 方... 2 5. ネスト... 3 6. 複 数 の 条 件 を 記 述...
平 成 26 年 12 月 6 日 跡 見 学 園 女 子 大 学 公 開 講 座 パソコンセミナー Excel 入 門 第 1 回 応 用 編 文 学 部 現 代 文 化 表 現 学 科 准 教 授 伊 藤 穣 [email protected] http://www2.mmc.atomi.ac.jp/~j-ito/ 目 次 1. 論 理 関 数 IF... 1 2. IF の 概 要... 1
2 出 願 資 格 審 査 前 記 1の 出 願 資 格 (5) 又 は(6) により 出 願 を 希 望 する 者 には, 出 願 に 先 立 ち 出 願 資 格 審 査 を 行 いますので, 次 の 書 類 を 以 下 の 期 間 に 岡 山 大 学 大 学 院 自 然 科 学 研 究 科 等
Ⅱ 入 学 者 選 抜 試 験 学 生 募 集 要 項 ( 自 然 科 学 研 究 科 環 境 学 研 究 科 共 通 ) ( 入 学 時 期 : 平 成 18 年 10 月 又 は 平 成 19 年 4 月 ) 1 出 願 資 格 次 の 各 号 のいずれかに 該 当 する 者 です (1) 修 士 の 学 位 若 しくは 専 門 職 学 位 を 有 する 者 又 は 平 成 19 年 3 月 (
<6D313588EF8FE991E58A778D9191E5834B C8EAE DC58F4992F18F6F816A F990B32E786C73>
国 立 大 学 法 人 茨 城 大 学 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 24 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 役 員 に 支 給 される 給 与 のうち 期 末 特 別 手 当 については 国 立 大 学 評 価 委 員 会
MetaMoJi ClassRoom/ゼミナール 授業実施ガイド
本 書 では 管 理 者 向 けに MetaMoJi ClassRoom/ゼミナールで 年 度 更 新 を 実 施 する 手 順 について 説 明 して います 管 理 者 ガイドと 合 わせてご 覧 ください Excelは 米 国 Microsoft Corporationの 米 国 およびその 他 の 国 における 登 録 商 標 または 商 標 です Apache OpenOffice Apache
Microsoft Office Excel2007(NO.2エクセル初級後編)
目 次 序 章... 1 エクセル 2007 初 級 ( 後 編 ) の 目 的... 1 エクセル 2007 初 級 ( 後 編 )について... 2 表 の 編 集 ( 後 編 その1)... 2 シートの 操 作... 2 基 本 の 計 算 式 ( 後 編 )... 3 印 刷 の 基 本... 3 グラフ 作 成 の 基 本... 3 第 1 章 表 の 編 集 ( 後 編 その 1)...
治 験 実 施 管 理 システム NMGCP 向 け Excel 形 式 プロトコール 作 成 手 順 書 V4.0.3 対 応 版 第 1 版 株 式 会 社 富 士 通 アドバンストエンジニアリング All Rights Reserved,Copyright 株 式 会 社 富 士 通 アドバン
2014 年 1 月 7 日 治 験 依 頼 者 各 位 新 潟 市 民 病 院 治 験 管 理 室 Excel 形 式 の 電 子 プロトコール 提 出 の 御 依 頼 当 院 では 効 率 的 で 正 確 な 治 験 の 実 施 のため 電 子 カルテ 内 に 専 用 の Excel 形 式 による 電 子 プロトコールを 導 入 しております つきましては 治 験 依 頼 の 際 に 下 記
預 金 を 確 保 しつつ 資 金 調 達 手 段 も 確 保 する 収 益 性 を 示 す 指 標 として 営 業 利 益 率 を 採 用 し 営 業 利 益 率 の 目 安 となる 数 値 を 公 表 する 株 主 の 皆 様 への 還 元 については 持 続 的 な 成 長 による 配 当 可
ミスミグループ コーポレートガバナンス 基 本 方 針 本 基 本 方 針 は ミスミグループ( 以 下 当 社 グループ という)のコーポレートガバナン スに 関 する 基 本 的 な 考 え 方 を 定 めるものである 1. コーポレートガバナンスの 原 則 (1) 当 社 グループのコーポレートガバナンスは 当 社 グループの 持 続 的 な 成 長 と 中 長 期 的 な 企 業 価 値 の
確 定 申 告 書 作 成 システム 操 作 手 順 書 ~ 個 人 利 用 者 向 け 操 作 説 明 書 ~ 平 成 27 年 1 月 JA 長 野 県 営 農 センター ( 株 ) 長 野 県 協 同 電 算 目 次 1.システムの 起 動... 1 ... 1 ... 2 2.ログインとログアウト... 2 ... 3 ...
<31352095DB8CAF97BF97A6955C2E786C73>
標 準 報 酬 月 額 等 級 表 ( 厚 生 年 金 ) 標 準 報 酬 報 酬 月 額 厚 生 年 金 保 険 料 厚 生 年 金 保 険 料 率 14.642% ( 平 成 18 年 9 月 ~ 平 成 19 年 8 月 ) 等 級 月 額 全 額 ( 円 ) 折 半 額 ( 円 ) 円 以 上 円 未 満 1 98,000 ~ 101,000 14,349.16 7,174.58 2 104,000
<4D6963726F736F667420576F7264202D20457863656C97F195CF8AB72091808DEC90E096BE8F912091E6312E313294C52E646F63>
Excel 列 変 換 Ver.1.0.3 操 作 説 明 書 第 1.1 版 Copyright (C) 2008 株 式 会 社 恒 河 沙 変 更 履 歴 版 作 成 日 作 成 者 主 な 変 更 点 第 1.0 版 2008/10/29 ( 株 ) 恒 河 沙 東 野 貴 行 新 規 作 成 第 1.1 版 2008/11/04 ( 株 ) 恒 河 沙 東 野 貴 行 - 2 - 目 次
2 役 員 の 報 酬 等 の 支 給 状 況 役 名 法 人 の 長 理 事 理 事 ( 非 常 勤 ) 平 成 25 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 16,936 10,654 4,36
独 立 行 政 法 人 駐 留 軍 等 労 働 者 労 務 管 理 機 構 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 25 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 検 証 結 果 理 事 長 は 今 中 期 計 画 に 掲 げた 新 たな 要
以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 4ページに 汎 用 データ 受 入 に 関 するよくあるお 問 い 合 わせをご 紹 介 しています Step (3ペー
人 事 奉 行 iシリーズ 汎 用 データ 受 入 の 手 順 書 汎 用 データの 作 成 方 法 を 知 りたい 汎 用 データのフォーマットがわからない 汎 用 データ 受 入 をしたら 受 入 エラーが 発 生 した について 社 員 情 報 データの 受 入 を 例 に 説 明 します 本 手 順 書 では OBC 受 入 形 式 ( ) の 汎 用 データの 受 入 を 受 入 フォーマットに
弁護士報酬規定(抜粋)
はなみずき 法 律 事 務 所 弁 護 士 報 酬 規 定 ( 抜 粋 ) 2008 年 10 月 改 訂 2014 年 4 月 * 以 下 の 弁 護 士 報 酬 は いずれも 税 込 です ただし D E L の2の 表 に 基 づき 算 出 さ れた 金 額 については 消 費 税 を 上 乗 せした 額 を 弁 護 士 報 酬 とします 目 次 A 法 律 相 談 料 B 顧 問 料 C 手
Box-Jenkinsの方法
Box-Jeks の 方 法 自 己 回 帰 AR 任 意 の 時 系 列 を 過 程 ARと 呼 ぶ で 表 す これが AR または AR m m m 個 の 過 去 の 値 に 依 存 する 時 これを 次 数 の 自 己 回 帰 ここで は 時 間 の 経 過 に 対 して 不 変 な 分 布 を 持 つ 系 列 相 関 のない 撹 乱 誤 差 項 である 期 待 値 一 定 の 分 散 σ
18 国立高等専門学校機構
様 式 1 公 表 されるべき 事 項 独 立 行 政 法 人 国 立 高 等 専 門 学 校 機 構 の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 平 成 25 年 度 における 役 員 報 酬 についての 業 績 反 映 のさせ 方 当 機 構 役 員 給 与 規 則 で 文 部 科
0 目 次 1. 畑 のあしあとの 使 い 方 P.3 2.オプション P.6 3.モバイルデバイスより 履 歴 取 得 P.8 4. 基 本 情 報 管 理 P.11 5. 栽 培 計 画 P.22 6.ドキュメント 出 力 P.25 7. 栽 培 履 歴 管 理 P.28 8.モバイルでの 栽
畑 のあしあと 詳 細 マニュアル 1 0 目 次 1. 畑 のあしあとの 使 い 方 P.3 2.オプション P.6 3.モバイルデバイスより 履 歴 取 得 P.8 4. 基 本 情 報 管 理 P.11 5. 栽 培 計 画 P.22 6.ドキュメント 出 力 P.25 7. 栽 培 履 歴 管 理 P.28 8.モバイルでの 栽 培 履 歴 登 録 P.31 2 1 畑 のあしあとの 使 い
Microsoft Word - 目次.doc
長 寿 医 療 制 度 と 国 民 健 康 保 険 一 体 化 に 関 する 舛 添 大 臣 私 案 イメージ < 現 行 > < 見 直 し 後 > 75 歳 長 寿 医 療 制 度 ( 県 単 位 広 域 連 合 ) 長 寿 医 療 ( 都 道 府 県 ) 1 両 者 を 一 体 化 し 都 道 府 県 が 運 営 75 歳 65 歳 被 用 者 保 険 から 財 政 調 整 国 保 国 保 被
2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数
2 県 公 立 高 校 の 合 格 者 は このように 決 まる (1) 選 抜 の 仕 組 み 選 抜 の 資 料 選 抜 の 資 料 は 主 に 下 記 の3つがあり 全 高 校 で 使 用 する 共 通 の ものと 高 校 ごとに 決 めるものとがあります 1 学 力 検 査 ( 国 語 数 学 社 会 理 科 英 語 の5 教 科 ) すべての 高 校 で 資 料 とする 2 調 査 書 (
平成16年年金制度改正 ~年金の昔・今・未来を考える~
第 2 回 社 会 保 険 料 労 働 保 険 料 の 賦 課 対 象 となる 報 酬 等 の 範 囲 に 関 する 検 討 会 平 成 24 年 9 月 20 日 資 料 1 通 勤 手 当 について 1 これまでの 通 勤 に 要 する 費 用 に 関 する 考 え 方 では 通 勤 手 当 の 金 額 が 実 費 弁 償 的 に 算 定 される 場 合 でも それは 通 常 使 用 者 が 負
2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1
独 立 行 政 法 人 統 計 センター( 法 人 番 号 7011105002089)の 役 職 員 の 報 酬 給 与 等 について Ⅰ 役 員 報 酬 等 について 1 役 員 報 酬 についての 基 本 方 針 に 関 する 事 項 1 役 員 報 酬 の 支 給 水 準 の 設 定 についての 考 え 方 独 立 行 政 法 人 通 則 法 第 52 条 第 3 項 の 規 定 に 基 づき
SMILEes 人事給与 「年間報酬平均による保険者算定」 Q&A集
平 成 24 年 6 月 SMILEes 人 事 給 与 年 間 報 酬 平 均 による 保 険 者 算 定 Q & A 集 平 成 23 年 に 施 行 された 年 間 報 酬 平 均 による 保 険 者 算 定 の 運 用 に 関 する 補 足 や 注 意 をQ& A 形 式 でまとめました 年 間 報 酬 平 均 による 保 険 者 算 定 を 行 う 場 合 は 平 成 23 年 社 会 保
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Ⅱ 国 地 方 公 共 団 体 公 共 公 益 法 人 等 の 消 費 税 Q&A ( 問 1) 免 税 期 間 における 起 債 の 償 還 元 金 に 充 てるための 補 助 金 等 の 使 途 の 特 定 Q 地 方 公 共 団 体 の 特 別 会 計 が 消 費 税 の 納 税 義 務 が 免 除 される 課 税 期 間
「1 所得税及び復興特別所得税の確定申告書データをお持ちの方」からの更正の請求書・修正申告書作成編
既 に 提 出 した 所 得 税 及 び 復 興 特 別 所 得 税 の 確 定 申 告 の 申 告 額 に 誤 り があった 場 合 で 納 める 税 金 が 多 すぎた 場 合 や 還 付 される 税 金 が 少 なす ぎた 場 合 に 提 出 する 更 正 の 請 求 書 や 申 告 をした 税 額 等 が 実 際 より 少 な すぎた 場 合 や 還 付 される 税 金 が 多 すぎた 場
