東京大学社会科学研究所パネル調査プロジェクトディスカッションペーパーシリーズ No 年 5 月 朝食摂取習慣の教育達成への因果効果の検証 傾向スコアマッチングと感度分析によるアプローチ 小川和孝 ( 東京大学 ) 要旨本論文の目的は 15 歳時の朝食摂取習慣が中学校における校内成績と

Similar documents
EBNと疫学

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

dvi

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Medical3

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

A5 PDF.pwd

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

PowerPoint プレゼンテーション

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - e-stat(OLS).pptx

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

統計的データ解析

教育収益率の地域差と地域移動効果―JGSS データを用いた所得関数の分析―

スライド 1

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students A Dissertation Submitted t

Microsoft PowerPoint - 資料04 重回帰分析.ppt

ポイント 〇等価尺度法を用いた日本の子育て費用の計測〇 1993 年 年までの期間から 2003 年 年までの期間にかけて,2 歳以下の子育て費用が大幅に上昇していることを発見〇就学前の子供を持つ世帯に対する手当てを優先的に拡充するべきであるという政策的含意 研究背景 日本に

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

ビジネス統計 統計基礎とエクセル分析 正誤表

情報工学概論

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

青焼 1章[15-52].indd

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

untitled

2 2 natural experiments y y 1 y 0 y 1 y 0 y 1 y 0 counterfactual y 1 y 0 d treatment indicator d = 1 (treatment group) d = 0 control group average tre

スライド 1

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

博士論文 考え続ける義務感と反復思考の役割に注目した 診断横断的なメタ認知モデルの構築 ( 要約 ) 平成 30 年 3 月 広島大学大学院総合科学研究科 向井秀文

Microsoft PowerPoint - ch04j

Powered by TCPDF (

The effect of smoking habit on the labor productivities

Medical3

Microsoft Word - å“Ÿåłžå¸°173.docx

本冊子の利用にあたって 本冊子は 能力強化研修で扱う内容を理解する上で助けとなるであろう統計学の基礎事 項を選択肢形式の問題として提示したものです 統計学に不安のある受講生は事前の学 習として活用ください 試験ではないので正答数自体は重要ではありません より効果的な学習 復習となるよ う 次のような

.001 nonsmoker smoker 0 Density 5.0e infant birthweight (grams) Graphs by 1 if mother smoked 図 2. 新生児体重のヒストグラム (

Microsoft Word doc

1.民営化

Chapter 1 Epidemiological Terminology

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

講義「○○○○」


日心TWS

母親の就業が子どもに与える影響―その意識を規定する要因の分析―

<4D F736F F D20837D834E838D97FB8F4B96E291E889F090E091E682528FCD81698FAC97D1816A>

横浜市環境科学研究所

60 Vol. 44 No. 1 2 準市場 化の制度的枠組み: 英国 教育改革法 1988 の例 Education Reform Act a School Performance Tables LEA 4 LEA LEA 3

基礎統計

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft Word - 教育経済学:課題1.docx

修士論文 ( 要旨 ) 2017 年 1 月 攻撃行動に対する表出形態を考慮した心理的ストレッサーと攻撃性の関連 指導小関俊祐先生 心理学研究科臨床心理学専攻 215J4010 立花美紀

様々なミクロ計量モデル†

厚生労働科学研究費補助金(循環器疾患等生活習慣病対策総合研究事業)

日本の世帯属性別貯蓄率の動向について:アップデートと考察

PSMATCH Procedure ニューラルネットワークの奇跡のマッチング ~Real World Data の利用可能性を忖度する ~ 馬場崇充 藤原正和 北西由武 ( 塩野義製薬株式会社解析センター ) PSMATCH Procedure Neural Network = Miracle En

ANOVA

1 Jensen et al.[6] GRT S&P500 GRT RT GRT Kiriu and Hibiki[8] Jensen et al.[6] GRT 3 GRT Generalized Recovery Theorem (Jensen et al.[6])

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - åł€æžœæ”¨è«Œã†®å�ºç¤”(çfl°æ€Š)final

Microsoft Word - 保健医療統計学112817完成版.docx

* 積極的労働市場政策と若年雇用 山本勲野原快太 DD DD

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

JGSS統計分析セミナー2009-傾向スコアを用いた因果分析-

Microsoft Word - manuscript_kiire_summary.docx

Microsoft Word - 坂本様本文確定

Microsoft Word - 博士論文概要.docx

自殺の経済社会的要因に関する調査研究報告書

I. はじめに母親の若年出産は子供の就学に影響を与えるのだろうか 母の若年出産それ自体が子供の就学に影響しているかを明らかにすることは 世代間で格差が連鎖するのかといった議論と密接に関係し重要な研究課題である 海外において多くの研究がこのテーマに取り組んできたが 明確なコンセンサスはいまだにない そ

日本における結婚観の変化―JGSS累積データ を用いた分析―

Microsoft Word - Power_Analysis_Jp_ docx

Microsoft PowerPoint - statistics pptx

13章 回帰分析


Microsoft Word - 209J4009.doc

学習指導要領の領域等の平均正答率をみると 各教科のすべての領域でほぼ同じ値か わずかに低い値を示しています 国語では A 問題のすべての領域で 全国の平均正答率をわずかながら低い値を示しています このことから 基礎知識をしっかりと定着させるための日常的な学習活動が必要です 家庭学習が形式的になってい

<4D F736F F D208D7393AE8C6F8DCF8A7789EF8FB4985E905C82B58D9E82DD91E5927C919F8AED D322E646F63>

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

2 調査結果 (1) 教科に関する調査結果 全体の平均正答率では, 小 5, 中 2の全ての教科で 全国的期待値 ( 参考値 ) ( 以下 全国値 という ) との5ポイント以上の有意差は見られなかった 基礎 基本 については,5ポイント以上の有意差は見られなかったものの, 小 5 中 2ともに,

 

Microsoft PowerPoint - statistics pptx

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

2011/02/09 CJC Propensity score

SNAと家計調査における貯蓄率の乖離-日本の貯蓄率低下の要因-

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft PowerPoint - 08economics4_2.ppt

. イントロダクション 06 年の電力自由化に伴い, すべての消費者が自由に電力会社や料金プランを選べるようになった. しかし依然として従来の規制料金から自由料金へ乗り換える人は少ない. こうした行動は, 料金プランを切り替えた際に自分が得をするのか, 損をするのかが把握できていないため, 切り替え

経済統計分析1 イントロダクション

課題研究の進め方 これは,10 年経験者研修講座の各教科の課題研究の研修で使っている資料をまとめたものです 課題研究の進め方 と 課題研究報告書の書き方 について, 教科を限定せずに一般的に紹介してありますので, 校内研修などにご活用ください

Probit , Mixed logit

Kobe University Repository : Kernel タイトル Title 著者 Author(s) 掲載誌 巻号 ページ Citation 刊行日 Issue date 資源タイプ Resource Type 版区分 Resource Version 権利 Rights DOI

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Stepwise Chow Test * Chow Test Chow Test Stepwise Chow Test Stepwise Chow Test Stepwise Chow Test Riddell Riddell first step second step sub-step Step

a naturalistic b Midgley, N., 2011 Child Psychotherapy and Research - New Approaches, Emerging Findings Catty, J., 2011 Catty, 2011 b Catty 2011 Wren,

政策課題分析シリーズ16(付注)

Microsoft PowerPoint - GLMMexample_ver pptx

Transcription:

東京大学社会科学研究所パネル調査プロジェクトディスカッションペーパーシリーズ No.79 2014 年 5 月 朝食摂取習慣の教育達成への因果効果の検証 傾向スコアマッチングと感度分析によるアプローチ 小川和孝 ( 東京大学 ) 要旨本論文の目的は 15 歳時の朝食摂取習慣が中学校における校内成績と 将来的な教育達成へと与える因果的な効果を測定することである 傾向スコアによるマッチングを用いて 社会階層などの朝食摂取習慣へ影響しうる共変量の調整を行った 分析の結果 男性の中 3 時校内成績 教育年数 女性の中 3 時校内成績に対して 朝食摂取習慣の有意なプラスの影響が確認された また 男性の中 3 時校内成績と教育年数については 感度分析を用いて観察されない変数の影響を考慮した上でもその効果は大きいことが確認された 謝辞本研究は 文部科学省科学研究費補助金特別研究員奨励費 ( 課題番号 23-10851) による研究成果の一部である 東京大学社会科学研究所パネル調査の実施にあたっては社会科学研究所研究資金 株式会社アウトソーシングからの奨学寄付金を受けた パネル調査データの使用にあたっては社会科学研究所パネル調査企画委員会の許可を受けた

1. 問題設定 本研究の目的は 15 歳時の朝食摂取習慣が中学校の校内成績と 将来的な教育達成へと与える因果的な効果を測定することである 近年 子どもの朝食摂取と教育達成との関係について 学術的 政策的な議論がしばしば行われる すなわち 個人の教育達成に影響する要因として 朝食の摂取を指摘するというものである 厚生労働省の 平成 22 年国民健康 栄養調査 では 7-14 歳における朝食の欠食率 1は男性 5.6% 女性 5.2% 15-19 歳における朝食の欠食率は男性 14.5% 女性 14.0% となっている また 文部科学省の 平成 20 年度全国学力 学習状況調査 によると 毎日 朝食を食べている児童生徒のほうがテストの正答率が高い傾向が見られるという結果が出されている 西本 (2004) は 沖縄県の高校生のデータから 朝食の摂取がテスト得点を高めているを確認しており またその結果を脳の機能の面から解釈している このような観点は栄養学の研究にも見られ 例えば Powell et al.(1998) は 子どもの健康状態の悪さや 朝食を摂らないことによる空腹状態が学習能力に負の影響を与える可能性を指摘している Yamamoto and Brinton (2010) は Bourdieu の文化資本理論に基づき 社会階層と社会移動全国調査 の 1995 年データから 文化資本による教育達成への影響を分析している この研究では 幼少期における 親による本の読み聞かせの経験 美術館 博物館へ連れて行ってもらった経験 という 身体化された文化資本 と 骨董品やピアノなどの所有という 客体化された文化資本 を分類し 身体化された文化資本が学校での学習に必要な 一般的な意欲や能力を高めることで 人々の最終的な教育年数に効果を持っているということを議論している すなわち 身体化された文化資本が人的資本に変換されることによって 教育達成に影響しているというものである このような枠組みを応用すれば 朝食を摂るという習慣が 教育達成に有利な身体化された文化資本として機能するということがありうるかもしれない 一方で 食事習慣というのは 単に何らかの社会階層の代理変数と見なされる場合もある ( 苅谷 志水編 2004) その場合には 推定された朝食の摂取の影響は 他の社会階層に関しての欠落変数 (omitted variable) によるバイアスを反映したものになる このように 朝食を摂取する習慣が教育達成に因果的な影響があるかどうかということに関心がある場合 両者に先行して関連する変数を適切に統制する必要がある このような方法として 社会科学の分野で最も広く用いられているのは 重回帰分析によるアプローチだろう 東京大学社会科学研究所 (2009) では 本稿で用いるのと同じである 15 歳時の朝食習慣が本人の教育達成に与える影響をすでに重回帰分析によって検証しているが 1 調査を実施した日 ( 特定の 1 日 ) における朝食を欠食したものの割合として定義されている -1-

この方法には後述するようなモデルの特定化による問題が生じ得る 本稿では Rosenbaum and Rubin(1983) などによって発展させられてきた傾向スコア (propensity score) による共変量調整が 重回帰分析に対して持つ利点について説明を行う そして 傾向スコアによるマッチング推定を用いて 朝食摂取の習慣が教育達成に与える因果効果を推定する また 推定された因果効果の頑健性について 感度分析 (sensitivity analysis) による検証を行う 2. 傾向スコアを用いたマッチングによる推定 2 (1) 潜在結果 (potential outcome) モデル ここでは Rubin(1974) などによって導入され 処置変数による因果効果を推定するために広く使用されている潜在結果モデルによる表記を導入する まず 個人 i についてそれぞれ Y i を従属変数 T i を処置変数 X i を処置変数に先行する観察される共変量とする この時 Y i (D i ) を処置変数の値がD i = {0,1} における潜在的な値とすると 個人 i における処置効果 (treatment effect) は δ i = Y i (1) Y i (0) (1) と定義される ここで Y i (1), Y i (0) はそれぞれ反実仮想的 (counterfactual) な従属変数である すなわち ある個人 i においてY i (1) とY i (0) を同時に観察することはできず よって 式 (1) を得ることも不可能である Holland(1986) は これを 因果推論における根本問題 (the fundamental problem of causal inference) と呼んでおり 2 つの解決法を提案している それは 科学的解決法 (scientific solution) と 統計学的解決法(statistical solution) である 科学的な解決法 とは 母集団におけるすべての個人の均一性を仮定することである すなわち Y i (1) = Y j (1) かつY i (0) = Y j (0) が成り立つことである この強い仮定の下では 個人レベルでの因果効果を推定することが可能である なぜならば δ = Y i (1) Y i (0) = Y j (1) Y j (0) = Y i (1) Y j (0) 2 Caliendo and Kopeing(2008) は 傾向スコアを用いたマッチングの手順として (1) 傾向スコアによるマッチングか共変量のマッチングかを決める (2) 傾向スコアの推定 (3) マッチングのアルゴリズムを選択する (4) コモンサポートをチェックする (5) マッチングの質を推定する (6) 感度分析 を挙げている 本節もこの説明に依るところが大きい -2-

が母集団のすべての個人に対して成り立ち 処置群における個人と対照群における個人の単純な従属変数の値の差をとればよいためである しかしながら 社会科学においては個人間の異質性というものが常に存在する (Xie 2013) そのため 個人の均質性を仮定した分析というものは現実的には無意味である よって Holland(1986) の分類による 統計学的解決法 が選択されることになる これは 個人レベルの因果効果ではなく 何らかの集計レベルの因果効果に注目するという方法である 3 その際に最もよく注目されるのは (1) の平均である すなわち δ ATE = δ i = E[Y i (1) Y i (0)] (2) で定義される平均因果効果 (average treatment effect: ATE) への注目である また 場合によっては 処置群における処置効果 (average treatment effect on the treated: ATT) すなわち実際に処置を受けた群に条件付けた際の処置効果へ関心がある場合もある すなわち δ ATT = δ i = E[Y i (1) Y i (0) D i = 1] (3) で定義されるものである この際 もし処置変数 T の割り当てがランダムであれば 式 (2),(3) はバイアスなく推定することが可能になる 4 なぜならば {Y i (1), Y i (0)} D i (4) 3 Xie(2013: 6263) は 個人レベルでは常に分散が存在するにもかかわらず 因果推論では常に集計レベルでの統計的分析が要求されることを 社会科学における根本的パラドックス (the fundamental paradox in social science) と呼んでいる 4 ここではさらに ある個人の潜在的な従属変数の値は 他の個人がどのような処置変数の値をとるかに依存しないという仮定が置かれる すなわち どのような処置変数の割り当てメカニズムの下でも それぞれの個人の潜在的な従属変数の値は一定だというものである これは stable unit treatment value assumption(sutva) と呼ばれる (Rubin 1980) 石田 (2012) は SUTVA が成り立つ事例とそうでない事例について ある個人が頭痛薬を飲んだ時の効果は 周囲の個人が頭痛薬を飲んだかどうかに依存しないのに対して 失業者を対象とした失業訓練の効果は 周囲の人々が同様の職業訓練を受けたかどうかが労働市場の需給関係に関わるので異なり得るという例を挙げている また例えば 学校においてピア グループによる成績への影響が存在する場合にも SUTVA が成り立たない可能性があるが そのような関心から SUTVA を弱めた分析例としては Sobel(2006) や Hong and Raudenbush(2008) などがある -3-

より 処置変数の割り当てと従属変数の潜在的な値が独立となり δ ATE = E[Y i (1) Y i (0)] = E[Y i (1) D i = 1] E[Y i (0) D i = 0] δ ATT = E[Y i (1) Y i (0) D i = 1] = E[Y i (1) D i = 1] E[Y i (0) D i = 0] (5) (6) となるためである 上式における E[Y i (1) D i = 1], E[Y i (0) D i = 0] はそれぞれデータから推定可能である しかし 処置変数の割り当て T がランダムではない観察研究 (observational study) においては 一般的に式 (4) は成り立たず 次に示すように 式 (5),(6) にもバイアスが生まれてしまう すなわち δ ATT について 観察研究における処置群と統制群の単純な平均の差は E[Y i (1) D i = 1] E[Y i (0) D i = 0] = E[Y i (1) Y i (0) D i = 1] + E[Y i (0) D i = 1] E[Y i (0) D i = 0] = δ ATT + E[Y i (0) D i = 1] E[Y i (0) D i = 0] となり E[Y i (1) D i = 1] E[Y i (0) D i = 0] がδ ATT と一致しないためである この時 右辺の最後に表れるE[Y i (0) D i = 1] E[Y i (0) D i = 0] は 処置群と対照群がともに処置を受けなかった場合の潜在的な従属変数の値の差であり セレクション バイアスによる影響である 5 セレクション バイアスが存在しない時 すなわち E[Y i (0) D i = 1] E[Y i (0) D i = 0] = 0 が成り立つ場合にのみ δ ATT はデータから一致性をもって推定することが可能となる 実験データではない観察データにおいてこれが可能となるための条件について これまで様々な研究が行われてきた その結果として δ ATE の推定については 次のような仮定が成り立てば十分であることが明らかにされている {Y i (1), Y i (0)} D i X i 0 < P(D i X i ) < 1 (7) (8) なお δ ATE ではなく δ ATT に関心がある場合には (7),(8) よりも弱い仮定である 5 ここでは 処置効果の個人間の異質性は存在しないことを仮定している 処置効果の個人間の異質性が存在する場合には 処置群と対照群における処置効果の差によるバイアスがさらに生じ得る (Brand and Xie 2010: 283) -4-

Y i (0) D i X i P(D i X i ) < 1 が成り立てば十分である Rosenbaum and Rubin(1983) は 式 (7),(8) の 2 つの仮定をあわせて 強く無視できる処置変数の割り当て (strongly ignorable treatment assignment) の仮定と呼んでいる すなわち 観察される共変量 Xを条件付けた際に 処置変数の割り当てと潜在的な従属変数が独立となればよいというのである しかし 上記のような仮定が成り立つ場合にも 共変量 Xの数が多い場合には すべての共変量を条件付けるのは現実的ではない なぜならば 共変量の数が多くなることによって ある処置群の個人と同一の共変量の値を持つ対照群の個人を見つけ出すことが困難になるためである 例えば離散変数の場合にはクロス表分析を思い浮かべればわかるように 統制変数を追加すればするほど 空白に近いセルが増え 信頼性のある分析が困難となってしまう これはしばしば 次元の呪い (curse of dimensionality) と呼ばれる問題である 次に述べる傾向スコアによる分析方法は このような問題に対処するために発展させられてきた (2) 傾向スコアとその推定 Rosenbaum and Rubin(1983) は P(D i X i ) を傾向スコアと定義した すなわち 観察される共変量を条件付けた場合の 処置変数の確率である そして {Y i (1), Y i (0)} D i X i が成り立つ場合には {Y i (1), Y i (0)} D i P(D i X i ) も同様にして成り立つことを証明している strong ignorability が成り立つ場合には 傾向スコアを条件付ければ 処置変数の割り当てと潜在的な従属変数が独立となるのである 実際の分析においては 傾向スコアはあらかじめ明らかではないので データから推定することが必要になる すなわち 傾向スコアをデータからモデル化することが必要であるが 処置変数が 2 値である場合には ロジット モデルやプロビット モデルが通常用いられる 傾向スコアを推定した後は その分布を処置群と対照群でバランスさせる必要がある その方法の 1 つとしてよく用いられるのが マッチングによるものである 傾向スコアによるマッチング推定量の一般的な形式は 次のように表わされる δ PSM ATT = E CP {E[Y i (1) D i = 1, P(D i X i )] E[Y i (0) D i = 0, P(D i X i )]} (9) -5-

ただし 上記の CP はコモンサポートを表し 処置群と対照群における傾向スコアのオーバーラップが存在する区間を意味する 傾向スコアによる因果効果の推定は 一般的な最小二乗法を用いた回帰分析による推定と同様に 処置変数のセレクションが観察される変数のみに依存していることを仮定している すなわち 観察されない変数が処置変数と従属変数の双方に影響している場合には どちらの方法による推定でもバイアスが生じてしまう しかし 傾向スコアマッチングによる推定値は回帰分析によるそれよりも 2 つの利点が存在する (Brand and Halaby 2006: 757) 第一に マッチングによる推定値は 線型性の仮定を要求しないということである OLS では変数のセレクションが線型に起きていることが仮定されるが これが妥当であるという保証は通常は存在しない マッチングは観察される変数のみにセレクションが依存していることは仮定するが 線型的なセレクションを仮定しないのである 第二に マッチングにおいては処置群と対照群の比較は 通常は共変量のオーバーラップが存在する区間にのみ限られる これに対して OLS による推定値は 共変量のオーバーラップが存在していなくとも 処置群と対照群に属する個人のどちらかが存在すれば用いられる すなわち OLS による推定値は しばしば直接に比較可能でないサンプルどうしを分析に含めているのである (3) 様々なマッチング法 マッチングの方法は様々あるが 本稿では nearest neighbor マッチング (NN マッチング ) radius マッチング kernel マッチングの 3 種類を用いる 一般的に それぞれのマッチング法にはバイアスと分散のトレードオフが存在する すなわち 推定値のバイアスをより減らそうとすると 推定値の分散は逆に増大することが知られている 6 NN マッチングは 傾向スコアが最も近い対照群の個人が マッチングのパートナーとして選ばれる この際 一度用いられた対照群の個人をマッチングにもう一度用いるかどうか (replacement) の区別がある replacement を行うかどうかについても 推定値のバイアスと分散のトレードオフが存在するとされる replacement を行う場合には より多くのマッチングを考慮するために分散が小さくなる一方で 傾向スコアの値が離れたマッチングも行うためである 本稿では replacement を行った NN マッチングによる推定値を 6 Black and Smith(2004) は leave-one-out cross validation という方法によって データにもっとも適合するマッチング推定量を選択している これは 対照群のサンプルの中から 1 つのサンプルを落として Y j (0) を計算し これを対照群のサンプルすべてに繰り返すことによって得られる 平均平方誤差に注目するという方法である -6-

示す NN マッチングは 比較に用いる対照サンプルの傾向スコアの値が大きく離れている場合に 質の低いマッチングをもたらしてしまう これを避けるために マッチングを行う傾向スコアの距離に上限 (caliper) を設けるという方法がある radius マッチングはこの caliper の範囲内に含まれるすべての対照群の個人をマッチングに用いるという方法である kernel マッチングは kernel function を用いて 反実仮想的な従属変数を構築するというものである kernel matching は 対照群のほぼすべてのケースを用いるため 上記の 2 つのマッチング法よりも 小さな分散をもたらすとされている Smith and Todd(2005) によれば kernel matching は kernel function を用いた従属変数から切片への重み付け回帰分析と見ることができ この時の推定された切片が反実仮想的な従属変数の平均の推定値を与えるという (4) 共変量がバランスされたかどうかの確認 上述のように 傾向スコアによるマッチングの目的は 処置群と対処群のサンプルのそれぞれの比較可能性を高めることである この目的が達成されたかどうかを確かめるために マッチングの前後において 2 つのグループのそれぞれの共変量の差がどれほど縮まったかのチェックがしばしば行われる 7 その際には 下記で示される standardized bias に注目がなされることが多い 8 X T X C SB before = 100 0.5 (V T (X) + V C (X)) X TM X CM SB after = 100 0.5 (V TM (X) + V CM (X)) マッチング後の standardized bias が 3% ないし 5% 以下になっていれば 多くの研究で 7 マッチングを行った後にはサンプル中における傾向スコアの推定に用いた共変量が 処置群と対照群でバランスされているかどうかのチェックは重要であるとされている しかし Austin(2008) は 1996 年から 2003 年の間に出版された 47 本の医学系論文をレビューし 適切な共変量のバランスチェックを行っているのはわずか 2 本だけであると述べている 8 Imai, King, and Stuart(2008) は 共変量がバランスされているかどうかは母集団ではなくサンプルの性質なので 何かしらの仮想的な母集団に対する推論を行う統計的検定を用いるのは誤りであるということと バランスのチェックに用いられる統計量はサンプルサイズに依存しないものがよいとしている -7-

は十分とされているという (Caliendo and Kopeing 2008: 48) しかし Imai, King, and Stuart(2008) のように 特定の基準を設けるべきではなく 処置群と対照群の共変量の差 はできる限り小さくされるべきだと主張する研究も存在する (5) 感度分析 (sensitivity analysis) 上述のように傾向スコアによるマッチング推定は strong ignorability の仮定に基づいている すなわち 傾向スコアによるマッチング推定は 処置変数の割り当てが観察される変数のみに依存していることを仮定している もし 観察されない要因 U が 処置変数と従属変数の両方に影響している場合 隠れたバイアス (hidden bias) が生じてしまう もし観察されない変数が処置変数の割り当てに影響している場合 処置群と対照群における従属変数の値の差は 因果効果としての解釈を有しない可能性があるのである 9 strong ignorability の仮定が成り立っているかどうかを 直接的にデータから検証する方法は存在しないが 推定値が観察されない変数による交絡に対してどれだけ頑健であるかを検証する 感度分析という方法がある (Rosenbaum 2002) 10 まず 処置変数 T について 観察される変数 X だけを統制しただけでは 従属変数への割り当てが独立にはならないが 観察されない要因 U も統制すれば 独立となるという仮定を行う この時 処置変数への割り当て確率を次のように考える P i = P(X i, U i ) = P(D i = 1 X i, U i ) = F(βX i + γu i ) (10) ここでβは観察される要因の γは観察されない要因の割り当て確率への影響である 次に マッチングされた個人 i と j のペアのそれぞれについて 処置を受けるオッズは P i /(1 P i ) と P j /(1 P j ) である F にロジスティック分布を仮定すると オッズ比は下記のようになる 9 観察されない変数が処置変数の割り当てに影響している場合に 因果効果を推定する 1 つの方法は 操作変数を用いることである しかし 操作変数による推定が因果効果としての解釈を有しうるには exclusion restriction や monotonicity assumption など (Angrist, Imbens, and Rubin 1996) の傾向スコアと同様に強い仮定が求められたり あるいは操作変数と処置変数が弱い相関しか持たない weak instrument(bound, Jaeger, and Baker 1995) の問題を克服したりする必要があるという問題がある これらが妥当に満たされる状況は多くはない 10 感度分析について他に解説や応用としては Harding(2003), DiPrete and Gangl(2004), Becker and Caliendo(2007) などがある -8-

P i /(1 P i ) P j /(1 P j ) = P i/(1 P j ) P j /(1 P i ) = exp(βx i + γu i ) exp(βx j + γu j ) ここでマッチングが十分であれば それぞれの個人は同一の観察される要因を持つこと になるため 上式の X は打ち消されることになる exp(βx i + γu i ) exp(βx j + γu j ) = exp {γ(u i U j )} すなわち マッチングされたペアが同一の観察される要因を持っていたとしても なお観察されない要因の差によって 両者の処置変数の割り当て確率が異なってしまう そこで この観察されない要因の大きさを変えていった場合に 推定値の信頼区間がどのように変わるかを検証するのが 感度分析の方法である もし 観察されない要因を相当に大きくしても なお推定値の信頼区間がゼロを含まない場合には それは因果効果として頑健であると判断するのである 3. データと方法 本稿で使用するデータは 東京大学社会科学研究所が実施している 働き方とライフスタイルの変化に関する全国調査 のうち 若年 壮年パネル調査の Wave1 と Wave3 である 本データは 2007 年時点 (Wave1) で 20 歳から 40 歳である全国の男女が母集団とされている 本調査はパネル調査として設計されているが 本稿の分析はパネルデータの特性を活かした分析ではない Wave1 時点で教育年数が確定しているサンプルのみを用いると 年少のコーホートで大学以上の学歴を持つサンプルが落ちてしまうという問題がある そこで 最終的な教育年数がほぼ確定していると思われる Wave1 時点で 1982 年生まれ以上のサンプルに限った分析を行う 教育達成として用いる従属変数は 2 つである 1 つは 中学 3 年時の成績である 下の方 =1 から 上の方 =5 となるような 5 件法の変数である もう 1 つは 教育年数である 最終学歴から次のような連続的な教育年数に変換した すなわち 中学 =9 高校 =12 短大 高専 専門 =14 大学 =16 大学院 =18 である 処置変数については Wave3 で尋ねられている 15 歳の頃 朝食を食べることについて 1. いつもしていた 2. だいたいしていた 3. したりしなかったり 4. あまりしなかった 5. 全然しなかった を尋ねた 5 点尺度の質問を用いる -9-

表 1 15 歳時の朝食習慣の分布 (%) いつも だいたい したりしな あまり 全然 していた していた かったり しなかった しなかった N 男性 62.4 15.5 10.6 6.5 5.0 1027 女性 76.7 11.4 7.0 4.0 1.0 1264 注 : 後の分析に使用するサンプル中での分布 傾向スコアを二項ロジットモデルによって簡便に推定するためには 処置変数を二値化する必要がある 11 表 1 に見られるように 15 歳時の朝食習慣についての変数の分布は 1. いつもしていた に偏っている よって 十分な対照群を確保するために 処置変数については 1. いつもしていた のみを 1 とし 他を 0 とする二値変数とした この朝食摂取習慣の質問は 15 歳時のことについて回顧的に尋ねているため 測定誤差が伴っている可能性が考えられる 独立変数の測定誤差はそれがランダムなものであれば 係数の絶対値を小さくする方向に影響するため その場合には以下で推定する効果は実際にはより大きいものとなる すなわち 推定される効果はより保守的なものだということである 傾向スコアの推定に含める共変量は 性別 生年 父親 母親学歴 15 歳時の暮らし向き 15 歳時に家にあった本の数 15 歳時に家にあったもの 父親の子育て態度 父親 母親の雇用形態 父親 母親の職業大分類 父親 母親の役職 父親 母親の企業規模 小学校 中学校時の習い事 ( 塾 予備校に行っていた 家庭教師についていた 通信添削をやっていた ) 中学生時の経験( 授業をさぼった 学校でタバコを吸った 教師に暴力をふるった ) 中学校の雰囲気( 学校が荒れていた 遅刻者が多かった 校則が厳しかった ) とした また 分析においては非線型的な関係を考慮し すべての変数はダミー変数化して投入している これにより 推定される因果効果のバイアスはより小さくなることが期待されるが 一方で推定値の分散は大きくなる 共変量をより厳密に統制する代わりに コモンサポートを減少させてしまうためである 以上の枠組みにより 処置群への平均因果効果 ATT を推定する また 朝食習慣による有意な効果が確認された場合には それがどの程度に観察されない要因に左右され得るのか 感度分析を行う 12 11 処置変数を二値以上に拡張する場合については Imai and van Dyk(2004) Hirano and Imbens(2004) などによって傾向スコアの一般化が提案されている また Bia and Mattei(2008) は Stata によるこの推定の方法として gpscore コマンドを紹介している 12 推定にあたっては 統計ソフト Stata の統計ソフト Stata の psmatch2 コマンドを用いた 他のコマンドとしては psmatch,nnmatch,atnd などが開発されている また 感度分析にあたっては rbounds コマンドを用いた -10-

4. 分析 (1) 傾向スコアの推定とバランスのチェック 次の表 2 は 処置群と対照群における共変量について マッチング前後でどれだけバイ アスが減少したかを示したものであるここでは kernel マッチングによる結果のみを示す 表 2 kernel マッチング前後の共変量のバランスのチェック mean bias(%) median bias(%) p>chi2 男性 マッチング前 8.0 6.5 0.000 マッチング後 4.2 3.3 0.115 女性 マッチング前 7.2 5.7 0.000 マッチング後 4.5 4.0 0.000 まず 男性については マッチング前には処置群と対照群で平均して 8.0% 存在した先行変数のバイアスが マッチング後には 4.2% まで減少した カイ 2 乗値に着目した場合でも 2 群の差は統計的に有意ではなくなっている 女性については マッチング前には処置群と対照群で平均して 7.2% 存在した共変量のバイアスが 4.5% まで減少した 減少の割合に注目すると 男性よりも小さく またカイ 2 乗値に注目した場合でも まだ統計的に有意と言える差が残っている しかし 先行研究ではバイアスが 5% 以下となっていればよいと指摘するものもあり おおむね傾向スコアの推定はうまくいっていると考えることができるだろう 次に 下の図は処置群と対照群における傾向スコアの分布を示したものである 傾向スコアのもっとも右端では 処置群のサンプルしか存在していない また 左端の方ではゼロではないものの 処置群が少なくなっている 上述したように 共変量のオーバーラップが存在する比較のみを行えるのが 傾向スコアマッチングによる分析の強みの 1 つである -11-

時 t 値はモデル 1 よりも小さくなり 4.89 となっているものの なお 2 を大きく超えている モデル 3 は NN マッチングによる推定結果である OLS によるモデル 2 に比べ ATT 標準誤差ともに大きく推定されている t 値は 3.72 であり モデル 2 よりは小さくなっている モデル 4 は Radius matching による推定結果である radius マッチングは一定の傾向スコアの範囲である caliper の中にないケースはマッチングに用いないため 処置群のケースがモデル 3 よりもやや少なくなっている ATT は NN マッチングによるモデル 3 よりもやや小さく 標準誤差もやや小さくなっている モデル 5 は kernel マッチングによる推定結果である モデル 4 よりも ATT 標準誤差ともに小さくなっており t 値はモデル 3,4 よりも大きくなっている 以上より OLS マッチングのいずれも単純推定値のバイアスを減少させることが示された また マッチングによる推定値は総じて OLS よりも ATT 標準誤差の双方をより大きく推定している しかし モデル 1 から 5 のいずれにおいても t 値は 2 を大きく超えており 朝食習慣による中 3 時成績への影響が統計的に有意なものであることが確認された 表 4 朝食習慣の中 3 時成績へ ATT の推定値 ( 女性 ) ATT S.E. T-stat Treated N Untreated N モデル1(Naive) 0.438 0.072 6.12 969 295 モデル2(OLS) 0.305 0.072 4.24 973 296 モデル3(NN) 0.313 0.102 3.08 942 295 モデル4(Radius) 0.326 0.085 3.84 942 295 モデル5(Kernel) 0.320 0.082 3.92 942 295 注 1: モデル3-5は common supportに含まれるサンプルのみを用いている 注 2:NN matchingにおいては neighborの数は1とし replacementをありとした 注 3:Radius matchingにおいては caliperの値は0.01に設定した 注 4:Kernel matchingにおいては Gaussian kernelを用い bandwidth は0.05に設定した 次に 表 4 は女性の中 3 時成績の推定結果を示している モデル 1 は表 3 と同様に 先行変数を考慮しない単純推定値である 男性の場合よりも推定値は小さいものの 0.438 であり t 値は 6.12 を示している モデル 2 は OLS により先行変数を統制した場合の推定結果である モデル 1 より ATT は小さくなっており 30.4%(=(0.438-0.305)/0.305*100) 減少した モデル 3 から 5 はマッチングによる推定値である 男性の場合と同様に マッチングの推定値は OLS に比べて ATT が大きくなり 標準誤差も大きくなる傾向が見られる しかし 男性の場合と比べると OLS との ATT の差は小さくなっている これまでは 15 歳時の朝食習慣を処置変数とし 中 3 時の成績を従属変数とした 次に -13-

教育年数を従属変数とした推定結果を示す 表 5 朝食習慣の教育年数へ ATT の推定値 ( 男性 ) ATT S.E. T-stat Treated N Untreated N モデル1(Naive) 1.170 0.136 8.59 641 386 モデル2(OLS) 0.768 0.131 5.86 647 386 モデル3(NN) 0.808 0.230 3.51 640 386 モデル4(Radius) 0.912 0.183 4.98 625 386 モデル5(Kernel) 0.926 0.167 5.54 640 386 注 1: モデル3-5は common supportに含まれるサンプルのみを用いている 注 2:NN matchingにおいては neighborの数は1とし replacementをありとした 注 3:Radius matchingにおいては caliperの値は0.01に設定した 注 4:Kernel matchingにおいては Gaussian kernelを用い bandwidth は0.05に設定した 表 5 は 男性について従属変数に教育年数を用いた場合の推定結果である モデル 1 は単純推定値であり 1.170 が得られた すなわち 朝食習慣があったことによって 処置群における教育年数は平均して 1.170 年高くなっている モデル 2 は OLS により先行変数を統制した結果である 結果は 0.768 であり モデル 1 よりもかなり小さくなっている しかし t 値は 5.86 と大きくなっている モデル 3 から 5 はマッチングによる推定値である NN マッチングによる推定値が最も小さく また標準誤差も NN マッチングによるものが最も大きく推定された しかし いずれのモデルにおいても t 値は 2 を大きく超えており 統計的に有意な結果が確認された 表 6 朝食習慣の教育年数へ ATT の推定値 ( 女性 ) ATT S.E. T-stat Treated N Untreated N モデル1(Naive) 0.464 0.109 4.25 969 295 モデル2(OLS) 0.280 0.100 2.80 973 295 モデル3(NN) 0.214 0.156 1.37 942 295 モデル4(Radius) 0.180 0.132 1.36 942 295 モデル5(Kernel) 0.209 0.129 1.63 942 295 注 1: モデル3-5は common supportに含まれるサンプルのみを用いている 注 2:NN matchingにおいては neighborの数は1とし replacementをありとした 注 3:Radius matchingにおいては caliperの値は0.01に設定した 注 4:Kernel matchingにおいては Gaussian kernelを用い bandwidth は0.05に設定した 表 6 は女性について 教育年数を従属変数に用いた場合の推定結果である これまでと同様にして モデル 1 は単純推定値であり 0.464 を示している すなわち 15 歳時の朝食習慣があったことによって 処置群の教育年数は平均して 0.464 年高くなっている モデル 2 は OLS の推定結果であり 係数は 0.280 が得られた t 値は 2.80 である モデル 3 から 5 は マッチングによる推定結果である 興味深いことに これまでとは -14-

異なり OLS よりもマッチングによる ATT の推定値の方がいずれも小さくなっている 標準誤差はこれまで通り マッチングの方が大きい 結果として モデル 3 から 5 はいずれも t 値は 2 を下回っている すなわち マッチングによる推定値では 女性における朝食習慣の教育年数への効果は統計的に有意ではないということが確認された 以上の結果をまとめると 次のようになる 中 3 時成績に対しては 朝食習慣は男女いずれにおいても正の有意な効果が確認されたが 教育年数に対しては男性のみで正の有意な効果が見られた (3) 感度分析の結果 上述したように 傾向スコアによるマッチングの推定値は strong ignorability の仮定の下で 平均因果効果としての意味を持つ すなわち 観察されない要因が処置変数に影響を与えていた場合には 推定値はバイアスのかかったものになる しかし strong ignorability は成立しているかどうかがデータから検証が不可能であり またしばしば強い仮定である よって 次に感度分析による観察されない要因に対する頑健性を検証する 表 7 感度分析の結果 中 3 時成績 ( 男性 Radius) 教育年数 ( 男性 Radius) γ 95% CI γ 95% CI 1 0.369 0.585 1 0.750 1.137 1.1 0.313 0.643 1.1 0.650 1.250 1.2 0.257 0.694 1.2 0.563 1.342 1.3 0.214 0.744 1.3 0.489 1.418 1.4 0.168 0.786 1.4 0.411 1.500 1.5 0.129 0.823 1.5 0.345 1.583 1.6 0.090 0.861 1.6 0.284 1.650 1.7 0.053 0.893 1.7 0.231 1.719 1.8 0.017 0.929 1.8 0.175 1.765 1.9-0.008 0.957 1.9 0.125 1.821 2-0.044 0.993 2 0.075 1.875 2.1-0.071 1.014 2.1 0.030 1.917 2.2-0.100 1.042 2.2-0.015 1.965 2.3-0.129 1.063 2.3-0.063 2.000 2.4-0.150 1.089 2.4-0.103 2.042 2.5-0.177 1.112 2.5-0.143 2.083 表 7 は それぞれ正に有意な朝食習慣の効果が見られた 男性における中 3 時成績 教育年数を従属変数とした場合の radius マッチングを用いた結果に対する感度分析の結果である まず 中 3 時成績に対する結果である 式 (10) におけるγ すなわち処置群への割り当てに観察されない要因が与える影響の大きさを変えていった場合に ATT の 95% 信頼区間がどのように変化するかが示されている γが 1.8 から 1.9 に変わった際に 95% -15-

信頼区間がマイナスの値を含むようになっていることが分かる すなわち 観察されない要因 U が処置群への割り当てのオッズ比に 1.9 以上の大きさで影響している際には 観察された朝食習慣の ATT について 帰無仮説は棄却できないということを意味する この大きさについて判断する方法として 他の共変量が処置変数への割り当てに与える影響との比較がしばしばなされる 例えば 傾向スコアの推定に用いた母親学歴について 中卒に対する大卒の処置変数への割り当てのオッズ比は 1.22 であった ( 結果の表は省略 ) 上記の 1.9 というのはこれよりもかなり大きい 表 7 の右側は 教育年数を従属変数とした場合の結果である 同様にして 95% 信頼区間がマイナスの推定値を含むγの大きさを確認すると 2.1 から 2.2 の間ということになる すなわち 中 3 時成績を従属変数とした場合よりも 教育年数の方が観察されない要因に対しては頑健な結果であるということが言える また いずれにせよ 処置群への割り当てのオッズ比が 1.9 以上というのは大きな影響であり 朝食習慣の教育達成への因果効果は観察されない要因が存在してもなお 統計的に有意なものであると判断される 5. 結論 本稿では 傾向スコアによるマッチングを用いて 朝食摂取習慣が教育達成に与える因果効果の検証を行った 分析の結果 男性の中 3 時成績 教育年数 女性の中 3 時成績に対して 朝食摂取習慣の有意なプラスの影響が確認された また 男性の中 3 時成績と教育年数については 感度分析を用いて観察されない変数の影響を考慮してもその効果は大きいものだった すなわち 朝食摂取習慣と教育達成の双方に対して影響している 観察されない要因があるとすれば その影響は分析で含められた社会階層の変数よりも処置変数に対して大きな影響を及ぼしていなければならない 朝食摂取習慣による教育達成への独自の影響が頑健に存在することが示唆されたが 朝食摂取の習慣が子どもの健康状態を通じて教育達成に影響するのか あるいは朝食摂取が教育達成に望ましい他の行動を誘発するような身体化された文化資本として働くのかなど そのメカニズムについては本研究からは十分に明らかにすることができないという問題点は残る Moffitt(2005) で指摘されるように 本稿で述べた因果効果分析の枠組みにおいては処置変数の従属変数への影響は外生的と見なされており 仮に何らかの媒介メカニズムが存在していたとしても reduced-form による推定しかできないためである この課題を乗り越える方法としては 1 つには本稿で用いた潜在結果モデルにおいて媒介変数を取り入れるアプローチが考えられる そのような試みとしては Imai, Keele, and Yamamoto(2010) や Hong and Nomi(2012) などが挙げられる もし 朝食摂取習慣とその後の教育達成の間の関係を 学力の向上がどれだけ媒介しており それによって説明され -16-

ない朝食摂取習慣の 直接効果 がどれだけ存在しているのかを明らかにすることができれば 朝食摂取による認知的な成長への効果と 教育達成へのそれ以外の望ましい振る舞いへの影響 ( 例えば 教師からの好ましい評価 ) を分離することができるかもしれない あるいは 因果効果の異質性 (Brand and Xie 2010 など ) に注目するという可能性が考えられる すなわち 朝食摂取をしやすい層 ( 傾向スコアの値が大きい層 ) と朝食摂取をしにくい層 ( 傾向スコアの値が小さい層 ) で 因果効果の大きさが異なる場合に 因果メカニズムを明らかにする可能性が得られる場合がある 例えば 朝食摂取をしやすい層において朝食を摂取しなかった場合の教育達成への負の影響が大きいというような関係が見られた際に それは社会経済的に恵まれた層の中での相対的剥奪や 教師からのスティグマを与えられるためだというようなメカニズムが想定できるかもしれない 13 また 本研究の対象では上述した SUTVA の条件 すなわち潜在的な従属変数が処置変数の割り当てメカニズムに依存しないという仮定が厳密には成り立たない可能性にも注意すべきである 処置変数である朝食摂取については ある個人が朝食を摂取するかどうかが それ以外の人々の朝食の摂取に影響されることはあまりないかもしれない すなわち処置変数の割り当ての独立性が担保される可能性は高い しかしながら 従属変数である中学校における校内成績とは他の人々との位置関係で決まる相対的な評価であるし 最終学歴は他の個人との競争が存在する ゆえに 他の個人が朝食摂取の習慣を持つことが ある個人の潜在的な従属変数に影響しうるのである この仮定の妥当性の度合いによって 推定された因果効果は一般的な解釈を持ち得なくなる 14 以上のような問題点は残るものの 本研究で示した分析枠組みと朝食摂取習慣の効果の大きさは この分野の研究に対して一定の貢献を行えたものと考えられる 引用文献 Angrist, Joshua D., Guido W. Imbens, and Donald B. Rubin, 1996, "Identification of Causal Effects Using Instrumental Variables," Journal of the American Statistical Association, 91(434): 444-55. Austin, Peter C., 2007, "A Critical Appraisal of Propensity-Score Matching in the Medical Literature between 1996 and 2003," Statistics in Medicine, 27(12): 13 ただし Rosenbaum and Rubin(1984) で提唱されている 傾向スコアの層別に因果効果の大きさを検討した予備的な分析を用いた結果 大きな差異は見られなかった 14 このように SUTVA が因果効果の推定に要求されることが 政策評価の問題を困難にさせる すなわち ある政策による介入を行うことは処置変数の割り当てを変更するということであり それによって個人の潜在的な従属変数の値が変わってしまうかもしれないからである 潜在結果モデルの下における政策評価の問題については Heckman(2005) などを参照されたい -17-

2037-49. Becker, Sascha O. and Andrea Ichino, 2002, "Estimation of Average Treatment Effects Based on Propensity Scores," Stata Journal, 2(4): 358-77 Becker, Sascha O and Marco Caliendo, 2007, "Sensitivity Analysis for Average Treatment Effects," Stata Journal, 7(1): 71-83. Bia and Mattei, 2008, "A Stata Package for the Estimation of the Dose-Response Function through Adjustment for the Generalized Propensity Score," Stata Journal 8(3): 354-73. Black, Dan A. and Jeffrey A. Smith, 2004, "How Robust is the Evidence on the Effects of College Quality?: Evidence from Matching," Journal of Econometrics, 121(1-2): 99-124. Bound, John, David A. Jaeger, and Regina M. Baker, 1995, "Problems with Instrumental Variables Estimation When the Correlation between the Instruments and the Endogenous Explanatory Variable is Weak," Journal of the American Statistical Association, 90(430): 443-50. Brand, Jennnie E. and Charles N. Halaby, 2006, "Regression and Matching Estimates of the Effects of Elite College Attendance on Educational and Career Achievement," Social Science Research, 35(3): 749-70. Brand, Jennnie E. and Yu Xie, 2010, "Who Benefits Most from College?: Evidence for Negative Selection in Heterogeneous Economic Returns to Higher Education," American Sociological Review, 75(2): 273-302. Caliendo, Marco and Sabine Kopeing, 2008, "Some Practical Guidance for the Implementation of Propensity Score Matching," Journal of Economic Surveys, 22(1): 31-72. DiPrete, Thomas A. and Markus Gangl, 2004, "Assessing Bias in the Estimation of Causal Effects: Rosenbaum Bounds on Matching Estimators and Instrumental Variables Estimation with Imperfect Instruments," Sociological Methodology, 34(1): 271-310. Harding, David J., 2003, "Counterfactual Models of Neighborhood Effects: The Effect of Neighborhood Poverty on Dropping Out and Teenage Pregnancy," American Journal of Sociology, 109(3): 676-719. Heckman, James J., 2005, "The Scientific Model of Causality," Sociological Methodology, 35(1): 1-97. Hirano, Keisuke and Guido W. Imbens, 2004, The Propensity Score with Continuous -18-

Treatments, Andrew Gelman and Xiao-Li Meng eds., Applied Bayesian Modeling and Causal Inference from Incomplete-Data Perspectives, New York: Wiley, 73-84. Holland, Paul W., 1986, "Statistics and Causal Inference," Journal of the American Statistical Association, 81(396): 945-60. Hong, Guanglei and Stephen W. Raudenbush, 2008, "Causal Inference for Time-Varying Instructional Treatments," Journal of Educational and Behavioral Statistics, 33(3): 333-62. Hong, Guanglei and Takako Nomi, 2012, "Weighting Methods for Assessing Policy Effects Mediated by Peer Change," Journal of Research on Educational Effectiveness, 5(3): 261-89. Imai, Kosuke, Luke Keele and Teppei Yamamoto, 2010, "Identification, Inference and Sensitivity Analysis for Causal Mediation Effects," Statistical Science, 25(1): 51-71. 石田浩,2012, 社会科学における因果推論の可能性 理論と方法 27(1): 1-18. 苅谷剛彦 志水宏吉編,2004, 学力の社会学 調査が示す学力の変化と学習の課題 岩波書店. Moffitt, Robert, 2005, "Remarks on the Analysis of Causal Relationships in Population Research," Demography, 42(1): 91-108. 西本裕輝,2004, 学力の規定要因再考 中 高生調査に基づいた試行的分析 人間科学 13: 89-107. Powell, Christine A., 1998, "Nutrition and Education: A Randomized Trial of the Effects of Breakfast in Rural Primary School Children," American Journal of Clinical Nutrition, 68(4): 873-9. Rosenbaum, Paul R., 2002, Observational Studies 2 nd ed., New York: Springer. Rosenbaum, Paul R and Donald B. Rubin, 1983, "The Central Role of the Propensity Score in Observational Studies for Causal Effects," Biometrika, 70(1): 41-55., 1984, "Reducing Bias in Observational Studies Using Subclassification on the Propensity Score," Journal of the American Statistical Association, 79(387): 516-24. Rubin, Donald B., 1974, "Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies," Journal of Educational Psychology, 66(5): 688-701.], 1980, "Randomization Analysis of Experimental Data: The Fisher Randomization Test Comment," Journal of the American Statistical Association, 75(371): 591-3. -19-

Smith, Jeffrey A. and Petra E. Todd, 2005, "Does Matching Overcome LaLonde's Critique of Nonexperimental Estimators?," Journal of Econometrics, 125: 305-53. Sobel, Michael E., 2006, "What Do Randomized Studies of Housing Mobility Demonstrate: Causal Inference in the Face of Interference," Journal of the American Statistical Association, 101(476): 1398-407. 東京大学社会科学研究所,2009, 働き方とライフスタイルの変化に関する全国調査 2009 集計結果 (http://ssjda.iss.u-tokyo.ac.jp/panel/pr/09pressrelease.pdf). Xie, Yu, 2013, "Population Heterogeneity and Causal Inference," Proceedings of the National Academy of Sciences of the United States of America, 110(16): 6262-8. Yamamoto, Yoko and Mary C. Brinton, 2010, "Cultural Capital in East Asian Educational Systems: The Case of Japan," Sociology of Education, 83(1): 67-83. -20-

東京大学社会科学研究所パネル調査プロジェクトについて 労働市場の構造変動 急激な少子高齢化 グローバル化の進展などにともない 日本社会における就業 結婚 家族 教育 意識 ライフスタイルのあり方は大きく変化を遂げようとしている これからの日本社会がどのような方向に進むのかを考える上で 現在生じている変化がどのような原因によるものなのか あるいはどこが変化してどこが変化していないのかを明確にすることはきわめて重要である 本プロジェクトは こうした問題をパネル調査の手法を用いることによって 実証的に解明することを研究課題とするものである このため社会科学研究所では 若年パネル調査 壮年パネル調査 高卒パネル調査の3つのパネル調査を実施している 本プロジェクトの推進にあたり 以下の資金提供を受けた 記して感謝したい 文部科学省 独立行政法人日本学術振興会科学研究費補助金基盤研究 S:2006 年度 ~2009 年度 2010 年度 ~2014 年度 厚生労働科学研究費補助金政策科学推進研究 :2004 年度 ~2006 年度 奨学寄付金株式会社アウトソーシング ( 代表取締役社長 土井春彦 本社 静岡市 ):2006 年度 ~2008 年度 東京大学社会科学研究所パネル調査プロジェクトディスカッションペーパーシリーズについて 東京大学社会科学研究所パネル調査プロジェクトディスカッションペーパーシリーズは 東京大学社会科学研究所におけるパネル調査プロジェクト関連の研究成果を 速報性を重 視し暫定的にまとめたものである