第3章 離散選択分析

Similar documents
Probit , Mixed logit

ビジネス統計 統計基礎とエクセル分析 正誤表

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

様々なミクロ計量モデル†

基礎統計

Microsoft PowerPoint - 資料3 BB-REVIEW (依田構成員).ppt

Microsoft Word - 補論3.2

Microsoft PowerPoint - 資料04 重回帰分析.ppt

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

スライド 1

Microsoft PowerPoint - sc7.ppt [互換モード]

統計的データ解析

Microsoft Word - å“Ÿåłžå¸°173.docx

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - e-stat(OLS).pptx

カイ二乗フィット検定、パラメータの誤差

スライド 1

EBNと疫学

. イントロダクション 06 年の電力自由化に伴い, すべての消費者が自由に電力会社や料金プランを選べるようになった. しかし依然として従来の規制料金から自由料金へ乗り換える人は少ない. こうした行動は, 料金プランを切り替えた際に自分が得をするのか, 損をするのかが把握できていないため, 切り替え

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

PowerPoint プレゼンテーション

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

講義「○○○○」

日心TWS

Microsoft Word - Time Series Basic - Modeling.doc

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

1.民営化

Microsoft Word - BB10DD.doc

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

情報工学概論

ベイズ統計入門

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 7依田高典 ppt[読み取り専用]

memo

13章 回帰分析

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

<4D F736F F D208CF68BA48C6F8DCF8A C30342C CFA90B68C6F8DCF8A7782CC8AEE967B92E8979D32288F4390B394C529332E646F63>

PowerPoint プレゼンテーション

Microsoft PowerPoint - ch04j

横浜市環境科学研究所

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

Microsoft PowerPoint - Econometrics pptx

スライド 1

スライド 1

PowerPoint プレゼンテーション

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

Microsoft Word - reg2.doc

PowerPoint Presentation

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word doc

要旨 携帯電話 スマートフォン タブレット PC の需要代替性 2 定性的な傾向 現在利用では 携帯端末が多いが 次回買い換え時には スマートフォンのシェアが上がる ただし 直ちに移行が進むわけではない ( p.4) 用途別に見た移動体端末の利用意向では 通話 メール 電子マネーのような基本サービス

Microsoft Word - thesis.doc

Microsoft PowerPoint - H21生物計算化学2.ppt

PowerPoint プレゼンテーション

Microsoft Word - Stattext13.doc

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft Word - eviews6_

モジュール1のまとめ

Microsoft PowerPoint - Statistics[B]

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft Word - Stattext12.doc

ボルツマンマシンの高速化

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

社会保険料の賃金への影響について

Microsoft Word - NumericalComputation.docx

生命情報学

データ解析

Microsoft PowerPoint - statistics pptx

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

布に従う しかし サイコロが均質でなく偏っていて の出る確率がひとつひとつ異なっているならば 二項分布でなくなる そこで このような場合に の出る確率が同じであるサイコロをもっている対象者をひとつのグループにまとめてしまえば このグループの中では回数分布は二項分布になる 全グループの合計の分布を求め

Microsoft PowerPoint - 10.pptx

パソコンシミュレータの現状

Microsoft Word - reg.doc

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

サーバに関するヘドニック回帰式(再推計結果)

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

青焼 1章[15-52].indd

景気指標の新しい動向

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft Word - Chap17

Microsoft PowerPoint - 基礎・経済統計6.ppt

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - appendix_b

評価点の差と選択率 実際には ほとんど評価点が同じときは, どちらも選択される可能性がある 評価点の差が大きいときは, 片方しか選ばれない. A が圧倒的に劣る A が選ばれることはほとんどない 選択肢 A が選ばれる可能性 0 つは同じ魅力 0% ずつ A が圧倒的に良いほとんど A だけが選ばれ

Microsoft PowerPoint - mp11-06.pptx

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

2014 BinN 論文セミナーについて

第7章

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

ミクロ経済学Ⅰ

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

SAP11_03

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

喨微勃挹稉弑

Transcription:

ブロードバンド ビッグバンの経済学 京都大学大学院経済学研究科依田高典 V.1.1 10/25/2005 第 3 章離散選択分析 本章では本書で用いられる離散選択分析の必要最低限の基本を初心者にも判りやすく紹介する ここでは離散選択分析を次の項目に分けて解説する ランダム効用理論 条件付ロジット モデル 入れ子ロジット モデル ミックスド ロジット モデル 顕示選好データと表明選好データ コンジョイント分析こうしたトピックの研究は 1920 年代に始まり 1970 年代に大きく花開き 2000 年にはマクファデン (D.McFadden) 教授とヘックマン (J.Heckman) 教授がノーベル経済学賞を受賞した コンピューターとシミュレーションの発達により今なお技術革新が進行中で 一昔前では不可能だった分析も可能になっている経済学のフロンティアの一つである 従ってそのような研究の最先端を初心者にも判りやすく紹介することは困難であるが 幸いなことに近年優れた三冊の教科書 J.J. Louviere, D.A. Hensher, and J. Swait (2000) Stated Choice Methods, Cambridge University Press. K. Train (2003) Discrete Choice Methods with Simulation, Cambridge University Press. D.A. Hensher, J.M. Rose, and W.H. Greene (2005) Applied Choice Analysis, Cambridge University Press. が相次いで出版され 離散選択分析の基本から発展まで網羅している しかしながら三著とも大変な力作であり 初学者にとっては一冊を読み通すだけでも大変であろう そこで本章は離散選択分析のエッセンスを判りやすくまとめる形で 必要最低限の内容が判るように工夫している 計量経済分析の推定結果を解釈するだけなら 必ずしも高度な数学的知識は必要なく 数式にはその都度言葉による説明も付けているので そこを拾い読みするだけでも良い また初学者は星印 (*) の付いている項は省略して差し支えない 1 1 * の数は難易度を表す * は詳細は除いて一読することを勧める ** は省略しても差し支えない 1

3.1 ランダム効用理論 (RUT) 本節では離散選択分析の基礎になるランダム効用理論を解説する (Louviere et al. 2000 Ch.3; Train 2003 Ch.2; Hensher et al. 2005 Ch.3 参照 ) そもそも離散的選択とは何かから説明を始めよう 離散的選択 (discrete choice): 選択集合の中から一つの選択肢を選ぶこと 選択集合 (choice set): 選択者が選択をする選択肢の集合のこと 従って離散選択モデルとは 選択肢の様々な属性に応じて選択者が選択集合の中からどの選択肢を選ぶかという行動に関する分析である 選択集合は次のような特徴を持たなければならない 選択肢は互いに排他的 (mutually exclusive) である 選択集合は網羅的 (exhaustive) である 選択肢の数は有限 (definite) である 例えばブロードバンド インターネット接続サービスを考えよう 第 1 章でも見たとおり 日本の代表的なブロードバンド サービスは ADSL CATVインターネット そして FTTHである ここで選択肢集合をADSL CATVインターネット FTTHと定義し 選択者はその中からただ一つの選択肢を選ぶ 実際にはあるユーザーは自宅でADSLと CATVインターネットを併用しているかもしれないが ここではそのような可能性は考えない 2 またあるユーザーはここで想定された選択集合に含まれていない選択肢 例えば無線 LANを用いているかもしれないが そのような可能性も考えない 選択者が選択肢から得る満足のことを効用 (utility) と呼ぶ ランダム効用理論 (random utility theory RUT) では 効用を二つの項に分ける 3 分析者が観察可能な代表的効用 (representative utility) 分析者が観察不可能な誤差項 (random component) RUT では選択者 n が選択肢 i を選ぶ確率を 選択集合の全ての選択肢に対して選択肢 j と i の誤差項の差が選択肢 i と j の代表的効用の差よりも小さい確率と考える 選択者 n が J 選択肢の中から一つ選ぶ 選択者 n が選択肢 j から得る効用を U, j = 1... J と書く 選択者 n が選択肢 i を選ぶ必要十分条件は 選択肢 i から得る効 用が選択肢 j から得る効用よりも大きいこと ( U > U, i j) である 研究者が観察でき ni 2 そのような可能性を考える場合 ADSLとCATVインターネットを併用することを一つの独立した選択肢として扱う 3 RUTは心理学の文脈ではThurstone (1927) 経済学の文脈ではMarshack (1960) に よって展開された 2

る代表的効用は選択肢固有の属性 x と個人特有の属性 s n に依存すると考え 代表 的効用をV = V( x, sn) と書く また誤差項をε とし 選択者の効用をU = V + ε と 書く 誤差項ベクトル ε n =< ε n1,...,ε nj > の結合分布関数を f ( ε ) と置けば 選択者 n が 選択肢 i を選ぶ選択確率は Pni = Pr( Uni > U ) = Pr( Vni + εni > V + ε ) = Pr( ε ε < V V ) ni ni = I( ε ε < V V ) f( ε ) dε, j i ni ni n n n (3.1) と書ける (Train 2003 pp.18-19 参照 ) ここで I () は括弧の式が真であれば 1 それ以外は 0 となる指示関数である 以上が RUT の主要内容である 代表的効用は しばしばパラメータに関して線形 K j k = 1 kj k V = α + β x (3.2) と仮定される ここで x k は選択肢 j 固有の属性 α j は選択肢固有の定数項 β kj は選 択肢固有の係数パラメータである もしも定数項と係数パラメータが選択肢共通である と仮定するならば 添え字 j を省略して α β と書けばよい k 3.1.1 RUT の例示 本項では RUT を例示する 選択肢を ADSL と FTTH の二つ 説明変数を価格 (PRICE) と通信速度 (SPEED) の二つとする この時 ADSL と FTTH の線形代表的効用は VADSL = α ADSL + β1adslpriceadsl + β2adslspeedadsl (3.3) V = α + β PRICE + β SPEED FTTH FTTH 1FTTH FTTH 2FTTH FTTH と書ける FTTH を選ぶ確率はV FTTH + ε FTTH > V ADSL + ε ADSL となる確率であるから P = Pr( V + ε > V + ε ) (3.4) FTTH FTTH FTTH ADSL ADSL と書ける ADSL を選ぶ確率 P ADSL についても同様である 3

3.2 条件付ロジット (CL) モデル 本節では最も基本的な離散的選択モデルである条件付きロジット (conditional logit CL) モデルを解説する (Louviere et al. 2000 Ch.3; Train 2003 Ch.3; Hensher et al. 2005 Ch.10,11 参照 ) 4 CL モデルの条件とは 誤差項が独立かつ同一に分布すること (independently and identically distributed IID) である 換言すると IID 条件は 全ての選択肢の効用の誤差 項がそれぞれの選択肢の誤差項から独立であり 誤差項がそれぞれ同じ分布を持つことを意味する このIID 条件から後で説明する無関係な選択肢からの独立性 (independence of irrelevant alternative IIA) という仮定が派生する 5 CL モデルでは 誤差項 ε が IID 条件に従うこと つまり極値 (extreme value EV) 分 布に従うことを仮定する この時 ε の密度関数と分布関数はそれぞれ e e f( ε ) = e e, F( ε ) = e (3.5) ε ε と書ける EV 分布の差 ε = ε εni はロジスティック分布 ε ε ε F( ε ) = e /(1 + e ) (3.6) に従う 従って CL モデルの選択確率 ( 以下 CL 選択確率 ) は Vni e Pni = I( ε εni < Vni V ) f( ε) dε = j V e, i (3.7) と書ける さらに代表的効用が線形である場合 CL 選択確率は P ni α K j+ k = 1 β x kj k e =, j i (3.8) α K j+ k 1 β x kj k e = j と書ける (Train 2003 pp.38-40 参照 ) j 3.2.1(*) IIA 条件 4 CL モデルは多項ロジット (multinomial logit MNL) モデルと呼ばれることも多い 5 IIA 仮定からロジット モデルを導いたのは Luce (1959) である IIA 仮定を RUT に対応させたのは Marshak (1960) である ロジット モデルを極値分布に対応させたのは Luce and Suppes (1965) である そしてロジット モデルを完成させたのが McFadden (1974) である 4

本項では CL モデルにおける IIA 条件と検定方法について解説する (Hausman and McFadden 1984 参照 ) IIA 条件とは 選択確率の比率が選択集合の他の選択肢の有無にかかわらず一定であることを意味する 正確に言えば IIA 条件は P P ni nk V Vni e / e Vni e = = = e V V nk Vnk e / e e j Vni Vnk j (3.9) として表される つまり選択肢 i と k の選択確率の比が選択肢 i と k 以外の選択肢に全く依存しない 後に見るように IIA 条件は交叉弾力性が一定という仮定も意味する IIA 条件が成立しているかどうかをテストするにはハウスマン テスト (Hausman test) を用いる ハウスマン テストは IIA 条件が成立すれば 選択肢の部分集合を用いた推定値は選択肢の完全集合を用いた推定値から統計的有意に異ならないという性質を利用する 具体的にはハウスマン テストは次のような手順で行う 全ての選択肢を用いて CL モデルの推定値 βu と共分散行列 V u を求める 選択肢の数を落として CL モデルの推定値 β と共分散行列 r V r を求める 1 ハウスマン統計量 [ β β ]'[ V V ] [ β β ] を求める u r r u u r 2 このハウスマン統計量はカイ二乗 ( χ ) 分布に従うので 推定されるパラメータの数だけの自由度を持つ片側 5% の χ 2 臨界値を計算し大小を比較する ハウスマン統計量が χ 2 臨界値よりも大きければ 部分集合 CL モデルの推定値と完全集合 CL モデル推定値は統計的に異なるので IIA 条件は成立していないことになる もしも IIA 条件が成立しないならば IID 条件を緩和したモデルの採用を検討すべきである このトピックは次節以降で扱う 3.2.2(*) CL 弾力性 本項では CL モデルの弾力性 ( 以下 CL 弾力性 ) について説明する 弾力性とは ある説明変数の 1% の変化に関する被説明変数の変化率 (%) を表す 特に離散的選択モデルでは選択確率 ( あるいは加入需要 ) の弾力性を表す (Train 2003 pp.63-64 参照 ) 弾力性には二つの概念がある CL 自己弾力性 (own-elasticity) は 選択肢 i の変数の 1% の変化に関する選択肢 i の選択確率の変化率を表す 選択肢 i の第 k 属性に 関する選択者 n が選択肢 i を選ぶ確率 P ni の弾力性は 5

P P / ni ni Pni Vni Ex = = x (1 ) kni kni Pni x / x x kni kni kni (3.10) = β x (1 P ) 代表的効用が線形( V ki kni ni K = β x ) の場合 ni k = 1 ki kni と書ける CL 交叉弾力性 (cross-elasticity) は 選択肢 j の変数の 1% の変化に関する選択肢 i の選択確率の変化率を表す 選択肢 j の第 k 属性に関する選択者 n が選択肢 i を選 ぶ確率 P ni の弾力性は P P / ni ni P V ni E = = x P k x / x x x k k k k (3.11) = β x P 代表的効用が線形( V kj k K = β x ) の場合 k = 1 kj k と書ける CL 交叉弾力性は選択肢 j だけに依存し選択肢 i に依存していない 従って選択肢 j の属性に関する CL 交叉弾力性は j を除いた選択肢 i で一定となる この交叉弾力性一定条件は CL モデルの IID 条件の帰結であり IIA 条件の異なる表現でもある 3.2.3(*) 最尤推定法 (MLE) 本項では CL モデルの最尤推定法 (maximum likelihood estimation MLE) について説明する MLE とは データを確率的に最も良く説明する推定値を見つける方法であり 次のような考え方に基付く (Louviere et al. 2000 p.43 参照 ) RUT では選択者 n が選択肢 j を選ぶ必要十分条件は 選択肢 j の効用 U が選 択肢 i の効用 U よりも大きいことである ni CL 選択確率を利用して 選択肢 j の効用 U が選択肢 i の効用 U よりも大きい確 率を全ての選択者に関して計算する 簡単に MLE を解説しよう 選択者 n が選択肢 j を選択する確率は Π ni ( P ) と書ける ここで I = 1は選択者 n が選択肢 j を選ぶ時に 1 そうでない時に 0 となる指示関数で ある N 人の選択者が選択肢 j を選ぶ確率を尤度関数 (likelihood function) と呼び j I 6

I L( β ) =Π Π ( P ), n= 1... N, j = 1... J (3.12) n j と書く ここで β はパラメータ ベクトルである 尤度関数の対数を対数尤度関数 (log-likelihood function) と呼び LL( β ) =Σ Σ I ln P, n= 1... N, j = 1... J (3.13) n j と書く 対数尤度関数をパラメータで微分し 最大化の一次条件 dll( β )/ dβ = 0 (3.14) を満たすようなパラメータを見つければよい (Train 2003 pp.64-65 参照 ) 3.2.4(*) 適合度 ( ρ ) 本項では離散選択モデルの適合度であるマクファデンの ρ について解説する ρ ( 擬似 R 2 とも呼ばれる ) とは 離散選択モデルがどの程度データの変動をうまく説明 するかを表す指標である 離散選択モデルは MLE を用いて推定されるので 対数尤度関数がモデル適合度の指標になる LL( β ) を推定されたパラメータにおける対数尤度関数の値 LL(0) を 全てのパラメータをゼロとおいた対数尤度関数の値とし LL( β ) ρ = 1 (3.15) LL(0) と書く ρ は 0-1 区間内の値をとり ρ が大きいほど適合度が高い 従って ρ の大小を 通じて同じデータ 同じ選択集合を持つ複数のモデルの適合度を比較することもできる しかし ρ は最小二乗法の決定係数とは直接比較できず 数値がかなり低めにでる ことに注意しよう 離散選択モデルでは 0.2 の ρ でも十分に高い適合度を表す 6 3.2.5 CL モデルの例示 本項では CL モデルの推定結果のイメージを例示しよう 数字はすべて説明のための 便宜的 なものである 選択肢を ADSL CATV インターネットと FTTH の三つ 説明変数を価格と通信速度の二つとする 記述統計を表 3.1(a) のように表す そこには選択肢毎に選択者数 選択比率 価格平均値 通信速度平均値が記載されている IIA 条件を確認しよう 現在 ADSL 6 MLEの ρ と最小二乗法の R 2 の間ではおおよそ ρ [ 0.1, 0.2, 0.3, 0.4, 0.5]= R 2 [0.3, 0.5, 0.6, 0.8, 0.9] という対応関係が成り立つ (Domenich and McFadden 1975 参照 ) 7

CATV インターネット FTTH の選択比率は 3:1:1 である CATV インターネットが利用 できない場合 ADSL FTTH の選択比率は 3:1 で保存され 選択比率は 75% 25% になる < 表 3.1 挿入 > 推定結果を表 3.1(b) のように表す そこには観察数 LL( β ) LL (0) ρ が記載され ている 離散選択モデルにおいて ρ =0.33 というのは 最小二乗法の R 2 でいうと 0.6 以 上にあたるので モデルの適合度はかなり高い 次に変数 推定値 標準誤差 t 値が 記載されている 変数は ( 基準化のために )CATV インターネットを除いた ADSL FTTH の選択肢固有の定数項 価格と通信速度の選択肢共通のパラメータである 推 定値の符号を見ると 価格の推定値の符号は負 通信速度の推定値の符号は正であると期待されるが 確かに符号条件は満たされている MLE 推定値は漸近的に t テストの性質を満たす 推定値の標準誤差に対する比率が t 値である t 値は変数の推定値が統計的有意にゼロから異なるかどうかを表す 絶対値で見て t 値が 1.96 よりも大きければ 変数の推定値は 5% 水準で統計的に有意である それぞれの変数の t 値を見てみると ADSL 定数項 価格 通信速度は統計的に有意な変数であるが FTTH 定数項は統計的に非有意な変数である 価格や速度の推定値を用いて弾力性や支払意思額 (willingness to pay WTP) を計算する際には推定値の有意性が必要である この点でこの推定結果は良好である 価格に関する需要の弾力性を表 3.1(c) のように表す 列は変化する価格の変数名を表し 行は変化する選択確率の変数名を表す 対角線上の数値は自己弾力性を表す 弾力性は通常絶対値で表示するが 自己弾力性と交叉弾力性が混同されないように 負のままにしている ADSL 自己弾力性は-0.96 なのに対して CATV インターネット自己弾力性は-2.56 FTTH 自己弾力性は-3.2 である 1より小さな弾力性を非弾力的 1 より大きな弾力性を弾力的と呼ぶので ADSL 自己弾力性は非弾力的 CATV インターネット FTTH 自己弾力性は弾力的である 一行目に注目すると ADSL 価格に関する CATV インターネット FTTH 選択確率の交叉弾力性はそれぞれ 1.44 である 交叉弾力性一定条件は CL モデルの IID 条件の帰結である 同様の交叉弾力性一定条件は二行目 三行目でも確認できる 最後に WTP を表 3.1(d) のように表す ここでは代表的効用が線形であることを仮定しているので パラメータ比率がいわゆる限界代替率を表し 通信速度パラメータを価格パラメータで除した比率の絶対値が 1Mbps あたりの金銭的価値を表す 従って 1Mbps あたりの WTP は 0.02/0.0008=25 円となる 3.2.6 CL モデルの限界 8

CL モデルは誤差項に IID 条件を課し その結果 IIA が導出される 実際の無数の選択肢候補の中からある特定の選択肢だけを抽出し選択集合を定義することはやむを得ない単純化である この時 IID 条件が成り立てば 推定結果の統計学的な諸問題を無視して分析できる しかし CL モデルは次のような制約を持っている 嗜好多様性 (taste variation):cl モデルは個人の嗜好の多様性を取り扱えない 代替性パターン (substitution pattern):cl モデルは柔軟な選択肢間代替性パターンを表現できない 系列相関 (serial correlation):cl モデルは時系列上の相関を取り扱えない そこでCL モデルの IID 条件の部分的緩和 さらには完全緩和が研究されてきた 第二の制約を緩和したのが次節で解説される入れ子ロジット モデルに代表される一般化極値モデルであり 全ての制約を緩和したのが次々節で解説されるミックスド ロジット モデルやプロビット モデルである (Train 2003 p.46 参照 ) 3.3 入れ子ロジット (NL) モデル 本節ではCLモデルの代替性パターン制約を緩和した入れ子ロジット (nested logit NL) モデルを解説する(Louviere et al. 2000 Ch.6; Train 2003 Ch.4; Hensher et al. 2005 Ch.13,14 参照 ) 7 入れ子とは 階層的意思決定 互いに排他的な選択集合の部分集合という意味である 8 NLモデルでは 異なる入れ子の選択肢に比べて 同じ入れ子内の選択肢が互いに近似した誤差項を持つ 従ってNLモデルでは入れ子内ではIID 条件が課されるが 入れ子間ではIID 条件が緩和されているので CLモデルよりも柔軟な代替性パターンを表現できる つまりIIA 条件は入れ子内では成立するが 入れ子間では成立しない NLモデルの性質を無関係な入れ子からの独立性 (independence of irrelevant nests IIN) と呼ぶことがある NLモデルでは入れ子毎に包括値 (inclusive value IV) パラメータと呼ばれる変数を加えて推定する インターネット接続サービスを考えると ダイアルアップ ISDN ADSL CATV インターネット FTTHなどの選択肢がある この中で最も通信速度に優れるFTTHと最も通 7 CLモデルのIID 条件を緩和したモデルを一般化極値 (generalized extreme value GEV) モデルと呼ぶ GEVモデルでは誤差項がEV 分布することを仮定しながら 選択肢間で相関することを許している NLモデルは最もよく使われるGEVモデルである 8 NLモデルは選択肢間の誤差項の相関にかかわる選択集合の分割を扱うので 正しくは逐次的意思決定ではなく あくまで同時的意思決定なのであるが 理解のしやすさのために逐次的意思決定のイメージを用いている 9

信速度に劣るダイアルアップの代替性パターン ( 交叉弾力性 ) と FTTHとADSLの代替性パターン ( 交叉弾力性 ) が同じと考えることは不自然である 例えばダイアルアップ ISDNを一つの入れ子と考え ナローバンド カテゴリーとしよう ADSL CATVインターネット FTTHを別の入れ子と考え ブロードバンド カテゴリーとする 選択者が第一段階でナローバンドかブロードバンドを選択し 第二段階で選択された入れ子の中から個別の選択肢を選択する さらにブロードバンド カテゴリーはADSL CATVインターネットの低速度ブロードバンド カテゴリーとFTTHの高速度ブロードバンド カテゴリーとに分割されるかもしれない 以上がNLモデルの骨子である 9 それではNLモデルを解説しよう 10 選択肢 jの集合をk 個の入れ子に分割し B,, 1 L BK で表す NLモデルの誤差項ベクトルをε =< ε,..., 1 ε > とすれば その累 積分布は n nj ε / ( ) ( ) λ k λ k k e j B F ε = e k, k = 1... K (3.16) と書ける ここで λ k は入れ子 kのスケール パラメータと呼ばれ ε, ε nm Bk の場合 ε とε nm の相関度の指標になる λ k が高ければそれらの相関度は低い 上位レベルのス ケール パラメータの下位レベルのスケール パラメータに対する比率をIVパラメータという 11 少なくとも一つのスケール パラメータは 1 に基準化される必要がある 上位レベルのスケール パラメータと下位レベルのスケール パラメータのどちらを基準化するかでNLモデルのランダム効用 (RU) は 2 つのタイプに分けられる (Louviere et al. 2000 pp.165-167 参照 ) ランダム効用モデル タイプ 1(RU1): 下位レベルのスケール パラメータを基準化する ランダム効用モデル タイプ 2(RU2): 上位レベルのスケール パラメータを基準化する RU1 と RU2 のどちらのモデルを採用するかは分析者に委ねられるが RU2 推定値 9 実際には入れ子構造の決定は難しい問題である (Cameron 1982 参照 ) そこでNLモデルではモデルの選択が重要な問題となる 大まかな基準としては (1) 直感的な選択 (2)IVパラメータが持つ入れ子内の選択肢の相関度 (3) モデルの対数尤度関数の比較などが提案されている (Louviere et al. 2000 参照 ) 10 NLモデルの選択確率はDaly and Zachary (1978) McFadden (1978) Williams (1977) によってほぼ同時に証明された 11 RUTに整合的であるためにはIVパラメータが一般に 0-1 区間にある必要がある 10

は高次レベルを含んだ複雑なモデルでも RUT と整合的であることから RU2 の方が望 ましいと言えよう (Hund 1998 参照 ) NL モデルの選択確率 ( 以下 NL 選択確率 ) は P ni V / / ni λ V λ k k λ k 1 ( Σ j B e ) k K V / λk λ l l= 1( j Be ) l e = (3.17) Σ Σ と書ける (Train 2003 pp.83-84 参照 ) NL モデルの推定は CL モデル同様に最尤法を用いるが 最尤法は逐次的でも同時的でも実行できる もしも入れ子のレベルが 2 から 4 程度であれば 完全情報最尤法 (full information maximum likelihood FIML) と呼ばれる同時推定が一般的である 同時推定の方が逐次的に推定するよりも効率的なパラメータ推定値を得ることができる 3.3.1(*) NL 選択確率の分解 本項では NL 選択確率について解説する (3.17) 式で与えられた NL 選択確率を理解するには 入れ子選択確率と選択肢選択確率に分解することが便利である 選択 者 n が入れ子 B 内の選択肢 j を選ぶ時 その代表的効用を入れ子内の選択肢共通 k の属性 W と選択肢固有の属性 Y に分け 効用を nk U = W + Y + ε, j B (3.18) nk k と書く その時 NL 選択確率は P = P P ni ni Bk nbk (3.19) ただし P Yni / λk e =, P Σ ni Bk Y / λk j B e k Wnk + λk IVnk e =, IV Σ nbk K Wnl + λl IVnl l= 1e nk Y / λk ln j B e k = Σ と書ける (Train 2003 pp.85-87 参照 ) 言葉で説明すると P ni は二つの確率に分解でき る P は選択者 n が入れ子 B を選んだという条件のもとで選択肢 i を選ぶ確率であ ni Bk り 選択肢選択確率に関してロジット形式が成立している k P nbk は選択者 n が入れ子 Bk を選ぶ確率であり 入れ子選択確率に関してロジット形式が成立している さらに 11

λkivnkは選択者 n が入れ子 k B 内の選択肢を選んだ時の期待効用を表し IV は包括 nk 値 λ k は IV パラメータである 3.3.2(*) NL 弾力性 本項では NL モデルの弾力性 ( 以下 NL 弾力性 ) を解説する NL 弾力性は選択肢が 同じ入れ子に所属するかどうかで異なる この意味で CL モデルの交叉弾力性一定条 件は部分的に緩和される 線形効用の場合 NL 自己弾力性は 1 E = [(1 P ) + ( 1)(1 P )] β x, i B (3.20) Pni xni ni ni Bk ni λk と書ける 交叉弾力性は 1 E = [ P + ( 1) P ] β x, i, j B (3.21) Pni x Bk λk k と書ける λk 1の場合 CL 弾力性とNL 弾力性は [ ] 内第二項の効果により異なる 12 k λ = 1の場合 CL 弾力性とNL 弾力性は形式的に一致する k 3.3.3 NL モデルの例示 本項では NL モデルの推定結果のイメージを例示しよう 数字はすべて説明のため の 便宜的 なものである 選択肢を ADSL CATV インターネットと FTTH の三つ 説 明変数を価格と通信速度の二つとする NL モデルを適用するに先立って IIA 条件が成立しているかどうかを確認するため CL モデルにハウスマン テストを行う必要がある ADSL CATV インターネット FTTH の選択比率が 3:1:1 である時 CATV インターネットが削除されると IIA 条件によれば ADSL FTTH の選択比率が 3:1 で保存される必要がある しかし例えば CATV インタ ーネットは ADSL と完全な代替性を持つ場合 ADSL FTTH の選択比率が 4:1 となる このような場合 ADSL と CATV インターネットを一つの入れ子と見なし FTTH を別の入 れ子と見なすことができよう そこで CATV インターネット選択肢を落として CL モデルの 推定を行い ハウスマン統計量を導出した 自由度 2 の χ 2 分布の片側 5% 臨界値は 5.99 であるから ハウスマン統計量がその値以上であれば IIA 条件が成立するという 12 従って同じ入れ子に所属する選択肢と異なる入れ子に所属する選択肢の間で交叉弾力性一定条件が緩和される 12

帰無仮説は棄却される 13 ハウスマン テストで IIA 条件が棄却されれば もはや CL モデルの採用は適当では ない そこで第一段階で ADSL CATV カテゴリーか FTTH を選び 第二段階で ADSL CATV カテゴリーを選んだ場合いずれかの選好肢を選ぶという NL モデルを推 定した 表 3.2(b) の NL モデル推定結果を表 3.1(b) の CL モデル推定結果と比較すると モデル適合度を表す ρ が 0.40 に向上している 変数の推定値の符号と統計的有 意性の傾向は CL モデルとそれほど変わらないが 個々の t 値は良くなっている 変数 には IV パラメータが追加されている IV パラメータ推定値は 0-1 区間にあり t 値は統 計的に有意である 表 3.2(c) の NL 弾力性を見ると 交叉弾力性が入れ子の内外の選択肢間で異なり 交叉弾力性一定条件がもはや成立していない 同じ入れ子内にある選択肢 (ADSL と CATV インターネット ) の交叉弾力性が入れ子外の選択肢 (FTTH) の交叉弾力性よりも 高くなっている 14 つまり入れ子内にある選択肢間の需要代替性の方が入れ子外にあ る選択肢間の需要代替性よりも高い < 表 3.2 挿入 > 3.3.4(**) HEV モデル 本項では最も一般的なGEVモデルである分散不均一極値分布 (heteroscedastic extreme value HEV) モデルを紹介しよう HEVモデルは全ての誤差項が可変な極値分布に従うモデルである 15 従ってHEVモデルでは全ての交叉弾力性が自由に決まる NLモデルがIIN 仮定を持っていたのに対して HEVモデルはIIA 条件を完全に緩和したモデルである HEV 選択確率は ( )/ / / [ V ni V + ni j e e ni i ni i Pni j ie ε θ ] e ε θ ε θ = Π e d( ε ni / θi ) (3.22) と書ける (Train 2003 p.96 参照 ) 積分が閉鎖形式(closed form) になっておらず 選択確率に積分記号がそのまま残っている 従って HEV モデルは解析的に解くことができず シミュレーションを用いる必要がある 13 ハウスマン テストでは定数項を落として計算することがある ここでは価格と速度を推定パラメータとしているので 自由度は 2 である 14 FTTH 価格に関するADSLとCATVインターネット選択確率の交叉弾力性は一定である これはIIN 条件を表す 15 実例としてAllenby and Ginter (1995), Bhat (1995), Hensher (1997a, 1998a, b) など参照 13

3.4 ミックスド ロジット (ML) モデル 本節では CL モデルの嗜好多様性 代替性パターン 系列相関の制約を全て緩和 したミックスド ロジット (mixed logit ML) モデルを紹介する (Louviere et al. 2000 Ch.6; Train 2003 Ch.5,6; Hensher et al. 2005 Ch.15,16 参照 ) ML モデルは誤差項に共分散 の多様性を考慮した一般性の高いモデルである ML モデルはランダム パラメータ (random parameter) モデルと呼ばれることもある 16 MLモデルではパラメータ β が確率分布 f ( β ) に従うと仮定する f ( β ) は正規分布 や対数正規分布がよく仮定される 17 パラメータ β を所与とすると 選択者 n が選択肢 i を選ぶ選択確率は Vni ( β ) e L ( β ) = (3.23) ni J V ( β ) e j= 1 とロジット形式を用いて書くことができる パラメータ β が確率的に分布する時 ML モ デルの選択確率 ( 以下 ML 選択確率 ) は f ( β ) 上の L ( β ) の積分となる 従って ML 選 択確率は P = L ( β ) f( β) dβ (3.24) ni ni と書ける (Train 2003 p.138 参照 ) 入れ子内の選択肢に 1 入れ子外の選択肢に 0 となるダミー変数を付けると ML モ デルは NL モデルに似た階層的選択構造を表現できる EV 誤差項の他に 誤差項 K μ n' x k 1 nkd = jk = μ を加える ここで d = 1は選択肢が入れ子 k 内にある時に 1 それ jk ni 以外の時 0 となるようなダミー変数 μ を正規分布 N(0, σ ) とする ダミー変数によっ nk て 分散 σ は入れ子毎に決まるので 入れ子毎に選択肢の相関が異なる さらにダミ ー変数 d jk k を選択肢が交叉するように特定化すれば より複雑な交叉した入れ子構造 k 16 ML モデルの初期の実例として Train et al. (1987a) and Ben-Akiva et al. (1993) がある コンピューターによるシミュレーション手法の発達によって近年 ML モデルは広く用いら れるようになり 実例は Bhat (1998a), Brownstone and Train (1999) Erden (1996) Revelt and Train (1998) Bhat (2000) など多数ある 17 対数正規分布は価格パラメータのように係数が正負いずれかの符号を持つ場合に用いられる 14

も表現できる (Ben-Akiva et al. 2001 参照 ) ML モデルの弾力性 ( 以下 ML 弾力性 ) も f ( β ) 上の積分として表現できる 選択肢 j の第 k 属性が 1% 変化した時 選択肢 i の選択確率の変化率は ni Lni ( β ) Ex ( )[ ] ( ) k = βkl β f β dβ (3.25) P ni と書ける (Train 2003 p.145 参照 ) ML 弾力性は選択肢毎に異なり もはや交叉弾力性 一定条件は成立しない 3.4.1(*) シミュレーション 本項では ML モデルの推定法について解説する ML 選択確率は閉鎖形式ではな いので 推定にはシミュレーションを用いる必要がある θ をパラメータ密度関数の平均や分散を表すパラメータとし パラメータ密度関数を f ( β θ ) とする ML 選択確率 は θ の値に対するシミュレーションを通じて計算される 具体的な計算方法は次の通り である (Train 2003 p.148 参照 ) f ( β θ ) から β を R 回抽出する ( β r, r = 1... R) r β 毎に ( β ) を計算する L ni 1 R Lni ( β ) の平均値 ˆ r Pni = L ( r 1 ni β ) を求める = R シミュレーション選択確率 P は ML 選択確率の不偏推定量であり 抽出回数 R が増 ˆni えるほど分散は減少する シミュレーション対数尤度 (simulated log likelihood SLL) 関 n= 1 j= 1 ni 1 N J 数は d ln Pˆ である ここで選択者 n が選択肢 j を選ぶとき d = それ以外 の時 0 とする 最大シミュレーション尤度 (maximum simulated likelihood MSL) 推定値は SLL を最大化するような β である シミュレーションで用いられる抽出方法であるが ランダム ドロー法とハルトン シークエンス法が代表的である ランダム ドロー (random draw) 法正規分布や一様分布から変数を抽出する方法 (Train 2003 p.208 参照 ) 推定量の計算が簡単なため最も良く利用される しかしランダム ドロー法ではカバーする範囲が偏る危険性と変数が互いに独立なために多くのドロー回数が必要になるという欠点がある 5 選択肢 10 選択肢 1000 サンプル程度の標準的問題では 100 回程度の抽出回数が必要とされる (Louviere et al. 2000 参照 ) ハルトン シークエンス法 15

一連のドローが負の相関を持つような素数を用いたアルゴリズム (Train 2003 p.224 参照 ) 素数 3 を例にとると 先ず 0-1 区間を 1/3 と 2/3 で分割し それらの区間を 1/9 4/9 7/9 さらに 2/9 5/9 8/9 と一定の間隔で細かく分割していく ハルトン シークエンス法の方がランダム ドロー法よりも広い範囲を効率的にカバーできる 100 回抽出ハルトン シークエンスを用いたMSLの方が 1000 回抽出ランダム ドロー法を用いたMSLよりも推定結果が優れることもある (Bhat 2001 参照 ) 18 3.4.2 ML モデルの例示 本項では ML モデルの推定結果のイメージを例示する 数字はすべて説明のための 便宜的 なものである 選択肢を ADSL CATV インターネットと FTTH の三つ 説明変数を価格と通信速度の二つとする ML モデルでは変数をランダムと見なす 重要なのはどの変数をランダムとし どの変数を非ランダムにするかである この問題は分析者の問題意識に依存する ここでは二つの変数をランダムであるとみなし MSL 法を用いる ADSL と CATV インターネットが共通の定数項を持ち それが正規分布に従うと仮定する この結果 ADSL と CATV インターネットの間に NL モデル同様の相関が生れ 柔軟な代替性パターンが表現される 交叉弾力性も選択肢間で異なる 通信速度パラメータが正規分布に従うと仮定する この結果通信速度に関する嗜好多様性がサンプル別に表現できる サンプル毎のWTPを計算することもできる 19 推定結果が表 3.3(b) に掲載されている 説明変数がランダム パラメータと非ランダム パラメータに分かれ ランダム パラメータは平均値と標準偏差が報告されている この分布が嗜好多様性を表す ADSL CATVインターネット定数項は平均 1 標準誤差 0.7 を持つ正規分布である 従って 8% のサンプルが負の係数を持ち 92% のサンプルが正の係数を持つと予想できる 同様に通信速度パラメータは平均 0.02 標準誤差 0.015 を持つ正規分布である 従って 5% のサンプルが負の係数を持ち 95% のサンプルが正の係数を持つと予想される 20 18 しかしハルトン シークエンスには二つの問題がある 一つはまれに例外 (anomaly) が発生すること もう一つは高次元を伴うシミュレーションではハルトン ドローの変数が高度に相関することである 従ってハルトン シークエンスにはさらなる研究が必要とされている ( 詳細はTrain 2003 参照 ) 19 価格パラメータもランダムと仮定できるが WTPは通信速度パラメータの価格パラメータに対する比率であるから 両方のパラメータをランダムにすると数値の解釈が難しくなる 20 速度パラメータが負であるサンプルが存在するというのは直感に反する 速度パラ 16

ML 弾力性が表 3.3(c) に掲載されている ML モデルでは柔軟な代替性パターンが表現可能であり ここでは ADSL と CATV インターネットがランダムに分布する共通定数項を持つと仮定しているので ADSL と CATV インターネットが入れ子になっているように交叉弾力性が選択肢間で異なる < 表 3.3 挿入 > 3.4.3(**) プロビット モデル 本項ではMLモデル同様にCLモデルの全ての制約を緩和する多項プロビット (multinomial probit MNP) モデルを紹介しよう 21 効用関数の誤差項ベクトル ε,, n =< εn 1 L ε > が平均ゼロ 共分散行列 Ω を持つJ 次元正規分布と仮定すると 密度関数は φε ( ) 1 (2 π ) Ω 1 1 n' Ω 2 n = e J /2 1/2 ε ε n (3.26) で与えられる この時 MNP モデルの選択確率 ( 以下 MNP 選択確率 ) は Pni = I( Vni + ε ni > V + ε ) φ ( ε n) d ε n (3.27) と書ける (Train 2003 pp.101-102 参照 ) MNP 選択確率は閉鎖形式とならず (J-1) 次元の積分が残るので 推定には計算負荷の高いシミュレーションが必要になる MNPモデルは全ての変数がランダムかつ変数間の相関も許容するMLモデルと形式的に一致するので 分析者の目的に応じて使い分けが可能である (Louviere et al. 2000 pp.199-204 参照 ) 22 3.5 RP データと SP データ ここまで実際に離散選択分析で用いるデータについては説明してこなかった 本節 メータは全てのサンプルで正の符号を持つと考えるならば 対数正規分布を仮定すべきであろう 21 二項プロビット モデルはThurstone (1927) によって提唱された 近年の選択分析におけるMNPの発展はHausman and Wise (1978) Daganzo (1979) などに負う 重要な先行研究としてはBen-Akiva and Bolduc (1996), Revelt and Train (1998), Bhat (1997a), McFadden and Train (1996), Brownstone, Bunch and Train (1998) が挙げられる 22 MLモデルで変数間の相関を許すには 推定時にコレツキ (Cholesky) 行列を制約しないようにする コレツキ行列 Lとは 行列 AをA=LL のように分解する行列である 17

では 2 種類のデータについて解説する (Louviere et al. 2000 Ch.8,9; Train 2003 Ch.7; Hensher et al. 2005 Ch.4.6 参照 ) 一つは顕示選好(revealed preference RP) データと呼ばれ 実際の市場で観察される選択に基づく もう一つは表明選好 (stated preference SP) データと呼ばれ 仮想的な実験で観察される選択に基づく 先ずRP データから説明する RP データは分析者の市場観察にせよ 選択者のアンケート回答にせよ 現実の選択に基づくデータである 従って現実の制約条件を反映し 実際に選択されたという点で高い信頼性を持つ RUT に従えば RP データは現在の制約条件下での効用最大化行動を表すと考えられるので RP データに基づく推定結果は短期予測に適している 他方で RP データの長所は同時に短所でもある RP データは既存のサービスや技術に関する選好を表すので 仮想的なサービスや技術を予測するような場面では利用できない また一般に変数の変動が乏しく 変数間の相関が観察されるので 優れた推定結果が得られない場合も多い RP データの特質をまとめると次のようになる (Louviere et al. 2000 pp.23-24 参照 ) RP データは現実の市場均衡を表現する RP データは技術制約を所与として扱う RP データは観察可能な選択肢のみを扱う RP データは実際の制度与件や制約条件を考慮に入れている RP データは現実的信頼性と妥当性を持っている RP データは各時点で選択者毎に一データのみ観察可能である RP データが利用できれば RP データを利用することが望ましい しかし実際には RP データが存在しないか 収集に時間と費用がかかることが多い 医療経済学 環境経済学のような分野では市場の組織化が限られているし ブロードバンド サービスのように技術革新が著しい新興分野では RP データがすぐに陳腐化し意味を持たなくなる このような時に分析を諦めてしまうと 分析可能な範囲は極めて限られることになる 長らく経済学は実験のできない学問と見なされてきた 近年では事情が異なる 仮想的市場における選択を通じてデータを収集し それを離散選択モデルで分析することができる SP データは RP データよりも広範囲で柔軟な意思決定問題を扱うことができる 例えば現実には存在しない選択肢や属性をプロファイルに付加したり 現実の技術制約に縛られず属性レベルを変化させたりすることが可能である 従って SP データは長期予測に向いている しかし SP データは仮想的選択実験に基づくので 選択結果が現実の制約条件を反映していないのではないかと懸念される また選択者の回答が分析者の意向に左右されるというフレーミングの問題も指摘されている SP データの特質をまとめると次のようになる (Louviere et al. 2000 pp.23-24 参照 ) SP データは仮想的な意思決定問題を扱う SP データは現実には存在しないようなサービスや技術に関する選好も扱うことができる 18

SP データは製品に商標 (label) がある場合もない場合も処理できる SP データは制度与件や制約条件を十分に考慮していない危険性がある SP データの信頼性は選択者が意思選択の構造 分析者の意図をどの程度理解しているかに依存する SP データは一時点で選択者毎に複数の回答を集めることができる 重要な点は RP データと SP データを比較してどちらが良いか悪いかを議論しているのではないことだ RP データと SP データはそれぞれ互いの弱点を補う利用が可能である ことにブロードバンド サービスのように技術革新が早く RP データの収集が困難な場合には SP データを積極的に利用すべき場面も出てくる RP データと SP データを使い分け あるいは合わせて使い 両面から分析することが重要である 3.5.1(*) RP データと SP データの結合 本項では RP データと SP データの結合について解説する RP データは現実の市場で の選択を反映するという強みを持つが 変数の変動が足りず 多重共線性の影響を受 けやすいという弱みを持つ 他方で SP データは変数の変動や直交性に関して柔軟な 設計が可能という強みを持つが 選択結果の比率が現実の市場シェアを意味しないと いう弱点を持つ そこで RP データと SP データを結合してしまうというのが一つの方策で ある 23 もしも RP データと SP データが同じ属性を持つならば 二つのデータの結合は簡単 にできる しかし両者を結合するにあたって両者のパラメータが同一であるという仮説を検定する必要がある この RP データと SP データの結合テストは次のような手順で行われる (Louviere et al. 2000 pp.244 参照 ) RP データと SP データそれぞれ別々に CL モデルを推定する 対応する対数尤度関数を LL(RP) LL(SP) とする RP データと SP データをプールしたモデルを CL モデルで推定する 対応する対数尤度関数を LL(RP+SP) とする RP データと SP データのパラメータ ベクトルを β とし パラメータ共通仮説 ( βrp βsp = ) のための検定統計量を 2[( LL( RP) + LLSP ( )) LLRP ( + SP)] とする この統計量は漸近的に χ 2 分布に従う 例えば表 3.1 の RP データ CL モデルの対数尤度関数は LL(RP)=-1000 である 次節で紹介するようなコンジョイント分析を実施し SP データ CL モデルの対数尤度関数が LL(SP)=-900 であったとしよう さらに RP データと SP データを結合したプール 23 このような取り組みは Morikawa (1989) Ben-Akiva and Morikawa (1990) Ben-Akiva, Morikawa and Shiroishi (1991) によって発展された 19

データ CL モデルの対数尤度関数が LL(RP+SP)=-1896 であったとしよう この時パ ラメータ共通仮説の統計量は 8 である 自由度 4 の χ 2 分布の片側 5% 臨界値は 9.49 であるから RP データ モデルと SP データ モデル間でパラメータが同一であるという 仮説は棄却されない 従って RP データと SP データを結合することが可能である 3.6 コンジョイント分析 前節で SP データについて解説した 本節では SP データを得るための具体的手法としてコンジョイント (cooint) 分析を解説しよう (Louviere et al. 2000 Ch.4,5,7; Hensher et al. 2005 Ch.4,5,6 参照 ) コンジョイント分析とは 選択者がプロファイルを順序づけるための仮想的市場の分析である また実験の設計 (experimental design) とは 実験で用いられる属性と属性レベルの組み合わせであるプロファイル (profile) を特定化することである 実験を設計するには次のようなステップが必要である (Hensher et al. 2005 Figure 5.1 参照 ) 1. 問題の決定 (problem refinements) 2. 説明変数の決定 (stimuli refinements) 選択肢の特定化 (alternative identification) 属性の特定化 (attributes identification) 属性レベルの特定化 (attributes level identification) 3. 実験の設計の決定 (experimental design consideration) 実験設計のタイプ (types of design) モデルの特定化 (model specification) 実験サイズの縮減 (reducing experimental size) 4. 実験のデザインの生成 (generate experimental design) 5. プロファイルの属性の決定 (allocate attributes to design columns) 主効果か交叉効果か (main effects vs. interactive effects) 6. 選択集合の生成 (generate choice sets) 7. 選択集合のランダマイズ (randomize choice sets) 8. 質問形式の決定 (construct survey instrument) 特にステップ3 の実験設計の決定には解説が必要である 実験設計には全てのプロファイルの組み合わせを網羅する完全要素設計 (full factorial design) 法がある ブロードバンド サービスを例にとって考えよう ここでは価格と通信速度という 2 つの属性を考える それぞれの属性には低 (L) 中(M) 高(H) という 3 レベルがあると仮定する これらのレベルが選択肢間で共通である必要はない ここで完全要素設計法を考えると [ 価格, 通信速度 ] に関して 9 つのプロファイルがある [L,L] [L,M] [L,H] [M,L] [M,M] [M,H] [H,L] [H,M] [H,H] 20

その他実験を設計する上で考えるべきことについて触れていこう コード (code) とは属性レベルにそれぞれ数字を対応させることである コードには 2 つの様式がある 設計コード (design code) とは L=0 M=1 H=2 と数字を割り振っていくやり方である 直交コード (orthogonal code) とは 全ての数字が集計してゼロとなるように L=-1 M=0 H=1 と数字を割り振っていくやり方である 様々な取り扱い上の理由から 足してゼロとなる直交コードを用いる方が望ましい コードの付け方を表 3.4 に例示しておく < 表 3.4 挿入 > 選択肢にラベルを貼るかどうかを決める必要がある 無ラベル実験とは 選択肢に商品ラベルが付けられてなく ただ選択肢 1 2 とのみ表記される ラベル実験とは 選択肢に商品ラベルが付けられていて 例えば ADSL とか FTTH と表記される どちらを採用するかは分析者の目的によるが パラメータの係数値に純粋な興味がある場合には無ラベル実験が 予測や市場シェアに興味がある場合にはラベル実験が望ましい 無ラベル実験とラベル実験を表 3.5 に例示しておく < 表 3.5 挿入 > 実験をデザインするにあたってプロファイルにどのように属性を割り当てるかを決定する必要もある 大きく分けて一次項と高次項の二つの効果の取扱が焦点になる 主効果 (main effects) モデルとは各属性の一次項 ( 価格 通信速度 ) だけを考慮に入れるモデルである 交叉効果 (interaction effects) モデルとは一次項のみならず複数の属性を交叉させた項 ( 価格 * 通信速度 ) も考慮に入れるモデルである 交叉効果を入れれば属性の非線形な影響も分析できるが 説明された変動部分の 70-90% が主効果だけで説明され 交差項の説明する部分は僅かに過ぎないという指摘もある (Dawes and Corrigan 1974 参照 ) 3.6.1(*) 直交性 本項ではプロファイルの数を減らし コンパクトな実験設計を解説する 多くの実験で 32 以上のプロファイルを処理することに成功しているとされる (Carson et al. 1994 参照 ) しかし属性や属性レベルの数が増えれば 完全要素設計法に基づくプロファイル数は膨大になる 例えばLを属性レベル数 Mを選択肢数 Aを属性数とすると 完全要素設計法が要求するプロファイル数はラベル実験の場合 L MA 無ラベル実験の場合 L A になる 先ほどのブロードバンド サービスの例では 選択肢数が 2 属性数が 2 属性レベル数が 3 21

であるから プロファイル数はラベル実験の場合 3 2*2 =81 無ラベル実験の場合 3 2 =9 になる 単純な意思決定問題でも ラベル実験の場合かなり大がかりな設計が必要なことが判る 完全要素設計法が要求するプロファイルのサイズを縮減するためには プロファイルの一部だけを効率的に用いる必要がある そのための基準として直交性 (orthogonality) を利用する 直交性とは変数が互いに独立ということである 直交性が満たされないと 推定量の効率性が失われ バイアスが発生する 直交要素設計 (orthogonal factorial design) 法とは属性間の相関がゼロという性質を維持しながら プロファイル数を節約する方法である 現在はSPSSなどのソフトを利用して直交要素設計法に基づき 直交性を保ったプロファイルを作成できる (Hensher et al. 2005 pp.112-116 参照 ) 3.6.2(*) 自由度 本項では自由度を解説する 実験設計に必要な自由度はサンプル数から推定パラメータ数を引いた数である 2 選択肢 2 属性のブロードバンド サービスの例で言えば ( 選択肢固有 ) パラメータは 4 である 実際に推定するにはもう一つ自由度が必要になるから 少なくとも 5 の自由度が必要である こうして主効果モデルに必要な自由度は ラベル実験の場合 MA+1 無ラベル実験の場合 A+1 となる 3.7 要約 本章で得られた結論を要約すると次のようになる 近年ミクロ計量経済学の分野ではランダム効用理論に基礎を置く離散選択分析の発展が著しく 消費者行動分析などに広く使われている 最も基本的な離散選択モデルは CL モデルである CL 選択確率は簡単なロジット形式で表されるので 簡単に計算できる しかし CL モデルには IID 条件が課されているので IIA 仮定が派生する そのため交叉弾力性が一定など分析上の不便もある IID 条件を部分的に緩和したのが NL モデルである NL モデルは選択肢間の類似性に従って選択肢を入れ子でグループ化する NL モデルでは入れ子が異なる選択肢間の交叉弾力性が一定ではなくなる IID 条件を完全に緩和したのが ML モデルである ML モデルはパラメータがランダムに分布することを許容し 柔軟な需要代替性パターンも記述できる ML モデルの推定にはシミュレーションが用いられるので その精度を高めることが今後の課題である 離散選択モデルで利用されるデータには RP と SP がある RP は現実の均衡を反 22

映するが 柔軟性に乏しい 逆に SP データは柔軟性に富むが 仮想性という弱点も持つ RP と SP を結合するなど 両者の長所を補完する利用法が重要である SP データの採集にはコンジョイント分析を用いることが可能である コンジョイント分析は仮想市場における離散選択からデータを得るので 柔軟かつ信頼性の高いデータを集めることができる 特にデザイン設計を単純化するための直交計画法などの有用性が高い 以上説明したように 離散選択モデルは実用性の高い経済学のフロンティアの一つである 本書はそうした分析を駆使して 日本のブロードバンドを研究していく 23

表 3.1:CL 推定結果例示 (a) 記述統計 選択者 選択比率 価格平均 速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b) 推定結果観察数 1000 LL( β ) -1000.0 LL(0) -1500.0 ρ 0.3333 変数 推定値 標準誤差 t 値 ADSL 定数項 1.5000 0.5000 3.0000 FTTH 定数項 0.2000 0.4000 0.5000 価格 -0.0008 0.0003-2.6667 速度 0.0200 0.0100 2.0000 (c) 価格弾力性 選択確率 ADSL CATV FTTH ADSL -0.9600 1.4400 1.4400 価格 CATV 0.6400-2.5600 0.6400 FTTH 0.8000 0.8000-3.2000 (d) 通信速度 WTP \25 /1Mbps 24

表 3.2:NL 推定結果例示 (a) 記述統計選択者 選択比率 価格平均 速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b) 推定結果観察数 1000 LL( β ) -900 LL(0) -1500 ρ 0.4000 変数 推定値 標準誤差 t 値 ADSL 定数項 1.0000 0.3000 3.3333 FTTH 定数項 0.4000 0.4000 1.0000 価格 -0.0009 0.0003-3.0000 速度 0.0250 0.0100 2.5000 IVパラメータ 0.7500 0.2500 3.0000 (c) 価格弾力性 選択確率 ADSL CATV FTTH 価格 ADSL -0.9113 2.2950 1.6200 CATV 1.0200-2.2050 0.7200 FTTH 0.9000 0.9000-3.6000 (d) 通信速度 WTP \28 /1Mbps 25

表 3.3:NL 推定結果例示 (a) 記述統計選択者 選択比率 価格平均 速度平均 ADSL 600 0.60 \3,000 10Mbps CATV 200 0.20 \4,000 20Mbps FTTH 200 0.20 \5,000 100Mbps 合計 1000 1.00 \3,600 30Mbps (b) 推定結果観察数 1000 LL( β) -850 LL(0) -1500 ρ 0.4333 変数 推定値 標準誤差 t 値 ランダム パラメータ ( 平均値 ) 定数項 1.0000 0.3000 3.3333 速度 0.0200 0.0100 2.0000 ランダム パラメータ ( 標準誤差 ) 定数項 0.7000 0.2500 2.8000 速度 0.0150 0.0050 3.0000 非ランダム パラメータ 価格 -0.0008 0.0003-2.6667 (c) 価格弾力性 選択確率 ADSL CATV FTTH 価格 ADSL -0.9600 1.6400 1.2400 CATV 0.8400-2.5600 0.4400 FTTH 1.0000 0.6000-3.2000 (d) 通信速度 WTP \25 /1Mbps 26

表 3.4: 完全要素設計とコード様式 プロファイル属性レベル設計コード直交コード価格速度価格速度価格速度 1 L L 0 0-1 -1 2 L M 0 1-1 0 3 L H 0 2-1 1 4 M L 1 0 0-1 5 M M 1 1 0 0 6 M H 1 2 0 1 7 H L 2 0 1-1 8 H M 2 1 1 0 9 H H 2 2 1 1 27

表 3.5: 無ラベル実験 vs. ラベル実験 無ラベル実験 選択肢 1 選択肢 2 価格 速度 価格 速度 プロファイル \3,000 12Mbps \5,000 100Mbps ラベル実験 ADSL FTTH 価格 速度 価格 速度 プロファイル \3,000 12Mbps \5,000 100Mbps 28