<4D F736F F D2094F18F578C B82CC8F578C768CEB8DB72E646F63>

東京海洋大学平成 8 年月兵藤哲朗非集計行動モデルの集計誤差についてメモ. 序非集計モデルの集計誤差については研究すべきテーマは 980 年代初頭に完遂したと思われるアメリカでは 970 年代半ばに Koppelman(976) によりそして日本では当時北海道大学の山形桐越らにより精力的な研究が積み重ねられてきたそれ以降集計方法は分類法で十分という結論が実務上でも一般的になり集計誤差自体を推計することも行われなくなったしかし今回修士論文で航空の Revenue Management (RM) を扱う過程で Logt モデルの集計誤差を定量的に計算する必要に迫られた簡単に言えば航空動態調査結果から券種選択モデルを構築しクラス ( 券種 ) 別の利用者を予測し航空会社のクラス別最適価格と座席配分を求める典型的な RM アルゴリズム (EMSR) を考えていたこの RM ではクラス別需要と共にその分散値が支配的役割を果たすそこで Logt モデルの集計誤差について理論に基づく推計が必要となった調べていくうちに最近の文献では集計誤差の定義やその計算例について全く触れていないことが分かった唯一 Ben-Akva et al.(985) のテキストで Koppelman(976) を引用してその基礎式を紹介しているが数式の標記に誤りがあったり ( 兵藤が持っているのは 985 年発行版 ) 計算例が示されていないなど集計誤差の重要性に比して十分な記述がなされていない大半の文献が 980 年前後であったため若干その理論を整理するのに時間を要したが上記の理由からここに集計誤差推計方法について例を示しながらまとめておくことにする. 誤差伝播の法則について集計誤差を計算する上でもっとも重要な基礎式が誤差伝播式である土木工学科では測量学の授業で習うことが多いが式が簡単な構造であることもあり単なる丸暗記で覚えていることが多いのではないだろうか?( 兵藤もそうだった ) しかも測量学では共分散項は省いて教えるようでますます式の導出過程が不明確になるようだまずは基礎式を整理しよう θ,θ 変数で表される関数 y = f ( ) について考える関数を点 ( θ ) 展開を行う ( θ θ ) + ( θ ) = 0 0 0 θ 0,θ 0 y y () ここで y y0 Ε の乗値の期待値が y の分散になることから期待値式を導く [( y y ) ] = Ε ( θ θ ) の周りで一次のテーラー [ ] + Ε[ ( θ θ ) ] + [ θ θ ] Ε[ θ ] 0 0 0 0 θ 0 Ε 分散記号を用いて書き直すと ()

σ σ σ σ θ θ θ θ + + y = (3) というおなじみの誤差伝播式を得ることができるこの式を一般的な多変量関数に拡張すればその一般式は下記の通りとなる f = σj (4) σ y j θ j ここでσ j は母数パラメータθ とθ j 間の分散共分散行列である 3.Logt モデルの集計誤差式集計方法として平均値法を考える V e P = (5) Vj e j 上記 Logt モデル式について効用項の微小変化を考え選択確率に関する誤差伝播式を定義すれば (4) 式と (5) 式から P P var [ P ] = cov Vj, Vk j k V j V (6) k を得るちなみに ( ) P P P f = j = Vj PP otherwse であるあとは効用項の分散共分散行列 cov[ V, ] j V k を求めればよい (7) 効用項にはパラメータと説明変数が含まれそれぞれが誤差分散を有するパラメータの分散共分散行列は情報行列の逆行列としてパラメータ推定結果と共に得ることができるまた説明変数の分散共分散行列は事後的に設定する必要がある例えば OD 間の所要時間であればゾーニングに起因する誤差や時間帯別の変動などに起因する誤差であり車保有率などの社会経済属性変数であれば標本調査による誤差 ( 平均値分散式から算出される ) として定義可能であろうさて単回帰 y=ax であれば右辺の分散は a var[ x] x var[ a] + で定義されるが同様に効用項の誤差を考えるまず以下の条件や変数を定義する選択肢の数 :nm 説明変数の数 :np 説明変数 :X (np 行 nm 列 ) パラメータベクトル :β (np 行列 ) 選択肢と選択肢 j 間の説明変数分散共分散行列 :Σ xj (np 行 np 列 ) パラメータ分散共分散行列 :Σ β (np 行 np 列 ) ここでは説明変数の分散共分散行列を後の式標記を単純化するため選択肢間の組み合わせで分解標記することとする

効用の誤差分散は単回帰の例と同様パラメータ誤差に起因する項と説明変数誤差に起因する項に分けられそれぞれ選択肢間の共分散も考慮する必要がある前者の誤差項からなる選択肢間分散共分散行列を Λ (nm 行 nm 列 ) とすれば Λ = Σ X (8) X β 一方後者の誤差項からなる選択肢間分散共分散行列の行 j 列要素を Λ j ( スカラー ) とすれば Λ = β Xj β (9) j Σ となるここで (9) 式を要素とする選択肢間の ( 説明変数誤差に起因する ) 分散共分散行列を Λ (nm 行 nm 列 ) と再定義するすると効用項の誤差分散行列は (8) 式 (9) 式から Λ + Λ となるこれと (6) 式より各選択肢の誤差分散を推計することができる 4. 計算事例代表的な都市間交通手段選択データを用いて集計誤差の推計を試みる用いたのは 995 年の旅客純流動調査からランダムに抽出した長距離帯の 6,000 サンプル ( 仕事目的 3,000 その他目的 3,000 サンプル ) で対象交通手段は航空鉄道車の 3 手段である MNL モデルの推定結果を以下にまとめる表 - パラメータ推定結果 Para. STD. t 値時間 ( 共通 ) -0.970 0.05-36.8 サンプル数 6000 費用 ( 共通 ) -3.676 0.6377-5.7 初期尤度 -6005.0 目的 D (Ar) 0.530 0.0957 5.5 最終尤度 -4475.7 目的 D (Ral) 0.080 0.088 0. 尤度比 0.543 定数項 (Ar) -.877 0.09 -.3 的中率 67.% 定数項 (Ral) -0.766 0.077-0.0 ( 時間は 00 分費用は 0 万円単位目的は仕事 = )

表 - 説明変数の選択肢別平均値標準偏差 Ave. Std. Ar 時間.84 0.468 Ar 費用 0.30 0.084 Ar 目的 D 0.500 0.500 Ar 0 0 0 Ar 定数項 0 Ar 0 0 0 Ral 時間 4.097 3.94 Ral 費用 0.73 0.067 Ral 0 0 0 Ral 目的 D 0.500 0.500 Ral 0 0 0 Ral 定数項 0 Car 時間 6.87 4.4 Car 費用 0.69 0. Ar share 0.440 Ral share 0.40 Car share 0.40 時間費用目的 D 目的 D 定数項定数項 ( 共通 ) ( 共通 ) (Ar) (Ral) (Ar) (Ral) 時間 ( 共通 ) 6.35E-04-4.E-04 -.E-04 4.79E-05.79E-03 8.3E-04 費用 ( 共通 ) -4.E-04 4.07E-0.88E-04 -.95E-03 -.79E-0 6.55E-03 目的 D (Ar) -.E-04.88E-04 9.5E-03 6.5E-03-5.48E-03-3.5E-03 目的 D (Ral) 4.79E-05 -.95E-03 6.5E-03 7.79E-03 -.96E-03-3.9E-03 定数項 (Ar).79E-03 -.79E-0-5.48E-03 -.96E-03.06E-0 5.7E-03 定数項 (Ral) 8.3E-04 6.55E-03-3.5E-03-3.9E-03 5.7E-03 5.4E-03 表 -3 推定パラメータの分散共分散行列表 -4 説明変数間の相関係数行列 Ar Ar Ar Ar Ar Ar Ral Ral Ral Ral Ral Ral Car Car Car Car Car Car 時間費用目的 D 0 定数項 0 時間費用 0 目的 D 0 定数項時間費用 0 0 0 0 Ar 時間.000 Ar 費用 0.750.000 Ar 目的 D 0.000 0.000.000 Ar 0 0.000 0.000 0.000.000 Ar 定数項 0.000 0.000 0.000 0.000.000 Ar 0 0.000 0.000 0.000 0.000 0.000.000 Ral 時間 0.43 0.63 0.000 0.000 0.000 0.000.000 Ral 費用 0.59 0.86 0.000 0.000 0.000 0.000 0.760.000 Ral 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Ral 目的 D 0.000 0.000.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Ral 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Ral 定数項 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Car 時間 0.553 0.84 0.000 0.000 0.000 0.000 0.899 0.93 0.000 0.000 0.000 0.000.000 Car 費用 0.473 0.758 0.000 0.000 0.000 0.000 0.95 0.883 0.000 0.000 0.000 0.000 0.973.000 Car 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Car 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Car 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 Car 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000.000 さて説明変数の分散共分散行列の設定方法には幾つかの議論を必要とする表 -4 はパラメータ推定に用いた 6,000 サンプルのデータから得られた相関係数行列の結果である見いだされるポイントとしては時間費用間の相関は同じ選択肢間のみならず異なる選択肢間でも大きい選択肢間で同じ値を持つ社会経済変数は選択肢間の相関係数はとなる定数項の共分散は 0 であるなどがあげられるさて集計予測を行う場合説明変数の分散共分散をどのように設定すべきか? 代表的な説明変数に応じて考察してみる a) 所要時間 : ゾーニングに起因する誤差 ( アクセスイグレス時間のバラツキが大きい ) が支配的で

あると考えられるその他自動車であれば時間帯別の変動も大きな要素であろう b) 費用 : 所要時間ほど大きな誤差はないように思われるが実際には航空運賃の割引構成率が不明であるなど主に割り引き運賃設定に関わる誤差が大きい都市圏内では自己負担会社負担別のいわば実質費用に関わる誤差要因がある c) 社会経済変数 : 年齢性別車保有などゾーン単位の正確なデータが存在する場合は予測対象 OD 交通量と母集団 ( 発生ゾーンの人口など ) との関係で誤差が生じるすなわち OD 交通量が母集団からの標本抽出であると考えた場合いわゆる比率の平均値分散式を用いた ( p) N n p σ p = (0) N n を説明変数の分散とすることが考えられる本稿では集計誤差式の提示を主目的とするため上記説明変数の誤差について詳細な議論に立ち入らないまずもって表 -4 の相関係数行列は距離帯分布が大きい都市間交通の OD ペア全体の相関であり予測時に発生する単一 OD ペアの誤差とは発生要因が全く異なることに留意すべきであるこれら問題点を認識した上で説明変数の分散共分散行列として下記の設定を行う説明変数の平均値は 6,000 サンプルの平均値 ( 表 -) を用いる所要時間費用に関しては変動係数 (C.V.) を 0. とする目的ダミー変数については N=,000 n=00 p=0.5 として分散は式 (0) から算出する結果得られた分散共分散行列は表 -5 の通り表 -5 本分析で設定された説明変数の分散共分散行列 (Σ xj ) Ar Ar Ar Ar Ar Ar Ral Ral Ral Ral Ral Ral Car Car Car Car Car Car 時間費用目的 D 0 定数項 0 時間費用 0 目的 D 0 定数項時間費用 0 0 0 0 Ar 時間 0.034 0.003 0.000 0.000 0.000 0.000 0.033 0.00 0.000 0.000 0.000 0.000 0.070 0.00 0.000 0.000 0.000 0.000 Ar 費用 0.003 0.00 0.000 0.000 0.000 0.000 0.006 0.000 0.000 0.000 0.000 0.000 0.03 0.000 0.000 0.000 0.000 0.000 Ar 目的 D 0.000 0.000 0.003 0.000 0.000 0.000 0.000 0.000 0.000.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ar 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ar 定数項 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ar 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ral 時間 0.033 0.006 0.000 0.000 0.000 0.000 0.68 0.005 0.000 0.000 0.000 0.000 0.53 0.00 0.000 0.000 0.000 0.000 Ral 費用 0.00 0.000 0.000 0.000 0.000 0.000 0.005 0.000 0.000 0.000 0.000 0.000 0.0 0.000 0.000 0.000 0.000 0.000 Ral 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ral 目的 D 0.000 0.000.000 0.000 0.000 0.000 0.000 0.000 0.000 0.003 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ral 0 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Ral 定数項 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Car 時間 0.070 0.03 0.000 0.000 0.000 0.000 0.53 0.0 0.000 0.000 0.000 0.000 0.47 0.08 0.000 0.000 0.000 0.000 Car 費用 0.00 0.000 0.000 0.000 0.000 0.000 0.00 0.000 0.000 0.000 0.000 0.000 0.08 0.00 0.000 0.000 0.000 0.000 プログラムは Gauss を用いた以下がそのソースコードである new, 00000; screen on; output fle=g: kamya agg-bas.out reset; output on; load beta[6,] = g: kamya beta.csv ; load x[6,3] = g: kamya x.csv ; load sbeta[6,6] = g: kamya sbeta.csv ;

load xs0[6*3,6*3] = g: kamya sx.csv ; v = x' * beta; p = exp(v)/sumc(exp(v)); cv = x'*sbeta*x; cv=zeros(3,3); =; do whle <= 3; j=; do whle j<=3; xs=xs0[ ((-)*6+):*6, ((j-)*6+):j*6 ]; cv[,j] = beta'*xs*beta; j=j+; endo; =+; endo; prnt cv; prnt cv; cov=cv+cv; varp=zeros(3,); =; do whle <= 3; j=; do whle j <= 3; f j==; a=p[]*(-p[]); else; a=-p[]*p[j]; endf; k=; do whle k <= 3; f k==; a=p[]*(-p[]); else; a=-p[]*p[k]; endf; varp[] = varp[] + a*a*cov[j,k]; k=k+; endo; j=j+; endo; =+; endo; prnt sqrt(varp)~p; prnt (sqrt(varp)./p); output off; パラメータ誤差および説明変数に起因する選択肢間分散共分散行列 ( プログラム中では各々 cv, cv) は下記の通りパラメータ誤差に起因する選択肢間効用分散共分散行列 : Λ 0.0877705 0.030578097 0.039480 0.030578097 0.03439 0.0430857 0.039480 0.0430857 0.0579366 説明変数誤差に起因する選択肢間効用分散共分散行列 : Λ 0.0587007 0.0679870 0.797078 0.0679870 0.84377 0.9395447 0.797078 0.9395447 0.5364008

選択肢間効用の分散共分散行列 : cov [ V, ] 0.08065356 0.6363985 0.0666366 0.378884 0.07765488 0.0357793 V j これを用いた各選択肢誤差分散と推計選択シェア : 選択肢誤差分散選択肢シェア 0.08065356 0.6363985 0.0666366 0.378884 0.07765488 0.0357793 結果として得られる各選択肢の変動係数は以下の通り 0.673380 0.035443 0.4965963 5. おわりに今回たまたま RM 分析に関連して再び非集計モデルの集計誤差を整理することになった最初に書いたとおり身近に関連する分かりやすい資料を見いだせなかったことから本稿執筆の運びとなったもし本稿に類した資料をご存じであれば是非ともご一報頂きたいさて実は 984 年月提出の兵藤の卒業論文も扱うべき題材は非集計モデルの誤差解析に関わるテーマであったしかし前橋高崎地区の LOS 作成プログラムに時間をとられ実際にパラメータ誤差などを計算したのは当時修士年の竹内氏であった ( 兵藤卒論のその章は竹内氏が計算執筆していた ) 今回年ぶりに卒論時の借金をわずかなりとも返却できたような気がするなお式展開など誤差の基本的考え方についてコメント頂いた福田大輔氏 ( 東京工業大学 ) に謝意を表する以上 < 参考文献 > ) Ben-Akva, M., and Lerman, S. (985): Dscrete Choce Analyss: Theory and Applcaton to predct travel demand, MIT press ) Koppelman, F.S. (976): Methodology for Analyss Errors n Predcton Wth Dsaggregate Choce Models, TRR? 3) 桐越他 (983): シミュレーションデータによる非集計ロジットモデルの誤差解析, 第 5 回土木計画学研究発表会講演集 4) 桐越他 (983): 非集計ロジットモデルのアグリゲーションバイアスに関する研究, 第 38 回年次学術講演会 5) 森地屋井竹内 (985): 非集計行動モデル構築に要する交通サービス特性データの精度に関する検討, 第 40 回年次学学術講演会