ベイジアンモデルによる地域人口予測モデルの可能性について 片桐智志 1 山下諭史 1 ( 1 ネイチャーインサイト株式会社 ) The possibility of regional population forecasting model by Bayesian model KATAGIRI, Satoshi 1 YAMASHITA, Satoshi 1 1 Nature Insight Co., Ltd.
要旨 : 人口増減を表現したリー カーター法に基づく階層ベイズモデルをマルコフ連鎖モンテカルロ法によって推定し, 岩手県の市町村別人口の予測モデルの作成を試みた. 利用できるデータの制約上, 全国規模のデータを代用したため完全ではないものの, 直線的な人口推計モデルと異なる, 確率的モデルによる人口予測の可能性を示すことができた. キーワード : 人口予測 MCMC マルコフ連鎖モンテカルロ法階層ベイズ Lee-Carter モデル 2
人口を予測するには 古くは マルサスの指数増加モデル Verhulst のロジスティックモデル 近似として有効だが 年齢別人口はわからない 3
人口を予測するには 人口が変動する要因は大別して2つ 1. 出生と死亡 ( 自然増減 ) 2. 住民の転入出 ( 社会増減 ) 2つの変動要因を推定すれば現在の人口から計算できる 4
コーホート要因法 コーホートx( たとえば5 歳ごとに区切った集団の人口 ) に変動率をかけて次期の人口を計算 P x,t+1 = s x,t P x,t これを繰り返せば予測人口が計算可能 本稿では1 歳 1 年ごとに計算 5
ロジャース モデル コーホート要因法の一種 移民を考慮して計算 パラメータが多くなるが コンピュータの性能向上に伴い利用した研究が増えている ( 小池, 2008) パラメータの推定方法が課題 6
ロジャース モデル 7
参考 : 各年年齢別死亡率 男女ともに年々死亡率低下 (= 長寿化 ) 8
参考 : 各年年齢別出生率 20 代は減少傾向 30 代は増加傾向 9
TEMPLATE プロシジャによるグラフ /* グラデーションになるよう色コードを作成 */ data work.tmp_color_mst ; attrib _10 length = 8 /* 10 進数 */ _HEX_B length = $8 /*16 進数カラーコード青 */ _HEX_G length = $8 /*16 進数カラーコード灰 */ ; do _10 = 0 to 250 ; _HEX_B = cats('cx',put(_10, HEX2.),PUT(_10, HEX2.),'FF') ; _HEX_G = cats('cx',put(_10, HEX2.),PUT(_10, HEX2.), PUT(_10, HEX2.) ) ; output ; end ; /* 続く */ 10
TEMPLATE プロシジャによるグラフ /* 続き */ /* 色コードを年と対応させる処理省略 */ /* 連結してマクロ変数に格納 */ %let contra = ; data _NULL_; set work.tmp_color_table end = end ; attrib contra length = $2304 ; retain contra ; contra = catx(" ",contra,_16); if end = 1 then call symputx("contra",trim(contra)) ; run ; /* 後略 */ Template プロシジャで DataContrastColors = ( &contra. ) を指定しグラデーションにする 11
リー カーター (LC) 法とは (Lee & Carter, 1992) による μ x,t = exp α x + β x κ t 死力 μ x,t の大きさを年齢別定数項 α x, 年齢別係数 β x, 時系列トレンドκ t に分解 年齢 年別の変化を柔軟にとらえられる 12
リー カーター (LC) 法とは μ x,t = exp α x + β x κ t κ t の予測値が得られれば μ x,t の予測値 つまり死亡率の将来の推移が予測可能 AR(1) やドリフト項のあるランダムウォークと仮定することが多い (Lee, 1993) では出生率にも応用 13
ポアソン双線形モデル 1. 当初のLC 法は特異値分解で計算 死亡者数のみから計算している 2. (Brouhns et al., 2002) は人口に対する死亡の発生率パラメータと解釈 14
ln μ x,t N(α x + β x κ t, σ μ 2 Y x,t po(μ x,t E x,t μ x,t は対数正規分布を仮定 死亡者数 Y x,t がポアソン分布と仮定 その期待値は μ x,t E x,t. E x,t は人口 μ x,t は死亡 ( 発生 ) 率と解釈可能 15
出生率への応用 出産も年齢ごとに発生するカウントデータ μ x,t を各年齢人口の出産率とすれば 出産もポアソン分布 + リー カーター法で将来出生率を表現することができる (Wiśniowski et al., 2015) では死亡 出生 移民 パラメータすべてにこのモデルを応用 16
式の一般化 : 死亡率 ln μ M,k x,t N(α M,k x + β M,k x κ M,k M,k t, σ 2 μ Y M,k x,t Po(μ M,k M,k x,t E x,t k = 男性 or 女性 男女別のパラメータを仮定 E M,k x,t = 性 年齢 年別人口 Y M,k x,t = 同死者数 17
式の一般化 : 出生率 ln μ F x,t N(α F x + β F x κ F F t, σ 2 μ Y F x,t Po(μ F F x,t E x,t 出生率のパラメータは女性のみ ただし Y x,t は男女合計出生数 以上を階層ベイズモデルとしてMCMCで推定 18
時系列 κ t の扱い 死亡率 : VAR(1) またはドリフトランダムウォーク 出生率 : ARMA(1,1) または AR(1) 係数の事前分布はすべてN(μ = 0, σ 2 = 1) 分散は逆ウィシャート分布 or 連続一様分布 19
パラメータの事前分布 α x N μ = 0, σ 2 = 100 β 1:X 1 MVN μ = 1, X Σ 1 = τ β Ψ β, β X = 1 i X β i τ β Γ 0.01,0.01, Ψ β は対角成分 2, それ以外 1 20
パラメータ推定結果 ( 死亡率 ) 21
パラメータ推定結果 ( 出生率 ) 22
MCMC の診断マクロ SAS/IML があれば 自動マクロに結果を与えるだけでMCMCの結果を診断可能 %GEWEKE() : 収束判定 (Geweke, 1992) %GELMAN() : 異なる初期値のMCMCサンプルが同一点に収束しているか (Brooks and Gelman, 1998) 23
ロジャース モデル ( 再掲 ) 24
パラメータの計算方法 すべて SQL プロシジャで計算可能 25
人口予測の結果 ( 岩手県盛岡市 閉鎖人口 ) 2015 2020 2025 2030 2035 2040 26
人口予測の結果 ( 岩手県盛岡市 開放人口 ) 2015 2020 2025 2030 2035 2040 27
主要参考文献 (1/3) 1. Brooks, S. P. & Gelman, A., 1998. General Methods for Monitoring Convergence of Iterative Simulations. Journal of Computational and Graphical Statistics, 7(4), pp. 434-455. 2. Brouhns, N., Denuit, M. & Vermunt, J. K., 2002. A Poisson log-bilinear regression approach to the construction of projected lifetables. Insurance: Mathematics and Economics, 31(3), pp. 373-393. 3. Geweke, J., 1992. Evaluating the accuracy of samplingbased approaches to the calculation of posterior moments. Bayesian Statistics, Volume 4, pp. 169-193. 28
主要参考文献 (2/3) 4. Lee, R. D., 1993. Modeling and forecasting the time series of US fertility: age distribution, range, and ultimate level. International journal of forecasting, 9(2), pp. 187-202. 5. Lee, R. D. & Carter, L. R., 1992. Modeling and Forecasting U. S. Mortality. Journal of the American Statistical Association, 87(419), p. 659 671. 6. Wiśniowski, A. et al., 2015. Bayesian population forecasting: extending the Lee-Carter method. Demography. 7. Spiegelhalter, D. J., Best, N. G., Carlin, B. P. & Van Der Linde, A., 2002. Bayesian Measures of Model Complexity and Fit. Journal of the Royal Statistical Society: Series B, 64(5), pp. 583-639. 29
主要参考文献 (3/3) 8. 小池司朗, 2008. 地域別将来人口推計における人口移動モデルの比較研究. 人口問題研究, 64[3], pp. 87-111. 30