卒業論文計画書横浜市立大学国際総合科学部国際総合科学科経営科学系経済学コース 4 年常盤夏奈子 はじめに 観光庁 (2018) によると 平成 29 年の日本での旅行消費額は 26.7 兆円と推計されている その中で 16.1 兆円 (60.2%) と 最も大きな割合を占めているのが日本人の国内宿泊旅行である 日本人の国内宿泊旅行の需要を少しでも喚起することができたならば それは日本国内の旅行消費額に大きな影響を及ぼす では どのようにして日本人の国内旅行の需要を増加させるか 方法の1つとして 休暇の地域分散化というものが存在する 地域ごとに異なる時期に休暇をとることで ゴールデンウィークやお盆 年末年始など旅行需要が集中してしまう時期を分散する これは 旅行者の側からすると 交通混雑や旅行代金の高額化を回避することができ 大きなメリットである 観光地や事業者の側から見ても 観光地における雇用の安定化 潜在需要の喚起など 様々なメリットがある 卒業論文では 矢部 (n.d.) による先行研究の手法をもとに 最新の統計データを用いて休暇分散のための地域ブロックの設定を実証分析する 本論では 分析手法であるネットワーク分析について説明し 研究計画を示す ネットワーク分析 ネットワーク分析とは 様々な対象における構成要素間の関係構造を探る研究方法である そこでは 関係構造を 点と線によって構成される構造として抽象化してとらえる 点は頂点やノード 線は辺やリンクとも呼ばれる グラフを用いてネットワークを表す際 リンクには無向と有向が存在する 無向グラフは 関係が常に双方向であるか そもそも向きを考える必要がないようなネットワークを表す際に用いられる 対して 関係に向きがあるネットワークを表す際には有向グラフが用いられる 卒論の文脈では 47 都道府県が頂点となり 旅行の Origin-Destination(OD) により有向グラフとして国内宿泊旅行が扱われることになる 中心性 中心性とは ネットワークを構成する各頂点が ネットワークにおいてどれくらい 中 1
心的 であるかを示す指標である ネットワークにおける各頂点の重要性を評価したり 比較したりする際に用いられ 卒論の文脈では国内宿泊旅行の動向を確認するのに使われ る PageRank PageRank は中心性指標の1つである もともとはウェブ上の情報検索におけるウェブページ評価方法として Google 社の創設者である L.Pageと S.Brin によって開発された PageRank は 隣接行列から推移確率行列を作り 算出される 隣接行列とは グラフにおける頂点間の関係の有無を行列で表現したものである 推移確率行列とは あるページ ( 頂点 ) からリンク ( 辺 ) をたどって移動するとき 次に他の各ページに移動する確率を行列で表したものである 1 ただし 卒論では 最初から 47 都道府県の推移行列として OD(Origin-Destination) 行列を使用することになる PageRank の具体的な計算は 強連結といって 有向グラフにおいて グラフに含まれるどの頂点どうしでも必ず相互に到達可能である状態をつくる工夫がなされる = + (1 ) 1 は推移確率行列 は隣接行列の行数 列数 すなわち頂点数であり はすべて の成分がの 正方行列を示す はグラフを強連結にするためのパラメータで ダンピングファクターとも呼ばれる 0 < < 1で 伝統的に = 0.85がとられる このように作られた強連結の推移確率行列は いかなる確率分布からも安定的な確率分布に到達することが知られており この安定的な確率分布が PageRank とされるのである 2 次節に計算例を示す PageRank の計算例 以下のような j から i への有向グラフによる隣接関係は隣接行列 B を与える 1 PageRank の基本的な発想は 他のページからのリンク数が多いページほどランキングが高く ランキングの高いページからのリンクは高く評価する というものである また 他のページへのリンクが少ないページからのリンクをより高く評価する点が PageRank の特徴である 他のページへのリンクが少ないページからのリンクは より 厳選されたリンク と考えるからである 2 American Mathematical Society (n.d.) 2
0 1 0 1 1 1 0 0 0 1 = = 1 1 0 1 0 0 1 0 0 1 0 0 1 0 0 隣接行列 B から j 列から i 行への推移確率行列 M を作る 0 0.333333 0 0.5 0.333333 0.5 0 0 0 0.333333 = 0.5 0.333333 0 0.5 0 0 0.333333 0 0 0.333333 0 0 1 0 0 推移確率行列 M を強連結にする = + (1 ) 1 = 0.85 + (1 0.85) 1 5 0.03 0.313333333 0.03 0.455 0.313333333 0.455 0.03 0.03 0.03 0.313333333 = 0.455 0.313333333 0.03 0.455 0.03 0.03 0.313333333 0.03 0.03 0.313333333 0.03 0.03 0.88 0.03 0.03 得られるベクトルは 初期配分を t (1,0,0,0,0), t (0.2, 0.2, 0.2, 0.2, 0.2) といったぐあいに適 当においても 推移確率行列を 30 回も乗じないうちに 安定的な配分として t(0.208887 0.183401 0.23304 0.146587 0.22804484) が得られ これが PageRank 3
と呼ばれる グラフ クラスタリンググラフ クラスタリングとは ネットワーク分析手法の1つで ネットワークの中で相対的につながりが強いグループを抽出することである 卒業論文では この手法を応用し 宿泊旅行の流動が密になっている宿泊旅行圏を抽出する Modularity 指標先ほど説明したグラフ クラスタリング手法には様々な指標に基づくものが存在し その中の1つの指標が Modularity 指標である Modularity 指標は Newman and Girvan(2004) が提案したものである Modularity とは 分割されたコミュニティ内の辺の数とコミュニティ間の辺の数の比較により コミュニティが高密度のサブグループをうまく抽出しているかを示す指標である サブグループとは ある程度の大きさをもつネットワークの中で その内部に他と区別できるような形で相互に結びついた下位集団のことである 卒業論文に向けて 卒業論文では 矢部 (n.d.) の手法をもとに 最新の統計データを用いて実証分析を行う 用いるデータは 観光庁の宿泊旅行統計調査である このうち 都道府県間の宿泊旅行流動を示した 参考第三表 2010 年 4 月 ~2018 年 2 月の毎月のデータを用いる 参考第三表の具体的な定義は 従業者数 100 人以上かつ観光目的の宿泊者が 50% 以上の宿泊施設 ( 都道府県別 ) における 居住地 ( 都道府県 ) 別の延べ宿泊者数である 2010 年 4 月以前のデータも存在するが 2010 年 4~6 月の調査から 調査対象が前回までの調査より広げられており 単純に比較することができないため 対象としない 分析の大まかな流れ PageRank を用いて どの都道府県が国内宿泊旅行ネットワークの中心にあるのか分析する 次に PageRank によって代表される宿泊旅行流動ネットワークの 時系列的な安定性について 主成分分析を用いて検証する 時系列的な安定性 すなわち 対象期間内の任意の一時点のデータを用いて休暇分散のための地域ブロックを設定しても ある程度の普遍性を持つことができることを再確認したら 次にグラフ クラスタリングにより 地域ブロックを設定する 具体的には 都道府県間の国内宿泊旅行の流動をネットワークとしてとらえ 宿泊旅行が相互に多く行われる国内宿泊旅行圏の抽出を Modularity 指標により行う これにより 家族や友人を伴っ 4
た旅行が多く行われている地域範囲に従って 休暇分散の地域ブロックを設定することができる そして 複数の地域ブロックを設定することによって需要の平準化にどのような効果を及ぼすのか 2009 年 5 月のデータを用いた矢部 (n.d.) の結果を最新のデータで再検証する 最後に 新しい結果を用いて それぞれ異なる時期に休暇をとった場合に 旅行需要が平準化される効果を検証する 参考文献 American Mathematical Society (n.d.) HOW GOOGLE FINDS YOUR NEEDLE IN THE WEB S HAYSTACK http://www.ams.org/publicoutreach/feature-column/fcarcpagerank (2018 年 6 月 23 日閲覧 ) 今井耕介 (2018) 社会科学のためのデータ分析入門[ 下 ] ( 株式会社岩波書店 ) 観光庁 (2010) 休暇分散化ワーキングチーム資料 http://www.mlit.go.jp/kankocho/iinkai/suishinhonbu/kyuka_wt.html(2018 年 7 月 5 日閲覧 ) 観光庁 (2018) 旅行 観光消費動向調査平成 29 年年間値報道発表資料 ( 確報 ) http://www.mlit.go.jp/common/001233130.pdf(2018 年 7 月 5 日閲覧 ) Page, L. and S. Brin (1998) The Anatomy of a Large-Scale Hypertextual Web Search Engine http://ilpubs.stanford.edu:8090/361/1/1998-8.pdf ((2018 年 6 月 23 日閲覧 )) 鈴木努 (2017) R で学ぶデータサイエンス 8 ネットワーク分析第 2 版 共立出版株式会 社 ) 矢部直人 (n.d.) 都道府県間流動データによる国内宿泊旅行圏の設定と休暇分散効果の検 証 http://www.mlit.go.jp/common/000143057.pdf (2018 年 6 月 29 日閲覧 ) 5