第 1 回 スタートアップゼミ データの 集 計 と 行行 動 モデルの 基 礎 Data Aggregation and the Basis of Behavior Model M2 大 山 雄 己
Flow of presentation No. 0 ゼミの 流流 れ 0. はじめに 1.データの 種 類 と 説 明 2. 基 礎 集 計 の 方 法 3. 行行 動 モデルの 基 礎 4. 課 題
Basis of behavior model 1-1 はじめに 生 活 研 ってどんな 研 究 をしているんですか? サービ ス 設 計 原, 斉 藤, 若若 林林 山 田, 戸 叶 瀧 口, 伊 藤 ネットワー クモデル 行行 動 モデル 渡 邊, 柿 元, 濱 上, 北北 川, 植 村, 藤 井, 山 川, 大 村 コミュ ニティ 都 市 地 域 松 村, 亀 田, 浦 田, 野 末 樋 口, 福 山, 中 埜 國 分, 斉 藤 有, 池 田 今 泉 デザ イン 中 村, 井 上, 福 士, 大 山, 芝 原 行行 動 モデルはさまざまな 研 究 分 野 と 関 係 性 が 強 い
Basis of behavior model 1-2 はじめに 主 な 研 究 テーマ 主 な 学 位 論論 文 研 究 テーマ 1) 街 路路 特 性 渡 辺 (2008), 柿 元 (2012) 2) 経 路路 選 択 モデル 山 川 (2009) 3) 歩 行行 者 濱 上 (2008), 北北 川 (2009), 植 村 (2010) 4)ソーシャルネットワーク 浦 田(2009) 5)コミュニティと 発 話 松 村 (2009), 亀 田(2010), 野 末 (まち 大) 6)ハバナ 樋 口(まちづくり 大 学 院 ) 7) 広 場 福 山(まちづくり 大 学 院 ) 8) 都 市 類 型 中 埜 (まちづくり 大 学 院 ) 9)アクティビティモデル 藤 井 (2009), 山 田(2010) 10) 地 域 での 活 動 斎 藤 有 (2010) 11) 交 通 管 制 戸 叶 (2012), 瀧 口(2010) 12)デザイン 中 村 (2007), 井 上 (2008), 福 士(2011) 13) 新 交 通 サービス 設 計 原 (2012), 斉 藤 (2012), 若若 林林 (2013) 14) 移 動 データの 精 緻 化 大 村 (2012), 今 泉 (2013) 15) 住 宅宅 國 分 (まち 大) 16) 回 遊 シミュレーション 伊 藤 (2012) 17) 行行 動 圏 域 池 田(2012)
Basis of behavior model No. 2 はじめに では, 行行 動 モデルとは? さまざまな 人の 選 択 行行 動 = 意 思 決 定 を 表 現 するモデル. 仮 定 1: 効 用 最 大 化 理理 論論 各 選 択 肢 の 望 ましさを 表 す 効 用 を 考 え, 個 人は 最 も 効 用 が 大きい 行行 動 選 択 肢 を 選 択 する. 仮 定 2: 確 率率率 的 意 思 決 定 効 用の 要 因 である 変 数 すべてを 観 測 することはできない. 非 観 測 要 因 によって 効 用 の 大きさは 確 率率率 的 に 変 動 する. U in = V in +ε in P in = exp(µv in) j C exp(µv ij )
Basis of behavior model No. 3 はじめに どのような 研 究 があるか? 各 交 差 点 を 意 思 決 定 地 点 として 2 ~5の 接 続 する 街 路路 を 逐 次 選 択 するモデル V n = β 1 X destination + β 2 X shortest + β 3 X straight + (1) 空 間 定 位 に 関 する 説 明 変 数 目 的 地 方 向 角 度度 α( ), 最 短 経 路路 ダミー, 直 進 ダミー (2) 空 間 特 性 に 関 する 説 明 変 数 A: 街 路路 空 間 の 形 態 と 機 能 を 表 す 説 明 変 数 B: 街 路路 景 観 パタンダミー(13パタン) (1) i β i X i (2) 1: 空 間 定 位,2: 空 間 定 位 + 構 成 要 素 (A),3: 空 間 定 位 + 景 観 パタン の3 通 りをモデルで 推 定
Basis of behavior model No. 4 はじめに モデル 推 定 結 果 空 間 定 位 空 間 定 位 + 空 間 構 成 要 素 空 間 定 位 + 街 路路 景 観 パタン 説 明 変 数 推 定 値 t 値 推 定 値 t 値 推 定 値 t 値 空 間 特 性 を 考 慮 したモデルでは, 直 進 志 向 性 が 弱 まる 空 間 定 位 目 的 地 方 向 角 度度 ( 度度 ) - 0.014-7.82** - 0.015-7.44** - 0.015-7.59** 直 進 ダミー 0.720 3.61** 0.294 1.16 0.550 2.53* 最 短 経 路路 方 向 ダミー 0.876 6.00** 0.656 4.07** 0.721 4.56** 構 成 要 素 歩 道 幅 員 0.102 2.72** 平 均 間 口 長 - 0.061-3.20** リンク 幅 0.033 1.48 街 路路 景 観 パタン 街 区 内 大 通 り(1)パタ ンダミー センター 街 (7)パタン ダミー 裏裏 道 店 舗 無 (1)パタン ダミー 構 成 要 素 や 街 路路 景 観 パタン が 経 路路 選 択 行行 動 に 有 意 な 影 響 を 与 えている 1.251 3.52** 0.958 3.46** - 1.272-1.58 サンプル 数 306 306 306 初 期 尤 度度 - 266.0-266.0-266.0 最 終 尤 度度 - 193.0-171.9-177.6 尤 度度 比 0.275 0.354 0.332 修 正 済 尤 度度 比 0.263 0.331 0.310 * :5% 有 意 ** : 1% 有 意
Basis of behavior model No. 5 一 般 的 な 分 析 の 流流 れ どのように 分 析 していくか. (ものすごく 簡 単 な 例例 ) このあたりまで 紹 介 します. データの 特 性 を 知 る. 分 析 を 行行なう 前 に,データに 馴 染 む 必 要 があります.どのような 情 報 が 得 ら れているのか,データから 何 がわかるのかを 把 握 しておきましょう. クロス 集 計 を 行行い, 傾 向 を 探 る. 基 礎 的 な 集 計 として, 様 々な 属 性 を 掛 けあわせて 何 と 何 に 相 関 があるのか, 行行 動 の 要 因 になっているものは 何 か, 分 析 します. モデルを 構 築 し, 推 定 を 行行なう. クロス 集 計 結 果 から 仮 説 が 立立ったら,モデルを 構 築 して 因 果 関 係 を 定 量量 的 に 分 析 します.ある 選 択 に 対 して 何 が 効 いているのかを 把 握 します.
データの 種 類 と 説 明
about Data No. 6 データの 種 類 と 説 明 どんなデータがあるか? 1) 行行 動 データ Macro PT (Person Trip) PP (Probe Person) ビデオ 画 像 Micro ゾーン グラフ 2 次 元 他 にも: 検 知 器 ( 断 面), 利利 用ログ(PASMO 等 ), 道 路路 交 通 センサス( 統 計 ) Bcals: 加 速 度度, 歩 数, 運 動 負 荷 などの 詳 細 な 移 動 文 脈 情 報 2) 質 的 データ アンケートデータ(Web Diary),RP/SP 調 査 ヒアリング( 音 声 )
about Data No. 7 データの 種 類 と 説 明 PP(プローブパーソン)データとは? GPS 機 能 を 搭 載 した 携 帯 電 話 と 移 動 通 信 機 器 と 連 動 した Webダイアリーを 用いてモニタの 移 動 活 動 記 録 と 数 秒 間 隔 の 位 置 情 報 を 取 得 できる 大 量量 かつ 詳 細 な 移 動 データ day- to- dayの 行行 動 記 録 ( 同 一 個 人の 複 数 日に 渡 る 行行 動 履履 歴 ) 移 動 手 段 移 動 目 的 個 人 属 性 平 均 速 度度 トリップ 長 トリップ 時 間 自 宅宅 乗 車車 駅 降降 車車 駅 勤 務 先 自 宅宅 を 出 る 時 に 操 作 徒 歩 から 電 車車に 乗 り 換 える 駅 で 操 作 電 車車から 車車に 乗 り 換 える 駅 で 操 作 勤 務 先 に 到 着 し た 時 に 操 作 大きく,location data,trip data の2 種 類 がある.
about Data No. 8 データの 種 類 と 説 明 trip data(トリップごと) tripid, userid, 移 動 目 的 手 段, 出 発 到 着 時 刻, 出 発 地 到 着 地 位 置 情 報 電 車車 1% バイク 4% 徒 歩 20% バス 0% 自 転 車車 22% バイク バス 自 転 車車 自 動 車車 自 動 車車 53% 電 車車 徒 歩 個 人 情 報 保 護 のため 除 いています.
about Data No. 9 データの 種 類 と 説 明 location data(5 ~10 秒 間 隔 ) tripid, locationid, userid, 移 動 手 段, 時 刻, 位 置 座 標, 測 位 モード 個 人 情 報 保 護 のため 除 いています.
基 礎 集 計 の 方 法
10 基 礎 集 計 の 方 法 aggregation 集 計 に 使 うソフトウェア 1)データ 整 理理 / 正 規 化 2)データ 集 計 R/Java/Excel 3) 可 視 化 R/GIS/Excel/Google Earth
aggregation 11 基 礎 集 計 の 方 法 データ 整 理理 / 正 規 化 いくらExcelでも,ボタンひとつではグラフも 描 けません. 自 分 の 目 的 に 合 わせて,まずデータを 整 理理 する 必 要 があります. データクリーニング/ 補 正 /マーケット セグメンテーション トリップデータ(1 回 の 移 動 =1 行行) ツアーデータ(1 日の 行行 動 =1 行行)
aggregation 12 基 礎 集 計 の 方 法 Excelでのクロス 集 計 :ピポットテーブル データ ピボットテーブルレポート 列列 エリア 行行エリア データエリア ピポットテーブル フィールドリスト 例例 えば, 移 動 目 的 と 移 動 手 段 の 関 係 性 が 知 りたい.
aggregation 13 基 礎 集 計 の 方 法 Excelでのクロス 集 計 :ピポットテーブル 行行エリアに 目 的, 列列 エリア データエリアに 移 動 手 段 を 入れれば, 目 的 別 移 動 手 段 分 担 率率率 が 出 る. 買 い 物 食 事 出 勤 登 校 娯 楽 業 務 帰 宅 帰 社 帰 校 その 他 0% 20% 40% 60% 80% 100% その 他 バイク バス 自 転 車 自 動 車 電 車 徒 歩 グラフにすれば, 傾 向 がよりわかり やすい.( 業 務 は 自 動 車車 分 担 率率率 が 高 く 徒 歩 が 少 ないなど ) (グラフ 100% 積 み 上 げ 横 棒 )
aggregation 14 基 礎 集 計 の 方 法 集 計 結 果 の 可 視 化 350 目 的 別 自 動 車 トリップ 数 集 計 した 結 果 はわかりやすいように グラフ, 表 としてまとめましょう. 300 250 200 注 意 点 150 100 縦 軸, 横 軸 には 項 目 名 単 位 を 記 入 [レイアウト] [ 軸 ラベル] 有 効 数 字 を 揃 える [ 軸 の 書 式 設 定 ] [ 表 示 形 式 ] [ 数 値 ] 軸 ラベルは 斜 めにしない [ 軸 の 書 式 設 定 ] [ 配 置 ] グラフ 名 グラフエリア 外 枠 を 消 す [グラフエリアの 書 式 設 定 ] グラフの 張 り 付 けは 拡 張 メタファイル 形 式 [ 貼 り 付 け] [ 形 式 を 選 択 して 貼 り 付 け] [ 図 ( 拡 張 メタファイル)] 自 動 車 トリップ 数 50 0 350 300 250 200 150 100 50 0 その 他 帰 社 帰 宅 業 務 娯 楽 出 勤 食 事 買 い 帰 校 登 校 物
行行 動 モデルの 基 礎
Basis of behavior model 15 行行 動 モデルの 基 礎 行行 動 モデルとは? さまざまな 人の 選 択 行行 動 = 意 思 決 定 を 表 現 するモデル. 離離 散 選 択 モデル を 指 すことが 多 い? 仮 定 1: 効 用 最 大 化 理理 論論 各 選 択 肢 の 望 ましさを 表 す 効 用 を 考 え, 個 人は 最 も 効 用 が 大きい 行行 動 選 択 肢 を 選 択 する. 仮 定 2: 確 率率率 的 意 思 決 定 効 用の 要 因 である 変 数 すべてを 観 測 することはできない. 非 観 測 要 因 によって 効 用 の 大きさは 確 率率率 的 に 変 動 する.
Basis of behavior model 16 行行 動 モデルの 基 礎 効 用をどう 記 述 するか. 効 用 関 数 U in U in = V in +ε in i V in : 選 択 肢 の 効 用 : 効 用の 確 定 項 : 効 用の 確 率率率 項 ε in 確 定 項? 観 測 要 因 で 記 述 できる 効 用 V in = k β k X ink = β 1 X in1 + β 2 X in 2 +...+ β K X ink X ink : 説 明 変 数 ( 効 用を 変 化 させる 要 因 ) β k :パラメータ(どのくらい 効 いてるか)
Basis of behavior model 17 行行 動 モデルの 基 礎 例例 : 路路 線 駅 の 選 択 後 楽 園 駅 からメトロに 乗 って 学 校 に 向 かうとき, 本 郷 三 丁 目 と 東 大 前 のどちらを 利利 用するか? 説 明 変 数 は? 本 郷 三 丁 目 東 大 前 駅 から 学 校 ( 建 物 )までの 距 離離, 駅 周 りの 店 の 数, 所 要 時 間, 運 行行 頻 度度, 改 札 階 との 高 低 差 ( 後 楽 園 ) V H = β 1 X dist,h + β 2 X shop,h + β 3 X time,h + β 4 X freqency,h + β H V T = β 1 X dist,t + β 2 X shop,t + β 3 X time,t + β 4 X freqency,t 他 にも,ダミー 変 数 ( 個 人 属 性 などの 定 量量 化 できない 変 数 )などを 説 明 変 数 とし て 用いることがあるが, 定 数 項 やダミー 変 数 はどちらかの 選 択 肢 にのみ 入れる.
Basis of behavior model 18 行行 動 モデルの 基 礎 例例 : 路路 線 駅 の 選 択 選 択 確 率率率 本 郷 三 丁 目(H)が 選 択 される 確 率率率 は, P ih = Pr[U ih U it ] ガンベル 分 布 f (ε) = e ε ε e e 誤 差 項 にガンベル 分 布 (Closed form)を 仮 定 する. P in = 1 1+ exp( µ(v in V im )) = exp(µv in ) exp(µv in ) + exp(µv im ) 選 択 確 率率率 は 最 終 的 に, 効 用の 確 定 項 ( 確 定 効 用の 差 )のみを 用いて 表 さ れる.
Basis of behavior model 19 行行 動 モデルの 基 礎 スケールパラメータ µ P H 本 郷 三 丁 目 選 択 確 率率率 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 μ=1 μ=0.2 μ=5-10 - 8-6 - 4-2 0 2 4 6 8 10 V H V T 本 郷 三 丁 目と 東 大 前 の 確 定 効 用 差
Basis of behavior model 20 行行 動 モデルの 基 礎 どのようにパラメータは 決 定 するのか? 尤 度度 (もっともらしさ)を 最 大 化 L = i n P in d in d in は 個 人iが 選 択 肢 nを 選 択 したとき1,それ 以 外 0. 実 際 の 推 定 では, 計 算 を 簡 便便 化 させるために 以 下 の 対 数 尤 度度 を 用いる. lnl = i n d in ln P in Newton- Raphson 法 などを 用いて 対 数 尤 度度 を 最 大 化 させるパラメータを 求 める.
Basis of behavior model 21 宿 題 6/26( 水)まで 担 当 を 決 め, やさしい 非 集 計 分 析 1 章 ~3 章 を 各 自まとめてくる. ppt:10 枚 程 度度 もう1 人は 四 段 階 推 定 法 について.