題目

Similar documents
Microsoft PowerPoint - H17-5時限(パターン認識).ppt

グループ演習_最終スライド

厚生労働科学研究費補助金(循環器疾患等生活習慣病対策総合研究事業)

地域医療ビッグデータに触ってみよう ほぼハンズオンマニュアル

1

平成 22 年第 2 四半期エイズ発生動向 ( 平成 22(2010) 年 3 月 29 日 ~ 平成 22(2010) 年 6 月 27 日 ) 平成 22 年 8 月 13 日 厚生労働省エイズ動向委員会

PowerPoint Presentation

症候性サーベイランス実施 手順書 インフルエンザ様症候性サーベイランス 編 平成 28 年 5 月 26 日 群馬県感染症対策連絡協議会 ICN 分科会サーベイランスチーム作成

画像処理工学

3.2013/14シーズンのインフルエンザアップデート(12/25現在)

PowerPoint プレゼンテーション

Microsoft PowerPoint - ip02_01.ppt [互換モード]

厚生労働科学研究費補助金 (地域健康危機管理研究事業)

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

< E B B798E7793B188F5936F985E8ED EA97975F8E9696B18BC CBB8DDD816A E786C7378>

70-4/表1~表4.pwd

< E B B798E7793B188F5936F985E8ED EA97975F8E9696B18BC CBB8DDD816A E786C7378>

22. 都道府県別の結果及び評価結果一覧 ( 大腸がん検診 集団検診 ) 13 都道府県用チェックリストの遵守状況大腸がん部会の活動状況 (: 実施済 : 今後実施予定はある : 実施しない : 評価対象外 ) (61 項目中 ) 大腸がん部会の開催 がん部会による 北海道 22 C D 青森県 2

スライド 1

通話品質 KDDI(au) N 満足やや満足 ソフトバンクモバイル N 満足やや満足 全体 21, 全体 18, 全体 15, NTTドコモ

1 1 A % % 税負 300 担額

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

 

年報.indd

横浜市環境科学研究所

pdf0_1ページ目

140829pref_detail.xlsx

Supplementary data


Microsoft Word - ㅎ㇤ㇺå®ı璃ㆨAIã†®æŁ°ç’ƒ.docx

Microsoft Word - WIDR201839

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

81 平均寿命 女 単位 : 年 全 国 長野県 島根県 沖縄県 熊本県 新潟県 三重県 岩手県 茨城県 和歌山県 栃木県

今週前週今週前週 2/18~2/24 インフルエンザ ヘルパンギーナ 4 4 RS ウイルス感染症 流行性耳下腺炎 ( おたふくかぜ ) 7 4 咽頭結膜熱 急性出血性結膜炎 0 0 A 群溶血性レンサ球菌咽頭炎 流行性角結膜炎 ( はやり目

<944D92868FC75F8F578C D834F F E F1817A35302E786C736D>

Microsoft PowerPoint - 物情数学C(2012)(フーリエ前半)_up

インターリーブADCでのタイミングスキュー影響のデジタル補正技術

目次 1. 研究背景 2. 研究目的 3. 使用データ概要 4. 分析概要 5. クラスター分析 6. 主成分分析 7. 結果 8. 改善策 9. まとめ参考文献 APPENDIX 2017 年 S-PLUS&VISUAL R PLATFORM 学生研究奨励賞 2

Microsoft PowerPoint - 03_資料2医療機器の適正配置ver11(きした修正)

表 1) また 従属人口指数 は 生産年齢 (15~64 歳 ) 人口 100 人で 年少者 (0~14 歳 ) と高齢者 (65 歳以上 ) を何名支えているのかを示す指数である 一般的に 従属人口指数 が低下する局面は 全人口に占める生産年齢人口の割合が高まり 人口構造が経済にプラスに作用すると

インフルエンザ(成人)

インフルエンザ、鳥インフルエンザと新型インフルエンザの違い

2 受入施設別献血量 ( 推計値 ) ブロ都ック道府県 合計 全国血液センター献血者数速報 (Ⅰ) 血液センター 平成 30 年 12 月分 L % L % 日 L L % 日 L L % 台 L L % 台 L 8, ,768

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6

共同住宅の空き家について分析-平成25年住宅・土地統計調査(速報集計結果)からの推計-

定点報告疾患 ( 定点当たり報告数の上位 3 疾患の発生状況 ) (1) インフルエンザ 第 51 週のインフルエンザの報告数は 1025 人で, 前週より 633 人多く, 定点当たりの報告数は であった 年齢別では,10~14 歳 (240 人 ),7 歳 (94 人 ),8 歳 (

untitled

SAP11_03

住宅宿泊事業の宿泊実績について 令和元年 5 月 16 日観光庁 ( 平成 31 年 2-3 月分及び平成 30 年度累計値 : 住宅宿泊事業者からの定期報告の集計 ) 概要 住宅宿泊事業の宿泊実績について 住宅宿泊事業法第 14 条に基づく住宅宿泊事業者から の定期報告に基づき観光庁において集計

1308

2019 年 7 月 4 日 ( 木 ) 愛知県保健医療局健康医務部健康対策課感染症グループ担当内田 久野内線 ダイヤルイン 手足口病警報を発令します!! 愛知県では 感染症の予防及び感染症の患者に対する医療に関する法律 に基づき 県内の小児科を標榜する

店舗の状況 Number of stores 国内コンビニエンスストアの店舗数の推移 Number of convenience stores in Japan * 2017 年度 /FY 年度 /FY 年度 ( 計画 )/FY2019 (Forecast) 20

- 1 - Ⅰ. 調査設計 1. 調査の目的 本調査は 全国 47 都道府県で スギ花粉症の現状と生活に及ぼす影響や 現状の対策と満足度 また 治療に対する理解度と情報の到達度など 現在のスギ花粉症の実態について調査しています 2. 調査の内容 - 調査対象 : ご自身がスギ花粉症である方 -サンプ

画像類似度測定の初歩的な手法の検証

Microsoft PowerPoint - 資料04 重回帰分析.ppt

共通基準による観光入込客統計 ~ 共通基準に基づき 平成 22 年 月期調査を実施した 39 都府県分がまとまりました~ 平成 23 年 10 月 31 日観光庁 各都道府県では 平成 22 年 4 月より順次 観光入込客統計に関する共通基準 を導入し 信頼 性の高い観光入込客統計調査を

pdf0_1ページ目

<4D F736F F D DC58F4994C5817A C8E89D495B294F28E558C588CFC82DC82C682DF8251>

< E188CA8C9F8FD88A65955C2E786C73>

参考 平成28年度 公立学校教員採用選考試験の実施状況調査

PowerPoint Presentation

平成13-15年度厚生労働科学研究費補助金

Microsoft PowerPoint - aep_1.ppt [互換モード]

Rの基本操作

1★プレス42週HP表紙

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習

1311

1

Microsoft Word - WIDR201826

PowerPoint プレゼンテーション

大気環境シミュレーション

日歯雑誌(H19・5月号)済/P6‐16 クリニカル  柿木 5

別紙 1 新型インフルエンザ (1) 定義新型インフルエンザウイルスの感染による感染症である (2) 臨床的特徴咳 鼻汁又は咽頭痛等の気道の炎症に伴う症状に加えて 高熱 (38 以上 ) 熱感 全身倦怠感などがみられる また 消化器症状 ( 下痢 嘔吐 ) を伴うこともある なお 国際的連携のもとに

<4D F736F F F696E74202D2091E6824F82518FCD E838B C68CEB82E894AD90B B2E >

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

平成 29 年度 消費者の意識に関する調査 結果報告書 食品ロス削減の周知及び実践状況に関する調査 平成 30 年 3 月 消費者庁消費者政策課

0. ポイント低いが, 宮城県では 歳代における出生率の低さが, 京都府では0 歳代の低さが影響しており, その要因が異なる. 次に, 平均出生年齢と合計特殊出生率との関係をみたものが図 である. 概して, 平均出生年齢と合計特殊出生率との間には負の相関関係がみられる. ただし, 各都道府県が直線上

Taro-鳥取における自死の現状(平

平成28年版高齢社会白書(概要版)

第2回:データの加工・整理

Presentation Title

DVIOUT

6/10~6/16 今週前週今週前週 インフルエンザ 2 10 ヘルパンギーナ RS ウイルス感染症 1 0 流行性耳下腺炎 ( おたふくかぜ ) 8 10 咽頭結膜熱 急性出血性結膜炎 0 0 A 群溶血性レンサ球菌咽頭炎 流行性角結膜炎 ( はやり目 )

Ⅰ. 調査設計 1. 調査目的 アレルギー疾患対策基本法が施行されており 地域の状況に合わせた適切なアレルギー疾患対策 の検討が進められている中 国内のアレルギー性鼻炎 ( 通年性 花粉症 ) の実態や 患者の保護者が 抱える悩みや情報ニーズを明らかにすることを企図し 本調査を実施しました その中で

第1章 低下から停滞に転じた鉱工業生産

日本語・日本文化研修留学生各大学コースガイド一覧

平成19年度環境ラベルに関するアンケート調査集計結果報告

Microsoft PowerPoint - CSA_B3_EX2.pptx

Microsoft PowerPoint - OsakaU_1intro.pptx

PowerPoint プレゼンテーション

はじめての機械学習

Microsoft PowerPoint - スポーツ経済度ランキング.ppt

»°ËÞ½ŸA“⁄†QŸA“⁄Æ�°½No9

主成分分析 -因子分析との比較-

風力発電インデックスの算出方法について 1. 風力発電インデックスについて風力発電インデックスは 気象庁 GPV(RSM) 1 局地気象モデル 2 (ANEMOS:LAWEPS-1 次領域モデル ) マスコンモデル 3 により 1km メッシュの地上高 70m における 24 時間の毎時風速を予測し

10 年相対生存率 全患者 相対生存率 (%) (Period 法 ) Key Point 1 10 年相対生存率に明らかな男女差は見られない わずかではあ

第6回:データセットの結合

Transcription:

インフルエンザ感染者数の傾向分析と予測 9 班 201720612 雨谷健司 201720622 川﨑航太 201720633 早瀬悠希 201720645 楊明達指導教官イリチュ美佳

研究背景 ( インフルエンザとは ) 原因 : インフルエンザウイルス特徴 : ウイルスに型がある感染して免疫を獲得しても何度も感染する合併症 重症化の危険症状 : 喉の痛み 咳 鼻水さらに 高熱 全身の倦怠感 頭痛 関節 ( 筋肉 ) 痛治療法 : 一般療法と薬物療法 副作用 吸入の必要性 入院の必要性 日本でのインフルエンザによる死亡者数画像出典 http://www.irasutoya.com/2014/02/blog-post_5079.html 画像出典 https://www.astellas.com/jp/health/healthcare/influenza/basicinformation06.html 2

研究背景 ( 日本でのインフルエンザ ) 冬 (12 月から 3 月 ) に流行 インフルエンザウイルスが低温 乾燥を好む 乾燥した冷たい空気により喉や鼻の粘膜が弱っている 年末年始の人の移動 画像出展 http://yajibee.com/post-7988/ 全国のインフルエンザ患者数の時系列データ 国立感染症研究所のデータを元に作成 3

研究目的 4

分析 予測手法 1. スペクトル解析 2. 相関分析 3. 季節性反映モデル 4. 主成分分析 5. 機械学習 (SVM) 6. SIR モデルフィッティング 7. SIR モデルを用いた予測 周期性の確認 気象データとの相関確認 気象データを用いた予測 気象データを用いず 既存モデルを用いた予測 5

使用データについて 国立感染症研究所が公表しているデータを使用 (2001 年 ~2015 年まで同様の形式で集計されている ) 現在は 第 10-1 表報告数, 週 都道府県 週報定点把握対象疾患 性別 で検討 2001 年第 10-1 表 ( 一部抜粋 ) 総数 (total No.) 1 週 (1week) 2 週 (2week) 3 週 (3week) 4 週 (4week) 報告数 (No. of cases) 報告数 (No. of cases) 報告数 (No. of cases) 報告数 (No. of cases) 報告数 (No. of cases) 総 数 (total No.) 305,441 1,163 1,875 2,641 4,220 北海道 (Hokkaido) 9,635 47 53 61 95 青森県 (Aomori) 3,759 10 11 20 23 岩手県 (Iwate) 6,072 21 21 23 24 宮城県 (Miyagi) 8,866 8 9 28 19 秋田県 (Akita) 5,123 13 17 9 23 山形県 (Yamagata) 4,178 5 7 10 20 福島県 (Fukushima) 5,998 5 10 11 10 茨城県 (Ibaraki) 3,642 26 54 67 74 栃木県 (Tochigi) 2,337 16 18 22 38 群馬県 (Gunma) 4,859 29 27 27 65 埼玉県 (Saitama) 19,442 78 136 183 298 千葉県 (Chiba) 10,167 38 79 92 168 東京都 (Tokyo) 6,114 21 51 73 130 神奈川県 (Kanagawa) 15,335 79 120 206 329 47 都道府県 52 週 (1 年 ) 15 年分のデータを使用 6

スペクトル解析 時系列データ スペクトル 時間領域 (Time domain) フーリエ変換 周波数領域 (Frequency domain) 不規則なデータを構成周波数成分に分解し 各周波数とエネルギー ( 振幅 ) との関係 ( スペクトル ) を取り出すための手法 フーリエ逆変換 周期は 1 年 (52.2 週 ) 季節性がある 気象データとの関係性 全国のインフルエンザの患者数の時系列データのスペクトル解析結果 7

相関分析 2 つ以上の変量の間で 一方が変化すると 他方もそれに応じて変化する関係 ( 相関関係 ) を統計分析すること 相関係数とは 1 から 1 までの値を取り 絶対値が 1 に近いほど相関が高い 茨城県のインフルエンザ患者数と絶対湿度の時系列データ 茨城県のインフルエンザ患者数と種々のデータとの時系列と流行期 (2015) の相関係数 時系列流行期 (2015) 相対湿度 -0.422-0.396 絶対湿度 -0.459-0.638 温度 -0.507-0.656 前週の患者数 0.941 0.935 前々週の患者数 0.805 0.769 3 週前の患者数 0.639 0.542 気象データでは 温度と絶対湿度の相関が高い過去のデータとの相関も高い 短期予測へ 8

気象を考慮した短期予測モデル MODEL1 MODEL2 1. 前シーズンのデータより モデルの係数 (A,B,C,D) を決定 2. モデルの入力に今シーズンのデータを使い 予測値を算出 モデルによる茨城県のインフルエンザ患者数の予測結果 9

機械学習の利用 最高気温 平均気温 平均湿度 最低気温 降水量の合計 日照時間 平均風速 患者数 最大風速 平均蒸気圧 10

主成分分析 (PCA) 主成分分析とは相関のある多数の変数から相関のない少数で全体のばらつきを最もよく表す主成分と呼ばれる変数を合成する データの次元削減に利用する 固有値各主成分の分散に対応し 主成分が保持している情報の大きさを示す寄与率各主成分が持っている情報の大きさを比率で示す 累積寄与率 >90% 固有値 寄与率 累積寄与率 1 0.350603 0.727124 0.727124 2 0.062345 0.129299 0.856423 3 0.036753 0.076223 0.932647 4 0.010716 0.022224 0.95487 5 0.008886 0.018429 0.973299 6 0.006063 0.012575 0.985874 7 0.00428 0.008876 0.99475 3 次元データ 8 0.002067 0.004286 0.999036 9 0.000465 0.000964 1 11

サポートベクター回帰 (SVR) SVR とはサポートベクターマシン (SVM) を回帰問題へ拡張したものである.SVM は, 教師付き機械学習を利用した識別器であり, 入力となる特徴量の高次元空間における最適な分離超平面を見つけるもので, 高い汎化能力が示されている サポートベクター回帰 線形回帰 SVR と線形回帰による回帰分析の比較 12

SIR モデル 気象データを考慮せず 数理モデルでの予測についても検討伝染病流行の数理モデルとして SIRモデルが有名である (Kermack et.al,1927) Susceptibles 感受性人口 感染 Infectious 感染人口 治癒死亡 Recovered 隔離人口 感受性人口 : 感染可能者免疫を持たず感染可能 ( 健康な人 ) 感染人口 : 感染者接触した感染可能者に病気を伝染隔離人口 : 感染後死亡 もしくは免疫を獲得した人 ( 系から排除された人 ) d S ( t ) β S ( t ) I ( t ) dt d I ( t ) β S ( t ) I ( t ) γ I ( t ) dt d R ( t ) γ I ( t ) dt β 感染率 γ 治癒率 13

感染者数 [ 人 ] SIR モデル 各県 各年でフィッティングにより 感染率 β 治癒率 γ を決定 例北海道 /2001~2002 年 (SIR モデル ) 実測値 週 モデルから算出した値 決定した基本再生産数が感染者数と強い相関を持つことを確認 基本再生産数 全体が感受性である人口集団において典型的な 1 人の感染者が再生産する二次感染者の平均 人口 感染率 治癒率 基本再生産数 1 人の感染者が何人に移すか 14

SIR モデルを用いた予測 感染者数を既知としてフィッティングしていたため 感染者予測には向かない 感染率 β 治癒率 γ を週ごとに決め 基本再生産数の途中結果を予測に用いる 前処理 1. 各県の人口を 10000 人に揃える 各県のデータを同等に扱う 2. 報告感染者数を区間数 3 週として 移動平均をとり平滑化する 感染者の急変動が原因で生じるフィッティング誤差を減少 週ごとに感染率 治癒率を算出することで フィッティング精度も向上 15

感染者予測におけるモデルフィッティングの有効性 使用幅 r n 週目 使用データの範囲を変えた際の予測精度を比較 分析 基本再生産数 ( 平均値 ) VS 報告感染者数 ( モデルによる特徴量抽出 ) ( 元データ ) 16

感染者予測におけるモデルフィッティングの有効性 基本再生産数と報告感染者数 幅 5 相関係数 0.61 6 週目 使用期間内の報告感染者数と総報告感染者数 6 週目から 使用幅を 5 と設定した場合 相関基本再生産数 > 報告感染者数 相関係数 0.435 17

感染者予測におけるモデルフィッティングの有効性 基本再生産数と報告感染者数 幅 5 相関係数 0.61 10 週目 使用期間内の報告感染者数と総報告感染者数 10 週目から 使用幅を 5 と設定した場合 相関基本再生産数 < 報告感染者数 相関係数 0.82 18

データ使用幅を変えた際の相関 基本再生産数と報告感染者数の相関 使用期間内の報告感染者数と総報告感染者数の相関 流行の初期段階においては 基本再生産数との相関の方が高い ピークに近づくにつれ 報告感染者数との相関が高くなる 本格的な流行が始まる前のデータからモデルフィッティングにより特徴量を抽出することで そのシーズンの総感染者数の早期予測が行える 19

まとめ スペクトル解析の結果 インフルエンザの周期性が判明した 同じく周期性を持つ気象データとの相関が高いことを確認した 短期予測モデルでは 気象を考慮することで精度が向上した 主成分分析により 9 つの変数を 3 つに削減することが出来た 線形回帰よりも SVM を用いた方が結果が向上した 気象データを考慮しない SIR モデルは 総感染者の早期予測に有効であった 総まとめ 今後 予測目的に応じた手法の選択が重要例 ) 来週の感染者を予測したい 今シーズンの総感染者を予測したいなど 気象を用いた予測と数理モデルを用いた予測の融合 アンサンブル予測なども有効だと考えられる 20

参考文献 1. 国立感染症研究所 https://www.niid.go.jp/niid/ja/allarticles/surveillance/2270- idwr/nenpou/6980-idwr-nenpo2015.html,2017/10/03 確認 2. 気象庁, 過去の気象データ http://www.data.jma.go.jp/obd/stats/etrn/index.php,2017/10/3 確認 3. 日野幹雄, スペクトル解析,2010, 朝倉書店 4. J.C ミラー, 村上正康訳, 統計学の基礎,1988, 培風館 5. 澤井啓介, 坂本亘, 代数変数によるインフルエンザ流行予測の改良, 日本計算機統計学会シンポジウム論文集,pp.69-72,2017 6. A.J. Smoda and B. Schoelkopf, A tutorial on support vector regression, NeuroCOLT2 Technical Report, NC2-TR-1998-030, 1998 7. W. O. Kermack and A. G. McKendrick, A Contribution to the Mathematical Theory of Epidemics, Proc. Roy. Soc. of London. Series A, Vol. 115, No. 772 (Aug. 1, 1927), pp. 700-721 21