Microsoft PowerPoint - LDW.ppt [互換モード]

Similar documents
コンピュータ応用・演習 情報処理システム

² ² ² ²

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

表1_表4

yamato_2016_0915_色校_CS3.indd


結婚生活を強める


取扱説明書

umeda_1118web(2).pptx



好きですまえばし

離散数学

- 1 -

%

2

ID010-2

地域と文化資産


オートマトン 形式言語及び演習 3. 正規表現 酒井正彦 正規表現とは 正規表現 ( 正則表現, Regular Expression) オートマトン : 言語を定義する機械正規表現 : 言語

1 2

<4D F736F F F696E74202D2093B CC8BE68AD B B82CC8AD AF95FB96405F88EA94CA ED28CFC82AF82C995D28F575F826C A6D94462E >

Microsoft PowerPoint - ad11-09.pptx

Microsoft PowerPoint - mp13-07.pptx

Microsoft PowerPoint - DA2_2019.pptx

A Constructive Approach to Gene Expression Dynamics

NGSデータ解析入門Webセミナー

スライド 1

Microsoft PowerPoint - 09re.ppt [互換モード]

生命情報学

エクセル応用 2016 第 1 章関数の利用 1 作成するブックを確認する 2 関数の概要 3 数値の四捨五入 切り捨て 切り上げを使う 4 順位を求める 5 条件で判断する 6 日付を計算する 7 表から該当データを参照する 第 2 章表作成の活用 1 作成するブックを確認する 2 条件付き書式を

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

Microsoft PowerPoint - 05.pptx

<4D F736F F F696E74202D208CA48B868FD089EE288FDA82B582A294C5292E B8CDD8AB B83685D>

2-1 / 語問題 項書換え系 4.0. 準備 (3.1. 項 代入 等価性 ) 定義 3.1.1: - シグネチャ (signature): 関数記号の集合 (Σ と書く ) - それぞれの関数記号は アリティ (arity) と呼ばれる自然数が定められている - Σ (n) : アリ

Probit , Mixed logit

Microsoft PowerPoint _ビッグデータWS.pptx

にゃんぱすー

~~濱田のジイサンとの出会い~~

Microsoft PowerPoint - 13AssociationRules-01.ppt [互換モード]

2-1. システム概要 2-2. システムの設計 SNS Twitter Web-GIS 推薦システム スマートグラスを統合 平常時は観光回遊行動支援 災害時は避難行動支援 情報の蓄積 共有 推薦とナビゲーションを可能にする 有用性 時間的制約の緩和 スマートグラスの統合 動的 リアルタイム性 SN


メタデータスキーマレジストリ MetaBridge の概要

OTデータとITデータの双方を統合的に分析可能な社会・産業インフラ分野向けのデータ分析基盤を提供開始

Microsoft PowerPoint - algo ppt [互換モード]

オートマトンと言語

頻出パターンマイニング

Microsoft PowerPoint - DA2_2017.pptx

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - DA2_2018.pptx

職業訓練実践マニュアル 重度視覚障害者編Ⅰ

PowerPoint プレゼンテーション

Microsoft Office Visioによる 施設管理について

JP-NETを活用した特許マップ 作成マニュアル【基礎編】

Taro-2分探索木Ⅰ(公開版).jtd

RaQuest MindManager

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

untitled

2 Word2010 応用 第 1 章書式設定 第 5 章グループ作業で役立つ機能 1.1 文字書式と段落書式 10 分 / 5.1 コメントの活用 15 分 / 1.2 スタイルの登録と利用 15 分 / 5.2 変更履歴の活用 20 分 / 1.3 組み込みスタイルの利用 10 分 / 5.3

Oracle Universal Content Management ドキュメント管理 クイック・スタート・チュ-トリアル

文書作成ソフト ( 初級 ) 第 1 章 Wordの基礎知識 STEP1 Wordの概要 STEP2 Wordを起動する STEP3 Wordの画面構成 STEP4 ファイルを操作する STEP5 Wordを終了する第 2 章文字の入力 STEP1 IME2010を設定する STEP2 文字を入力す

ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1

導入設定ガイド

PowerPoint Presentation

Microsoft PowerPoint - 3.ppt [互換モード]

どのような便益があり得るか? より重要な ( ハイリスクの ) プロセス及びそれらのアウトプットに焦点が当たる 相互に依存するプロセスについての理解 定義及び統合が改善される プロセス及びマネジメントシステム全体の計画策定 実施 確認及び改善の体系的なマネジメント 資源の有効利用及び説明責任の強化

CLEFIA_ISEC発表

Excel2013 ピボットテーブルを使った分析

パソコンで楽チン、電力管理3169編

Microsoft PowerPoint - DA2_2018.pptx

Microsoft Word - Excel2.doc

Microsoft PowerPoint - 13approx.pptx

研究最前線 HAL QCD Collaboration ダイオメガから始まる新粒子を予言する時代 Qantm Chromodynamics QCD 1970 QCD Keiko Mrano QCD QCD QCD 3 2

スライド 1

untitled

Microsoft PowerPoint - stat-2014-[9] pptx

リンクされたイメージを表示できません ファイルが移動または削除されたか 名前が変更された可能性があります リンクに正しいファイル名と場所が指定されていることを確認してください 9 2

クラス図とシーケンス図の整合性確保 マニュアル

計算幾何学入門 Introduction to Computational Geometry

IMI情報共有基盤 「表からデータモデル」 データ変換のみを行う方向け画面説明

Microsoft PowerPoint - 資料04 重回帰分析.ppt

家族を強める

改訂履歴 項番版数作成日 / 改訂日変更箇所変更内容. 平成 28 年 5 月 3 日新規章構成の変更, 分冊化に伴い新規作成 (i)

(2) 情報資産の重要度に応じた適正な保護と有効活用を行うこと (3) 顧客情報資産に関して 当法人の情報資産と同等の適正な管理を行うこと (4) 個人情報保護に関する関係法令 各省庁のガイドライン及び当法人の関連規程を遵守すると共に これらに違反した場合には厳正に対処すること ( 個人情報保護 )

Microsoft Word - 第4章.doc

調和系工学 ゲーム理論編

スライド 1

2 / 25 複数ソフトの組み合わせ テキストファイルを Excel で開く テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 14 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Office ボタ

Microsoft PowerPoint - 7.pptx

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献

3/7 マイグレーション開発方針 顧客名 0 作成者 根岸正 < プログラム移行方針 > システム名称 A-VX システムマイグレーション作成日 2015/09/01 < COBOL 資産のプログラム移行 > COBOLソース ( メインとCOPYLIB) を入力としてSCC 言語変換ツールにてVB

Microsoft PowerPoint - 第3回2.ppt

情報処理Ⅰ

Chapter 版 Maxima を用いた LC のインピーダンス測定について [ 目的 ] 電気通信大学 先進理工学科の2 年次後期に実施される電気 電子回路実験において L,C のインピーダンス測定を実施している この実験項目について 無料ソフトの Maxima を用い

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

要求仕様管理テンプレート仕様書

Cisco Start Firewall Cisco ASA 5506-X PAT(Port Address Translation) の設定 2016 年 3 月 23 日 第 1.1 版 株式会社ネットワールド

ER/Studio Data Architect 2016 の新機能

Transcription:

グラフ系列マイニング 猪口明博大阪大学産業科学研究所科学技術振興機構さきがけ

研究の背景 データマイニング インフラ技術の高度化 多様で大規模な情報やデータへのアクセス, 蓄積が容易. 多様で大規模なデータから有用な知識を発掘することは重要な課題. 頻出アイテム集合マイニング [Arawal 9] 頻出アイテム集合列挙問題 一般に多くの事例を説明する知識は有用である. バスケット分析 Raw Data 例 ) スーパーマーケットのデータベースからよく売れる商品の組み合わせを高速に抽出する. データベースはアイテム ( 商品 ) の集合からなる. Taret Data Selection Preprocessed Data Preprocessin Transformed Data Transformation Rules & Patterns Minin Knowlede Interpretation Evaluation 顧客 ={ 食料品 a, 食料品 b, 日用品 b,...} 顧客 n={ 食料品 a, 飲料水 a, 日用品 b,...} σ 人以上の人が購入した商品の組み合わせを全て列挙 { 食料品 a, 飲料水 a}, { 食料品 a, 飲料水 a, 日用品 b},

頻出部分グラフマイニング 問題 : σ 個以上のグラフに含まれる全ての部分グラフを全て列挙 応用例 抗ヒスタミン薬の共通パターン発見 共通パターン H H O HN Ar OHHNEt O Ar X N R H Et NHHNEt HOHHN H R H 抗ヒスタミン薬の一般的な構造 ( 母核 )

グラフ系列の例 ホームページのリンク構造の変化 HTML 文章 : 頂点, ハイパーリンク : 辺 人間関係ネットワークの変化 人 : 頂点, 人間関係 : 辺 遺伝子ネットワークの変化 ( 進化 ) 遺伝子 : 頂点, 相互作用 : 辺 機械の組み立て 部品 : 頂点, 隣接する部品間 : 辺 その他... 6 7 9 8 8 7 7 脱退 参加

グラフ系列のマイニング 6 6 6 頻出する部分系列をマイニング 頻出変換部分系列 FTS (Frequent Transformation Subsequence) グラフ系列 頂点数, 辺数が増減する. 頂点ラベル, 辺ラベルが変化する. 仮定 各頂点は, 頂点 IDをもつ. グラフ系列中の連続するつのグラフの間では, 構造が大きく変化することはなく, ごく一部の構造のみが変化する. 系列中のグラフは, 疎グラフである.

関連研究 Dynamic Graph [Borwardt 006] 00 0 0 () () Evolvin Graph [Berlinerio 009] () () 00 () () 頂点数が増減するグラフやラベルが変化するグラフを扱うことができない. ()

GTRAE の基本アイデア [Inokuchi 008] 系列 系列 頻出パターンコンパイル (vi),(vi,vi,ei,ei,ei),(vi,ed,ed,vd),(ei,ed,vd),(ed,vd) (vi,vi,vi,ei),(vi,ei),(vi,ei,ei,ed,vd),(ei,ed,vd) 系列パターンマイニング 頻出部分系列 (FTS) (vi,vi,ei),vi,(ei,ed,vd)

グラフの変換 頂点や辺の追加, 削除, ラベル変更をグラフの変化. ( j) 赤い頂点の追加 vi ( j) ( j ) ( j ),,,, ( j ) 青い頂点と緑の頂点の間の辺の削除 ed ( j ),vi, ed, グラフの変化をアイテム集合 ( 変換規則の集合 ) の系列に変換後, 系列パターンマイニングアルゴリズムを適用し,FTS を列挙する.

6 種の変換規則頂点の追加 (vi) 辺の追加 (ei) 頂点の削除 (vd) 辺の削除 (ed) 頂点ラベルの変更 (vr) 辺ラベルの変更 (er)

グラフ系列の補間 観測されたグラフ系列 補間されたグラフ系列,(vi, vi, ed, ei),

応用例 抗ヒスタミン薬の共通パターン発見 共通パターン H H O HN Ar OHHNEt O Ar X N R H Et NHHNEt HOHHN H R H 抗ヒスタミン薬の一般的な構造 ( 母核 ) Ar Ar X N R - H H -H R N H 頻出部分グラフが連結 理解が容易 頻出部分グラフが非連結 理解が困難

関連のある FTS のマイニング A 女性 と女性 は関連がある. 女性 と男性 は関連がある. 女性 と男性 は女性 を介して関連があると考える. 男性 は他の人と関連がない. 和グラフ FTS の和グラフが連結であるならば, 関連がある と定義する. 他の頂点と関連のない頂点を除くことで, 互いに関連のある頂点と辺からなる FTS のみをマイニングする.

グラフ系列マイニング問題 変換部分系列の支持度 sup( seq( d')) { d i d i () i... ( n) i { d i }, seq( d')... ), seq( d') : relevant seq (d) : 変換規則の系列 頻出変換部分系列 (FTS:Frequent Transformation Subsequence) 最小支持度以上の支持度を有する変換部分系列 d i () i seq( d () i i ( n) i } 支持度の逆単調性 seq( d' ) seq( d' ) sup( seq( d' )) sup( seq( d' )) グラフ系列マイニング問題 グラフ系列の集合が入力として与えられたとき, 全ての FTS を列挙すること

GTRAE のマイニング手順グラフ系列の集合 和グラフ A 射影 頻出連結部分グラフ グラフマイニングアルゴリズム (vi,vi,ei),vi,ed,ie Relevant FTSs 系列パターンマイニングアルゴリズム

GTRAE の課題 GTRAE は観測されたグラフ系列中の連続する つのグラフで, その大部分は変化せず, ごく一部の構造が変化することを仮定 観測されたグラフ系列中の連続する つのグラフが大きく変化する場合には, 変換規則の系列が長くなり, 膨大な計算時間を要する. 6 6 6

FRISSMiner [Inokuchi 00] A 頻出する部分系列をマイニング G G G G グラフ系列 頂点数, 辺数が増減する. 頂点ラベル, 辺ラベルが変化する. 各頂点は,ID をもつ. グラフ系列中の連続する つのグラフの間では, 構造が大きく変化することはなく, ごく一部の構造のみが変化する. G P P G P P

FRISSMiner のマイニング手順 グラフ系列の集合 和グラフ 射影 頻出連結部分グラフ グラフマイニングアルゴリズム () () () () () ()

射影 () () () () () () 頂点 ID の Reassinment <ABD> <ABDD> 各グラフの同型性を O() で計算可能 系列パターンマイニングアルゴリズム FRISSs <ABD> をマイニングする探索の深さは

GTRAE と FRISSMiner の比較 前提 グラフ系列の表現形式取り出されるパターン GTRAE 連続するグラフ間で構造が大きく変化しない 変換規則の系列 共通する変化 FRISSMiner なしグラフの系列共通する構造

まとめ グラフ系列マイニング GTRAE [Inokuchi 008] 変換規則の系列でグラフ系列を表現 グラフ系列の集合から共通する変化を列挙 FRISSMiner [Inokuchi 00] グラフ系列の集合から共通する構造を列挙 課題 グラフ構造の変化の予測 データの背後に隠された変動やそのパターンを検知