Microsoft PowerPoint - Oct1510b_柳沢.pptx



Similar documents
2 研 究 資 源 共 通 化 統 合 検 索 システムソフトウェア 利 用 者 用 マニュアル(ゲートウェイシステム) 目 次 1. はじめに 主 な 利 用 の 流 れ 検 索 検 索 画 面 検 索 画 面 の 設 定...

研究テーマ考案 ブログ記事を知識源とした 雑談メタファに基づく情報推薦

キーワード分析による言語情報の定量化方法

PowerPoint プレゼンテーション

KINGSOFT Office 2016 動 作 環 境 対 応 日 本 語 版 版 共 通 利 用 上 記 動 作 以 上 以 上 空 容 量 以 上 他 接 続 環 境 推 奨 必 要 2

検 討 検 討 の 進 め 方 検 討 状 況 簡 易 収 支 の 世 帯 からサンプリング 世 帯 名 作 成 事 務 の 廃 止 4 5 必 要 な 世 帯 数 の 確 保 が 可 能 か 簡 易 収 支 を 実 施 している 民 間 事 業 者 との 連 絡 等 に 伴 う 事 務 の 複 雑

Microsoft PowerPoint - MVE pptx

( 別 途 調 査 様 式 1) 減 損 損 失 を 認 識 するに 至 った 経 緯 等 1 列 2 列 3 列 4 列 5 列 6 列 7 列 8 列 9 列 10 列 11 列 12 列 13 列 14 列 15 列 16 列 17 列 18 列 19 列 20 列 21 列 22 列 固 定

Microsoft Word - 第3章.doc

<4D F736F F D208ED089EF95DB8CAF89C193FC8FF38BB CC8EC091D492B28DB88C8B89CA82C982C282A282C42E646F63>

2016 年 度 情 報 リテラシー 次 に Excel のメニューから[ 挿 入 ]タブをクリックし 表 示 されたメニュー 内 の[グラフ]にある[ 折 れ 線 グラフ]のボタンをクリックする するとサブメニューが 表 示 されるので 左 上 の[ 折 れ 線 ]を 選 択 する [ 挿 入 ]

_ZEI-0329_特集(朝倉)_プ2.indd

4 教 科 に 関 する 調 査 結 果 の 概 況 校 種 学 年 小 学 校 2 年 生 3 年 生 4 年 生 5 年 生 6 年 生 教 科 平 均 到 達 度 目 標 値 差 達 成 率 国 語 77.8% 68.9% 8.9% 79.3% 算 数 92.0% 76.7% 15.3% 94

Q IFRSの特徴について教えてください

(Microsoft Word - \221\346\202P\202U\201@\214i\212\317.doc)

(2) 共 通 費 について 第 2 編 共 通 費 2 12 共 通 費 算 定 に 関 する 数 値 の 取 り 扱 い (1) 積 み 上 げによる 算 定 積 み 上 げによる 算 定 は 第 3 編 18に 準 ずる (2) 率 による 算 定 公 共 建 築 工 事 共 通 費 積 算

<4D F736F F D204D46834E A6D92E8905C8D905F93B193FC819593FA8E9F95D C5292E646F63>

公文書非公開決定処分に関する諮問について(答申)

スライド 1

Box-Jenkinsの方法

迷惑メールフィルタリングコントロールパネル利用者マニュアル

一 覧 表 ( 専 従 者 用 ) YES NOチャート( 専 従 月 額 単 価 用 ) (P.4)を 参 考 にしてください < 直 接 雇 用 者 > 一 覧 表 ( 専 従 者 用 )の 単 価 は 委 託 期 間 中 に 継 続 して 半 年 以 上 当 該 AMED 事 業

Ⅰ 調 査 の 概 要 1 目 的 義 務 教 育 の 機 会 均 等 その 水 準 の 維 持 向 上 の 観 点 から 的 な 児 童 生 徒 の 学 力 や 学 習 状 況 を 把 握 分 析 し 教 育 施 策 の 成 果 課 題 を 検 証 し その 改 善 を 図 るもに 学 校 におけ

<4D F736F F D208EE892CB91BE FDA8DD7816A2E646F63>

4 承 認 コミュニティ 組 織 は 市 長 若 しくはその 委 任 を 受 けた 者 又 は 監 査 委 員 の 監 査 に 応 じなければ ならない ( 状 況 報 告 ) 第 7 条 承 認 コミュニティ 組 織 は 市 長 が 必 要 と 認 めるときは 交 付 金 事 業 の 遂 行 の

(1)1オールゼロ 記 録 ケース 厚 生 年 金 期 間 A B 及 びCに 係 る 旧 厚 生 年 金 保 険 法 の 老 齢 年 金 ( 以 下 旧 厚 老 という )の 受 給 者 に 時 効 特 例 法 施 行 後 厚 生 年 金 期 間 Dが 判 明 した Bは 事 業 所 記 号 が

1 書 誌 作 成 機 能 (NACSIS-CAT)の 軽 量 化 合 理 化 電 子 情 報 資 源 への 適 切 な 対 応 のための 資 源 ( 人 的 資 源,システム 資 源, 経 費 を 含 む) の 確 保 のために, 書 誌 作 成 と 書 誌 管 理 作 業 の 軽 量 化 を 図

弁護士報酬規定(抜粋)

1-1 一覧画面からの印刷

. 負 担 調 整 措 置 8 (1) 宅 地 等 調 整 固 定 資 産 税 額 宅 地 に 係 る 固 定 資 産 税 額 は 当 該 年 度 分 の 固 定 資 産 税 額 が 前 年 度 課 税 標 準 額 又 は 比 準 課 税 標 準 額 に 当 該 年 度 分 の 価 格 ( 住 宅

国 税 クレジットカード 納 付 の 創 設 国 税 のクレジットカード 納 付 については マイナンバー 制 度 の 活 用 による 年 金 保 険 料 税 に 係 る 利 便 性 向 上 に 関 するアクションプログラム( 報 告 書 ) においてその 導 入 の 方 向 性 が 示 されている

研究者情報データベース

2. データを 検 索 する なごやコレクションのデータを 検 索 するための 方 法 として キーワード 検 索 詳 細 検 索 の 二 通 りの 検 索 方 法 が あります 2.1. キーワードから 探 す キーワードを 入 力 する トップページの 入 力 ボックスに 検 索

は 固 定 流 動 及 び 繰 延 に 区 分 することとし 減 価 償 却 を 行 うべき 固 定 の 取 得 又 は 改 良 に 充 てるための 補 助 金 等 の 交 付 を 受 けた 場 合 にお いては その 交 付 を 受 けた 金 額 に 相 当 する 額 を 長 期 前 受 金 とし

研究者総覧システム

平成19年9月改定

リング 不 能 な 将 来 減 算 一 時 差 異 に 係 る 繰 延 税 金 資 産 について 回 収 可 能 性 がないも のとする 原 則 的 な 取 扱 いに 対 して スケジューリング 不 能 な 将 来 減 算 一 時 差 異 を 回 収 できることを 反 証 できる 場 合 に 原 則

■コンテンツ

kyoukai.indd

<4D F736F F F696E74202D208E9197BF322D31208C9A90DD B835E CC8A C982C282A282C4>

改 定 履 歴 改 訂 日 改 訂 理 由 及 び 内 容 承 認 者 確 認 者 改 訂 者 05/8/7 新 版 発 行 05/0/5 推 奨 動 作 環 境 を 追 記

<4D F736F F D2091E F18CB48D C481698E7B90DD8F9590AC89DB816A2E646F63>

入札方式別操作

セマンティック HTML/XHTML サンプルページ

鳥 取 国 民 年 金 事 案 177 第 1 委 員 会 の 結 論 申 立 人 の 昭 和 37 年 6 月 から 38 年 3 月 までの 国 民 年 金 保 険 料 については 納 付 していたものと 認 められることから 納 付 記 録 を 訂 正 することが 必 要 である 第 2 申

- もくじ - Ver の 変 更 点 P.3 1 障 害 者 総 合 支 援 法 概 要 P.4 2 平 成 25 年 度 以 降 地 域 区 分 対 応 P 地 域 区 分 設 定 方 法 P 地 域 区 分 について P 地 域 単 価 の 確

しかし 主 に 欧 州 の 一 部 の 回 答 者 は 受 託 責 任 について 資 源 配 分 の 意 思 決 定 の 有 用 性 とは 独 立 の 財 務 報 告 の 目 的 とすべきであると 回 答 した 本 ED に 対 する ASBJ のコメント レターにおける 意 見 経 営 者 の 受

1 林 地 台 帳 整 備 マニュアル( 案 )について 林 地 台 帳 整 備 マニュアル( 案 )の 構 成 構 成 記 載 内 容 第 1 章 はじめに 本 マニュアルの 目 的 記 載 内 容 について 説 明 しています 第 2 章 第 3 章 第 4 章 第 5 章 第 6 章 林 地

R4財務対応障害一覧

「報・連・相」の方法


Microsݯft Word - 91 forܠ2009November.docx

SXF 仕 様 実 装 規 約 版 ( 幾 何 検 定 編 ) 新 旧 対 照 表 2013/3/26 文 言 変 更 p.12(1. 基 本 事 項 ) (5)SXF 入 出 力 バージョン Ver.2 形 式 と Ver.3.0 形 式 および Ver.3.1 形 式 の 入 出 力 機 能 を

1-1 建 築 物 等 保 守 管 理 業 務 業 務 の 実 施 方 針 本 業 務 の 実 施 方 針 等 について 記 載 してください なお 以 下 の 事 項 については 必 ず 記 載 して ください ( 施 設 維 持 管 理 業 務 全 体 で A4 判 180 枚 以 内 で 記

5-2 一 般 ユーザー 用 :メール 2 送 信 者 のリンクをクリックすると 受 信 メールの 内 容 を 見 ることができます 受 信 メール 内 容 画 面 項 目 送 信 者 宛 先 CC 本 文 (テキスト) 本 文 (HTML) メールアドレスのリンクをクリックするとアドレス 帳 へ

注 雇 促 進 税 制 と 本 制 度 のどちらかを 利 する 可 能 性 があるが あらかじめどちらの 制 度 を 利 するか 判 断 できない という 場 合 雇 促 進 税 制 の 事 前 届 出 ( 雇 促 進 計 画 の 提 出 )をした 上 で 申 告 の 際 にどちらを 利 するかご

1. アクセスする 2. 簡 易 検 索 画 面 (fig. 1) アクセスすると 最 初 に 出 る 画 面 です 検 索 語 入 力 ボックスにキーワードを 入 力 して 論 文 検 索 ボタンをクリックし ます 3. ボックス 下 部 のチェック 項

<4D F736F F D203193FA8AD45F95CA8E86325F89898F4B315F94F093EF8AA98D AD97DF914F82CC8FEE95F182CC8EFB8F C28E8B89BB2E646F63>

<93798D488E7B8D488AC7979D977697CC5F F96DA8E9F2E786264>

1

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

求職情報誌201505改訂版1.xls

Word 003 スキルブック 06 - オブジェクトの 利 用 0.Word で 作 る 表 : 行 幅 を 最 小 値 より 小 さく 設 定 する 3 表 の 左 右 のサイズを 適 宜 調 整 します Word で 表 を 作 成 するとき, 列 幅, 行 幅 ともに 基 本 的 に 自 由

大田市固定資産台帳整備業務(プロポーザル審査要項)

養 老 保 険 の 減 額 払 済 保 険 への 変 更 1. 設 例 会 社 が 役 員 を 被 保 険 者 とし 死 亡 保 険 金 及 び 満 期 保 険 金 のいずれも 会 社 を 受 取 人 とする 養 老 保 険 に 加 入 してい る 場 合 を 解 説 します 資 金 繰 りの 都

PowerPoint プレゼンテーション

<4D F736F F D D31208EC096B18F438F4B8E7793B1834B FC92F BD896694C5816A2E646F6378>

Microsoft Word - FBE3A91F.doc

<4D F736F F D C B838B91CE8DF491808DEC837D836A B76312E342E646F63>

(5) 人 権 侵 害, 差 別 又 は 名 誉 毀 損 となるもの, 又 はおそれがあるもの (6) 他 人 を 誹 謗 し, 中 傷 し, 又 は 排 斥 するもの (7) 投 機 心, 射 幸 心 をあおるもの, 又 はそのおそれがあるもの (8) 内 容 が 虚 偽 誇 大 であるなど 過

(Microsoft Word - \203A \225\345\217W\227v\227\314 .doc)

たものであり 必 ずしも 理 屈 の 面 から 定 められたものではないことから 5 年 を 超 える 見 積 可 能 期 間 に 係 る 繰 延 税 金 資 産 の 計 上 金 額 と 計 上 根 拠 を 開 示 する 理 由 が 乏 し いこと 結 果 として 企 業 の 分 類 を 開 示 す

国立研究開発法人土木研究所の役職員の報酬・給与等について

PowerPoint プレゼンテーション

<4D F736F F D E A815B F95F28D73838F C D758DC02093C195CA8D A93AD95DB8CAF82CC8F578C B582A2944E937882AA82CD82B682DC82E9914F82CC8A6D C E646F6

ただし 区 分 は 同 一 の 譲 渡 所 得 であっても 不 動 産 の 譲 渡 損 益 は 不 動 産 の 譲 渡 損 益 どうしで また 株 式 等 の 譲 渡 損 益 は 株 式 等 の 譲 渡 損 益 どうしで それぞれ 通 算 を 行 うことになっています( 次 項 の 損 益 通 算

所 得 税 と 住 民 税 の 税 率 表 所 得 税 と 住 民 税 の 税 率 は 以 下 の 通 りです 退 職 所 得 の 場 合 も この 税 率 表 を 使 います 1. 平 成 19 年 1 月 1 日 以 降 ( 所 法 891) 課 税 所 得 所 得 税 率 控 除 額 ~195

<4D F736F F D E718CF68D C768E5A8F9197DE>

<4D F736F F D2095BD90AC E D738FEE816A939A905C91E D862E646F63>

特別徴収封入送付作業について

平成16年度

<4D F736F F D CF322D33817A95DB8CEC8ED292B28DB881698A6D816A2E646F63>

[2] 控 除 限 度 額 繰 越 欠 損 金 を 有 する 法 人 において 欠 損 金 発 生 事 業 年 度 の 翌 事 業 年 度 以 後 の 欠 損 金 の 繰 越 控 除 にあ たっては 平 成 27 年 度 税 制 改 正 により 次 ページ 以 降 で 解 説 する の 特 例 (

Oracle Text 概要

<4D F736F F F696E74202D B E E88E68C9A90DD8BC65F E DC58F4994C52E >

2 活 動 組 織 において 実 測 が 可 能 な 場 合 は コンパス 測 量 やGPS 計 測 等 により 対 象 森 林 の 面 積 ( 延 長 )を 実 測 して 下 さい GPS 機 器 の 貸 し 出 しについては 事 務 局 へご 相 談 下 さい 活 動 組 織 に おいて 実 測

2 役 員 の 報 酬 等 の 支 給 状 況 平 成 27 年 度 年 間 報 酬 等 の 総 額 就 任 退 任 の 状 況 役 名 報 酬 ( 給 与 ) 賞 与 その 他 ( 内 容 ) 就 任 退 任 2,142 ( 地 域 手 当 ) 17,205 11,580 3,311 4 月 1

<4D F736F F D2090BC8BBB959491BA8F5A91EE8A C52E646F63>

Microsoft Word - 19年度(行個)答申第94号.doc

(Microsoft PowerPoint - Ver12\203o\201[\203W\203\207\203\223\203A\203b\203v\216\221\227\277.ppt)

PowerPoint プレゼンテーション

年 金 払 い 退 職 給 付 制 度 における 年 金 財 政 のイメージ 積 立 時 給 付 時 給 付 定 基 (1/2) で 年 金 を 基 準 利 率 で 付 利 給 付 定 基 ( 付 与 利 の ) 有 期 年 金 終 身 年 金 退 職 1 年 2 年 1 月 2 月 ( 終 了 )

<4D F736F F D2095BD90AC E D738FEE816A939A905C91E D862E646F63>

新 生産管理システム ご提案書 2002年10月15日 ムラテック情報システム株式会社

Microsoft PowerPoint _リビジョンアップ案内_最終.pptx

平成27年度大学改革推進等補助金(大学改革推進事業)交付申請書等作成・提出要領

勤 怠 項 目 6~10の 追 加 < 概 要 > 勤 怠 項 目 6~10を 追 加 しました それに 伴 い 下 記 の 箇 所 が 変 更 になりました ページ 場 所 誤 25 給 与 奉 行 への テキスト 書 出 順 勤 怠 項 目 1~ 勤 怠 項 目 5 27 内 容 勤 怠 項 目

の 購 入 費 又 は 賃 借 料 (2) 専 用 ポール 等 機 器 の 設 置 工 事 費 (3) ケーブル 設 置 工 事 費 (4) 防 犯 カメラの 設 置 を 示 す 看 板 等 の 設 置 費 (5) その 他 設 置 に 必 要 な 経 費 ( 補 助 金 の 額 ) 第 6 条 補

第 40 回 中 央 近 代 化 基 金 補 完 融 資 推 薦 申 込 み 公 募 要 綱 1 公 募 推 薦 総 枠 30 億 円 一 般 物 流 効 率 化 促 進 中 小 企 業 高 度 化 資 金 貸 付 対 象 事 業 の 合 計 枠 2 公 募 期 間 平 成 28 年 6 月 20

第1回

Transcription:

Extracting Relevant Snippets from Documents through Language Model based Text Segmentation Web Intelligence, 2009 Qing Li, K. Selcuk Candan, Yan Qi ( Oct.15,2010, 柳 沢 担 当 )

目 的 言 語 モデルを 用 いたSnippetの 抽 出 方 法 提 案 文 書 から 適 切 な 文 の 抽 出 RELEVANCE LANGUAGE MODELS 言 語 モデルの 利 用 Curvature analysis 曲 線 からのテキストセグメント

関 連 研 究 TextTiling 法 [Hearst,1997] 領 域 内 における 語 彙 の 重 なり 尺 度 に 基 づく 類 似 度 により 境 界 を 決 定

言 語 モデルを 用 いたアプローチ RELEVANCE LANGUAGE MODELS 言 語 モデルによる 境 界 d P(w M) d w d P(w Mr) w P(w ) w snippet Non snippet

言 語 モデルを 用 いたアプローチ RELEVANCE LANGUAGE MODELS d snippet P(w ) Non snippet w collection: 全 document 内 の 単 語 の 集 合 cfw :collection 内 のwの 出 現 頻 度 coll.size :collection 内 の 総 単 語 数

言 語 モデルを 用 いたアプローチ RELEVANCE LANGUAGE MODELS 仮 説 : snippet 内 の 単 語 の 出 現 確 率 はqueryの 共 起 確 率 と 類 似 [Lavernko] クエリ q={q1,q2,q3 qk}を 用 いて P(w Mr)をP(w ( q q1,q2,q3 qk)で q 近 似 d Mr P(w Mr) snippet w Mrはクエリによるドキュメントの 集 合 から 抽 出

言 語 モデルを 用 いたアプローチ RELEVANCE LANGUAGE MODELS 手 順 1. クエリq で 上 位 ランキングされたページRqを 取 得 2. 与 えられたDocumentの 単 語 出 現 確 率 p(w d)を 計 算 Pml(w d):ドキュメント 内 での 単 語 wの 出 現 確 率 Pbg(w):スムージングのため 3. P(w Mr)をP(w Rq)で 近 似

言 語 モデルを 用 いたアプローチ SNIPPET EXTRACTION CUTS[Yan2006] [ ] Blogのトピックセグメンテーション i 日 目 とi+1 日 目 のEntry 間 の 類 似 度 の 差 に 応 じてトピックが 変 わったか 判 断 Entry : blog ページから 一 日 分 の 記 事

言 語 モデルを 用 いたアプローチ SNIPPET EXTRACTION CUTS[Yan2006] [ ] Blogのトピックセグメンテーション» Step1: 各 Entry 内 に 含 まれるキーワード 単 語 の 重 みづけ» Step2: 各 Entry 間 で 非 類 似 度 Dを 取 得 今 回 は 時 系 列 (Straight line)

言 語 モデルを 用 いたアプローチ SNIPPET EXTRACTION CUTS[Yan2006] [ ] Blogのトピックセグメンテーション i 日 目 とi+1 日 目 のEntry 間 の 類 似 度 の 差 に 応 じてトピックが 変 わったか 判 断 Entry : blog ページから 一 日 分 の 記 事 連 日 で 同 じトピックを 書 いていると 想 定?

言 語 モデルを 用 いたアプローチ SNIPPET EXTRACTION 今 回 トピックセグメンテーション» Step1: 文 内 のキーワード 単 語 の 重 みづけ» Step2: 文 内 での 非 類 似 度 Dを 取 得 今 回 は 時 系 列 (Straight line)

言 語 モデルを 用 いたアプローチ 曲 線 における 変 動 のセグメンテーション 理 想

言 語 モデルを 用 いたアプローチ 曲 線 における 変 動 のセグメンテーション 理 想 近 似 値 を 用 いた 確 率 モデル

言 語 モデルを 用 いたアプローチ Curvature analysis[y.qi,2006] 曲 線 の 傾 きに 応 じたセグメンテーション Dminated: 比 較 的 水 平 部 分 Drifting: 傾 いている 部 分 (セグメント) Interrupted: 一 時 的 な 遮 断 部 分 Case1: 近 似 による 一 時 的 な 遮 断 Case2:Drifting 部 分

言 語 モデルを 用 いたアプローチ Curvature analysis[y.qi,2006] 曲 線 の 種 類 Dminated: 比 較 的 水 平 部 分 Drifting: 傾 いている 部 分 (セグメント) Interrupted: 一 時 的 な 遮 断 部 分 Case1: 近 似 による 一 時 的 な 遮 断 Case2:Drifting 部 分

言 語 モデルを 用 いたアプローチ Curvature analysis[y.qi,2006] 一 時 的 な 遮 断 部 分 とDrifting g 部 分 の 区 別 e1からe4 間 での 傾 き 方 で 区 別 s1の 線 について 定 義

言 語 モデルを 用 いたアプローチ Curvature analysis[y.qi,2006] Adaptive curve segmentation[david.g,1987] プログラムコードの 効 率 的 に 処 理 するためセグメント 端 から 端 まで 線 において 垂 線 が 最 大 となる 点 を 取 得 上 記 で 得 た 点 から 端 まで 線 を 引 き 同 様 に 点 を 取 得 セグメント( 線 ) 間 の 点 が 与 えられた 数 (MinSpan)になるまで 同 様 な 作 業 を 繰 り 返 す セグメント( 線 ) 間 の 点 が 与 えられた 数 (MinSpan)になるまで 同 様 な 作 業 を 繰 り 返 す ( 上 記 の 例 :MinSpan=1) 最 初 から 点 iと 点 i+2で 線 を 引 けば 一 緒?

言 語 モデルを 用 いたアプローチ Curvature analysis[y.qi,2006] それぞれの 部 分 を 傾 きにより 識 別 k: 傾 き(e) λdrifting:パラメタ 上 記 の 場 合 Interruptの 条 件 に 当 たるのは h=2

有 用 性 の 検 証 実 験 1 正 解 データとの 比 較 (preciotion, recall,f measure) 使 用 データ Internet 上 から 収 集 30 queries 一 般 によくつかわれる 名 詞 RM Curve or FS win queries ans 30 queriesに 対 してのanswers 詳 細 不 明 200 単 語 ごと 上 記 の 手 法 でセグメントを 行 い 最 も 多 くqueryを 含 む 部 分 を 選 択 RM Curve: Curvature analysis FS Win:googleの 検 索 結 果 テキストデータのSizeを 増 やしての 検 証

実 験 結 果 正 解 データとの 比 較 (preciotion, recall,f measure) 200 単 語 ごと 上 記 の 手 法 でセグメントを 行 い 最 も 多 くqueryを q y 含 む 部 分 を 選 択 Ls: 正 解 データの 単 語 の 総 数 Le: 抽 出 したSnippetの 単 語 の 総 数 Lo: 正 解 データと 抽 出 Snippetの 単 語 の 重 複

実 験 結 果 有 用 性 の 検 証 正 解 データとの 比 較 (preciotion, recall,f measure) answerのサイズ 変 更 Precision Recall

有 用 性 の 検 証 ノイズを 含 めた 実 験 実 験 2 内 容 の 異 なる2つのドキュメントにqueryを 挿 入 (ノイズ) ズ RM Curve or FS win queries ans queries queries

有 用 性 の 検 証 ノイズを 含 めた 実 験 実 験 結 果 2 内 容 の 異 なる2つのドキュメントにqueryを 挿 入 (ノイズ) ズ F 値 (Noise 考 慮 あり)

考 察 1 FM Win: Noiseが 入 ると 精 度 が 低 い RM Curve: queryに 関 する 文 脈 上 の 語 を 考 慮 可 能 Noiseの 適 切 でないセグメントのフィルタリングが 可 能

考 察 2 文 書 の 件 数 と 精 度 (F 値 ) ページRqの 理 想 の 数 文 書 は5~40の 間 が 良 い 特 に15 件 が 一 番 良 い

結 論 適 切 なスニペットを 抽 出 するモデルの 提 案 RM Curve 正 解 データとの 比 較 queryに 関 する 文 の 語 を 考 慮 可 能 Noiseの 適 切 でないセグメントのフィルタリングが 可 能

関 連 研 究 LEASED WITH YOUR GOOGLE DESCRIPTION? ( 抜 粋 ) Where is Google pulling the snippet description? Snippetの 抽 出 エリア(googleの g 話 ) METAタグ ALTテキスト( 画 像 説 明 ) 文 頭 テキスト 追 加 Headタグ 追 加 Bodyタグ 追 加 ALTタグ ナビゲーションバー( 左 隅 ) Copyright 情 報 キーワードのフレーズ

TextTiling 法

クエリとの 共 起 確 率 共 起 確 率 P(w Q) の 例 q1 q2 q3

クエリとの 共 起 確 率 共 起 確 率 P(w Q) の 例 q1 q2 q3

LEASED WITH YOUR GOOGLE DESCRIPTION? Where is Google pulling the snippet description? ( 抜 粋 ) 1. META description tag (although Google doesn t use contents to dt determine relevancy). 2. First ALT text found on the page. 3. First text found on the page pg (which may be a heading tag, body text, etc.). 4. Additional heading tags on the page. 5. Additional body text found on the page. 6. Additional ALT text on the page. 7. Navigation bar on the left hand side of the page (which is rarely a relevant description of a site!). 8. Copyright information at the bottom of the page. 9. Wherever the keyword phrase is found.

言 語 モデルを 用 いたアプローチ Curvature analysis[y.qi,2006] Adaptive curve segmentation[david.g,1987] 空 間 内 の 点 をbinary treeのデータとして 保 持