Microsoft PowerPoint - NC12-2.pptx

Similar documents
概要 協調フィルタリング Start-up問題 利用者が少ないとうまくいかない 集団協調フィルタリング 複数サイトの情報をマルチタスク学習を利用して集める 広域ネットワーク上に分散 通信量を抑制 個人情報の保護 個人嗜好データは局所サイト内でのみ保持 各サイトの個性の保持 個別の推薦モデルの獲得 実


コンピュータ応用・演習 情報処理システム

nlp1-12.key

画像類似度測定の初歩的な手法の検証

共購買情報を用いた多様性のある推薦アルゴリズムの提案

スライド 1

PowerPoint Presentation

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1

行列、ベクトル

Microsoft Word - thesis.doc

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

スライド 1

Microsoft Word - 補論3.2

3. ワークシート 入力データの検証 の完成 ワークシート 入力データの検証 には 入力データの検証表 があります セル範囲は セル A2 からセル G22 までで 2 行目が項目見出しとなっており A 列が入力データ B 列が点検値無し C 列が入力された点検値 D 列が分類コード E 列が製品コ


Microsoft PowerPoint - 7.pptx

ビジネス統計 統計基礎とエクセル分析 正誤表

ギリシャ文字の読み方を教えてください

Microsoft PowerPoint - 最終_図書館TA 黒木 Journal of citation Reports.ppt

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

1. 主な機能追加項目 以下の検索項目をサポートしました 書誌 全文検索コマンド検索 国内 査定日 最新の査定日 ( 登録査定日または拒絶査定日 ) を検索します 査定種別 最新の登録 拒絶査定 または査定なしを検索します 審査最終処分日 最新の審査最終処分日を検索します 審査最終処分種別 最新の審

Microsoft PowerPoint _Part 2_scopus_training2018

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS IEICE Technical Report IN ( ),

2011 年度春学期基礎ゼミナール ( コンピューティングクラス ) A コース 1 / 18 コンピュータリテラシー A コース 第 10 講 [ 全 15 講 ] 2011 年度春学期 基礎ゼミナール ( コンピューティングクラス ) 同志社大学経済学部 DIGITAL TEXT コンピュータリ

論理と計算(2)

Microsoft Word - deim2016再提出.docx

題目

プレポスト【解説】

迷惑メール対策[Barracuda]操作マニュアル

スライド 1


スライド 1

memo

PowerPoint プレゼンテーション

Microsoft PowerPoint - 13approx.pptx

Rの基本操作

情報システム評価学 ー整数計画法ー

補足 中学で学習したフレミング左手の法則 ( 電 磁 力 ) と関連付けると覚えやすい 電磁力は電流と磁界の外積で表される 力 F 磁 電磁力 F li 右ねじの回転の向き電 li ( l は導線の長さ ) 補足 有向線分とベクトル有向線分 : 矢印の位

5_motif 公開版.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

2

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ

PowerPoint プレゼンテーション

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ

A Constructive Approach to Gene Expression Dynamics

Microsoft PowerPoint - 10.pptx

現在 Web 上には様々なオブジェクトが溢れている 例えば Amazon や楽天などのオンラインショッッピングサイトでは CD や DVD 電化製品など 多くの商品が販売されており また 人物や国 機関 出来事などに関する情報は個人の Web ページや Wikipedia などに細かく記載されている

Microsoft Word - 18環設演付録0508.doc

PowerPoint プレゼンテーション

オートマトン 形式言語及び演習 1. 有限オートマトンとは 酒井正彦 形式言語 言語とは : 文字列の集合例 : 偶数個の 1 の後に 0 を持つ列からなる集合 {0, 110, 11110,

Microsoft Word - å“Ÿåłžå¸°173.docx

始めに, 最下位共通先祖を求めるための関数 LcaDFS( int v ) の処理を記述する. この関数は値を返さない再帰的な void 関数で, 点 v を根とする木 T の部分木を深さ優先探索する. 整数の引数 v は, 木 T の点を示す点番号で, 配列 NodeSpace[ ] へのカーソル

2-1. システム概要 2-2. システムの設計 SNS Twitter Web-GIS 推薦システム スマートグラスを統合 平常時は観光回遊行動支援 災害時は避難行動支援 情報の蓄積 共有 推薦とナビゲーションを可能にする 有用性 時間的制約の緩和 スマートグラスの統合 動的 リアルタイム性 SN

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

Microsoft Word - 【6.5.4】特許スコア情報の活用

条件付き書式 の ルールの管理 をクリック 2 新規ルール をクリック 1 ルール の管理をクリック 3 指定の値を含むセルだけ書式設定 を クリック 7 グレーを選び OK をクリック 4 次の値に等しい を選ぶ 5 2 と入力 6 書式をクリック 8OK をクリック 以下同様に 新規ルール をク

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2011-DBS-153 No /11/3 Want list を用いた購買支援と情報推薦 楊斐 清光英成 大月一弘 森下淳也 ユーザの購買希望を列挙した Want list を利用し, 個別のユーザに適

<4D F736F F D B838B8A7597A3424F DEC837D836A B5F E315F E646F63>

情報処理学会研究報告 IPSJ SIG Technical Report ニコニコ動画のログデータを用いた ソーシャルノベルティのある動画の発見に関する研究 平澤真大 小川祐樹 諏訪博彦 太田敏澄 インターネットの普及によって, ニコニコ動画のような動画共有サイトの需要が高まり, 結果多くの動画コン

Web Web [4] Web Web [5] Web 2 Web 3 4 Web Web 2.1 Web Web Web Web Web 2.2 Web Web Web *1 Web * 2*3 Web 3. [6] [7] [8] 4. Web 4.1 Web Web *1 Ama

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17)

AI AI Artificial Intelligence AI Strategy& Foresight AI AI AI AI 1 AI AI AI AI AI AI AI AI AI AI AI AI AI 2 AI 1 AI AI 3 AI 3 20 AI AI AI AI AI

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft PowerPoint - sc1manual.pptx

Web [1] [2] [3] [4] [5] SupportVectorMachine SVM [6] [7] Google [11] Web

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B>

日本外傷歯学会認定医(平成24年11月30日付) H

迷惑メールフィルタリングサービス コントロールパネル利用者マニュアル

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

Contents 1. 新機能 2. 機能改善 3. その他の改善 Hitachi Systems, Ltd All rights reserved. 1

Microsoft PowerPoint - kougi9.ppt

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

Probit , Mixed logit

バイオインフォマティクスⅠ

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

演習2

tokyo_t3.pdf

FORTRAN( と C) によるプログラミング 5 ファイル入出力 ここではファイルからデータを読みこんだり ファイルにデータを書き出したりするプログラムを作成してみます はじめに テキスト形式で書かれたデータファイルに書かれているデータを読みこんで配列に代入し 標準出力に書き出すプログラムを作り

企業活動分析 株式会社ブリヂストン(2014年)

みなさん、改めましてこんにちわ

測量試補 重要事項

1 Word2007 を立ち上げて 表を作って内容を入力し 体裁を整える 1 時間の関係で あらかじめ下記のような簡単な文書を作成して デスクトップにファイル 旅行案内操作前 1 を置いてありますからこのファイルをダブルクリックして開いて下さい (* 時間のある方は末尾に表の挿入方法などを参考に書い

P. もくじ 4.ShareDisk 機能 4-. アップロード方法の種類 アップロード可能なファイルサイズ 4-. ファイルの送信 ( ドラッグ & ドロップでアップロード (HTML5)) 4-3. ファイルの送信 ( ファイルずつ指定してアップロード ) 4-4. 送信状況一覧 4-5. ファ

プログラミング基礎

国立国会図書館サーチとのOAI-PMH連携時に障害となるポイント

DEIM Forum 2009 A2-4 ランキング情報を利用した楽曲推薦システムの構築 樫山裕史 手塚太郎 木村文則 前田亮 立命館大学大学院理工学研究科 滋賀県草津市野路東 1-1-1, 立命館大学情報理工学部 滋賀県草津市野路東 1-1-1,


Microsoft PowerPoint - ad11-09.pptx

コンピュータグラフィックス第6回

vecrot

相関係数と偏差ベクトル

変更履歴 版数変更日変更内容 /9/1 初版設定

2011年度 大阪大・理系数学

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

住宅減税と住宅取得資金の贈与

MT UNDP HDI Langville and Meyer., pp. -, Gowers, Barrow-Green, and Leader., pp. -. なおこれら 参 考 文 献 の 参 考 ページ 数 は 翻 訳 書 の 該 当 ページ 数 に 拠 った.


航空機の運動方程式

Transcription:

演習問題の解答 ネットワークコンピューティング (2) 情報推薦 関西学院大学理工学部情報科学科北村泰彦 ベクトル空間モデルの例において,d 3 の文書を得ようとして, Genes and Genomes を検索質問文として検索を行った. 1. 類似度 0.85 以上の文書を検索結果とするときの, 再現率と適合率を求めよ. 再現率 =0/1=0%, 適合率 =0/1=0% 2. 類似度 0.8 以上の文書を検索結果とするときの, 再現率と適合率を求めよ. 再現率 =1/1=100%, 適合率 =1/2=50% 3. 類似度 0.5 以上の文書を検索結果とするときの, 再現率と適合率を求めよ. 再現率 =1/1=100%, 適合率 =1/3=33% 1 2 ベクトル空間モデル コサイン尺度を用いた場合の類似度計算 cos, 1 3 2 0.408 cos, 1 5 2 0.316 cos, 2 3 2 0.816 cos, 3 6 2 0.866 cos, 1 2 2 0.5 cos, 0 2 2 0 推薦システム 現在, インターネット上は情報過多 (information overload) の状況に陥っており, 利用者は必要な情報を見つけ出すことができない. 推薦システム (recommender system) とは, 利用者にとって有用と思われる対象, 情報, または商品などを選び出し, それらを利用者の目的に合わせた形で提示するシステムである. 3 4

推薦システム 情報検索は, 利用者主導で情報を探し出すこと. 検索結果は利用者の想定内. 情報推薦は, システム主導で情報を提供すること. 利用者が想定しない情報を入手できることもある. 例 : 新刊書. 現在, 電子商取引の発展, 少量多品種の消費傾向に伴い, 情報推薦の重要性が高まっている. If I have 3 million customers on the Web, I should have 3 million stores on the Web. 5 (Jeff Bezos, Amazon.com CEO) 推薦システムの分類個人化の度合い 非個人化 (no personalization): 全ての利用者に対して, 同じ推薦を行う. 編集者による推薦, 売り上げ順位リスト.Apple Store(http://store.apple.com/jp/) 一時的個人化 (ephemeral personalization): システムを利用する一つのセッションで同じ振る舞いをした利用者に, 同じ推薦を行う. Amazon.com 永続的個人化 (persistent personzalization): 利用者の個人情報や過去の利用履歴に応じて異なる推薦を行う.Amazon.com 6 推薦システムの分類推薦手段の分類 概要推薦 (broad recommendation): 全体の統計情報 ( 今週の売り上げランキング ) や編集者からの情報提供 ( 評論家が推薦する映画 ). システム初心者への推薦. 利用者評価 (user comments and ranking): 利用者間での相互推薦. 利用者の批評文や評価レート. 利用者同士の推薦の方が受け入れられやすい. 7 推薦システムの分類推薦手段の分類 通知サービス (notification service): 利用者がシステムを操作していないときに, 電子メールなどで推薦を配送する. 利用者のシステムの再利用を促す. 関連アイテム推薦 (item associated recommendation): 利用者が注目しているアイテムの比較候補を示すことで, 購入の判断支援や関連商品の購入を促す. 緊密な個人化 (deep personalization): システムが利用者の情報や過去の履歴を収集し, それに基づき推薦を行う. 個人向け推薦リスト. 他のシステムとの差別化につながる. 8

推薦システム設計の要素推薦の評価尺度 予測精度 : 推薦したアイテムに利用者がどの程度関心を持つか. 適合率と再現率. セレンディピティ (serendipity) : 利用者が知っているアイテムを推薦しても意味がない. セレンディピティとは目新しさ, 思いがけなさ, 意外性を表す. 被覆率 (coverage): 全アイテムのうち, 推薦評価値の予測が可能なアイテムの割合. 推薦システム設計の要素推薦の評価尺度 学習率 (learning rate): 嗜好データの増加に伴って予測精度は向上する. その向上の度合いを学習率と呼ぶ. 実用的な予測精度に達するまでに必要な嗜好データの数. 9 10 推薦システムの実行過程 1. データの入力 : 推薦システムを利用して推薦を受けようとする人を推薦利用者と呼ぶ. 推薦利用者は自身の嗜好データ (preference data) を推薦システムに入力する. 嗜好データとはいろいろなアイテムについての関心や好みの度合いを数値化したデータである. 2. 嗜好の予測 : 推薦利用者の嗜好データに加えて, 収集しておいた他の利用者の情報やアイテムの情報を利用して, 推薦利用者がまだ知らないアイテムへの嗜好を予測する. 3. 推薦の提示 : 予測した嗜好に基づいて, 目的に応じた適切な形式で, 推薦結果を推薦利用者に提示する. 11 嗜好の予測 内容ベースフィルタリング (content based filtering): 推薦利用者の嗜好データと推薦アイテムを直接比較して, 嗜好データと類似性の高いアイテムを推薦する. 映画を推薦する場合, 推薦利用者に好きな監督 俳優やジャンルを尋ねてから, その条件にあった映画を推薦する. 12

内容ベースフィルタリング 嗜好の予測 (collaborative filtering): 推薦利用者の嗜好データと類似している別の利用者を見つけ出し, 推薦利用者が好むアイテムを推薦する. 未知との遭遇スティーブン スピルバーグ E.T. スティーブン スピルバーグ AI スティーブン スピルバーグ 宇宙戦争スティーブン スピルバーグ プライベート ライアンスティーブン スピルバーグ戦争 グラディエータリドリー スコット歴史 映画を推薦する場合, 映画の趣味があう知り合いに映画を推薦してもらう. 13 14 未知との遭遇 E.T. 活動利用者 未知との遭遇 ブレード ランナー グラディエータ AI 宇宙戦争 プライベート ライアン 利用者データベース 標本利用者 A 標本利用者 B 15 と内容ベースフィルタリングの比較 内容ベースフィルタリング セレンディピティ ドメイン知識が不要 ( アイテムに関する知識 が不要 ) Cold start 問題 ( 新しい利用 者やアイテム ) への対応 少ない利用者数 被覆率 ( 評価されていないアイ テムを推薦できない ) 類似アイテム ( 異なる色の商品は異な る商品とされる ) 少数派の利用者 ( 少数派の嗜好パターンは無視される ) 16

1. 類似度の計算 : 利用者データベースの各利用者と推薦利用者の嗜好の類似度を求める. 類似度とは, 嗜好パターンがどれほど似ているかを定量化したものである. 2. 嗜好の予測 : 推薦利用者が知らないアイテムについて, それらのアイテムに対する利用者の好みと, その利用者と推薦利用者の間の類似度に基づいて, 推薦利用者がそのアイテムをどのくらい好むかを予測する. 人の全利用者の集合を, 種類の アイテムの集合を とする. 評価値 行列は利用者 のアイテム への評価 値 ijを要素とする行列である. ij は評価済みなら評価値の定義域 Rのいずれかの値を取り, 未 評価なら欠損値 * をとる. 推薦利用者を で表す. すなわち, は推薦利用者のアイテムへの評価値である. 利用者と推薦利用者が評価済み のアイテムの集合を, それぞれ と で表す. 17 18 推薦利用者と利用者の類似度は, 共通に評価しているアイテムについての Pearson 相関で測る. ここで, は二人が共通に評価したアイテムの集合, すなわち. また である. なお, ならば, とする. アイテム の評価式は で重み付けした, 各利用者のアイテムへの評価値の加重平均で予測する. ただし はアイテムを評価済みの利用者の集合で, である. 19 20

1: 親子丼 2: 牛丼 3: 海鮮丼 4: カツ丼 1: 山田 1 3 * 3 2: 田中 * 1 3 * 3: 佐藤 2 1 3 1 4: 鈴木 1 3 2 * 上の表は, とする評価値行列である. 推薦 利用者を2: 田中 ( ) としたとき,2: 田中の親子丼へ の推定評価値,を求めよ. 21 親子丼を評価済みの利用者 ( 1 に含まれる利用者 ) と推薦利用者の間の相関係数を求める. 1: 山田,3: 佐藤,4: 鈴木の3 人とも親子丼を評価済みなので, 1 である. 2: 田中と1: 山田の相関,は, 共通に評価しているアイテムが2: 牛丼だけなので,, である. 22 次に,2: 田中と3: 佐藤の相関を計算する. この二人がともに評価しているアイテムは2: 牛丼と3: 海鮮丼なので,, となる. これらのアイテムについての, 上の平均評価値はそれぞれ以下の通りである.,, したがって相関は,,,,,,,,,, 同様に計算すると 2: 田中と 4: 鈴木の相関は, となる. 23 24

( 追加 ) 同様に計算すると 2: 田中と 4: 鈴木の相関は,,,,,,,, 次に推定評価値を計算する. まず,2: 田中の全評価済みアイテム上の平均評価値を求める. したがって,,,,,,,,,,, ここで よって 2: 田中は 1: 親子丼が好きであると予測される. 25 26 参考文献 神嶌敏弘 : 推薦システムのアルゴリズム (1), 人工知能学会誌,22(6):826 837, 2007. 神嶌敏弘 : 推薦システムのアルゴリズム (2), 人工知能学会誌,23(1):89 103, 2008. 神嶌敏弘 : 推薦システムのアルゴリズム (3), 人工知能学会誌,23(2):248 263, 2008. 27