共同作業の新しい進め方
SHARE ORGANIZE DISCOVER BUILD MANAGE アイデア チーム エキスパート アプリケーション コスト コンテンツ プロジェクト 答え Web サイト リスク ビジョン 情報 コネクション クラウド 時間 を共有する を組織するを見つけるを構築するを統制する
ユーザーに合わせてユーザーが探してる結果を見つけることが出来る 常に一歩先のエクスペリエンスを伴って 答えを取得し 次の行動を行うことが出来る あらゆるスケール要件にも対応可能でスマートなアプリケーションを構築することが出来る 検索を意識させずに ミッションクリティカルなアプリケーションに検索機能を利用することが出来る
ベストプラクティスに基づいたスケールと冗長化を兼ね備えた構成
サーバーロール 外部公開 API コンポーネント ( スケールする単位 ) カスタムモジュール 斜体 : 実行モジュール名 カスタムアプリケーション 検索インデックス クラウド mssearch.exe noderunner.exe noderunner.exe noderunner.exe noderunner.exe 検索管理 DB クロール DB リンク DB 分析レポート DB
検索の解剖図 ("Search Patterns", http://searchpatterns.org/) より エンド ユーザー 絞り込み パーソナライズ 検 索 API リッチな UI 迅速なレスポンス HTML + JavaScript の 表示フォーマット設定 REST + JSON コネクタ フレームワーク 検索キーワード意味判断 類義語展開 等 クエリ処理 コンテンツ処理 検索インデックス セキュリティ トリミング 結果順位調整 レコメンド 等 情報リソース 絞り込み 並び替え 等 属性抽出 カテゴリ分け 言語処理 外部システム呼出 フィルタリング 等 ク ロ ー ラ ー データベース SharePoint Lotus Notes ファイルサーバー Webサイト
4コア / 12GB / 300GB 4コア / 12GB / 300GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 12GB / 300GB 4コア / 12GB / 300GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 4コア / 16GB / 500GB 8コア / 24GB / 800GB インデックス / サーチ コア コンポーネントの指標 1,000 万アイテム / ノード 500 GB / 1,000 万アイテム クエリ処理コンポーネントの指標 8,000 万アイテム毎に追加 ディスクの指標 1KB Read [IOPS] 32KB Read [IOPS] 32KB Write [IOPS] 64KB Read [IOPS] 管理コンポーネント コンテンツ処理コンポーネント 分析処理コンポーネント インデックス / サーチ コア コンポーネント クロール コンポーネント クエリ処理コンポーネント 256KB Write [IOPS] 仮想環境 100MB Read [MB/s] 100MB Write [MB/s] 10,000 rpm 以上 RAID 5 構成 SAS インターフェースを推奨 2,000 1,800 900 - - 500 250 - - - 300 100 200 200
どこのアイテムも システムに合わせて 適切な情報を取得
検索インデックス ファイル サーバー 社内外の Web サイト SharePoint サーバー ひとプロフィル Lotus Notes/Domino Exchange RDBMS (SQL Server, LOB アプリケーション パブリック フォルダ Oracle Database 等) (SAP, Siebel 等) 標準で対象のファイル形式 Office ドキュメント テキスト HTML XML PDF ZIP 圧縮ファイル オープンドキュメント フォーマット Outlook メッセージファイル など クラウド ローカルまたはリモートの (Office 365, Azure 等) SharePoint サーバー OpenSearch クロール 検索
差分クロールのスケジュール実施例 期待値 現実値 変更プロセス変更プロセス変更プロセス変更プロセス 変更プロセス 継続的クロール実施例 変更プロセス 変更量が多い際にクロール時間が長くなり スケジュールされた差分クロールがスキップされる 時間 時間 クロールされていないコンテンツ数 インデックス新鮮度の検証結果 Crawl Schedule Incremental Crawl Freshness Continuous Crawl Freshness 現実値 #1 #3 #4 #2 #5 #6 #7 #8 #9 #10 スキップされるスケジュール無し 日時 低い値でほぼ一定となる コンテンツ変更の多い時間帯 コンテンツ変更の少ない時間帯 コンテンツ変更の多い時間帯
章タイトルプロパティの値 ; ; コンテンツへの情報付与 カスタムプロパティ A の値 ; ; ; カスタムプロパティ B の値 ; ; ドキュメント解析メタデータ抽出 管理プロパティへのマッピング 言語判別 コンテンツエンリッチメント 発音変換 ワードブレーク カスタムエンティティ抽出 ドキュメントサマリー生成 外部 Web サービスから取得した情報 外部 Web サービス
検索意図が理解され 結果が視覚化され 次の行動を起こせる
検索インデックス 検索結果 Web ブラウザ 検索結果からコンテンツのダウンロード コンテンツ 絞り込み 検索結果はこう分類されますよ ひと検索 この検索キーワードに関連した人です クエリ候補 こんな検索キーワードはどうですか? お気に入り 以前 これを参照しましたよ ソーシャル いいね! と xx 回押されていますよ サムネイルおよびプレビューの確認 Office Web Apps による Web ブラウザ上の参照または編集ランク付けモデルによる適切な検索結果順序検索ホバーパネルによる適切な次のアクション
検索ボックスに入力された検索キーワード クエリルール 実際に実行される検索クエリー 検索インデックス お気に入り ひとの検索結果 表示テンプレート ひとのアイテムの表示形式 (HTML) 表示テンプレート Word アイテムの表示形式 (HTML) 表示テンプレート PowerPoint アイテムの表示形式 (HTML) 結果の種類 ドキュメントの種類などの判断 ドキュメントの検索結果
OSS を検索 セキュリティ情報を持った検索インデックス 共有フォルダ 1 各種認証基盤の利用 検索結果 OSS.DOCX OSS.DOCX OSS.PPTX 共有フォルダ 2 OSS を検索検索結果 OSS.DOCX 検索実行時におけるセキュリティ情報の確認 OSS.XLSX SharePoint ポータル Active Directory などの認証基盤 OSS.XLSX OSS.PPTX
活用が可能な 分析機能の提供
検索インデックスへの推奨情報の投入 推奨アイテムのリクエスト 推奨アイテムの送信 推奨アイテム Web パーツや REST API 各種イベント アイテム間の関連グラフの計算 イベント情報の送信 イベント情報の登録 分析レポート DB
利用状況レポート機能により 人気のあるアイテムの利用状況データの取得 最も人気のあるアイテム 推奨アイテムの送信 推奨アイテム Web パーツを含むページ 利用状況レポート アイテム間の関連グラフの計算 イベント情報の送信 イベント情報の登録 利用状況データの取得 カスタム分析アプリケーション 分析レポート DB
柔軟で 権限移譲された管理
こんな頻度で継続的クロールを実行しよう ファーム管理者によるファームレベルの検索管理 サイトコレクション管理者によるサイトコレクション単位の検索管理 サイト管理者によるサイト単位の検索管理 この管理プロパティも検索出来るようにしよう カスタム管理アプリケーション このサイトをもう一度クロールして!
検索 UX の構築 簡単な統合
サーバーロール 外部公開 API 下線 : 新機能 コンポーネント ( スケールする単位 ) カスタムモジュール 斜体 : 実行モジュール名 カスタムコネクタ コンテンツエンリッチメントサービス カスタムフィルタ カスタムワードブレーカー カスタムセキュリティトリマー カスタムアプリケーション 検索インデックス クラウド mssearch.exe noderunner.exe noderunner.exe noderunner.exe noderunner.exe カスタム管理アプリケーション カスタム分析アプリケーション 検索管理 DB クロール DB リンク DB 分析レポート DB
Web ブラウザ REST クライアント マネージドクライアント
1. クロール 3. 検索時に情報を渡す 2. 検索 Web ブラウザ
検索を意識させず 重要なシステムに 検索機能を利用
SHARE ORGANIZE DISCOVER BUILD MANAGE アイデア チーム エキスパート アプリケーション コスト コンテンツ プロジェクト 答え Web サイト リスク ビジョン 情報 コネクション クラウド 時間 を共有する を組織するを見つけるを構築するを統制する
サイトコレクションを跨いだ情報表示 コンテンツタイプを跨いだコンテンツ表示 クエリ結果 Web パーツ (SharePoint 2010) コンテンツ検索 Web パーツ (SharePoint 2013) 〇 〇 結果のプレビュー 〇
単なる検索結果だけではなく 答えを見つけるためのインテリジェントな検索 UX を提供します ビジネスユーザーに 更に関連性の高く 魅力的で アクションを起こし易い検索を提供します 統合し易く 管理し易い 拡張性のあるプラットフォームを提供します
代替方法 検索アラートまたは SharePoint RSS を利用 検索の分析機能に変更 KQL または FQL を利用 REST または CSOM の利用を推奨 BCS コネクタフレームワークの利用を推奨
変更前 変更後 - 個数制限なく作成できる パイプライン拡張 おすすめコンテンツビジュアルおすすめコンテンツ Content SSA + Query SSA 最大 12 個まで コンテンツエンリッチメント Web サービス 昇格した結果 Search SSA
代替方法なし ( カスタムによる方法を検討中 ) SharePoint コネクタを利用 BCS ベースのカスタムコネクタ なし 標準で 55 種類のファイル種類に対応必要なファイル種類に対応した ifilter の導入 なし なし 検索アラートまたは SharePoint RSS を利用
どこのアイテムも システムに合わせて 適切な情報を取得
クラウド
5 分間隔に変更する場合 $ssa = Get-SPEnterpriseSearchServiceApplication $ssa.setproperty("continuouscrawlinterval", 5) $ssa.update()
ドキュメント解析機能によって見出しやスライドのタイトル情報を検索ホバーパネルにリンクとして表示
カスタムプロパティ A の値 ; ; ; カスタムプロパティ B の値 ; カスタムエンティティ抽出
ドキュメント解析メタデータ抽出 管理プロパティへのマッピング 言語判別 Web サービスコールアウト 発音変換 ワードブレーク カスタムエンティティ抽出 ドキュメントサマリー生成 トリガー評価 Web サービスへ Web サービスから
検索意図が理解され 結果が視覚化され 次の行動を起こせる
昇格した結果
クエリ候補 分析レポート DB お気に入り 分析レポート DB
注意 各絞り込みカテゴリ内の絞り込みフィルターごとのヒット数は検索結果に含まれているが 標準 UI では非表示のため 表示したい場合には表示テンプレートの変更が必要
縮小表示 プレビュー
PowerPoint プレゼンテーションの関連情報 PowerPoint プレゼンテーションのアクション ディスカッションの関連情報 ディスカッションのアクション
標準で提供されるランク付けモデル既定の検索モデルカタログのランク付けモデル推薦者のランク付けモデルひとの専門分野の検索 ( 社会的距離に基づくランク付けモデル ) サイト候補のランク付けモデル Minspan を高く設定した検索モデルひとの検索の社会的距離モデルひとの検索に適用する専門分野ランク付けモデルひとの名前の検索 ( 社会的距離に基づくランク付けモデル ) ひとの名前の検索に適用するランク付けモデル人気のランク付けモデル 補足 製品リリース後に CodePlex から GUI ベースのランクモデル管理ツールを提供する予定 O14 既定の検索モデル ひとの検索アプリケーションのランク付けモデル Minspan なしの検索モデル
検索クエリを 製品 だと認識し Knowledge Center サイトを推奨 人の名前 と認識し ひと検索の結果を表示 ビデオ検索でよく利用されている検索クエリであると認識し ビデオ検索の結果を表示
活用が可能な 分析機能の提供
特定のサイトに対する推奨アイテム 特定のアイテムに対する推奨アイテム 特定のドキュメントに対する推奨アイテム
アイテム A の推奨アイテム エキスパート 1 エキスパート 2 エキスパート 3 エキスパート 4 履歴情報アイテム B アイテム C アイテム D 履歴情報アイテム B アイテム E アイテム F 履歴情報アイテム E アイテム F アイテム G 履歴情報アイテム B アイテム E アイテム G アイテム A アイテム A アイテム A アイテム A アイテム A アイテム A 3 3 2 2 1 1 アイテム B アイテム E アイテム F アイテム G アイテム C アイテム D アイテム A アイテム A アイテム A アイテム A 3 2 2 1 アイテム B アイテム F アイテム G アイテム D アイテム B アイテム F アイテム G アイテム D エキスパート あるアイテムにその時点で最も関わっているユーザー バックリンク 特定のアイテムのエキスパートが そのアイテムを推奨していることを確認 関係性の相互相関により 精度と関連性を担保
柔軟で 権限移譲された管理
サイトコレクション管理者 サイト管理者 クエリルールおよび昇格した結果の追加および更新 結果の種類および表示テンプレートの追加および更新 検索先の追加および更新 管理プロパティの追加 サイトインデックスの再作成 ( 次回クロール時に再インデックスさせる ) サイトおよびサブサイトを検索結果の対象外とする インデックス対象外にする列 ( 例 : いいね! の数 ) 構成 ( クエリルールや検索先など ) のインポートおよびエキスポート
検索 UX の構築 簡単な統合
OData 形式 (Atom / JSON) WFE サービス
検索を意識させず 重要なシステムに 検索機能を利用
公開 API Exchange 関連 SharePoint 関連カスタムソリューション