Excel から始める Big Data 活用体験講座
ハンズオン演習の手引き データマイニング 2
現場社員もツールを使いこなせていますか? データソース との接続方法が わからない 操作が難しくて ツールを使用 できない 開発者にレポートを 頼むので 時間がかかる 豊富なデータ ソースを意思決定に活用できていますか 現場社員 解決策 解決策 誰でも分析で きる BI 環境を 提供 データを見やすく わかりやすくビジュアルに可視化できますか 数値だけでは 傾向や動向が わかりづらい 分析に使用できるデータソースが限定されてしまうと 意思決定の精度が低下 リッチなグラフィックで可視化すれば 数値が示す特徴が一目瞭然 解決策 リッチな グラフィックで データを 可視化 各種ソースを 可視化できる ツールを提供 ビッグデータを活用できる仕組みはありますか? SNS モバイル デバイス キオスク 非構造化データ 解決策 外部のビッグ データを 分析に活用 ストリーム データ 3
ビジネス データ活用のワークスタイル 業務の領域 非定型 データウェアハウス 多くの仕事 何らかの仮説に基づき それを検証する 業 務 の 性 質 情報が溜まっていると言う意味 ための情報を複数ソースから集め 掛け では スタティック 静的 で 情報 合わせたものを プレゼンテーションに あり そこでは情報編集はされ 落とす という意味では 非定型的な業 ない この領域で コミュニケー ションをスムーズにし シ ステム的にもスキル的にも 効率化する必要がある 務 であり 情報編集も伴うので ダイ ナミック である 情報 業務システム 情報 SCM にしても会計にしても 業務の性質が定型的なものは ERP 化されて効率が追求されてきた 定型 スタティック 静的 情報編集の度合い ダイナミック 動的 4
情報の引き出し をスムーズにし 編集 が容易なセルフサービス BI ツールの選択により経営のスピードアップを実現 プラットフォームの特性 非定型 コーポレート BI 業 務 の 性 質 セルフサービス BI この領域で コミュニケー ションをスムーズにし シ ステム的にもスキル的にも 効率化する必要がある 情報 BI ソリューションが パワーユーザーまた IT 部門により管理され ユー はユーザーにより作成され 共有される ザーに対する読み取りアクセス および 高い可用性とスケーラ ビリティが提供される 情報 業務システム 情報 IT 部門により管理される 定型 スタティック 静的 情報編集の度合い ダイナミック 動的 5
ビッグおよびスモールデータへの簡単なアクセス 社内や外部データの検索 アクセス 処理 非構造化データとの組み合わせ使い慣れたツールによる強力な洞察力 Office や Office 365 の使い慣れた Excel およびモバイルデバイスアクセスで分析と洞察にかかるスピードをアップ完全な BI プラットフォーム クラウドとオンプレミスをカバーする完全なプラットフォームにより BI モデルに合わせてデータの価値とセキュリティを高めることが可能 コンポーネント説明 Excel 2010 Excel 2013 Power Pivot 多種多様なデータへの接続とデータモデルの作成多次元テーブルやグラフの作成 追加のアドイン 標準アドイン Power Query 多種多様なデータへの接続とデータモデルの拡張追加のアドイン追加のアドイン Power View Power Map Data Mining Add-in リッチなレポートをインタラクティブに作成時系列的変化をアニメーション効果で表示 地理情報を 3D で視覚化時系列的変化をアニメーション効果で表示 主要な影響元分析 分類 予測などが可能なデータマイニングツール 追加のアドイン 標準アドイン 追加のアドイン 追加のアドイン 6
多種多様なデータ ソース Office 365 Enterprise E3 SharePoint Online Excel 2013 Pro Plus Power Query Data Model PowerPivot Power View Power Map Data Mining Add-ins Power Q&A 7
イン メモリの高速分析処理 数百万行を超える膨大なデータの高速な多 次元分析 データソースのデータとデスクトップのファイルを 関連付けた分析が可能 Excel 標準機能でデータを可視化して分析 ピボット テーブル スライサー 条件付き書式 スパークライン インジケーター 3D グラフなど 使い慣れた機能で分析結果を可視化 デスクトップから アドホックにデータ分析 多種多様なデータ ソースへの接続 リレーショナル データベース 多次元データベース クラウド上のサービス データ フィード Excel 形式ファイル テキスト ファイル Web データ 8
Excel 標準機能で高速な多次元分析操作を可能に 4 ピボットテーブルやグラフの配置を選択 1 リボンから PowerPivot ウィンドウを起動 2 接続するデータソースやファイルを選択 使い慣れた Excel の操作性で PowerPivot ワークブックを作成 9
インターネット上のデータや購入した外部データの取り込みが簡単 Office 2013 Pro Plus または Office 365 Enterprise E3 で利用可能 ブラウザー Excel 社内 社外データの識別とインポート リレーショナル データベース Excel テキスト XML Odata Web ページ Hadoop HDFS 検索機能による関連データの探索 複数データ ソースの結合と変換 外部データを取り込み Office 365 Enterprise E3 Excel 10
従来のレポーティングツールではできなかった 表現力豊かなレポートを作成可能 PowerPivot のデータモデルを利用 SharePoint に配置すれば ブラウザからの操作も可能 分析結果をリッチかつインタラクティブに表現 データ チャート グラフを 1 つのビューに集約 スキルに関わらずあらゆる人が利用可能 トレンドの推移をアニメーションで表現 データの変化を時系列にアニメーション表示できる 変化の過程を視覚的に確認できる 11
Excel 上の地理と時間に関するデータを 3 次元処理 新たな観点での分析を実現 Office 2013 Pro Plus または Office 365 Enterprise E3 で利用可能 時系列に沿ってデータを地図上にレンダリング可能 Bing Map 上にマッピングできるので 地図のライセンスが不要!! 12
ブラウザーから PowerPivot ファイルに対して 自然言語検索で結果を抽出 検索結果は PowerView 形式でブラウザーに自動描画 Office 365 Enterprise E3 の SharePoint Online で利用可能 PowePivot ファイルをパブリッシュ Office 365 Enterprise E3 SharePoint Online HTML 5 のため デバイスに依存せず PC タブレット スマートフォンなどで閲覧可能 13
ハンズオン演習の手引き エリア 都道府県 商品 売上 日付 PowerPivot による多次元分析 データモデル 14
ハンズオン演習の手引き PowerPivot Power View によるカードとグラフの作成 15
ハンズオン演習の手引き エリア 都道府県 商品 売上 日付 ツイート集計 Power Query によるデータモデルの拡張 Power View によるバブルチャートの作成 16
ハンズオン演習の手引き エリア 商品 都道府県 売上 ツイート集計 公園面積 日付 Power Query によるデータモデルの拡張 Power Map による 3D マップの作成 17
http://www.microsoft.com/ja-jp/download/details.aspx?id=39379 http://www.microsoft.com/enus/download/details.aspx?id=38395&wt.mc_id=blog_pbi_announce_di 2014 年 7 月時点の最新コンポーネント 18
Excel Visio から SQL Server Analysis Services データマイニン グ エンジンを活用するための COM コンポーネント アドインの種類 説明 Excel 用テーブル分析ツー ル データの分布と種類が自動的に分析され 妥当な結果を得るための最適なデータ処理が推測される ユーザー自身がアルゴリズムを選択したり 複雑なパラメーターを構成したりする必要はない 使用する一連のデータを新しい Excel テーブル形式に変換する必要がある Excel 用のデータ マイニング クライアント データ マイニング モデルの作成 テスト 調査 および管理を Excel 上で実行 ソースとして Excel 内のデータを利用することも SQL Server Analysis Services インスタンスを通じ てアクセスできる外部データを利用することも可能 Visio 用のデータ マイニング テンプレート 注釈の設定が可能な Visio の図面として マイニング モデルを表示し 共有する 多次元モードの Analysis Services インスタンスへの接続が必要 マイニング エンジン テーブル分析ツール Excel SQL Server 2014 Analysis Services 多次元モード データ マイニング クライアント 19
Analysis Services マイニングエンジンを利用して Excel 上でマイニングを行う テーブル分析ツール名 主要な影響元の分析 カテゴリの検出 自動推論 例の全体適用 予測 例外の強調表示 説明 選択した特定の値または値列に最も大きな影響を及ぼすデータ列を特定 類似の特性を共有する行を検出 選択した列内で不足しているデータ値を検出し データのパターンに基づいて新しい値を推論 ある列に部分的に入力されている例を全体に適用する 与えられた一連のデータから将来の値を予測 データの列から 検出されたパターンと一致しない値を検出 シナリオ分析 ゴールシークツール ターゲット値を指定すると そのターゲットを満たすために変更する必要のある基本要因 が特定される 予測計算 買い物かご分析 What-If ツール 既存の値を操作し その変更が結果に与えると見られる影響を調べることができる 過去のパターンから導き出された基準に基づいてケースを評価するための対話型ワークシートを作成し 意思決定に使用できるスコアを計算 併せて購入される頻度が高い複数の製品を見つけ出して クロスセルやアップセルで使用できるパターンを特定 20
顧客の購買行動を分析同時に購入される頻度の高いアイテムの分析ソースデータをテーブル形式に変換 トランザクション ID アイテム アイテムの値を用意 21
有効なすべての組み合わせの一覧トランザクションデータに注文が含まれている場合 注文ごとに個々のアイテムが注文された回数が計算され そのアイテムと他のアイテムのすべての組み合わせが計算される レポート内の列アイテムのバンドルバンドルのサイズ販売数販売ごとの平均値バンドルの総数 内容 アイテムセットの一覧 アイテムセット内のアイテム数 この組み合わせが検出されたケースの数この列を基準にして並べ替えを行い 最も一般的なアイテムセットを表示できる バンドルの総数を販売数で除算した値 このアイテムセット内のアイテムの値の合計 22
検出されたアイテムセットを分析することで作成された一連のルール 各ルールは サポートデータから得られる確率に関連付けられる 23
レポート内の列選択したアイテム推奨選択されたアイテムの販売関連付け販売関連付け販売の割合推奨アイテムの平均値関連付け販売の総数 内容 提案を行うために必要なアイテムの一覧 提案するアイテムの一覧 選択したアイテムの販売数 選択したアイテムと推奨アイテムをセットにした販売数このルールの根拠となる既存のデータ内のケースの数 関連付け販売を選択されたアイテムの販売で除算した値のパーセンテージこのルールが正しいかどうかの確率 1 列目のアイテムと 2 列目のアイテム間の相関関係の強さ 重要度とも呼ばれる 0 の場合 相関関係はない 正の値の場合は 1 列目のアイテムによって 2 列目のアイテムが予測される 数値が大きいほど相関関係が強くなる アイテムの価値を指定した場合 この列で アイテムのコストを前提とした予測の価値を計算 24
データに基づいた予測を実行 必要条件 予測数 予測の作成対象となる時系列データの列 パターンを含んでいると思われる期間 25
予測値を点線で表示データテーブルに予測値が追加される 予測値 予測値 26
Analysis Services マイニングエンジン機能を Excel からウィザードを立ち上げて利用 データモデリングアルゴリズム 分類 推定 クラスター 関連付け 予測 詳細設定 マイニング構造の作成 詳細設定 構造へのモデルの追加 説明 モデル内の他の列の値に基づいて ある 1 つの列の値を予測する分類モデルを構築 データパターンを抽出し そのパターンを使用して 連続する数値 日付 または時間の値を予測する推定モデルを構築 類似の特性を共有する行のグループを検出するクラスターモデルを構築 買い物かご分析などの複数のトランザクションに現れるアイテム間の関連付けを検出する アソシエーションモデルを構築 一連のセルのパターンを検出する予測モデルを構築し 追加の値を予測 SQL Server Analysis Services データマイニングアルゴリズムを使用し Excel に格納されたデータに基づいて新しいデータマイニングモデルを構築強力な新しいクエリエディターによって パラメーターをカスタマイズし データマイニング拡張機能 (DMX) ステートメントを構築 新しい関連モデルを作成することにより 既存のデータ構造を変更これらの新しいモデルにより 同じデータを別のデータマイニングアルゴリズムで分析 27
10 億人の Office ユーザーが利用可能 Office 365 を採用 Power BI データ カタログ データ管理ポータル Power BI サイト Power View Power Query Power Pivot Power Map Power BI 管理センター Data Management Gateway Power BI Q&A Q&A Power BI モバイル アプリ
Office 365 -いつでもつながる 共同作業ができる- Q&A
データ管理ポータルへのリンク Power BI サイトが利用する SharePoint サイトへのリンク オンラインヘルプへのリンク Power BI サイトの設定や Power BI 管理センターへのリンク Power BI Q&A へのリンク お薦めの Power BI ワークブック Power BI Q&A で利用するお薦めの質問一覧 お気に入りに設定したワークブック Power BI サイトが認識しているワークブックの一覧 31
2014 Microsoft Corporation. All rights reserved. Microsoft Windows Windows Vista およびその他の製品名は 米国およびその他の国における登録商標または商標です ここに記載されている内容は情報の提供のみを目的としており このプレゼンテーションの発表時における Microsoft Corporation の見解を示すものです マイクロソフトは市場の変化に対応する必要があるため この資料の情報は マイクロソフトの確約とは見なされないものとします マイクロソフトは マイクロソフトは このプレゼンテーションの発表日以降に提供される情報の正確性を保証するはできません 明示 黙示または法律の規定にかかわらず マイクロソフトは このプレゼンテーションに関する一切の保証を行いません