Machine Learning on AWS

Similar documents
PowerPoint Presentation

PowerPoint Presentation

よくある問題を解決する~ 5 分でそのままつかえるソリューション by AWS ソリューションズビルダチーム

AWS における ベストパートナーを見つける 7 つの方法 相澤恵奏アマゾンウェブサービスジャパンアライアンス技術本部テクニカルイネーブルメント部部長パートナーソリューションアーキテクト #AWSInnovate 2019, Amazon Web Services, Inc. or its affi

Hortonworks Kitase

Joint Content Development Proposal Tech Docs and Curriculum

アジェンダ はクラウド上でも十分使えます 1. の概要 とは の導入事例 で利用される構成 2. をクラウドで使う クラウドサービスの分類 Amazon Web Services による構成例 2

最新 IoT デザインパターン 〜AWS IoT と AWS Greengrass を用いた構築パターン〜

tokyo_t3.pdf

PowerPoint Presentation

データベースの近代化:シンプルなクロスプラットフォーム、最小のダウンタイムで実現するクラウド移行

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

マネージド AI サービスと GPU IaaS クラウドで GPU が活きる二つの選択肢 マネージド AI サービス GPU IaaS Amazon AI Google Cloud Vision API 等 IBM Watson Microsoft Cognitive Services Amazon

AWS Mobile Deep Dive - 入門から実践までの最短コース 〜 ライブコーディングで学ぶ AWS を活用したモバイルアプリの開発 〜

最新アップデート AWS IoT Solution 〜 事例とサービスアップデート 〜

サンプル株式会社 御中 システム導入のご提案

AWS の運用監視入門 (AWS CloudWatch)

データマネジメントを取り巻く IT の課題 大規模データの実践的活用に向けて レッドハット株式会社 Senior Solution Architect and Cloud Evangelist 中井悦司 2012/04/13 version1.0

AI AI Artificial Intelligence AI Strategy& Foresight AI AI AI AI 1 AI AI AI AI AI AI AI AI AI AI AI AI AI 2 AI 1 AI AI 3 AI 3 20 AI AI AI AI AI

数字で見る AWS 190 か国で 100 万を超えるアクティブなお客様日本で 2 万を超えるお客様 120 億ドルのビジネス規模 (2016 見込み ) 昨年度比で 58% の増加 16 地域に 42 のデータセンター群 2006 年のビジネス開始以降 60 回の値下げ 2016 年には約 1,0

10年オンプレで運用したmixiをAWSに移行した10の理由

サーバとデータのマイグレーション ソリューション

Slide 1

PowerPoint プレゼンテーション

AWS Deck Template

流通業界におけるデジタルトランスフォーメーションの実践

Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行

AWS 認定 DevOps エンジニア - プロフェッショナルサンプル試験問題 1) あなたは Amazon EBS ボリュームを使用する Amazon EC2 上で実行されているアプリケーションサーバ ー向けに 自動データバックアップソリューションを導入する業務を担当しています 単一障害点を回避し

データセンターの効率的な資源活用のためのデータ収集・照会システムの設計

新しい 自律型データ ウェアハウス

PowerPoint プレゼンテーション

ネットアップクラウドデータサービス

PassSureExam Best Exam Questions & Valid Exam Torrent & Pass for Sure

PowerPoint プレゼンテーション

ビッグデータのリアルタイム分析基盤技術「Jubatus」を活用し、センサデータ機械学習検証システムを構築 - ビニールハウスのデータ異常検知の自動化を実現 -

スライド 1

PostgreSQL による クラスタ構成の可能性 SRA OSS, Inc. 日本支社 取締役支社長 石井達夫

【AWS Tech 再演】Amazon EC2 Systems Manager によるハイブリッド環境の管理

Amazon RDS 入門

PowerPoint プレゼンテーション

スピーカースライド作成前の確認シート例

Windows Azure Platform: その全体像 David Chappell Chappell & Associates Copyright 2009 David Chappell

PowerPoint プレゼンテーション

OTデータとITデータの双方を統合的に分析可能な社会・産業インフラ分野向けのデータ分析基盤を提供開始

無料セミナー資料:ビッグデータ管理基盤ソフトウェアHadoop入門

AWSSummitTokyo2018

Python Perl JavaScript および PHP などの ランザクション ID を利用することで 重複する処理 な Tuple が流れるかはグルーピングより決定されま 多くの言語をサポートしています を判別することができます す 6 簡単なデプロイと運用 は簡単にデプロイし 動作させるこ

PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部

PowerPoint Presentation

Enterprise Cloud + 紹介資料

利用約款別紙 SkyCDP for AWS 基本サービス仕様書 この仕様書は SkyCDP for AWS の基本サービスに関する内容 方法について記述したものです 尚 SkyCDP for AWS オプションサービスをご利用のお客様は各 SkyCDP for AWS オプションサービスのご契約内容

AWS のコンテナ管理入門(Amazon EC2 Conatainer Service)

PowerPoint プレゼンテーション

Elastic MapReduce bootcamp

Microsoft Word - AWSBlueprint final.docx

Microsoft PowerPoint - ã…Šã…¬ã…fiㅥㅼ盋_MVISONCloud製åfi†ç´¹ä»‰.pptx

AWS のストレージサービス入門

サーバーレスアプリケーションのための CI/CD パイプライン構築 

スライド 1

ストリームデータ処理技術を利用したソリューションの紹介 -大量データのリアルタイム処理-

ライフサイクル管理 Systemwalker Centric Manager カタログ

スライド 1

WebSAM MCOperations Amazon Web Services 向け構築ガイド 2015 年 5 月 日本電気株式会社

スライド 1

クラウド セキュリティ インターネット セキュア ゲートウェイ Umbrella

ICTのメガトレンドに向けたハイパーコネクテッド・クラウドへの取組み

Oracle Cloud Adapter for Oracle RightNow Cloud Service

AWS Deck Template

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

Magicians Meeting Tokyo, Japan October 2018

AWS Well-Architected フレームワークによるクラウド ベスト プラクティス

PowerPoint Presentation

PSQL v12 新機能のご紹介 ~ 認証要件変更に伴う運用の見直し ~ 株式会社エージーテック 2015 年 1 月 13 日

Server and Cloud Platform template

Presentation Title

日立とアシストが情報システム運用のレポーティングソフトウェアを共同開発

PowerPoint Presentation

AWS セキュリティ入門

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1

<4D F736F F F696E74202D2082A282DC82B382E795B782AF82C882A FC96E CF68A4A A2E >

WHITE PAPER RNN

PowerPoint プレゼンテーション

クラウドでアクセラレーテッドコンピューティング!GPU と FPGA を駆使してアプリケーションを高速化


Agenda Hadoop Sahara Kilo Q&A Copyright 2015 Mirantis, Inc. All rights reserved Page 2

D. Amazon EC2 のインスタンスストアボリュームへ 1 時間ごとに DB のバックアップ取得を行うと共に Amazon S3 に 5 分ごとのトランザクションログを保管する 正解 = C 会社のマーケティング担当ディレクターから " 何気ない親切 " と思われる善行を目にしたら 80 文字

マイクロソフトが提供するAI関連サービスとその最新事例

スライド 1

InfoFrame Relational Store V2.2 構築ガイド for Amazon Web Services RS J

クラウドネイティブにセキュリティを 活用する!API を連携して実装する方法

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

Amazon Redshift テーブル設計詳細ガイド –分散スタイルとソートキーの決定方法–

Microsoft 365 Business 中小企業のお客様に最適な 統合ソリューション 日本マイクロソフト株式会社

スライド 1

Startup_on_AWS_usecases_StartupDay

【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus

目次 1. はじめに SSL 通信を使用する上での課題 SSL アクセラレーターによる解決 SSL アクセラレーターの導入例 SSL アクセラレーターの効果... 6 富士通の SSL アクセラレーター装置のラインナップ... 8

WebSAM Application Navigator Amazon Web Services 向け構築ガイド 2014 年 3 月 日本電気株式会社 1

スライド 1

Transcription:

Machine Learning on AWS アマゾンウェブサービス株式会社ソリューションアーキテクト志村誠 2017.06.01 2017, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

志村誠 (Makoto Shimura) 所属 : アマゾンウェブサービスジャパン株式会社 業務 : ソリューションアーキテクト ( データサイエンス領域 ) 経歴 : Hadoop ログ解析基盤の開発データ分析データマネジメントや組織のデータ活用

Target / Key takeaway 機械学習を使ってビジネスを加速させたい方 機械学習サービスを AWS 上で構築したい方 AWS 上で機械学習のサービスをどう構築するか 問題ごとに AWS サービスをどう選択するか

業種業態問わずさまざまなビジネスで機械学習が活用されるようになってきている

Howard Hughes Corporation 利用者の物件購入性向を予測するモデルを構築

Zillow Group Apache Spark on EMR による各種レコメンデーション

AWS を活用して, 機械学習を用いたサービスを展開するにはどうすればよいか

本セッションのアジェンダ 解くべき問題を明確にする AWS の機械学習サービス AWS を活用したサービスの構築 典型的なユースケース

解くべき問題を明確にする

解決したいビジネス課題から出発する まずは自分たちのビジネスを振り返る ニーズがあるが実現できていない部分に注目 機械学習から出発するのではなく あくまで課題を解決するためのツールと考える

機械学習とはなにか 特定事象のデータを学習し, モデルを獲得それに基づいて判断や予測を実施する

機械学習の一般的な処理の流れ Training Prediction

機械学習の一般的な処理の流れ Training 大量のデータ 学習アルゴリズム 機械学習モデル Prediction

機械学習の一般的な処理の流れ Training 大量のデータ 学習アルゴリズム 機械学習モデル Prediction 機械学習モデル

機械学習の一般的な処理の流れ Training 大量のデータ 学習アルゴリズム 機械学習モデル Prediction 入力データ 機械学習モデル 予測判断結果

機械学習の一般的な処理の流れ Training 大量のデータ 学習アルゴリズム 機械学習モデル Prediction 入力データ 機械学習モデル 予測判断結果

ビジネス課題で機械学習を活用するためのポイント ( 大量の ) 良質なデータでモデルの精度が向上 判断や予測を自動化することが可能 大規模に展開するほど ( 単位 ) コストが下がる

ビジネス課題で機械学習を活用するためのポイント 良質なデータが継続的に手に入るか? 自動化する価値のあるクリティカルな予測か? 費用対効果に見合うか?

機械学習に向いている典型的なビジネス課題 レコメンド 人間の手では不可能な量の商品 / ユーザーに対して個別のおすすめを提供したい 異常検知 24 時間 365 日人間が監視するのはコストが非常に高い異常が起きたらすぐに検知して対策をとりたい 画像認識 大量の画像をチェックするのは不可能自動的に顔の位置や不適切な画像か等を判定したい クラスタリング ユーザをいくつかのセグメントに分類してセグメント別のマーケティング施策を実施したい

AWS の機械学習サービス

4 層から構成される AWS の機械学習サービス Amazon Rekognition Amazon Polly Amazon Lex More to come in 2017 AI Services Amazon Machine Learning Amazon Elastic MapReduce Spark & SparkML More to come in 2017 AI Platform Apache MXNet TensorFlow Caffe Torch Theano CNTK Keras AI Engines P2 EMR/Spark ECS Lambda GreenGrass FPGA More to Come In 2017 Hardware

4 層から構成される AWS の機械学習サービス Amazon Rekognition Amazon Polly Amazon Lex More to come in 2017 AI Services Amazon Machine Learning Amazon Elastic MapReduce Spark & SparkML More to come in 2017 AI Platform Apache MXNet TensorFlow Caffe Torch Theano CNTK Keras AI Engines P2 EMR/Spark ECS Lambda GreenGrass FPGA More to Come In 2017 Hardware 22

Deep Learning に最適な P2 インスタンス GPU アクセラレータ NVIDIA Tesla K80 を最大 16 個搭載可能 大量の GPU を使うことで, ディープラーニングのモデル構築にかかる時間を大幅に短縮可能 Instance Name GPU Count Memory GPU Memory Network Performance P2.xlarge 1 61GiB 12 GiB High P2.8xlarge 8 488GiB 96 GiB 10 Gigabit P2.16xlarge 16 732GiB 192 GiB 20 Gigabit 23

Greengrass によるエッジコンピューティング オフラインでニアリアルタイムのローカルイベント処理 AWS Lambda を利用したプログラミングモデル オンラインになったときにクラウドと同期 Messages Action Authentication & Authorization Device Gateway Security Device State

4 層から構成される AWS の機械学習サービス Amazon Rekognition Amazon Polly Amazon Lex More to come in 2017 AI Services Amazon Machine Learning Amazon Elastic MapReduce Spark & SparkML More to come in 2017 AI Platform Apache MXNet TensorFlow Caffe Torch Theano CNTK Keras AI Engines P2 EMR/Spark ECS Lambda GreenGrass FPGA More to Come In 2017 Hardware 25

Deep Learning AMI で各種パッケージを手軽に利用 OS は Amazon Linux と Ubuntu の 2 種類各種フレームワークがプリインストール * MXNet v0.9.3 tag Tensorflow v1.0.1 tag Theano rel-0.8.2 tag Caffe rc5 tag Caffe2 v0.6.0 tag CNTK v2.0 beta 12.0 tag Torch master branch Keras 2.0.2 tag 26 https://aws.amazon.com/marketplace/pp/b01m0axxqb?qid=1475211685369&sr=0-1&ref_=srh_res_product_title

AWS は MXNet を全面的にサポート マルチ GPU でのスケーラビリティに優れている AWS 社員もコミッターとして活躍 CloudFormation で MXNet クラスタを構築するテンプレートを提供 27 http://aws.typepad.com/sajp/2016/11/mxnet-default-framework-deep-learning-aws.html

4 層から構成される AWS の機械学習サービス Amazon Rekognition Amazon Polly Amazon Lex More to come in 2017 AI Services Amazon Machine Learning Amazon Elastic MapReduce Spark & SparkML More to come in 2017 AI Platform Apache MXNet TensorFlow Caffe Torch Theano CNTK Keras AI Engines P2 EMR/Spark ECS Lambda GreenGrass FPGA More to Come In 2017 Hardware 28

Amazon machine Learning スケーラビリティ : システムの拡張や運用を考える必要がないパッケージ化 : テストデータ分割や評価手法, 予測 API の提供などが組み込まれている アプリケーション Redshift 上の取引データを使って Amazon ML で不正取引の抽出を行い S3 に出力される結果を Redshift に戻して利用 Amazon Redshift 2 クラス分類ロジスティック回帰 多クラス分類多項ロジスティック回帰 回帰分析線形回帰 29

Amazon EMR (Elastic MapReduce) フルマネージドな Hadoop を提供しており, クラスタの構築, 構成変更, 破棄まで管理可能 HDFS ではなく S3 上のデータを直接読み書きすることで, コンピュートとストレージを分離可能ワークロードに応じたクラスタを複数立ち上げて, 同一データを処理可能 Spark MLlib や Mahout でスケーラブル機械学習 30

4 層から構成される AWS の機械学習サービス Amazon Rekognition Amazon Polly Amazon Lex More to come in 2017 AI Services Amazon Machine Learning Amazon Elastic MapReduce Spark & SparkML More to come in 2017 AI Platform Apache MXNet TensorFlow Caffe Torch Theano CNTK Keras AI Engines P2 EMR/Spark ECS Lambda GreenGrass FPGA More to Come In 2017 Hardware 31

AI Services Polly 文章をリアルな音声 に変換するサービス Rekognition 画像分析機能をアプリケーション に簡単に追加できるようにするサービス Lex 声やテキストを使用した会話 型インターフェイスを様々なアプリケーションに構築する ためのサービス これらは,fine-tuning された AWS が提供するディープラーニングモデルを API で簡単に利用できるマネージドサービスとなります 32

そのほかのサービスも合わせてシステムを構築 機械学習用途にも利用できるサービス Amazon Kinesis Analytics 異常検知アルゴリズムをそなえた RUNDOM_CUT_FOREST 関数 Amazon Elasticsearch Service more like this のように, 検索機能を機械学習用途で利用可能 機械学習のサイクルを構成するサービス Amazon Data Pipeline スケジュールを組んで EMR のジョブを実行 Amazon API Gateway 機械学習の結果を提供するための API を作成

AWS を活用したサービスの構築

サービス選択における指針 Right tools for the job 機能的特性と性能的特性の両面から, 最適なサービスを見極める Managed services first インフラの運用を AWS に任せて, アルゴリズムやアプリケーションに集中

ゴールを明確にする? 解決したいビジネス課題 取得したいアウトプット Machine Learning System!

機械学習における 3 つのステージ? Model ゴールに合わせたモデルを設定する Machine Learning Training Pipeline データを用いてモデルを学習する Prediction 学習済みモデルを用いて予測する!

適切なモデルを選択する? Model レコメンド 異常検知 分類問題 Machine Learning System!

適切なモデルを選択する? Model Machine Learning System レコメンド 協調フィルタリング コンテンツベース ルールベース Spark MLlib or Mahout on Amazon EMR Amazon Elasticsearch Service! Amazon EC2

適切なモデルを選択する? Model Machine Learning System 異常検知 K-means ChangeFinder Random Cut Forest Spark streaming on Amazon EMR Storm on Amazon EC2! Amazon Kinesis Analytics

適切なモデルを選択する? Model Machine Learning System 分類問題 Logistic Regression Deep Learning SCW Amazon Machine Learning Spark on Amazon EMR Amazon Rekognition Amazon Polly MXNet on Amazon EC2! Hivemall on Amazon EMR

データからモデルを学習する? データサイズ データの場所 Machine Training Learning System モデルの更新頻度 ハードウェア特性!

データからモデルを学習する? データサイズ 単一のインスタンスで扱えるサイズ クラスタで処理する必要があるサイズ Machine Training Learning System Amazon EC2 Spark on Amazon EMR Amazon Machine Learning!

データからモデルを学習する? データの場所 ストレージに保存されている DB に保存されている Machine Training Learning System ストリームで流れてくる Amazon S3 Amazon RDS! Amazon Kinesis Stream

データからモデルを学習する? モデルの更新頻度 バッチで定期的に更新 オンラインで更新し続ける Machine Training Learning System 更新の必要が ( ほとんど ) ない Amazon Data Pipeline Spark streaming on Amazon EMR!

データからモデルを学習する? ハードウェア特性 CPU のみ CPU + GPU Machine Training Learning System メモリ最適化 C4 instance on Amazon EC2 P2 instance on Amazon EC2! X1 instance on Amazon EC2

学習したモデルで予測する? モデルサイズ 提供形態 Machine Learning System Prediction!

学習したモデルで予測する? モデルサイズ 単一のインスタンスで扱える モバイルデバイスに組み込める Machine Learning System DB に格納する必要がある Amazon EC2 Prediction AWS Greengrass (Preview)! Amazon Dynamo DB

学習したモデルで予測する? 提供形態 API を提供 ストリームデータを逐次処理 デバイス等に組み込む Machine Learning System Amazon Machine Learning Amazon Rekognition Amazon Polly Prediction! Amazon API Gateway Amazon Kinesis Analytics Spark Streaming on Amazon EMR AWS Greengrass (Preview)

典型的なユースケース

ユースケース 1 EC サイトにおける商品のレコメンド あなたはハンドメイドの雑貨をあつかう EC ショップを運営しています.1 回の購入あたりの売り上げが伸び悩んでおり, 商品ページでほかのおすすめ商品を表示することで, 合わせ買いを促進したいと思っています. 毎日新しい商品が入荷してくるので, できるだけ早くおすすめに反映させたいです. またそれとは別に, セール商品は手動でおすすめできるようにもしたいと考えています.

ユースケース 1 EC サイトにおける商品のレコメンド アイテムベースのレコメンドと, ルールベースのレコメンドの 2 種類 ストレージに溜まった巨大なログデータと,DB にあるマスタデータ アイテムベースのレコメンド内容は日次で更新 スマホアプリから結果を API 経由で取得して表示

ユースケース 1 新商品のルールベースレコメンド Elasticsearch Service Kinesis Firehose API Gateway Lambda 日次更新のアイテムベースレコメンド Dynamo DB S3 EMR

ユースケース 2 画像 SNS における同一人物の顔判定 あなたは画像ベースの SNS を運営しています. ユーザーがアップロードした写真から顔部分を抽出して人物判定を行い, 同一人物が写っている場合, そのユーザーを 知り合いかも? とおすすめする機能を追加しようとしています. これにより, ユーザー同士のつながりが強化され, サービスへのコミットメントも高まるのではないかと考えています.

ユースケース 2 画像 SNS における同一人物の顔判定 複数の画像から顔を抽出して, 同一人物の判定 S3 上の大量の画像データ モデルの更新頻度は週次 - 日次 スマホアプリから結果を API 経由で取得して表示

ユースケース 2 バッチで Rekognition の index を追加 Dynamo DB EC2 Worker Rekognition S3

ユースケース 3 プラントのセンサデータにおける異常検知 あなたの会社では, 常時稼働させているプラントにおいて, 複数のセンサから常にデータを取得し続けています. 現在は 3 交代制で作業員が監視する仕組みで, 非常に負荷が高い状況ですが, センサデータから異常検知を行う仕組みを作ることで, 作業員の負荷を下げたり, 判断ミスを減らしたりすることを考えています.

ユースケース 3 プラントのセンサデータにおける異常検知 数百のセンサが 5 秒間隔で JSON データを送信 ストリーム処理 異常検知 アラートをあげる

ユースケース 3 異常を検知したらアラートをあげる Kinesis Firehose Kinesis Analytics Kinesis Streams Lambda SNS

まとめ

まとめ 解決したいビジネス課題から出発するその中でニーズはあるが実現できていない部分に注目機械学習はあくまでツールであり, 目的ではない システム要件を定める要件に即した AWS サービスを選択するユースケースを参考に

本セッションの Feedback をお願いします 受付でお配りしたアンケートに本セッションの満足度やご感想などをご記入ください. アンケートをご提出いただきました方には, もれなく素敵な AWS オリジナルグッズをプレゼントさせていただきます アンケートは受付, パミール 3F の EXPO 展示会場内にて回収させて頂きます

AWS ソリューション Day 2017- Database Day ~ すでに始まっている! クラウドへのデータベース移行 と データレイクを軸としたビッグデータ活用 ~ Database Day とは? ユーザー企業 / パートナー /AWS による導入事例や活用動向また技術情報をご紹介する IT 部門 ( エンジニア 管理者など ) 向けのカンファレンス開催日時 会場 2017 年 7 月 5 日 ( 水 ) 10:00~17:30 (9:30 開場予定 ) 大崎ブライトコアホール (JR 大崎駅より徒歩 5 分 ) セッション 1 基調講演 2 ブレイクアウトセッション 2 トラック構成 トラック 1: データベース移行 ( 事例セッションあり ) トラック 2: データレイク (JAWSUG-BigData 支部事例セッションあり ) お申込み https://aws.amazon.com/jp/about-aws/events/2017/solutiondays20170705/

2017, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Appendix

機械学習とはなにか Artificial Intelligence Machine Learning Deep Learning

機械学習とはなにか Artificial Intelligence Machine Learning Deep Learning

機械学習とはなにか Strong AI Artificial Intelligence 汎用人工知能人間のように 知的 な知能 Machine Learning Deep Learning

機械学習とはなにか Artificial Intelligence Weak AI Machine Learning 特化型人工知能 汎用人工知能のための要素技術人間側でいろいろお膳立てが必要 知的 ではない Deep Learning

機械学習とはなにか Artificial Intelligence Machine Learning Deep Learning 機械学習 特定事象のデータを学習してモデルを獲得それに基づいて判断や予測を実施

機械学習とはなにか Artificial Intelligence Machine Learning Deep Learning ディープラーニング機械学習の手法のひとつ

機械学習の一般的な分類 教師あり学習 機械に学習させたい事象の ( 正しい ) 結果を与えて学習させる Machine Learning 教師なし学習 与えたデータからその分布の特徴を捉える学習を行う 強化学習 正解ではなく行動に対する評価を与えて学習する

ユースケース 1? Model モデル選定 協調フィルタリング コンテンツベース Machine Learning System Spark MLlib の ALS を使って協調フィルタリングのモデルを更新 また新しい商品が追加されたら, レコードを Elasticsearch Service に追加して,more like this 検索!

ユースケース 1? 学習システム クラスタで処理する必要があるサイズ ストレージ保存 + バッチ更新 ストリーム + オンライン更新 Machine Training Learning System S3 上のログデータを Spark on EMR で読みこんで日次バッチを実行 Kinesis Firehose から直接データを挿入してオンラインでデータ更新!

ユースケース 1? 予測システム DB に格納する必要がある API で提供 Machine Learning System Prediction 協調フィルタリングの結果は Dynamo DB に格納 API Gateway から lambda で Dynamo DB および Elasticsearch Service 両方から結果を取得!

ユースケース 2? Model Machine Learning System モデル選定 Deep Learning Rekognition で顔認識と類似度判定をおこなう!

ユースケース 2? 学習システム ストレージ保存 + バッチ更新 Machine Training Learning System S3 上の画像データを Rekognition の indexfaces API 経由で認識させて index を作成する!

ユースケース 2? 予測システム DB に格納する必要がある API で提供 Machine Learning System Prediction ユーザーごとの 知り合いかも? リストは Dynamo DB に格納して API 経由で提供!

ユースケース 3? モデル選定 Random Cut Forest Model Machine Learning System Kinesis Analytics で変化点を検知 データの種類や問題によっては, Spark Streaming 等を使う場合も!

ユースケース 3? 学習システム ストリーム + オンライン更新 Machine Training Learning System Kinesis Stream 経由で取得したデータを Kinesis Analytics でストリームで処理!

ユースケース 3? 予測システム アラートをあげる Machine Learning System Kinesis Analyitcs の分析結果を Lambda 経由で SNS に送り, アラートをあげる Prediction!