Rの基本操作

Similar documents
PowerPoint Presentation

データ分析のまとめ方

PowerPoint プレゼンテーション

Microsoft PowerPoint - 09SPSS解説.ppt

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

スライド 1

ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1

AI技術の紹介とセンサーデータ解析への応用

PowerPoint プレゼンテーション

SILAND.JP テンプレート集

スーパー英語アカデミック版Ver.2

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Proc luaを初めて使ってみた -SASでの処理を条件に応じて変える- 淺井友紀 ( エイツーヘルスケア株式会社 ) I tried PROC LUA for the first time Tomoki Asai A2 Healthcare Corporation

スライド 1

eService

PowerPoint プレゼンテーション

スクールCOBOL2002

7.1 研究者情報の修正 e-rad に登録している自身の情報を修正する手順について説明します 画面 操作概要 トップ (1) グローバルメニュー 研究者情報の修正 を選択 研究者情報の修正 (2) 研究者の情報を修正 研究者情報の修正 ( 入力内容の確認 ) (3) 修正した研究者の情報を確認 研

Microsoft PowerPoint - T4OOマニュアル_初期設定用_ pptx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

プログラミング基礎

V-CUBE One

目次 はじめに P.02 マクロの種類 ---

Maser - User Operation Manual

V-CUBE One

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

スライド 1

廃液処理依頼 Fig. 登録画面 ログイン後 WASTE FLUID MANAGER(Fig.) が表示されます 画面上部にはグループ名とユーザー名が表示されます 廃液処理依頼は画面左上のメニューボタンをクリックすると表示されます 廃液タンクのタグに表示された管理番号と廃液投入記録簿に記した管理番号

3.1 事務分担者の新規登録 事務分担者を新規登録する手順について説明します 画面 操作概要 トップ (1) グローバルメニュー 自機関情報 > 事務分担者 > 新規登録 を選択 事務分担者の登録 (2) 事務分担者情報を入力 事務分担者の登録 ( 入力内容の確認 ) (3) 入力した事務分担者情報

操作マニュアル 廃止届出登録 第 8 版 2019 年 7 月 22 日

セットアップガイド ( 管理者向け ) (1.3 版 ) KDDI 株式会社

すだちくんメール法人(所属設定職員管理)_docx

4_MySupport登録のご案内_docx

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

Microsoft Word - mstattext02.docx

目次 1. はじめに 更新履歴 ログイン ログアウト ログイン時の URL とユーザー名 ログイン ログアウト トップ画面 活動一覧画面 活動情報の

SOBA ミエルカ クラウドセミナーモード 配信者マニュアル 目次 はじめに 配信者のユーザー登録について ライブ配信の作成 ライブ配信への招待 ライブ配信への参加方法... 4 (1) ライブ配信を選んで参加する方法 ( 管理者 配信

スライド 1

PowerPoint プレゼンテーション

Microsoft Word - 2IFTTT利用手順_ver1

Microsoft Word - PGS for Reseller User GuideMay2014.doc

Microsoft PowerPoint - T4OOマニュアル_admin管理者_ pptx

Oracle ESB - レッスン02: CustomerDataバッチCSVファイル・アダプタ

16soukatsu_p1_40.ai

PowerPoint プレゼンテーション

ホームページにパスワード認証を設定します 会員限定のページなどに利用できます 設定の手順 を設定するには 以下の手順で行います ユーザ登録 を設定したページにアクセスするためのユーザを登録します の設定 を設定するページ アクセスを許可するユーザを選択し 設定します 設定完了 を設定したページにアク

エクセルに出力します 推定結果の表は r(table) という行列で保存されますので matlist r(table) コマンドで 得られたの一覧を表示させます. use clear. regress

Microsoft PowerPoint - A1-2_株式会社ネクスト_藤澤正通_S _005.pptx

Microsoft Word - cms12.doc

13.1 ログイン ID の変更 ログイン ID を変更する手順について説明します 画面 操作概要 トップ (1) グローバルメニュー ログイン ID の変更 を選択 ログイン ID の変更 (2) ログイン ID を変更 ログイン ID の変更 (3) ログイン ID の変更を完了 2

ICSD web 簡単ガイド (Ver

MATLAB®によるビッグデータ解析

償却奉行 i8/ i シリーズ 汎用データ受入の手順書 汎用データの作成方法を知りたい 汎用データのフォーマットがわからない 汎用データ受入をしたら受入エラーが発生した について資産データの受入を例に説明します 本手順書では OBC 受入形式 ( ) の汎用データの受入を 受入フォーマットに従って

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

13章 回帰分析

目次 管理画面へログイン 3 採用情報の投稿 4 採用情報の入力方法 5 トップページの項目の編集 6-9 メディアライブラリ 10-11

目次 Webフォルダの特長と仕組み 3 Webフォルダの開き方 4 1 児童生徒の場合 4 2 先生の場合 5 Webフォルダ機能 ファイルのアップロード ( 保存 ) 6 ファイルのダウンロード 7 ファイルの開き方 8 新規フォルダの作成 9 フォルダ ファイルの名称の変更 10 フォルダ ファ

Microsoft Word - NanoPhotometer用PCソフトウエア操作説明書 Rev 1.00.doc

Visual Studio 2017 RC インストール & ファーストステップガイド 2016 年 11 月 16 日 (V1.0)

1. 基本操作 メールを使用するためにサインインします (1) サインインして利用する 1 ブラウザ (InternetExploler など ) を開きます 2 以下の URL へアクセスします ( 情報メディアセンターのトップページからも移動で

Microsoft PowerPoint - e-stat(OLS).pptx

仕様書用テンプレート

1 Ver /3/10

ExcelVBA

Presentation Title

ウツタイン様式調査オンライン処理システム

Data Explorerの使い方|国立教育政策研究所 National Institute for Educational Policy Research

Microsoft Word - WebClass Ver 9.08f 主な追加機能・修正点.docx

. 起動 目次 P.. ログイン 画面 P.. メニュー 画面 P.. POS 開示 _ 指定店舗 アイテム別 期間合計 画面 ( レポート A) P. 5. POS 開示 _ 店舗別 指定アイテム 期間合計 画面 ( レポート B) ----

1.民営化


AppsME(kintone)_セットアップガイド

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

ELCA操作ガイド(受験生向け)

PowerPoint プレゼンテーション

機械学習とデータマイニングは交差する部分が大きく 技法も同じなので混同されることが多いが 次のよう に定義できる 機械学習の目的は 訓練データから学んだ 既知 の特徴に基づく予測である データマイニングの目的は それまで 未知 だったデータの特徴を発見することである セルフサービス BI Power

CASEC

Eschartマニュアル

マイクロソフト IT アカデミー E ラーニングセントラル簡単マニュアル ( 管理者用 ) 2014 年 11 月

クイックマニュアル(利用者編)

1. ログイン 1-1 管理画面へのログイン 施設の作成 編集 削除や承認 公開には その操作権限を持つアカウントでログイン します アカウントについての詳細は 管理者にお問い合わせください (1) [ ユーザー ID またはメールアドレス ] と [ パスワード ] を入力後 [ ログイン ] を

操作マニュアル -SmaLAB.                  - Version 1.0版

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

第 2 章 PL/SQL の基本記述 この章では PL/SQL プログラムの基本的な記述方法について説明します 1. 宣言部 2. 実行部 3. 例外処理部

スライド 1

Chapter 1 Epidemiological Terminology

Microsoft PowerPoint - 学習支援サービス(Moodle)で資料公開.pptx

SOS取説

<4D F736F F D D815B A982E782CC E E646F6378>

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

3 課題提出方法競技者は 完成した作品 ( 未完成作品も含む ) を大会主催側の用意する外付けのUSBメモリに保存し提出する なお 作品を保存したUSBメモリは 競技時間終了と同時に大会関係者が回収する 4 注意事項 (1) 郵便番号 CSV データ 学生住所 CSV データ 教員住所 CSV デー

共有フォルダ接続手順 1 共有フォルダ接続ツールのダウンロード 展開 CSVEX のトップページから共有フォルダ接続ツールの zip ファイルをダウンロードします ダウンロードした zip ファイルを右クリックして すべて展開 を選択します (Windows 環境では zip ファイルを解凍しなくて

Microsoft Word - Word1.doc

スライド 1

Microsoft Word - NEWSマニュアル docx

サイボウズ Office 10「リンク集」

Python (Anaconda ) Anaconda 2 3 Python Python IDLE Python NumPy 6

演習1

サイボウズ Office「リンク集」

Transcription:

Microsoft Azure 高校生のための Azure Machine Learning By M. Takezawa

機械学習 (Machine Learning) とは 機械学習とは 機械にデータを学習させ データに潜むパターンや特性を発見し予測させることです Microsoft Azure Machine Learning とは Microsoft 社が提供する Azure の機能の一つであり 機械学習を用いたデータ分析をプログラミング手法を意識せず 視覚的に構築できるクラウドサービスです ただし,R や Python のスクリプトを記述するためのモジュールも用意してあります ここでは 回帰分析を例に R でのデータ分析と機械学習を用いたデータ分析を比較します

Microsoft Azure Machine Learningとは

Microsoft Azure Machine Learning とは Azure での Machine Learning の概要 ( 英語版 ) XYZW :Module Training Experiment Predictive Experiment Built in ML Algorithms Test Data Data for Evaluate Train Model Score Model Evaluate Model

Microsoft Azure Machine Learning とは Azure での Machine Learning の概要 XYZW : モジュール名 学習実験 : 機械に学習させる 組込アルゴリズム 学習用データ 予測実験 : 計算を実行する 評価用データ モデルの学習 モデルの予測 モデルの評価

Microsoft Azure Machine Learning とは 学習実験 (Training Experiment) XYZW : モジュール名 [ xyzw ]: メニュー名 アルゴリズムの選択 [Machine Learning] [Initialize Model] 組込アルゴリズム 学習用データ 学習用データの選択前操作 (Preprocess) 事前にいろいろ加工する ( 前操作 ) 不必要な列や行の削除欠損値の処理など [Data Transformation] [Manipulation] モデル学習の選択 [Machine Learning] [Train] モデルの学習 学習済みモデルとして保存モデルの予測データの分析 ( 予測 ) 選択 右クリック [Save as Trained Model] [Machine Learning] [Score] よく使う操作 : 実行 :RUN ボタン実行結果の可視化 : モジュールを右クリックで Visualize

Microsoft Azure Machine Learning とは 予測実験 (Predictive Experiment) XYZW : モジュール名 [ xyzw ]: メニュー名 データの分析 ( 予測 ) [Machine Learning] [Score] 評価用データ [DATASETS] : [New] アップロード モデルの予測 データの書き出し (csv など ) Convert to CSV [Data Format Conversions] [Convert to CSV] [Download] モデルの評価 データの評価 [Machine Learning] [Evaluate] よく使う操作 : 実行 :RUN ボタン実行結果の可視化 : モジュールを右クリックで Visualize

Microsoft Azure Machine Learning の操作 Azure での Machine Learning のログイン方法 Azure portal へのログイン方法 http://portal.azure.com/ もしくは検索ワード入力 :MLstudio Azure Machine Learning のログイン方法 https://studio.azureml.net/ Login ID : ******@manavi-i.com Password: *************** (Password は自分用に変更 )

Microsoft Azure Machine Learning の操作 新規の Experiment 作成 https://studio.azureml.net/ NEW を選択

Microsoft Azure Machine Learning の操作 新規の Experiment 作成 Blank Experiment クリック

Microsoft Azure Machine Learning の操作 空の Experiment の出現 メニュー キャンバス 空の Experiment には メニュー キャンバス の 2 画面構成 この空のキャンバスにいろいろなモジュールを配置する 次のスライドを参考のこと

回帰分析 1( 学習用データ :pop.csv, 評価用データ :pop2.csv) pop.csv と pop2.csv の読み込み 学習用データ 評価用データ pop.csv:2000-2010 までの人口データ pop2.csv:2011~2020 までの空のデータ [DATASETS] [New] アップロード

回帰分析 1( 学習用データ :pop.csv, 評価用データ :pop2.csv) 学習用データ評価用データ pop.csv:2000-2010までの人口データ pop2.csv:2011~2020までの空のデータ 1 XYZW : モジュール名 [ xyzw ]: メニュー名 学習用 評価用データの選択 1 アルゴリズムの選択 モデル学習の選択 1 学習用データ 1 評価用データ 外部ファイルとして読み込み後 [Saved Datasets] [My Datasets] [pop, pop2] 外部ファイル読込は前のスライドで 右クリックで [Visualize] で確認 データの分析 ( 予測 ) 説明変数 :year データの評価 目的変数 :number 線型単回帰

回帰分析 1( 学習用データ :pop.csv, 評価用データ :pop2.csv) 1 学習実験 データの配置 人口データ分析 XYZW : モジュール名 [ xyzw ]: メニュー名 2 アルゴリズムの選択 [Machine Learning] [Initialize Model] [Regression] 2 1 説明変数 :year 目的変数 :number 3 モデル学習 [Machine Learning] [Train] 3 予測したい列 ( 目的変数 ) を設定 Train Model を選択 [Launch column selector] number( 目的変数 ) 学習済みモデルとして保存する場合 : Train Model を右クリック [Save as Trained Model] 5 2 4 3 3 1 4 5 4 5 4 モデルの予測 : [Machine Learning] [Score] 5 Score Model を右クリック 次のスライド モデルの評価 [Machine Learning] [Evaluate] Evaluate Model を右クリック 2 枚後のスライドへ 実行 :RUN ボタン 実行結果の可視化 : モジュールを右クリックで [Visualize]

回帰分析 1( 学習用データ :pop.csv, 評価用データ :pop2.csv) 学習実験 4 人口データ分析 Scored Labels: モデル学習で計算 ( 予測 ) された数値 Score Model を右クリック Scored Labels この Scored Labels の意味は 2000-2010 までの人口データから分析した 2011~2020 までの人口の予想値

回帰分析 1( 学習用データ :pop.csv, 評価用データ :pop2.csv) 学習実験 5 予測精度の確認 人口データ分析 Evaluate Model 平均絶対誤差 :0 に近いほど分析精度は高い を右クリック 二乗平均平方根誤差 :0に近いほど分析精度は高い相対絶対誤差 :0に近いほど分析精度は高い(0~1) 相対二乗誤差 :0に近いほど分析精度は高い(0~1 ) 決定係数 :1に近いほど分析精度は高い(0~1)

回帰分析 2( 学習用 評価用データ :Automobile price data(raw)) 学習用 評価用データ Automobile price data(raw): 自動車のデータ分析 XYZW : モジュール名 1 5 1 2 1 [ xyzw ]: メニュー名 学習用 評価用データの選択 [Saved Datasets] [Samples] [Automobile price data(raw)] 3 4 説明変数 :make, fuel-type, num-of-doors, engine-size, horsepower. 6 目的変数 :price 7 説明変数 :1, 目的変数 :1 単回帰分析 8 説明変数 :2 以上, 目的変数 :1 重回帰分析

回帰分析 2( 学習用 評価用データ :Automobile price data(raw)) 入力データの前処理 [Data Transformation] [Manipulation] XYZW : モジュール名 1 Data Transformation Manipulation 2 2 利用する列の選択 Select Columns in Dataset を選択 Launch column selector 説明 目的変数をすべて選択 RUN 3 2 3 2 3 3 欠損値の修正 ( 行全体の除去の場合 ) Clean Missing Data を選択 Cleaning Mode(Remove entire row) RUN その他の方法 列の除去, 平均値での置換など 実行結果の可視化 : モジュールを右クリックで [Visualize]

回帰分析 2( 学習用 評価用データ :Automobile price data(raw)) 精度の評価 精度の評価のために ホールドアウト法 を用いる XYZW : モジュール名 [ xyzw ]: メニュー名 4 4 4 [Data Transformation] [Sample and Split] 学習用データと評価用データを分離する Split Data を選択 Fraction of Row in the First output Dataset 分離率の % を代入 (0.7 など ) RUN 実行結果の可視化 : モジュールを右クリックで Visualize

回帰分析 2( 学習用 評価用データ :Automobile price data(raw)) 学習実験 学習用 評価用データ Automobile price data(raw): 自動車のデータ分析 XYZW : モジュール名 [ xyzw ]: メニュー名 5 アルゴリズムの選択 [Machine Learning] [Initialize Model] [Regression] 5 6 モデル学習 [Machine Learning] [Train] モデルの予測 : [Machine Learning] [Score] 6 予測したい列 ( 目的変数 ) を設定 Train Model を選択 [Launch column selector] price( 目的変数 ) 学習済みモデルとして保存する場合 : Train Model を右クリック [Save as Trained Model] 6 7 実行結果の可視化 : モジュールを右クリックで Visualize 8 7 8 Score Model を右クリック 次のスライド モデルの評価 [Machine Learning] [Evaluate] Evaluate Model を右クリック 2 枚後のスライドへ

回帰分析 2( 学習用 評価用データ :Automobile price data(raw)) 学習実験 Automobile price data(raw): 自動車のデータ分析 Score Model を右クリック Price: 元のデータ,Scored Labels: モデル学習で計算 ( 予測 ) された数値 Price Scored Labels

回帰分析 2( 学習用 評価用データ :Automobile price data(raw)) 学習実験 Automobile price data(raw): 自動車のデータ分析 Evaluate Model を右クリック 予測精度の確認 平均絶対誤差 :0に近いほど分析精度は高い二乗平均平方根誤差 :0に近いほど分析精度は高い相対絶対誤差 :0に近いほど分析精度は高い(0~1) 相対二乗誤差 :0に近いほど分析精度は高い(0~1 ) 決定係数 :1に近いほど分析精度は高い(0~1)

回帰分析 3( 異なるアルゴリズムで比較する ) 回帰分析 デシジョンフォレスト回帰分析との比較 Automobile price data(raw): 自動車のデータを例に Split Data Linear Regression Train Model Score Model Decision forest Regression Train Model Score Model デシジョンフォレスト回帰分析とは 通常の多項式に基づいた回帰分析とは異なり 決定木 ( デシジョンツリー ) を基礎概念として回帰分析するアルゴリズムである ビッグデータ時代に相応しい機械学習の方法として最近注目されている 参考 : ランダムフォレスト (Random Forest) Evaluate Model

回帰分析 3( 異なるアルゴリズムで比較する ) 決定木 (Decision Tree) とは 説明変数の値をある基準にもとづいて分岐 ( 木構造 ) させ, 判別や予測 のモデルを構築する If-Then のルールで表すことが出来る 精度はやや落ちる デシジョンフォレスト回帰分析とは : 通常の多項式に基づいた回帰分析とは異なり 決定木 ( デシジョンツリー ) を基礎概念として回帰分析するアルゴリズムである ビッグデータ時代に相応しい機械学習の方法として最近注目されている 参考 : ランダムフォレスト (Random Forest) R データセットの cars より

回帰分析 3( 異なるアルゴリズムで比較する ) 決定木 (Decision Tree) とは 回帰直線 回帰木

回帰分析 3( 異なるアルゴリズムで比較する ) 回帰分析 デシジョンフォレスト回帰分析 : 精度の比較 上 : 線型回帰下 : デシジョンフォレスト回帰 右側に [Decision Forest Regression] のアルゴリズムを追加する