PowerPoint プレゼンテーション

Similar documents
プログラミングによるビッグデータの分析(R)

PowerPoint プレゼンテーション

2. 生田仮想デスクトップ PC の接続方法 生田仮想デスクトップ PC に接続する方法は 次の 2 通りです 1. HTML アクセス Internet Explorer や Safari などのブラウザを用います PC に特別なソフトウェアをインストールす る必要が無いので 管理者権限をもってい

NSS利用者マニュアル

内容 1 はじめに インストールの手順 起動の手順 Enterprise Architect のプロジェクトファイルを開く 内容を参照する プロジェクトブラウザを利用する ダイアグラムを開く 便利な機能.

2. 生田仮想デスクトップ PC の接続方法 生田仮想デスクトップ PC に接続する方法は 次の 2 通りです 1. HTML アクセス Internet Explorer や Safari などのブラウザを用います PC に特別なソフトウェアをインストールす る必要が無いので 管理者権限をもってい

CS-DRC1操作説明書

CubePDF ユーザーズマニュアル

実習を行う上での心構えについて

PDF Convertor for mac スタートアップガイド

3 ハイパーサーバサービスの諸設定を行う為の コントロールパネル のメイン画面が表示されます ウェブサイトとドメイン タブの データベース 欄にある 新規データベースを追加 をクリックします ( 新規データベースを追加 ボタンがない場合は データベース をクリックし データベース画面にある 新しいデ

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します 一般に OSS は営利企業ではない特定のグループが開発するソフトウェアで ソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが 大規模な

やさしくPDFへ文字入力 v.2.0

IME( 日本語入力システム ) の確認 変更方法 / プロパティ確認の手順 ************************************************************************************ ドキュメント目次 IME( 日本語入力システム )

SimLab Plugins for SketchUp 評価版インストールおよびアクティベート方法 注意事項 評価版をお使い頂くには 評価用ライセンスでのアクティベートが必要です 評価用ライセンスファイルの取得を行い 手動でアクティベートする必要があります 各 SimLab プラグインは 評価用とし

Microsoft PowerPoint - install_NGSsokushu_windows(ver2.1).pptx

SDP Generator

SOBA ミエルカ クラウドセミナーモード 配信者マニュアル 目次 はじめに 配信者のユーザー登録について ライブ配信の作成 ライブ配信への招待 ライブ配信への参加方法... 4 (1) ライブ配信を選んで参加する方法 ( 管理者 配信

Dahua アプリかんたん手順(2) SmartPlayer操作手順書

nLiteによるドライバの統合 - フロッピーディスク不要のXPインストールCDの作成方法 -

はじめに SDP Generator は オーバーレイに対応した JVC カメラに画像をインポートするデータファイル (SDP ファイル ) を生成するためのアプリケーションです 本アプリケーションを使用することで スコアボードのチーム名に チームロゴや画像化された多言語の文字をカメラ映像に表示する

PowerPoint Presentation

IPPO - 校内研修支援プログラム - 使用説明書 目次 項 目 ページ 1 プログラム利用の準備 この説明書の記述について プログラムの動作環境等 プログラムファイルのコピー プログラムファイルの起動 4 2 プログラムファイルの利用


SimLabプラグインは各機能を15回分評価版として試用できます

在宅せりシステム導入マニュアル

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド

1. Stata( ステータ ) Stata は,StataCorp 社の販売している統計ソフトウェアで, 計量経済学においてもっともよく使われています 最新の計量経済学的手法の論文を執筆する際に,Stata による推定方法 ( コマンド ) も同時に発表されることがよくあり, 基本的な分析からより

発環境を準備しよう2 章開Eclipseをインストールしようそれでは Eclipseをセットアップしましょう Eclipseは Eclipse Foundationのサイトからダウンロードできます ダウンロードのページを開くと いく

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

Taro-QGIS 3.2

目次 第 1 章はじめに 本ソフトの概要... 2 第 2 章インストール編 ソフトの動作環境を確認しましょう ソフトをコンピュータにセットアップしましょう 動作を確認しましょう コンピュータからアンインストー

インストールマニュアル

自宅でJava言語の開発環境を作る方法

鳥取県物品電子入札システムセキュリティ ポリシー設定マニュアル IC カードを利用しない応札者向け 第 1.7 版 平成 31 年 2 月鳥取県物品契約課 鳥取県物品電子入札システムセキュリティ ポリシー設定マニュアル Ver.01-07

BD&DVD 変換スタジオ 4 DVD 変換スタジオ 4 HOW-TO-COPY 注意 : 本説明はヨドバシカメラ等の家電量販店や ベクター ジェムソフトストア等の日本国内オンライン 販売店 leawo.jp 等でご購入の製品が対象です 目次 1. はじめに 2. Blu-ray DVD Decry

Studuinoソフトウェアのインストール

変換スタジオ 4 DVD 総合 Box ディスククローン 4 DVD HOW-TO-COPY 注意 : 本説明はヨドバシカメラ等の家電量販店や ベクター ジェムソフトストア等の日本国内オンライン 販売店 leawo.jp 等でご購入の製品が対象です 目次 1. はじめに 2. Blu-ray DVD

目次 第 1 章はじめに 本ソフトの概要... 2 第 2 章インストール編 ソフトの動作環境を確認しましょう ソフトをコンピュータにセットアップしましょう 動作を確認しましょう コンピュータからアンインストー

Microsoft Word - winscp-LINUX-SCPを使用したファイル転送方法について

スライド 1

miChecker導入手順書

1 Ver /3/10

ピツニーボウズジャパン ソリューションのご紹介

Microsoft Word - データ保管サービス操作マニュアル(第二版).docx

産能大式フローチャート作成アドインマニュアル

目次 第 1 章はじめに 電子入札システムを使用するまでの流れ 1 第 2 章 Java ポリシーを設定する前に 前提条件の確認 2 第 3 章 Java のバージョンについて Java バージョン確認方法 Java のアンインストール ( ケース2の

PowerPoint プレゼンテーション

WebCADD.com ご利用ガイド

<4D F736F F D208D C8FEE95F18DEC90AC A B D836A B2E646F63>

設定をクリックしてください 初期設定をクリックします

(3) 図 ファイルの展開先 ( 保存場所 ) 指定画面 が表示されます 参照ボタンを押下すると 図 フォルダ指定画面 が表示されるので 保存先を指定し OK ボタン を押下します 図 ファイルの展開先 ( 保存場所 ) 指定画面 の 展開 ボタンを押下します 図

目次 1. AOS ユーザー登録サイト AOS ユーザー登録 AOS ライセンスキー登録 ios 版アプリ インストール 起動と新規登録 初期設定とバックアップ Andro

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

Amazonポイントプログラム (設定編)

スライド 1

活用効果調査入力システム Ver3 システム操作説明書 平成 27 年 2 月

商標類 Microsoft は, 米国およびその他の国における米国 Microsoft Corp. の登録商標です Microsoft Office は, 米国 Microsoft Corp. の商品名称です Microsoft Excel は, 米国 Microsoft Corp. の商品名称です

Microsoft Word - Python利用環境構築ガイド_ docx

4. ファイルアップロード機能 使い方 ファイルをドラッグ & ドロップ した状態 図 4-1: ファイルアップロード画面 ( 例 ) 1. 送信するファイルをドラッグ & ドロップしてください 送信するファイルの右のエリアをマウスでクリックする事により 従来のエクスプローラー形式のアップロードも可

DBMSリポジトリへの移行マニュアル

クイックスタート [USB メモリのセキュリティ無料版用 ] 2 / 18 パソコンへのインストール セットアップファイルの名前は次のファイル名です 環境によっては ".exe" の部分は表示されていない場合もあります このファイルを実行 ( ダブルクリック ) して インストールを開始します エデ

Microsoft Word - e-Parcel_VCN-CommCenter7.0_Installation_manual doc

Multi LABELIST V5 練習マニュアル - 様々な発行方法編 第 1 版 2013 年 3 月 18 日 株式会社サトー

ふれんずらくらく流通図面マニュアル

シヤチハタ デジタルネーム 操作マニュアル

基本設計書

内容 MD00Manager とは?... MD00Manager をインストールする.... ソフトのインストール... MD00Manager の使い方.... 起動をする... 機能説明...7 機能説明 ( メニューバー )...8 機能説明 ( ステータスバー )...8 機能説明 ( コ

ランタイム版 Pro 版共通 症例登録システム 2018/12/11 Q & A 目次 1. 起動時のエラー... 2 Q11. " ファイル jsgoe_data3.fmp12 を開くことができません" と表示されます (Windows) 2 Q12. ショートカットから起動できません (Wind

目 次 1. ログイン システムの操作 データ検索 検索 CSV 出力 台帳表示 位置確認 詳細表示 データ編集

( 目次 ) 1. はじめに 開発環境の準備 仮想ディレクトリーの作成 ASP.NET のWeb アプリケーション開発環境準備 データベースの作成 データベースの追加 テーブルの作成

Proself利用方法

地図 SD カードを取り外す 最初に ナビゲーション本体から地図 SD カードを取り外します 本操作は地図 SD カードを初めて ROAD EXPLORER Updater に登録するときや パソコンにダウンロードしたデータを地図 SD カードに保存するときに実行してください 1 ナビゲーション本体

操作ガイド 用紙タイプ登録ツール

サイボウズ Office 10「リンク集」

環境確認方法 (Windows の場合 ) OS 動作環境日本語版 Windows 7, 8, 8.1, 10 であること 確認方法 Windows キーを押しながら R キーを押します または [ スタート ] メニューから [ ファイル名を指定して実行 ] ( または [ プログラムとファイルの

1 本ドキュメントが想定するネットワーク環境 本ドキュメントが想定するネットワーク環境を図に示す 各種モダリティで撮像した DICOM データは DICOM サーバに送信され データベースに登録される クライアントパソコンには InVesalius がインストールされている これらの機器はすべてネッ

スライド 1

1. はじめに本手順書は インテリジェントウェイブ社 ( 以下 IWI 社 ) の株主のお客様が IWI 社から株主優待として配布された Doctor Web 社のアンチウイルス製品 ( 以下 Dr.Web Anti-Virus) のバージョン のいずれかをご利用中で 同製品のバー

Transcription:

総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース4] オープンデータ ビッグデータ利活用事例 4-3: プログラミングによるビッグデータの分析 (R) [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5

実習紹介本講座の学習内容 (4-3: プログラミングによるビッグデータの分析 (R)) 講座概要 統計分析ソフトウェアRとRstudioの概要を示し ダウンロード インストール方法を紹介します Rstudioの画面構成と基本操作を説明します Rstudioを用いたExcelファイルの読み込み方法 回帰分析の実行方法を説明します Rを用いることで高度な分析 大容量ビッグデータの分析ができることを示します 講座構成 [1]RとRstudioのダウンロード インストール [2]RとRstudioの基本操作 [3]Rstudioにおけるデータ分析 学習のゴール 統計分析ソフトウェア R と Rstudio の概要を把握します Rstudio における画面構成 基本操作を把握し プログラミングの具体例を理解します R を用いることで高度な分析 大容量ビッグデータの分析ができることを把握します

統計分析ソフトウェア R と Rstudio R は無料で利用できる統計分析用ソフトウェア( プログラミング言語 ) R studio は R を快適に利用するための統合開発環境です この講座では ビッグデータ分析をはじめとする様々な分析に活用できる R( アール ) を説明します R は Windows Macintosh Linux にインストールできる無料のソフトウェアであるとともにプログラミング言語です R は データ分析に特化した言語で データ分析の初心者から専門家まで幅広い人気があります 様々なソフトウェアの制作に利用される C 言語や Java といった汎用プログラミング言語と異なり R はデータ分析がしやすい設計になっています 米国電気電子学会が人気のあるプログラミング言語を示した The Top Programming Languages 2017 において R は第 6 位になっています Rstudio は R を快適に利用することができる統合開発環境です [1]R と Rstudio のダウンロード インストール 統合開発環境 (IDE: Integrated Development Environment) は 一つのソフトウェアの中に入力欄 出力欄 データ欄等が統合されて表示されることで プログラミング等による開発を行いやすくする環境です R studio は 無料で利用できるオープンソース版と優先的なサポートが受けられる商用ライセンスがあります 統計分析ソフトウェア R のロゴ The Top Programming Languages 2017 の上位 10 位 統合開発環境 R studio のロゴ R は第 6 位の人気 2016 The R Foundation. 出典 米国電気電子学会 (IEEE) https://spectrum.ieee.org/static/interactive-thetop-programming-languages-2017 RStudio is trademarks of RStudio, Inc

R と Rstudio のダウンロード R と R studio は 誰でもウェブサイトからダウンロードすることができます Rのインストール用ファイルは CRANに参加する統計数理研究所のウェブサイトからダウンロードすることができます https://cran.ism.ac.jp/ CRAN(Comprehensive R Archive Network ) は R に関するファイルを蓄積 提供する国際ネットワークです 2017 年 10 月時点における上記 URL のウェブサイトの表記は概ね英語ですが 英単語が分かれば ダウンロードやインストールに支障はありません OS へインストールするための R には Windows 版 Macintosh 版 Linux 版がありますが この講座では Windows 版で説明します Windows を利用している場合は Download R for Windows をクリックした後 base も文字をクリックした後に表示される Windows 版のダウンロードボタンをクリックして下さい OS に応じた R の選択画面 [1]R と Rstudio のダウンロード インストール Windows 用 R のダウンロード画面 Rstudio のインストール用ファイルは Rstudio のウェブサイトからダウンロードできます https://www.rstudio.com/products/rstudio/download/ デスクトップ版のダウンロードへのリンク Rstudio には 各 PC の中の R を実行するデスクトップ版と離れたサーバ上の R を実行するサーバ版がありますが 一般にはデスクトップ版を利用します Rstuido のトップページからの移動する場合は まず画面上部の Products>Rstudio を選択してください 次に表示される画面で [Open Source Edition] の欄にある DOWNLOAD RSTUDIO DESKTOP のボタンを押します 続いて表示される画面でオープンソース版の DOWNLOAD NOW をクリックします オープンソース版のダウンロードボタン

R と Rstudio のインストール [1]R と Rstudio のダウンロード インストール R と R studio は マウスのクリックだけで簡単にインストールすることができます R のインストールにおいては 全て初期設定で OK や 次へ で進めて 問題ありません 設定内容が把握でき 変更したい方は インストール先のフォルダの指定 32bit 版か 64bit 版等の選択をして下さい 設定内容が把握できない方や細かい設定を気にしない方は 全て初期設定でのインストール 32bit 版と 64bit 版の両方のインストールで構いません R のインストールの言語選択 R のインストール開始画面 R のインストール時の最後の選択 Rstudio のインストールも 全て初期設定で 次へ で進めて 問題ありません 初期設定でインストールを完了すると スタートメニューの中に Rstudio のショートカットができます これをクリックすると Rstudio が起動します Rstudio インストール開始 Rstudio のインストール先指定プログラムフォルダ内のショートカット

R の起動と基本操作 R を直接操作して プログラミングと出力の関係を確認します R および Rstudio のインストール後は 右下のようなショートカットアイコンが表示されます R i386 は 32 ビット版の R を指し R x64 は 64 ビット版の R を指します Windows の場合は 利用している Windows が 32 ビット版なら R i386 64 ビット版なら R x64 を使って下さい 利用している Windows が 32 ビットか 64 ビットか分からない場合は どちらでもプログラムが動く R i386 を使って下さい まず R を直接操作するために R のショートカットアイコンをクリックして起動します R の基本部分は日本語化がされており 初期画面には R のライセンスに関する日本語での説明が表示されます R の直接操作 プログラミング体験として 中央下の枠内の黒字の部分の入力し 出力を見ます R では #( 番号記号 ナンバーサイン ハッシュ ) の右側をプログラミングとしての読み込み時に無視します # の右側には日本語でも説明書きやコメントを書くことができます R の初期画面の表示 R へのプログラムコード入力 1 # 足し算としての 1+2 1+2 #R で変数を作る場合は # 変数名 <- 変数の中身 で入力 #x に 10 y に 20 を入力 x<- 10 y<- 20 #x と y の足し算としての z z=x+y # 変数名を入力すると 変数の値を出力 z # 全体を () でくくると 計算と同時に出力 (zz=x*y) [2]R と Rstudio の基本操作 R の出力

Rstudio の画面構成 Rstudio は分割した画面構成によって R のプログラミングを効率的に行えます Rstudioのショートカットアイコンクリックすると 分割された画面構成のRstudioが起動します Rstudioには 公式の日本語版はありませんが 初歩的な英単語の知識で概ね読めることに加えて ウェブ上の無料翻訳サービスを活用すれば 英語が苦手でもRstudioの利用に支障はありません 初期状態で画面の左側が縦に分割されていないは 画面上側のメニューの左端にある [File] [New File] [R Script] を選択します Rstudio 内では分割された各パネルで 入力欄 出力 データ一覧 グラフと機能分化しています Rstudio では分割された各パネルにタブ ( つまみボタン ) が付いており パネル内の表示内容や表示対象を変えることができます Rstudio の画面構成は メニューの [Tools] [Global Options] [Panel Layout] から 利用者の好みに合うようにカスタマイズできます 初期設定における Rstudio の画面構成 ( 主なタブの内容 ) [2]R と Rstudio の基本操作 ソースエディタ 複数行のプログラミング入力データビュー データの内容表示 環境 ( ワークスペース ) 変数 データ等の一覧ヒストリー ( ログ ) 過去の入力値の確認 コンソール (R の本体部分 ) 一行単位のプログラミング入力 分析結果の出力 プロット ( グラフ ) 図の表示ヘルプ 説明ページへのリンク

Rstudio への入力と画面出力 Rstudio を使うと 変数データ一覧やグラフを確認しながら プログラミングができます 右下の画像では ベクトル形式のデータを操作 線付きの散布図 ( グラフ ) の描画を行っています Rstudio では ソースエディタからプログラムコードを実行したい範囲を選択後 Run のボタンをクリックしてください ベクトルは 数値を横 ( 行 ) または列 ( 縦 ) に並べたものを指し 数値を束ねたもののイメージです [2]R と Rstudio の基本操作 R へのプログラムコード入力 2 Rstudio の 4 分割画面の表示 ###2 種類のベクトルの記入 v1<- c(1, 2, 3, 2, 1) v2<- c(10, 20, 30, 40, 50) # ベクトル同士の足し算 ( 表示付 ) (plus_v1v2=v1+v2) ソースエディタ入力 データビューデータの表示 環境 ( ワークスペース ) 変数 データ一覧 #2 つのベクトルを横に並べて行列作成 ( 表示付 ) (set_v1v2=cbind(v1, v2)) ### 統計関数の利用 # 平均値 mean mean(plus_v1v2) コンソール結果出力 プロット ( グラフ ) グラフ出力 # 基本統計量セット summary summary(plus_v1v2) # set_v1v2 を線付きで散布図で青で表示 plot(set_v1v2,type="o", col="blue")

Rstudio における Excel ファイルの読み込み Rstudio では 簡単に Excel データを読み込むことができます Rstudio の標準設定における右上のパネルの [Import Dataset] から外部のデータを読み込みます Excelファイルを取り込む場合は[From Excel] [Browse] とクリックし データの入ったExcelファイルの選択後 プレビューでデータの内容を確認してから [Import] をクリックします Rstudio の標準設定とするフォルダは [Tools] [Global Options] [General] にある Default working directory から変更できます Excel ファイル内の分析用データは 1 行目に変数名 2 行目以降に一行ずつ個別の標本のデータが入っている形式にしておきます R で日本語のファイル名を取り込む設定もありますが 半角英数字のファイル名にしておくと データ読み込み時のエラーの心配がありません Excel ファイルの中の各セルに入っているデータは 文字データの列であれば日本語が含まれていても問題ありません データがプレビューに表示されている状態では [Code Preview] にデータと読み込みに対応するプログラムコードが表示されます このコードをコピーして ソースエディタに貼りつけることで 次回以降の同じデータ読み込みをする際にプログラムコード内で行えます Excel ファイルの指定と [Browse] プレビューによるデータ内容の確認 [3]Rstudio におけるデータ分析 プログラムコードと [Import] Rstudio 内に取り込んだ Excel データの表示

Rstudio における回帰分析 [3]Rstudio におけるデータ分析 R では読み込み済のデータに対して 1 行のプログラムで回帰分析が実行できます Rstudio で読み込んだ Excel ファイルはデータフレームと呼ばれる形式となり データフレーム形式の中の各列は データフレーム名 $ 列名 ( 変数名 ) で指定することができます 標準的な読み込み設定では Excel ファイル上のデータの 1 行目が列名 ( 変数名 ) となります データフレームの中の列名 ( 変数名を ) 変更したい場合は names(data_ols) <- c( 新列名 1, 新列名 2, 新列名 3 ) と順に指定したり names(data_ols)[3]<- 新列名 3 と列の番号を指定して 変数名を改めることができます R における回帰分析は lm( 被説明変数 ~ 説明変数 1 + 説明変数 2 +...) という 1 行のプログラムコードで実施できます 前のスライドで取り込んだ Excel データに関する回帰分析の結果を lm_result という名前のデータ ( リスト形式 ) として保存する場合は lm_result<-lm(data_ols$y ~ data_ols$xα + data_ols$xβ) と入力します ソースエディタにおける回帰分析のプログラムコード入力 回帰分析の結果がデータ ( リスト形式 ) をクリックして データビューに分析結果が表示されます 標準的な読み込み設定では Excel ファイル上のデータの 1 行目が列名 ( 変数名 ) となります 環境 ( ワークスペース ) における表示 データビューに表示される回帰分析の結果の内容

R におけるパッケージの利用 R におけるビッグデータの活用 R はパッケージを利用することで様々な出力 高度な分析を簡単に実行できます 複数の回帰分析の結果を並べて表示して 比較したい場合には memisc パッケージが便利です R において R のプログラムコードを配布用にとりまとめたものを パッケージ と言います インターネット上の CRAN に保存されているパッケージを初めて使う場合は プログラムコードに install.packages( パッケージ名 ) と入力し PC 内にパッケージをダウンロード インストールしてください ( 一度 PC にインストールすれば 2 回目以降のプログラムコードへの記載は不要です ) PC 内にインストールされているパッケージは プログラムコードに library( パッケージ名 ) と入力した後に使うことができます ソースエディタにおけるプログラムコード入力 #xα xβ のそれぞれ 1 変数で単回帰して結果を格納 lm_res2<-lm(data_ols$y ~ data_ols$xα) lm_res3<-lm(data_ols$y ~ data_ols$xβ) # パッケージ memisc のインストールと利用宣言 install.packages("memisc") library(memisc) # パッケージ memisc 内の mtable 関数を利用 #3 つの回帰分析の結果を並べて表示 mtable(lm_result, lm_res2, lm_res3) mtable 関数 (memisc パッケージ ) の出力 R のパッケージを使うと 機械学習の高度な分析も簡単なプログラムコードで実行できます 本格的な機械学習のデータ処理 分析には Python( パイソン ) というプログラミング言語が優れており 人気があります 64 ビット版の R を使うと 大容量のビッグデータのデータ処理 分析が可能です [3]Rstudio におけるデータ分析 回帰分析の結果表示において Intercept は切片の高さを表し 説明変数の値が全て 0 の場合における被説明変数の予測値に対応します 効果がありそうな説明変数には * を付けることが 分析結果の表記において慣例となっています R-squared は決定係数を意味し 0 以上 1 以下の値をとる回帰分析の当てはまり度合いの指標です 64 ビット版の R では メインメモリの容量を上限としてデータを格納することができ GB( ギガバイト ) 単位のデータ処理 分析が可能です