今日の話のメインターゲット R を ( 入れてみたが ) 使い方が分からない人 そもそも使ったことが無い人 R の存在を知らなかった人 2

Similar documents
数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

PowerPoint Presentation

Microsoft PowerPoint - handout07.ppt [互換モード]

「統 計 数 学 3」

Microsoft PowerPoint - prog03.ppt

ゲームプログラミング講習 第0章 導入

◎phpapi.indd

メソッドのまとめ

PowerPoint プレゼンテーション

Microsoft PowerPoint ppt

Microsoft PowerPoint - å®�æ−•è©¦é¨fi3ㆮ対ç�Œ.pptx

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

1 〇〇クリッカーマニュアル 目次 クリックすると移動します 目次準備 1. VC または VS2013 をインストール 2. DX ライブラリのダウンロードと解凍 3. なんとかクリッカー プロジェクトのダウンロードと解凍 4. なんとかクリッカー プロジェクトを開く編集編集する部分画

3.Cygwin で日本語を使いたい Cygwin で以下のコマンドを実行すると それ以降 メッセージが日本語になります export LANG=ja_JP.UTF-8 これは 文字コードを日本語の UTF-8 に設定することを意味しています UTF-8 は Cygwin で標準の文字コードで, 多

初めてのプログラミング

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

FTP とは? FTP とは File Transfer Protocol の略です 日本語訳すると ファイルを転送するときの決まり事という意味です 飛行機が世界中の空港で離陸 着陸できるのは 決められた手順 通信方式 が存在するからです パイロットでない私たちが聞いても よく分からないやり取りです

XAMPP で CMS のお手軽 テスト環境を手に入れよう 2011/5/21 上村崇 1

Microsoft Word - CygwinでPython.docx

C#の基本

第 5 章インディケータとテンプレート MetaTrader4 に標準装備されているインディケータの使い方 ここまでの作業で MetaTrader4 の基本的なチャート操作についてはマスターできたと思います ここからは MetaTrader4 に標準装備されている インディケータ という便利なテクニ

情報処理概論(第二日目)

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft Word - ラベルマイティStep1.doc

memo

プログラミング実習I

ToDo: 今回のタイトル

<4D F736F F D208AC888D B836A F C91808DEC837D836A B81698AC7979D8ED A E646F6

理工学図書館後期 LS 講習会 きれいなグラフを作ろう! gnuplot 入門

win版8日目

pp2018-pp4base

PowerPoint2007基礎編

memo

初めてのプログラミング

第4回

gnuplot の使い方 gnuplot は汎用的で しかも手軽に使えるプロッティング プログラムです 計算結果をグラフにするとき に非常に便利なので ぜひ覚えてください 1 gnuplot の始め方 終わり方 gnuplot の始め方は ターミナル上のプロンプトの後ろで gnuplot と打つだけ

PowerPoint プレゼンテーション

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ

マウス操作だけで本格プログラミングを - 世界のナベアツをコンピュータで - プログラムというと普通は英語みたいな言葉で作ることになりますが 今回はマウスの操作だけで作ってみます Baltie, SGP System 操作説明ビデオなどは 高校 情

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

受付代行 設定マニュアル このマニュアルでは 恵比寿ボイスプロダクションが Google アシスタントアプリで公開している 受付代行 ( ) を使って Google

Source Insight

Microsoft PowerPoint - ca ppt [互換モード]

GSLetterNeo vol 年 7 月 形式手法コトハジメ TLA + Toolbox を使って (2)- 熊澤努 sra.co.jp はじめに GSLetterNeo Vol.130 で TLA + Toolbox を紹介しました 今回からより詳しく T

PowerPoint プレゼンテーション

スライド 1

JavaScriptで プログラミング

Outlook2010 の メール 連絡先 に関連する内容を解説します 注意 :Outlook2007 と Outlook2010 では 基本操作 基本画面が違うため この資料では Outlook2010 のみで参考にしてください Outlook2010 の画面構成について... 2 メールについて

HP Primeバーチャル電卓

ガイダンス

Microsoft PowerPoint - C4(反復for).ppt

クラウドの活用 クラウドとは雲 または雲状の煙やほこりという意味です ネット上にあって仕事はしてくれるがどこにあるかよくわからないサービスをクラウドと呼びます ここではクラウドサービスまたはクラウドサービスで利用されるサーバー群を指しクラウドを活用すると表現します クラウドには Micro soft

第21章 表計算

Anaconda x86_64 版バージョン の インストールとパッケージの追加 最終更新 : 2018 年 2 月 10 日 URL: Anaconda は,Py

Eclipse マニュアル <作成目的> Eclipse のインストール方法などを紹介したページはいろいろありますが 専門用語がわからない初心者でもわか りやすく Eclipse のインストール方法 基本操作などをまとめたマニュアル作成を目的としています <目次> 1 Eclipse のインストール

エクセルによる数値計算と化学への応用

Microsoft Word - 操作マニュアル-Excel-2.doc

また 初期化について 以下のサンプルコードのように指定すれば 定義時に値を代入できます * オマケ配列は同名で複数個の箱を用意出来ます 同名ではありますが それぞれは別々の個体であるわけです また この複数個の変数は メモリ上に連続で確保されます 2. 文字と文字列 C 言語では文字と文字列は異なる

Microsoft Word - Web版付録1(7, 10 および Vista)改訂版.docx

引き算アフィリ ASP 登録用の日記サイトを 作成しよう Copyright 株式会社アリウープ, All Rights Reserved. 1

kiso2-03.key

<4D F736F F D20838F815B836882C54C494E E DEC90AC283194C529>

Python によるジオプロセシング スクリプト入門

Microsoft Excel -成績処理に役立つExcelの基礎知識と関数-

目次 新規ユーザー登録... 3 初期設定... 6 (1) 特定商取引法に基づくページのURLを設定する... 7 (2) コンバージョン測定タグを設定する... 7 サイトを作成してみよう

設定ファイル R 起動時に読み込まれ, R における種々の設定を項目別にファイルに記述してあります R の主な設定ファイルは Rconsole, Rdevga, Renviron, Rprofile の 4 つです いずれもテキストファイルですが, 改行コードが Windows のものと異なる場合が

目次 1. はじめに ログイン方法 (PC の場合 ) メール送信方法 (PC の場合 )... 6 からのアドレス帳の移行方法 (PC の場合 ) メール転送方法 (PC の場合 ) Gmail アプリの設

Microsoft Word - index.html

Microsoft Word - IE11 設定手順書 受注者 win 7.doc

プログラミング基礎

PowerPoint プレゼンテーション

メール設定

スライド 1


Visual Studio 2017 RC インストール & ファーストステップガイド 2016 年 11 月 16 日 (V1.0)

PHP 分科会 '12/01 OpenSource 協議会 System i 2012/01/26

Outlook Express 6 の場合 (Windows XP) Outlook Express 6 の場合 (Windows XP) Windows XP に付属する Outlook Express 6 に αweb のメールアカウントを追加する方法についてご案内します 1 スタート をクリッ

PowerPoint2003基礎編

PowerPoint Presentation

PowerPoint プレゼンテーション

プログラミング基礎

PowerPoint プレゼンテーション

Microsoft PowerPoint - Borland C++ Compilerの使用方法(v1.1).ppt [互換モード]

2. オプション設定画面で, 必要事項を記入 選択します. 少なくとも, タイトル に課題の見出しとなる文章を入力する他, 種別 を アンケート( 無記名式 ) に設定する必要があります. また, アクセス制限はここでは コースメニューで非表示にする に設定します. その他設定は必要に応じて行って下

Pirates Buster Series Secure Viewer セットアップマニュアル (Web インストーラ)

1. Stata( ステータ ) Stata は,StataCorp 社の販売している統計ソフトウェアで, 計量経済学においてもっともよく使われています 最新の計量経済学的手法の論文を執筆する際に,Stata による推定方法 ( コマンド ) も同時に発表されることがよくあり, 基本的な分析からより

フィルタとは

PowerPoint プレゼンテーション

こんにちは! レンタルサーバ完全必勝ワンポイントパック FTP 使い方編 をダウンロードしていただきありがとうございます そもそも FTP ソフトって何? FTP ソフトとは サーバにファイルをアップロードする際に使うソフトの事です FTP ソフトは色々なものが出ていますが今回は一般的に使われている

Code_Aster / Salome-Meca 中級者への道 2015年5月31日

方法 4 の手順 パソコンの条件 を確認するための画面を表示する Windows8より前のパソコンでの確認方法 () スタートボタン をクリックする () ( マイ ) コンピューター と書いてある部分を右クリックする (3) プロパティ をクリックする (4) システムの画面が表示される Wind

Si 知識情報処理

フローチャート自動生成ツール yflowgen の使い方 目次 1 はじめに 本ツールの機能 yflowgen.exe の使い方 yflowgen.exe の実行方法 制限事項 生成したファイル (gml ファイル形式 ) の開

Microsoft PowerPoint - sousa pptx

PowerPoint プレゼンテーション

Microsoft Word - no103.docx

dae opixrae 1 Feb Mar Apr May Jun と表示される 今 必要なのは opixrae のデータだけなので > opixrae=opixdaa$opi

PowerPoint プレゼンテーション

共済会_Kねっと利用マニュアル(2018).indd

グーグル検索マクロの使い方

Transcription:

5 月 20 日 15:30-16:30/ 23 日 16:30-17:30 統計用言語 R の使い方 基礎工学研究科 M1 奥野彰文 予定時間 約 60 分

今日の話のメインターゲット R を ( 入れてみたが ) 使い方が分からない人 そもそも使ったことが無い人 R の存在を知らなかった人 2

今日の目標 R/Rstudio をインストールして 簡単な計算を実行する. (R で何ができるか ) 把握する. 3

目次 1. R 言語とは I. 何ができるのか? 2. インストールから実行まで I. R のダウンロード / インストール II. Rstudio のダウンロード / インストール III. コンソールとスクリプト 3. 簡単な統計解析 I. 平均, 分散を求める +α 4. グラフを描いてみよう I. データのプロット II. 線形回帰 余った時間 : R- 番外編

R 言語とは? [ 本節の内容 ] R って何 Rを使って何ができるのか Rstudioの紹介

R 言語って何ですか 統計解析用のプログラム言語 タダ無料 6

何ができるのか だいたいなんでもできる 通常の四則演算 + 行列やベクトルの演算 様々な統計分析 ( 回帰や分散分析 etc) データのグラフ表示 R 実行画面 7

超優秀なツール RStudio R のための統合開発環境 ( 便利なツール ) もちろん タダ無料 R を見やすくしたようなもの. データを分析している感が出て恰好良い 導入も簡単 8

RStudio R から Rstudio へ RStudio をインストールする前に, 先に R をインストールする必要があります! 9

インストールから実行まで [ 本節の内容 ] Rをインストール Rstudioをインストール Rstudioを実行する

R をダウンロード (1) CRAN からプログラムをダウンロード http://cran.r-project.org/index.html Download R for (Windows) base 11

R をダウンロード (2) クリック! 適当なフォルダに保存. ( 英語版ですが, インストール時に日本語が選択できます.) 12

Rをインストール (3) ダウンロードしたファイルを実行. R-***-win.exe 次へ で進む. 起動オプションなど設定する必要は無い 実行ファイルがインストールできました. これで R が使用可能に. 13

Rstudio をダウンロード (1) 公式サイトからプログラムをダウンロードする. https://www.rstudio.com/ 14

Rstudio をダウンロード (2) on your desktop を選択 ( ノート PC の方もこちら ) こっちはサーバー用 15

Rstudio をダウンロード (3) Recommended for your system にあるリンクをクリック 16

Rstudio をインストール (4) 特に設定は必要ない. 次へ で進めばよい. RStudio が使用可能に. 17

Rstudio を実行する ( コンソール ) 起動 ( 初期画面 ). コンソール. 3+2 を入力して Enter を押してみる. 18

単純な計算機として機能している. 複雑な計算も可能 変数も利用可能. ( 変数宣言必要なし. 詳細は後で.) 対話的に計算ができる. 電卓的利用. 19

もう少しプログラミングっぽい使い方 ここをクリック 左上部分に新しい画面が出てきた. ( スクリプト編集画面 ) 20

コンソールとスクリプト コンソール = 1 行ずつ実行 スクリプト = プログラムをまとめて実行 さっきのコードを書いて 実行する範囲を選択, で実行! 21

スクリプトの編集 出来るだけスクリプトを使いましょう. 直接コンソールに打つと, 間違った時が大変. 統計っぽい解析 22

簡単な統計解析 [ 本節の内容 ] ベクトル という考え方 平均, 分散を計算する ( 偏差値を計算する ) ( ヒストグラムを描く )

ベクトル という考え方 配列みたいなもの. 数字の列ぐらいに思ってください. a に (1,2,3,4,5) という数字の列を入れる a に 5 つの数字が入っている. ベクトルに対して, 様々な関数が用意されています. 最大値平均値分散 24

計算は ベクトル が基本 例 ) あるテストの平均点を求める. A さん B さん C さん D さん E さん F さん G さん H さん 点数 55 45 65 30 85 90 95 50 1) 点数のデータをベクトルで表現 2) 平均点を計算 (mean を使う ) 3) 最高点等も計算できる! 25

ベクトルに名前を付ける 1 誰が何点なのか分からない 2 名前を入れたベクトルを作成. ( 点数の順番と対応 ) 3 pts( 点数一覧 ) に名前を入れる 4 名前がつきました! 5 最高点は G さんでした. 26

もっと巨大なデータの処理 200 人分の点数のデータがあったとする. mean, max, min を調べる : 平均点 : 最高点 手計算だとしんどい : 最低点 27

魔法のコマンド ( 偏差値編 ) : 偏差値 2 行だけ書けば計算できる 28

グラフ的な処理 さっきの点数のヒストグラムを描く たった一言命令するだけ 29

まとめ R/Rstudioのダウンロード / インストール 計算はベクトルが基本 コマンドいろいろあって便利です 30

グラフを描いてみよう [ 本節の内容 ] データのプロット 線形回帰

データのプロット アイスコーヒーの注文数を予測しよう http://markezine.jp/article/detail/16164 32

データを入力 頑張って入力します. こんな感じ 表の上から順に入力 ( 順番を変えてはいけません ) 一言だけ命令 33

図を拡大 ( データ 1) 22 度, 300 杯 34

図を修正する plot() だと図は自動で調整される が, 手動で修正できる. :x 軸,y 軸の範囲 : グラフのタイトル タイトルが出た 色々な setting を試してみましょう. ( 点の間を線で結んでくれる設定等 ) 35

図を修正する (2) pch とか変えてみる [R-Source] http://cse.naro.affrc.go.jp/takezawa/r-tips/r/53.html 36

相関係数を計算 ( 統計を知っている人用 ) 面倒な計算も一発 かなり強い相関がある ( >0.8 ) グラフから見ても線形に近似できそう 37

線形回帰 計算の方法について, 興味のある人は 線形回帰 で調べましょう省略! また一言だけ命令 : 38

線形回帰 (2) たった一言で式が求まった! これをグラフに書き込んでみる 39

線形回帰 (3) 回帰直線を図に書き込む 40

この章のまとめ データとplot() で図を書ける 手動調整用のコマンドも豊富 線形回帰も楽々 41

今日やったことのおさらい R/RStudioのDL/Install 簡単な統計解析 平均や分散の計算 偏差値とヒストグラム グラフを描いてみる plot() 関数 手動でのグラフの調整 線形回帰 42

最後に 講習会終了後の質問は, 火曜日 15:00-18:00 金曜日 15:00-18:00 @ 利用支援カウンター または, E-mail: sogo-ta52@library.osaka-u.ac.jp まで. 43

おまけ [ 本節の内容 ] 今日使ったソースコード 参考文献

今日使ったコード (1) #analyze points pts <- c(55,45,65,30,85,90,95,50) mean(pts) max(pts) #big data pts<-ceiling(rnorm(200,mean=60,sd=15)) min(pts) max(pts) mean(pts) #standard score normalized.pts <- scale(pts,center=true,scale=true) 50 + 10*normalized.pts #coffee ~ temperature temperature <- c(22,23,23,24,24,25,25,26,26,27,27,28,29,32,28,24,31,31,32,33,33,34,34,35,35) coffee <- c(300,310,320,330,320,330,310,320,310,340,360,350,360,400,370,310, 360,390,390,400,410,450,460,440,480) 45

今日使ったコード (2) #simple plot plot(temperature,coffee) #manual plot(temperature,coffee,xlim=c(22,35), ylim=c(300,480), main="coffee~temperature", pch=17) #linear regression lm(coffee~temperature) #plot predicted line prd <- lm(coffee~temperature) abline(prd) 46

参考文献 定番の本 同じ内容が無料で公開 (web) R-Tips http://cse.naro.affrc.go.jp/takezawa/rtips/r.html 47

R- 番外編 [ 本節の内容 ] ヘルプを読む (?mean) プログラミングっぽい書き方 ベクトルの応用

ヘルプを読む コマンド (mean 等 ) のヘルプを読む. 例 ) mean() の使い方を調べる? + コマンド名 RStudio の右下のウインドウにヘルプが表示される. 49

mean() の help Arguments( 引数 ) オプションみたいなもの mean では trim という引数を入力できる. ( 入力しなければデフォルト値 =0) ちょっと使ってみる. 50

mean の引数 -trim ヘルプの下の方に, Example が載っている. 1 行目 : x に (0,1,2,3,4,5,6,7,8,9,10,50) というベクトルを代入 何が違う? 51

trim の続き the fraction (0 to 0.5) of observations to be trimmed from each end of x before the mean is computed. Values of trim outside that range are taken as the nearest endpoint. trim 無し (0,1,2,3,4,5,6,7,8,9,10,50) trim=0.1 (1,2,3,4,5,6,7,8,9,10) 52

他にも色々調べてみましょう?plot,?hist,?lm,?abline, 等々 けど分かりにくい場合もある. ( 英語を読むのが面倒臭い ) メジャーな関数なら Web 検索. または R-tips の方が分かりやすいかも. 53

プログラミングっぽい書き方 1+2+3+ +100 を求めたい. 方法 1) ベクトルを使う方法. 方法 2) for を使う方法. 少しプログラミング風になった. 54

プログラミングっぽい書き方 for 文について. Rでfor 文を使うと遅い. forではなくベクトルを使う方が良い. > 速い. ( 場合によっては数百倍 ) 通常の利用では, 単なる好みの問題 55

関数を作る 1 変数の関数 2 変数の関数 更に複雑な関数 ベクトル (pts) 56

ベクトルで計算する 全ての要素に適用される 57

ベクトルで計算する ( 発展 ) を求めるにはどうするか? 58

行列で計算する ( 発展 ) をどうやって計算するか? (i,j) 要素 =ij 59

R- 番外編, まとめ 困ったらヘルプを読みましょう. Web 検索, R-tips, またはRから呼び出せるヘルプへ. プログラムっぽい書き方もできます. for, while, repeat 系も利用可. ただしベクトルを利用した方が早い. ( 発展 ) 行列を使って書くのがRの醍醐味. 関数も作れます. 活用しましょう. 60