Microsoft PowerPoint - R-intro-04.ppt

Similar documents
Microsoft PowerPoint - 統数研シンポジウム_R_ ppt

Microsoft PowerPoint - R-stat-intro_02.ppt [互換モード]

Microsoft PowerPoint - epi_ ppt [互換モード]

データ分析のまとめ方

農業・農村基盤図の大字小字コードXML作成 説明書

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

操作マニュアルアテンダント

スライド 1

untitled

I

条件付き書式 の ルールの管理 をクリック 2 新規ルール をクリック 1 ルール の管理をクリック 3 指定の値を含むセルだけ書式設定 を クリック 7 グレーを選び OK をクリック 4 次の値に等しい を選ぶ 5 2 と入力 6 書式をクリック 8OK をクリック 以下同様に 新規ルール をク

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

太閤以外で作成されたアンケートデータを太閤データに変換して使用する方法

Microsoft PowerPoint - R-graph_data-mining.ppt

図 2 エクスポートによるシェープファイルの新規保存 新規保存するファイルは, より分かりやすい名前をつけて適切なフォルダ (shape フォル ダにまとめておくのがよい ) 上に保存しておく 2 / 10

第 14 講複数ソフトの組み合わせ テキストファイルを Excel で開く 2 / 17 テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 13 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Off

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

win版8日目

WebCADD.com ご利用ガイド

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

パソコンで楽チン、電力管理3169編

「不動産リスト」を解く

Section1_入力用テンプレートの作成

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

2 / 18 ページ 第 13 講データの活用とデータマップの作成 13-1 ホームページの保存 ホームページ (Web ページ ) に表示される様々な情報を ファイルとして保存することができます

Microsoft Word - ExcelTable.docx

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

(Microsoft Word - Excel\216\300\217K\212\356\221b1.doc)

サイボウズ Office「リンク集」

2 / 25 複数ソフトの組み合わせ テキストファイルを Excel で開く テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 14 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Office ボタ

スライド 0

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

サイボウズ Office 10「個人フォルダ」

機器の自動配置

PowerPoint プレゼンテーション

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx

簡易版メタデータ

2 / 16 ページ 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっている

Moodleアンケートの質問一括変換ツール

memo

Microsoft Word - 09isA11_mod.doc

サイボウズ Office 10「リンク集」

作成するアプリ 本書は 楽々 Web データベースで 一覧アプリ を作成する方法を説明します 以下のような Excel ファイルの一覧表を題材に 楽々 Web データベースに Excel ファイルを読み込ん でアプリを作成し 使用するまで を説明します 課題管理表.xlsx タイトル詳細 内容対応優

Multi LABELIST V5 練習マニュアル - 様々な発行方法編 第 1 版 2013 年 3 月 18 日 株式会社サトー

年齢別人数計算ツールマニュアル

CONTENTS マニュアルの表記... S01-02_01 1.DataNature Smart 全体概要図... S01-02_11 2. 基本操作... S01-02_ ジョブの作成... S01-02_21 加工条件設定... S01-02_21 Step1: 処理対象データの指

Microsoft PowerPoint - R-intro-06.ppt

問題 1 次の文章は Excel の作業環境について述べたものである 下線部の記述の正誤を判断し 解答群 { } の記号で答えよ ただし 下線部以外の記述に誤りはないものとする 設問 1. クイックアクセスツールバーには アプリケーション名やファイル名が表示される 設問 2. 数式バーのる ボタンを

_unix_text_command.pptx

スーパー英語アカデミック版Ver.2

PowerPoint プレゼンテーション

スライド 1

Microsoft PowerPoint - prog04.ppt

推奨 web ブラウザについて スマートフォンやタブレットには様々な web ブラウザがあります Android 端末には 標準ブラウザ ios 端末には Safari どちらでも使用できる Y ブラウザ FireFox Google Chrome などの web ブラウザがあります ビット web

やってみようINFINITY-写真管理 編-

<4D F736F F D208BD98B7D D B838B835A DD92E8834B C52E646F63>

Microsoft Word - index.html

はじめに

エクセルの基礎を学びながら、金額を入力すると自動的に計算され、1年分の集計も表示される「おこづかい帳」を作りしょう

サイボウズ Office 10「個人フォルダ」

ことばを覚える

2011 年度春学期基礎ゼミナール ( コンピューティングクラス ) A コース 1 / 18 コンピュータリテラシー A コース 第 10 講 [ 全 15 講 ] 2011 年度春学期 基礎ゼミナール ( コンピューティングクラス ) 同志社大学経済学部 DIGITAL TEXT コンピュータリ

Create!Form V11 - Excel 出力設定

memo

Microsoft Word A08

Microsoft PowerPoint - Borland C++ Compilerの使用方法(v1.1).ppt [互換モード]

立ち読みページ

Datalink_summary

セル G5 に 大手町店 の合計を求めましょう 暮らしのパソコンいろは 1 セル G5 をクリックします 2 ホーム タブをクリックします 3 編集 グループの ( 合計 ) をクリックします セル G5 と数式バーに =SUM(D5:F5) と表示され セル範囲 D5:F5 が点滅する線で囲まれま

スプレッドシートについて

処理手順 1) 健康保険組合から受領した 賞与支払届ターンアラウンド CD を パソコンの CD ドライ ブにセットします 2) マイコンピュータ CD ドライブ の順にダブルクリックして オープンしたウィン ドウにある KPFD0006.txt というアイコンをダブルクリックします すると CD

Microsoft Word MSExcel2010

2 / 14 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっていることを確

各種パスワードについて マイナンバー管理票では 3 種のパスワードを使用します (1) 読み取りパスワード Excel 機能の読み取りパスワードです 任意に設定可能です (2) 管理者パスワード マイナンバー管理表 の管理者のパスワードです 管理者パスワード はパスワードの流出を防ぐ目的で この操作

職人20 住所録移行マニュアル_outline.indd

更新履歴 項番版数更新内容更新日更新者 初版制定 2017/11/20

(7) 表示されている [ オートフィルオプション ] をクリックして [ 書式なしコピ ー ] をクリックします (8)[ 評価 1] の結果が表示されます [ 評価 2] の列には [ 売上数量 ] が 1500 以上であれば 1000 以上であれば そ うでなければ と表示されるようにしてくだ

第1部参考資料

Excel2013 データベース1(テーブル機能と並べ替え)

ワープロソフトウェア

基本的な利用法

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

Microsoft Word - Omrono_yuserDic.doc

Microsoft Word - SPC9-API_ユーザーズガイド_V37.doc

PowerPoint プレゼンテーション

このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

Microsoft Word - HOBO雨量専用説明書_v1.1.doc

生存確認調査ツール

intra-mart Accel Platform — ViewCreator ユーザ操作ガイド   第6版  

出力可能なバーコードの種類 出力可能なバーコードの種類各バーコードはそれぞれのバーコードの仕様に準拠します バーコードの種類 PDF417 MICROPDF417 対応バーコードの名称 PDF417 マイクロ PDF417 操作例 PDF417 商品コードの内容を PDF417 にする 作成された

Microsoft Word - 2._5)OLAPツール『Query & Analysis』の「データ転送」機能.docx

ご注意 1. 本ソフトウェアの著作権は 株式会社サトーにあります 2. 本ソフトウェアおよびマニュアルの一部または全部を無断で使用 複製することはできません 3. 本ソフトウェアは コンピュータ 1 台につき 1 セット購入が原則となっております 4. 本ソフトウェアおよびマニュアルは 本製品のソフ

PowerPoint プレゼンテーション

Microsoft Word - 206MSAccess2010

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Word Online を開く 文書 ( ドキュメント ) を作成する 文書 ( ドキュメント ) を開く.

メソッドのまとめ

Office 10 パッケージ版「リンク集」

データベース機能 EXCEL には簡単なデータベース機能があり 表のデータから条件に合致するレコードを抽出することなどができる 本来がデータベースソフトウェアではないので 専用のソフトと比べるとその機能は劣るが 単なる表引きや計算ではできないことを可能にし 非常に便利な利用をすることができる 1 デ

Transcription:

R で学ぶデータ解析とシミュレーション 4 ~ データハンドリング入門 ~

4 時間目のメニュー パッケージについて パッケージとは パッケージの呼び出し 追加パッケージのインストール データハンドリング入門 データフレームとは 種々のテキストファイルを R に読み込ませる方法 データハンドリング手法一覧 演習 2

パッケージとは R は関数とデータを機能別に分類して パッケージ という形にまとめている どのようなパッケージがあるのかは関数 library() を実行することで知ることが出来る パッケージ名 解説 3

パッケージの呼び出し コマンドでパッケージ foreign を呼び出す場合: メニューからパッケージ foreign を呼び出す場合: 1 メニュー パッケージ から パッケージの読み込み を選択 2 読み込むパッケージ名を選択して [OK] を選択 4

追加パッケージのインストール コマンドでパッケージ xlsreadwrite をインストールする : メニューからパッケージ xlsreadwrite をインストールする : 1 メニュー パッケージ から パッケージのインストール を選択 2 Japan(Tsukuba) [OK] をクリック 3 インストールするパッケージを選択して [OK] をクリック 5

4 時間目のメニュー パッケージについて パッケージとは パッケージの呼び出し 追加パッケージのインストール データハンドリング入門 データフレームとは 種々のテキストファイルを R に読み込ませる方法 データハンドリング手法一覧 演習 6

データフレームとは 統計解析を行うデータの形式は様々 ( R 上で ) データを手で入力して テキストファイル,EXCEL,ACCESS,SAS などの形式 R でデータ解析を行う際は, データフレームという形式にデータを変換することが多い ( 見た目は行列 ) EXCEL: シート ACCESS: テーブル SAS: データセット 7

データフレームとは 数値ベクトルや文字ベクトル, 因子ベクトルなどの異なる型のデータをまとめてもつ変数 外見は行列と同じ 各列の要素の型はバラバラでも構わない データフレームの各行 各列は ラベルを必ず持ち, ラベルに よる操作が可能 8

データフレームの作成 R でベクトルデータを作成した後, データフレームを作成 ( いわゆる手入力 ) 性別 身長 体重 データをベクトルで用意した後, 関数 data.frame() で1つのデータフレームに変換する ファイルからデータを読み込んで, データフレームを作成 関数 read.table() などでファイルからデータを読み込む パッケージ xlsreadwrite の関数 read.xls() で EXCEL ファイルを読み込む パッケージ RODBC の関数 odbcconnectxxxxx() でファイルにアクセスした後, 関数 sql.query() でデータを読み込む 9

データフレームの作成 ( 手入力 ) data.frame() 10

データフレームの閲覧 データフレームの中身を確認したいときは R のコンソール画面で R 標準のデータエディタで ( データを見ながらの作業不可) relimp パッケージのテキストウインドウで コンソール上 データエディタ テキストウインドウ 11

データフレームを作成すると 12

データフレームの作成 (.txt ) 関数 read.table などでテキストファイルからデータを読み込むことが出来る data.txt 13

データフレームの作成 (.xls ) パッケージ xlsreadwrite の関数 read.xls() で EXCEL ファイルを読み込む data.xls 14

データフレームの作成 (RODBC) パッケージ RODBC の中の関数 odbcconnectxxxxx でファイルにアクセスした後, 関数 sql.query でデータを読み込むことが出来る 他にも ORACLE のデータベースや, その他のデータ形式ファイル (DBASE,MySQL,PostgreSQL) からデータを読み込むことも可 15

データフレームの作成 (foreign) パッケージ foreign の中には, 外部データを読み込むための関数が多数用意されている data.restore read.dbf read.dta read.epiinfo read.mtp read.octave read.spss read.ssd read.systat read.xport 16

演習 作業フォルダの作成 & 変更 準備 1. R の ファイル ディレクトリの変更... を選択した後, フォルダ work を選択してください 17

演習 2. データ data.txt をフォルダ work に格納してください 3. 2. で格納したデータを変数 x に読み込んでください 4. 関数 head() を用いて, 変数 x の 1 行目から 3 行目を表示してください 5. パソコンに EXCEL がインストールされている方は, パッケージ xlsreadwrite の関数 read.xls でデータ data.xls を読み込んでください 18

参考 データの型 R には データの型 という概念があり, 数値 文字 因子 ( カテゴリ ) などを区別する 外部ファイルを R に読み込むと 数値 は 数値型 文字 は 因子型( カテゴリ ) に自動変換される 文字 を 文字型 としたい場合は要変換! 19

4 時間目のメニュー パッケージについて パッケージとは パッケージの呼び出し 追加パッケージのインストール データハンドリング入門 データフレームとは 種々のテキストファイルを R に読み込ませる方法 データハンドリング手法一覧 演習 20

テキストファイル データフレーム (1) 列名がなく, データ間がスペースで区切られている場合 R が勝手に列名を決めている data01.txt 21

テキストファイル データフレーム (2) 列名があり, データ間がスペースで区切られている場合 data02.txt 22

テキストファイル データフレーム (3) 1 行目にコメント,2 行目に列名があり, データ間がスペースで区切られている場合 data03.txt 23

テキストファイル データフレーム (4) 列名があり, データ間がコンマで区切られている場合 data04.txt 24

テキストファイル EXCEL EXCEL ファイル (.xls) を R に読み込ませる場合 :.xls ファイルをそのまま読み込ませる.csv ファイルに変換して読み込ませる ここに焦点を当てる 目的は関数 read.csv() で読み込める形式にすること ( 前節の data04.txt の状態 ) まず,EXCEL ファイルを開き, メニューの [ ファイル ] の [ 開く ] から,[ 名前をつけて保存 ] を選択する 保存する名前をつけた後, 次に [ ファイルの種類 ] から [CSV カンマ区切り ] を選択して保存する 25

テキストファイル EXCEL EXCEL を別名で保存 (.csv ファイルとして保存 ) 別名で保存 CSV( カンマ区切り ) で保存 26

テキストファイル データフレーム (4') 列名があり, データ間がコンマで区切られている場合 data04.csv 27

テキストファイル データフレーム (5) 列名がなく, データ間がスペースで区切られている場合 R が勝手に列名を決めている data05.csv 28

参考 データファイルの読み込み 関数 file.choose() を使用すると, ファイル名を指定するダイアログが表示される 直接ファイル名を指定せずにマウスでファイルを指定することが出来るようになる! 29

参考 EXCEL のセルをコピーして作成 EXCEL のセルをコピーして, そのまま R に貼り付けることも出来る! 30

4 時間目のメニュー パッケージについて パッケージとは パッケージの呼び出し 追加パッケージのインストール データハンドリング入門 データフレームとは 種々のテキストファイルを R に読み込ませる方法 データハンドリング手法一覧 演習 31

データへのアクセス方法 コマンド x$ 列名,x[ 列名 ], x[[" 列名 "]] x[2], x[[2]] x[3, 2], x[[3, 2]] x[[3," 列名 "]], x[[3," 列名 "]] x[c(1, 2)] x[c(3, 4), ] x[,c(t,f,t)] x[sex=="f", ] x[,sex=="f" & WEIGHT>50 ] 機能指定した列データを表示 2 番目の列データを表示 3 行 2 列目のデータを表示指定した列の 3 行目のデータを表示 1 列目と 2 列目のデータを表示 3 行目と 4 行目のデータを表示論理ベクトル c(t,f,t) が TRUE となっている列を表示性別が F( 女性 ) である行を表示性別が F( 女性 ) かつ体重が 50kg より大きい行を表示 32

データへのアクセス例 データフレーム [ 行番号, 列番号 ] で指定する データフレーム x 33

データへのアクセス例 データフレーム $ 列名で指定する データフレーム x 34

データの加工 抽出 コマンド head(xn=a) tail(xn=b) na.omit(x) transform(xy= ベクトル ) subset(x 条件式 ) subset(x 条件式 ベクトル ) reshape(x,...) apply(x[, 範囲 ], 1, 関数 ) 機能先頭から a 行だけ抽出する末尾から b 行だけ抽出する NA を含む行を削除するデータフレーム x に新たな列 y を追加する条件式に合う行のみを抽出するベクトルで指定した列に対し, 条件式に合う行のみを抽出するデータフレーム x を横展開 / 縦展開するデータフレーム x の指定した範囲について, 各行ごとに関数を適用する ( 各列ごと : apply(x[, 範囲 ], 2, 関数 ) とする ) 35

データの加工 抽出例 DF 36

データの加工 抽出例 DF 37

データの加工 抽出例 DF 38

データの結合など コマンド ncolx nrowx namesx rbindxy cbindxy data.framexy mergexy x の列名を表示する 機能 x の列数 ( 変数の数 ) を求める x の行数 ( データ数 ) を求める x と y を縦に並べて結合する x と y を横に並べて結合する x と y を横に並べて結合する x と y を併合 ( マージ ) する. 通常は引数に all=t を指定し, データを全て残す all=t を指定しなければデータの共通部分が結果として返される. 39

データの縦結合 40

41 データのマージ例 + +

データのソート (1 変数のソート ) 42

データのソート (2 変数のソート ) 43

欠損の扱い (1) 手入力でデータフレームを作成する場合で欠損が含まれているデータを読み込む場合は, ベクトル中の欠損部分を NA としておけば, 該当部分に欠損値 (NA) が入る 44

欠損の扱い (2) ファイルからデータを読み込む場合で欠損が含まれているデータを読み込む場合は, データ間がコンマで区切られている方が処理しやすい この場合, 単に欠損部分を空白にしておけば, 該当部分に欠損値 (NA) が入る data06.txt

4 時間目のメニュー パッケージについて パッケージとは パッケージの呼び出し 追加パッケージのインストール データハンドリング入門 データフレームとは 種々のテキストファイルを R に読み込ませる方法 データハンドリング手法一覧 演習 46

データハンドリング例 ( 導入 ) Aさん~D 女史 ( 変数はNAME) の 4 人に, やせ薬 (GROUP==Active) か偽薬 (GROUP==Placebo) を投薬する 投薬してから1 日目 (DAY==1)~3 日目 (DAY==3) に体重を測定する 体重は, 午前 (KG_AM) と午後 (KG_PM) の1 日 2 回測定する 47

データハンドリング例 ( 導入 ) データの形式は EXCEL で保存されていると仮定する 体重に関するデータとグループに関するデータの 2 つ まずは 2 つのデータセットを R に読み込ませる data1.xls データフレーム x1 に data2.xls x2 に 48

データハンドリング例 (1) 読み込み 49

50 データハンドリング例 (2)

51 データハンドリング例 (3)

演習 sample.csv 3 日目の体重の平均 と 1 日目の体重の平均 の変化量が -2kg 未満の人 を抽出してください まず sample.csv を読み込んでください 順番の一例は 各日の平均を求める 各日の平均 の列を横に展開する 3 日目の平均 -1 日目の平均 抽出 です 52

53 データハンドリング例 (4)

54 データハンドリング例 (5)

データハンドリング例 (6) 55

データハンドリング例 (7) 56

データハンドリング例 (8) 57

データハンドリング例 (9) 58

演習 (18 枚目のスライド分 ) の回答例 59

4 時間目にやったこと パッケージについて パッケージとは パッケージの呼び出し 追加パッケージのインストール データハンドリング入門 データフレームとは 種々のテキストファイルを R に読み込ませる方法 データハンドリング手法一覧 演習 終 60