Microsoft PowerPoint - 統数研シンポジウム_R_ ppt

Similar documents
Microsoft PowerPoint - R-intro-04.ppt

Microsoft PowerPoint - R-stat-intro_02.ppt [互換モード]

untitled

データ分析のまとめ方

Microsoft PowerPoint - epi_ ppt [互換モード]

Microsoft PowerPoint - R-graph_data-mining.ppt

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

農業・農村基盤図の大字小字コードXML作成 説明書

図 2 エクスポートによるシェープファイルの新規保存 新規保存するファイルは, より分かりやすい名前をつけて適切なフォルダ (shape フォル ダにまとめておくのがよい ) 上に保存しておく 2 / 10

操作マニュアルアテンダント

第 14 講複数ソフトの組み合わせ テキストファイルを Excel で開く 2 / 17 テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 13 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Off

win版8日目

スライド 1

WebCADD.com ご利用ガイド

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

2 / 18 ページ 第 13 講データの活用とデータマップの作成 13-1 ホームページの保存 ホームページ (Web ページ ) に表示される様々な情報を ファイルとして保存することができます

Microsoft Word - ExcelTable.docx

I

2 / 25 複数ソフトの組み合わせ テキストファイルを Excel で開く テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 14 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Office ボタ

スライド 0

基本的な利用法

太閤以外で作成されたアンケートデータを太閤データに変換して使用する方法

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

条件付き書式 の ルールの管理 をクリック 2 新規ルール をクリック 1 ルール の管理をクリック 3 指定の値を含むセルだけ書式設定 を クリック 7 グレーを選び OK をクリック 4 次の値に等しい を選ぶ 5 2 と入力 6 書式をクリック 8OK をクリック 以下同様に 新規ルール をク

Microsoft Word - index.html

Section1_入力用テンプレートの作成

サイボウズ Office 10「個人フォルダ」

また Excel 読み込みウィザードで Excel ファイルを読み込むと 指定した設定が JSL(JMP のスクリプト言語 ) に自動保存できるた め この JSL を実行することにより 簡単に Excel データの再読み込みを行うことができます 次の 2 章では これらの読み込みオプションのいくつ

スーパー英語アカデミック版Ver.2

年齢別人数計算ツールマニュアル

Microsoft PowerPoint - prog04.ppt

エクセルの基礎を学びながら、金額を入力すると自動的に計算され、1年分の集計も表示される「おこづかい帳」を作りしょう

職人20 住所録移行マニュアル_outline.indd

サイボウズ Office「リンク集」

電子紊品チェックシステム利用マニュアル

CONTENTS マニュアルの表記... S01-02_01 1.DataNature Smart 全体概要図... S01-02_11 2. 基本操作... S01-02_ ジョブの作成... S01-02_21 加工条件設定... S01-02_21 Step1: 処理対象データの指

PowerPoint プレゼンテーション

情報処理演習

Moodleアンケートの質問一括変換ツール

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

PowerPoint プレゼンテーション

Microsoft Word - 2._5)OLAPツール『Query & Analysis』の「データ転送」機能.docx

簡易版メタデータ

CASEC

Microsoft Word - 09isA11_mod.doc

Microsoft Word MSExcel2010

Microsoft Word - 206MSAccess2010

関数とは 関数とは 結果を得るために 処理を行う仕組み です Excel2010 には あらかじめ関数が数式として組み込まれています たとえば SUM 関数 は 指定した値をすべて合計する 仕組みです 長い計算式や複雑な計算式を作成せずに 簡単に結果を求めることができます 例合計 =A1+A2+A3

Microsoft Word - 参照データ使用方法.docx

Microsoft PowerPoint - R-intro-06.ppt

Microsoft PowerPoint - Borland C++ Compilerの使用方法(v1.1).ppt [互換モード]

PowerPoint プレゼンテーション

スプレッドシートについて

サイボウズ Office 10「個人フォルダ」

サイボウズ Office 10「リンク集」

PowerPoint プレゼンテーション

目次 1 はじめに 利用条件 動作環境 アドインのインストール アドインの操作方法 アドインの実行 Excel CSV の出力 テンプレートの作成 編集 テンプレートのレイアウト変更 特記

ワープロソフトウェア

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

情報処理演習 B8クラス

Create!Form V11 - Excel 出力設定

問題 1 次の文章は Excel の作業環境について述べたものである 下線部の記述の正誤を判断し 解答群 { } の記号で答えよ ただし 下線部以外の記述に誤りはないものとする 設問 1. クイックアクセスツールバーには アプリケーション名やファイル名が表示される 設問 2. 数式バーのる ボタンを

_unix_text_command.pptx

更新履歴 項番版数更新内容更新日更新者 初版制定 2017/11/20

演算増幅器

Microsoft Word - SPC9-API_ユーザーズガイド_V37.doc

memo

Microsoft Word - Omrono_yuserDic.doc

memo

SpreadSheet Interface

2 / 16 ページ 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっている

Microsoft Word - S01-01_データ抽出設定.docx

第1部参考資料

2 / 14 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっていることを確

8. Windows の補足情報 コマンドの使用についての説明です Windows からのファイル直接印刷 Windows でコマンドを使用したファイル直接印刷の方法についての説明です この機能はネットワーク接続をしているときに使用できます この方法で印刷できるファイルは 本機が搭載しているエミュレ

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

PowerPoint プレゼンテーション

コンピュータリテラシ

[ ] 算定基礎届の CD 届出データ作成マニュアル 健保提供 ターンアラウンド CD の活用 概要 1) 健康保険組合が提供する 算定基礎届ターンアラウンド CD は 日本年金機構により示された 届書作成仕様書 ( 健康保険 厚生年金保険適用関係 届書 ) に基づく CD による算定

機器の自動配置

やさしく名刺ファイリング PRO v.7.0 簡易操作マニュアル

スライド 1

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

コマンド入力による操作1(ロード、プロット、画像ファイル出力等)

電子納品チェックシステム利用マニュアル

「不動産リスト」を解く

5-2. 顧客情報をエクスポートする 顧客管理へのアクセス手順 メールディーラーで管理する顧客情報に関する設定を行います 1. 画面右上の 管理設定 をクリックする 2. 管理設定 をクリックする 3. ( タブ ) 顧客管理 をクリックする 2

以下のソフトウェアに専用ライセンスを設定することで 変換機能が使えるようになります アプリケーション名バージョン日付 JPGIS-XML ビュー F 7.1.0α 以降 2013/06/27 以降 フリーウェア JPGIS-XML ビュー F のバージョン から XML の 筆 と 図郭

E01 前年度一括申告情報を取り込むには 前年度一括申告情報 (CSV Excel ファイル ) 取込 ボタンをクリックして前年度一括申告データを読込ます CSV データは 各都道府県医師会に日本医師会より提供されています 項目があっていれば独自に用意したファイルを読み取ることも可能です ( 注 )

操作方法 XXXTOEMF は コマンドライン形式のアプリケーションです 通常のコマンドと同じように コマンドラインからの実行やバッチファイルに組み込むことが可能です インストールについては, 別紙の KDxxxx コンバートソフトの特記事項について を参照してください ここでは 直接コマンドライン

F KDbarcode_CODE39 Microsoft WORD/EXCEL のアドイン製品 Kernel Computer System カーネルコンピュータシステム株式会社 本社 : パッケージ販売部 横浜市神奈川区金港町 6-3 横浜金港町ビル 6F TEL:

2011 年度春学期基礎ゼミナール ( コンピューティングクラス ) A コース 1 / 18 コンピュータリテラシー A コース 第 10 講 [ 全 15 講 ] 2011 年度春学期 基礎ゼミナール ( コンピューティングクラス ) 同志社大学経済学部 DIGITAL TEXT コンピュータリ

処理手順 1) 健康保険組合から受領した 賞与支払届ターンアラウンド CD を パソコンの CD ドライ ブにセットします 2) マイコンピュータ CD ドライブ の順にダブルクリックして オープンしたウィン ドウにある KPFD0006.txt というアイコンをダブルクリックします すると CD

FORTRAN( と C) によるプログラミング 5 ファイル入出力 ここではファイルからデータを読みこんだり ファイルにデータを書き出したりするプログラムを作成してみます はじめに テキスト形式で書かれたデータファイルに書かれているデータを読みこんで配列に代入し 標準出力に書き出すプログラムを作り

PowerPoint プレゼンテーション

Transcription:

でデータハンドリング ~ データフレーム 30 分クッキング ~

本日のメニュー データフレームとは データフレームの作成 データハンドリングの方法と例 2

データフレームとは 統計解析を行うデータの形式は様々 ( R 上で ) データを手で入力して テキストファイル,EXCEL,ACCESS,SAS などの形式 R でデータ解析を行う際は, データフレームという形式にデータを変換することが多い ( 見た目は行列 ) EXCEL: シート ACCESS: テーブル SAS: データセット 3

データフレームとは 数値ベクトルや文字ベクトル, 因子ベクトルなどの異なる型のデータをまとめてもつ変数 外見は行列と同じ 各列の要素の型はバラバラでも構わない データフレームの各行 各列は ラベルを必ず持ち, ラベルに よる操作が可能 4

本日のメニュー データフレームとは データフレームの作成 データハンドリングの方法と例 5

データフレームの作成 R でベクトルデータを作成した後, データフレームを作成 ( いわゆる手入力 ) 性別 身長 体重 データをベクトルで用意した後, 関数 data.frame() で1つのデータフレームに変換する ファイルからデータを読み込んで, データフレームを作成 関数 read.table() などでファイルからデータを読込 パッケージ RODBC の関数 odbcconnectxxxxx() でデータファイルにアクセスした後, 関数 sql.query() でファイルからデータを読込 6

データフレームの作成 ( 手入力 ) data.frame() 7

データフレームの閲覧 データフレームの中身を確認したいときは R のコンソール画面で R 標準のデータエディタで ( データを見ながらの作業不可) relimp パッケージのテキストウインドウで コンソール上 データエディタ テキストウインドウ 8

データフレームを作成すると 9

データフレームの作成 (.txt ) 関数 read.table などでテキストファイルからデータを読み込むことが出来る data04.txt 10

データフレームの作成 (RODBC) パッケージ RODBC の中の関数 odbcconnectxxxxx でデータファイルにアクセスした後, 関数 sql.query でファイルからデータを読み込むことが出来る 他にも ORACLE のデータベースや, その他のデータ形式ファイル (DBASE,MySQL,PostgreSQL) からデータフレームを作成することもできる 11

データフレームの作成 (foreign) パッケージ foreign の中には, 外部データを読み込むための関数が多数用意されている data.restore read.dbf read.dta read.epiinfo read.mtp read.octave read.spss read.ssd read.systat read.xport 12

データフレームの作成 (foreign) SPSS データを R に読み込む例 SAS データを R に読み込む例 13

本日のメニュー データフレームとは データフレームの作成 データハンドリングの方法と例 14

データハンドリング例 ( 導入 ) Aさん~D 女史 ( 変数はNAME) の 4 人に, やせ薬 (GROUP==Active) か偽薬 (GROUP==Placebo) を投薬する 投薬してから1 日目 (DAY==1)~3 日目 (DAY==3) に体重を測定する 体重は, 午前 (KG_AM) と午後 (KG_PM) の1 日 2 回測定する 15

データハンドリング例 ( 導入 ) データの形式は EXCEL 体重に関するデータとグループに関するデータの 2 つ まずは 2 つのデータセットを R に読み込ませる data1.xls データフレーム x1 に data2.xls x2 に 16

データハンドリング例 (1) 読み込み 17

18 データハンドリング例 (2)

19 データハンドリング例 (3)

20 データハンドリング例 (4)

データハンドリング例 ( 目的は ) 3 日目の体重の平均 と 1 日目の体重の平均 の変化量が -2kg 未満の人 を抽出する 21

22 データハンドリング例 (5)

データハンドリング例 (6) 23

データハンドリング例 (7) 24

データハンドリング例 (8) 25

データハンドリング例 (9) 26

データハンドリング例 (10) 27

本日のメニュー データフレームとは 統計解析を行うためのデータの形式 見た目は行列 でも使い勝手が良い データフレームの作成 手入力でもデータの読み込み可だけど 外部データ ( テキストファイル, EXCEL,ACCESS, SAS, ) からでも読み込み可 データハンドリングの方法と例 RODBC を使ったデータ読み込みの例を紹介 データのマージ, ソート, 変数追加, 変数削除, データの横展開, 条件抽出の例を紹介 28

おまけ 実務で R にデータを読み込む際 1 EXCEL RODBC でデータフレームにする 2 EXCEL CSV に変換 関数 read.table() でデータフレームにする 2' 他のアプリ テキストデータ 関数 read.table() でデータフレームにする 3 SAS xpt に変換 read.xport() でデータフレームにする (SAS でできないことを R にさせるという意図 ) 4 SQL でデータベースにも直接アクセスできるはず 5 XML でデータを入力, 出力させることもできるはず データがちゃんと入力されているかを確認する方法は? データフレームから抜き取り とか 要約統計量 とか 次元の数 と 一番右下のセルに値が正しく入っているか を確認 欠測の数を数える EXCEL に出力して比較 ( コンペア ) する R から折り返しはきだし,SAS 上で比較 ( コンペア ) する 29

参考文献 & 謝辞 参考文献 THE R BOOK 4 章 ( 岡田昌史他 ; 九天社 ) データ解析環境 R 5 章 ( 舟尾, 高浪 ; 工学社 ) パッケージ RODBC foreign のヘルプ 発表資料作成の際にお世話になった人 北西由武さん ( 塩野義製薬 ) 高浪洋平さん ( 武田薬品工業 ) 30

でデータハンドリング ~ データフレーム 30 分クッキング ~ 終

でデータハンドリング ~ ここからはおまけ ~

作業ディレクトリの変更 ファイルからデータを読み込むには まず, データがあるディレクトリ ( フォルダ ) に作業ディレクトリを変更する 次に, 関数 read.table() などでファイルからデータを読み込む ファイルからデータやプログラムを読み込んだり, ファイルにデータを書き出したりする場所を作業ディレクトリという 指定したディレクトリに指定した作業ディレクトリにデータがセーブされたり,R 用エディタなどが保存されるようになる 33

作業ディレクトリの変更 (Windows) [ ファイル ] の [ ディレクトリの変更 ] を選択 [Browse] をクリックして, 変更先のディレクトリを選択 34

作業ディレクトリの変更 (Mac OS X) [ その他 ] の作業 [ ディレクトリの変更 ] を選択 変更先のディレクトリを選択 35

テキストファイル データフレーム (1) 列名がなく, データ間がスペースで区切られている場合 R が勝手に列名を決めている data01.txt 36

テキストファイル データフレーム (2) 列名があり, データ間がスペースで区切られている場合 data02.txt 37

テキストファイル データフレーム (3)1 行目にコメント,2 行目に列名があり, データ間がスペースで区切られている場合 data03.txt 38

テキストファイル データフレーム (4) 列名があり, データ間がコンマで区切られている場合 data04.txt 39

テキストファイル EXCEL 目的は関数 read.csv() で読み込める形式にすること ( 前節の data04.txt の状態 ) まず,EXCEL ファイルを開き, メニューの [ ファイル ] の [ 開く ] から,[ 名前をつけて保存 ] を選択する 保存する名前をつけた後, 次に [ ファイルの種類 ] から [CSV カンマ区切り ] を選択して保存する 40

テキストファイル EXCEL Windows 版 R の場合 別名で保存 CSV( カンマ区切り ) で保存 41

テキストファイル EXCEL Mac OS X 版 R の場合 別名で保存 CSV( カンマ区切り ) で保存 42

テキストファイル EXCEL (4 ) 列名があり, データ間がコンマで区切られている場合 data04.csv 43

テキストファイル EXCEL (5) 列名がなく, データ間がコンマで区切られている場合 data05.csv 44

データフレームの作成 EXCEL のセルをコピー & ペースト Windows 版の場合は, 列名をコピーしてもしなくてもよい 45

データフレームの作成 EXCEL のセルをコピー & ペースト Mac OS X 版の場合は, 列名をコピーしてはいけない 46

SAS XML R(1) パッケージ XML と SASXML を使用する ( 作者 :Duncan Temple Lang 氏 <duncan@research.bell-labs.com>) まず,SAS データセット XML に変換する 47

SAS XML R(2) 次に XML R へ読み込む パッケージ SASXML の中に入っているソース eventsas.s,sas.s,sasdataset.r を実行する その後, 以下を実行する 48

< 寄り道 > R XML R 49

< 寄り道 > R から SAS を操作する 関数 system() を用いる + SAS の出力 50

< 寄り道 > SAS から R を操作する x コマンドを用いて DOS を起動し,R を実行する + R の出力 51

データへのアクセス方法 (1) x[2], x[[2]] x[c(1, 2)] x[c(3, 4), ] x[,c(t,f,t)] x[sex=="f", ] コマンド x$ 列名,x[ 列名 ], x[[" 列名 "]] x[3, 2], x[[3, 2]] x[[3," 列名 "]], x[[3," 列名 "]] x[,sex=="f" & WEIGHT>50 ] 機能 指定した列データを表示 2 番目の列データを表示 3 行 2 列目のデータを表示 指定した列の 3 行目のデータを表示 1 列目と 2 列目のデータを表示 3 行目と 4 行目のデータを表示 論理ベクトル c(t,f,t) が TRUE となっている列を表示 性別が F( 女性 ) である行を表示 性別が F( 女性 ) かつ体重が 50kg より大きい行を表示 52

データへのアクセス方法 (2) データフレーム [ 行番号, 列番号 ] で指定する データフレーム x 53

データへのアクセス方法 (3) データフレーム $ 列名で指定する データフレーム x 54

データの加工 抽出 (1) コマンド ncolx nrowx namesx rbindxy cbindxy data.framexy mergexy 機能 x の列数 ( 変数の数 ) を求める x の行数 ( データ数 ) を求める x の列名を表示する x と y を縦に並べて結合する x と y を横に並べて結合する x と y を横に並べて結合する x と y を併合 ( マージ ) する. 通常は引数に all=t を指定し, データを全て残す.all=T を指定しなければデータの共通 部分が結果として返される. 55

データの加工 抽出 (2) コマンド head(xn=a) tail(xn=b) na.omit(x) transform(xy= ベクトル ) subset(x 条件式 ) subset(x 条件式 ベクトル ) 機能 先頭から a 行だけ抽出する 末尾から b 行だけ抽出する NA を含む行を削除する データフレーム x に新たな列 y を追加する 条件式に合う行のみを抽出する ベクトルで指定した列に対し, 条件式に合う行のみを抽出する 56

57 データのマージ + +

データのソート (2 変数のソート ) 58

欠損の扱い (1) 手入力でデータフレームを作成する場合で欠損が含まれているデータを読み込む場合は, ベクトル中の欠損部分を NA としておけば, 該当部分に欠損値 (NA) が入る. 59

欠損の扱い (2) ファイルからデータを読み込む場合で欠損が含まれているデータを読み込む場合は, データ間がコンマで区切られている方が処理しやすい. この場合, 単に欠損部分を空白にしておけば, 該当部分に欠損値 (NA) が入る. data06.txt 60

でデータハンドリング 終