R で 学 ぶデータ 解 析 とシミュレーション 付 録 ~ R Commander の 概 要 ~
メニュー R Commander の 概 要 データ iris の 読 み 込 み 方 法 グラフの 作 成 方 法 R Commander でのデータ 解 析 例 グラフのカタログ 各 メニューの 概 要 Graphic by (c)tomo.yun (http://www.yunphoto.net) 2
R の 概 要 オープンソース&フリーの 統 計 解 析 用 ソフト 長 所 関 数 電 卓, 数 値 計 算,プログラミング, 統 計 解 析,グラフィックス の 機 能 があり,どの 機 能 も 充 実 している 機 能 拡 張 が 容 易 に 行 える 使 用 人 口 が 多 いので,バグが 少 なく 情 報 も 豊 富 3
R の 概 要 オープンソース&フリーの 統 計 解 析 用 ソフト 短 所 大 規 模 なデータを 扱 う 場 合 は 多 少 骨 が 折 れる EXCEL などの 表 計 算 ソフトに 比 べて GUI (マウス 操 作 )の 機 能 が 劣 っているので,R の 命 令 をひとつひとつ 覚 えなければいけない そこで 登 場 するのが GUI 版 Rである R Commander! 4
R Commander 5
R Commander とは? R Commander(アールコマンダー)は John Fox 教 授 (カナダ McMaster 大 学 )が 開 発 した GUI 版 R のこと マウス 操 作 で R を 使 うことが 出 来 る! (R の 命 令 を 覚 えなくても R の 出 力 が 得 られる!) 2005 年 頃 より 関 西 大 学 の 荒 木 孝 治 先 生 が 主 体 と なって R Commander のメッセージ 翻 訳 がなされ R Commander はバージョン 1.1-1 より 本 格 的 に 日 本 語 化 された! 6
R Commander の 概 要 1 メニューから 機 能 を 選 択 2 スクリプトウィンドウには 実 行 した R のコマンドが 出 力 される 3 出 力 ウィンドウには, 実 行 結 果 が 出 力 される 4 メッセージにはエラーや 警 告 が 出 力 される 7
メニュー R Commander の 概 要 データ iris の 読 み 込 み 方 法 グラフの 作 成 方 法 R Commander でのデータ 解 析 例 グラフのカタログ 各 メニューの 概 要 Graphic by (c)tomo.yun (http://www.yunphoto.net) 8
使 用 するデータ iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species 5.1 3.5 1.4 0.2 setosa 4.9 3.0 1.4 0.2 setosa 4.7 3.2 1.3 0.2 setosa 4.6 3.1 1.5 0.2 setosa 5.0 3.6 1.4 0.2 setosa 5.4 3.9 1.7 0.4 setosa 4.6 3.4 1.4 0.3 setosa フィッシャーが 判 別 分 析 法 を 紹 介 するために 利 用 したアヤメの 品 種 分 類 (Species:setosa,versicolor,virginica)に 関 するデータ 以 下 の4 変 数 を 説 明 変 数 としてアヤメの 種 類 を 判 別 しようとした アヤメのがくの 長 さ(Sepal.Length) アヤメのがくの 幅 (Sepal.Width) アヤメの 花 弁 の 長 さ(Petal.Length) アヤメの 花 弁 の 幅 (Petal.Width) まずは R Commander にデータを 読 み 込 ませる 方 法 をいくつか 紹 介 9
データ iris を 手 入 力 する 場 合 スプレッドシートに データを 入 力 する 10
データ iris がテキストファイルである 場 合 テキストファイルまたはクリップボードから... を 選 択 11
データ iris がテキストファイルである 場 合 データの 読 み 込 み データセット 名 を 入 力 する ファイル 内 に 変 数 名 ( 列 名 )がある 場 合 はチェック 欠 測 値 の 記 号 を 指 定 する( 通 常 は"NA") フィールドの 区 切 り 記 号 ( 空 白,カンマ,タブ,etc)を 指 定 する 小 数 点 の 記 号 (ピリオド or カンマ)を 指 定 する 読 み 込 むことが 出 来 るデータセットの 種 類 は 豊 富! 12
データ iris が Excel ファイルである 場 合 1 EXCELファイルのデータをコピーした 後, そのデータを R Commander に 読 み 込 ませる ことも 可 ( クリップボード )にチェック! 13
データ iris が Excel ファイルである 場 合 2 EXCELやAccessファイルの データを 読 み 込 むときは, 1 上 記 画 像 のメニューを 選 択 してデータセット 名 を 入 力 2 読 み 込 むファイル を 選 択 する 14
サンプルデータの 読 み 込 み パッケージ 内 のデータ R には,サンプルデータセットが 多 数 収 録 されている! このメニューでサンプルデータの 一 覧 を 表 示 したり, サンプルデータを 読 み 込 むことが 出 来 る 本 日 はサンプルデータ iris を 使 用 する 15
サンプルデータの 読 み 込 み 使 うことが 出 来 るサンプルデータ の 一 覧 (データの 簡 単 な 説 明 つき) が 表 示 される 16
サンプルデータの 読 み 込 み 1. パッケージを 選 択 ( 普 通 はdatasetsを 選 択 ) 2. 使 用 するデータセットの 名 前 (ここでは iris )をダブルクリック 3. データセット 名 を 変 更 する 場 合 はデー タセット 名 を 修 正 17
読 み 込 んだデータの 表 示 読 み 込 んだデータセット を 表 示 するときは, データセットを 表 示 をクリック! 読 み 込 んだデータセット を 表 示 するときは, データセットの 編 集 をクリック 18
読 み 込 んだデータの 加 工 アクティブデータセット アクティブデータセット 内 の 変 数 の 管 理 解 析 に 使 うデータセットを 選 択 する 読 み 込 んだデータセットに 関 する 情 報 を 見 る データの 部 分 集 合 を 切 り 取 ったり, 欠 測 値 を 除 く 処 理 を 行 う データセットをファイルに 出 力 する 数 値 データをカテゴリデータに 変 換 する 変 数 名 を 変 更 したり, 変 数 を 削 除 する etc... 19
読 み 込 んだデータの 加 工 例 データを 加 工 するときは まず 使 用 するデータセットを 選 択 (ここでは iris をダブルクリック) 20
読 み 込 んだデータの 加 工 例 データセットから 部 分 集 合 を 切 り 出 す 1 切 り 出 す 変 数 を 選 択 する 2 部 分 集 合 の 表 現 に 条 件 式 を 入 力 する 3 切 り 出 した 後 のデータセット 名 を 入 力 する 21
データの 出 力 諸 設 定 をした 後... データセットをファイルに 出 力 する (テキストファイルのみ) 22
メニュー R Commander の 概 要 データ iris の 読 み 込 み 方 法 グラフの 作 成 方 法 R Commander でのデータ 解 析 例 グラフのカタログ 各 メニューの 概 要 Graphic by (c)tomo.yun (http://www.yunphoto.net) 23
グラフに 関 するメニュー グラフ 様 々な 種 類 のグラフを 描 くことが 出 来 る インデックスプロット,ヒストグラム, 幹 葉 表 示 ( 幹 葉 図 ), 箱 ひげ 図,QQプロット, 散 布 図, 散 布 図 行 列, 折 れ 線 グラフ, 条 件 付 き 散 布 図, 平 均 のプロット, 棒 グラフ, 円 グラフ,3Dグラフ グラフをファイルに 保 存 することも 出 来 る 作 成 することができるグラフの 一 覧 は 後 ほど 紹 介 24
グラフの 作 成 手 順 1 描 きたいグラフ ( 例 :ヒストグラム) のメニューを 選 択 2データの 変 数 や オプションを 指 定 25
グラフの 保 存 描 いたグラフを 保 存 することが 出 来 る (PNG,PDF,PS,EPS ) グラフの 形 式 やサイズを 指 定 して[OK]をクリック 26
メニュー R Commander の 概 要 データ iris の 読 み 込 み 方 法 グラフの 作 成 方 法 R Commander でのデータ 解 析 例 グラフのカタログ 各 メニューの 概 要 Graphic by (c)tomo.yun (http://www.yunphoto.net) 27
データの 表 示 データを 眺 めても よく 分 からない データを 要 約 する! 28
1 変 数 の 要 約 Sepal.Length Sepal.Width Petal.Length Petal.Width Species 5.1 3.5 1.4 0.2 setosa 4.9 3.0 1.4 0.2 setosa 4.7 3.2 1.3 0.2 setosa 4.6 3.1 1.5 0.2 setosa 5.0 3.6 1.4 0.2 setosa 5.4 3.9 1.7 0.4 setosa 4.6 3.4 1.4 0.3 setosa アヤメのがくの 長 さ(Sepal.Length)の 特 徴 をつかむには 1. 数 値 による 要 約 要 約 統 計 量 を 求 める 2. グラフによる 要 約 ヒストグラムを 作 成 する 3. 層 別 して 要 約 統 計 量 やヒストグラム 29
要 約 統 計 量 の 算 出 30
ヒストグラムの 作 成 ヒストグラムを 作 成 31
ヒストグラムの 作 成 一 番 小 さい 値 ( 最 小 値 ) 真 ん 中 の 値 ( 中 央 値 ) 一 番 大 きい 値 ( 最 大 値 ) 一 目 瞭 然! 32
層 別 にヒストグラムを 作 成 アヤメの 種 類 別 にヒストグラムを 描 く 1 データ iris からアヤメの 種 類 (Species)が setosa となっているものだけを 抽 出 2 先 ほど 紹 介 した 方 法 でヒストグラムを 描 く 3 versicolor,verginica についてもヒストグラム 作 成 33
層 別 にヒストグラムを 作 成 層 別 にヒストグラムを 作 成 一 Setosa :がくが 短 い 層 別 すると 特 徴 が 浮 き 出 る! Verginica:がくが 長 い 目 瞭 然! 34
2 変 数 の 関 係 Sepal.Length Sepal.Width Petal.Length Petal.Width Species 5.1 3.5 1.4 0.2 setosa 4.9 3.0 1.4 0.2 setosa 4.7 3.2 1.3 0.2 setosa 4.6 3.1 1.5 0.2 setosa 5.0 3.6 1.4 0.2 setosa 5.4 3.9 1.7 0.4 setosa 4.6 3.4 1.4 0.3 setosa アヤメの 花 弁 の 幅 (Petal.Width)と 花 弁 の 長 さ(Petal.Length)の 関 係 を 見 る 場 合 は 1. 数 値 による 要 約 相 関 係 数 を 求 める 2. グラフによる 要 約 散 布 図 を 描 く 3. 層 別 してグラフ( 散 布 図 )を 描 く 35
相 関 係 数 の 算 出 1 相 関 係 数 を 求 める 変 数 を 指 定 する 2 相 関 係 数 の 種 類 にチェックを 入 れる 相 関 係 数 が 求 まる 36
散 布 図 の 作 成 散 布 図 を 描 く 37
散 布 図 の 作 成 Petal.Width と Petal.Length の 関 係 は 右 肩 上 がり ひと 目 で 分 かる! 一 目 瞭 然! 38
層 別 散 布 図 の 作 成 層 別 変 数 にアヤメの 種 類 Species を 指 定 する 39
層 別 散 布 図 の 作 成 Versicolor Virginica 一 目 Setosa 瞭 Setosa : 左 下 に 分 布 層 別 すると 特 徴 が 浮 き 出 る! Verginica: 右 上 に 分 布 然! 40
メニュー R Commander の 概 要 データ iris の 読 み 込 み 方 法 グラフの 作 成 方 法 R Commander でのデータ 解 析 例 グラフのカタログ 各 メニューの 概 要 41
インデックスプロット 42 変 数 を1つ 指 定 する
ヒストグラム 変 数 を1つ 指 定 する 43
幹 葉 表 示 変 数 を1つ 指 定 する 44
箱 ひげ 図 45 変 数 を1つ 指 定 する
箱 ひげ 図 ( 層 別 ) 前 のページの 画 面 で 層 別 のプロット を 選 択 することで カテゴリ 変 数 で 層 別 したグラフを 出 力 46
QQプロット 47 変 数 を1つ 指 定 する
散 布 図 48 X 軸 の 変 数 を1つ Y 軸 の 変 数 を1つ 指 定 する
散 布 図 ( 層 別 ) 前 のページの 画 面 で 層 別 のプロット を 選 択 することで カテゴリ 変 数 で 層 別 したグラフを 出 力 49
散 布 図 行 列 変 数 を3つ 以 上 指 定 する 50
散 布 図 行 列 ( 層 別 ) 前 のページの 画 面 で 層 別 のプロット を 選 択 することで カテゴリ 変 数 で 層 別 したグラフを 出 力 51
折 れ 線 グラフ に 観 測 値 番 号 を 追 加 したデータセット Nile について 折 れ 線 グラフを 作 成 する 52
条 件 付 き 散 布 図 X 軸 変 数 を1つ Y 軸 変 数 を1つ 層 別 変 数 を1つ 指 定 する 53
平 均 のプロット カテゴリ( 因 子 ) 変 数 と 目 的 変 数 を 指 定 する 54
棒 グラフ 変 数 を1つ 指 定 する 55
円 グラフ 変 数 を1つ 指 定 する 56
3Dプロット 目 的 変 数 を1つ, 説 明 変 数 を2つ 指 定 する マウスでグラフを 動 かすことが 出 来 る! 57
3Dプロット( 層 別 ) 前 のページの 画 面 で 層 別 のプロット を 選 択 することで カテゴリ 変 数 で 層 別 したグラフを 出 力 マウスでグラフを 動 かすことが 出 来 る! 58
メニュー R Commander の 概 要 データ iris の 読 み 込 み 方 法 グラフの 作 成 方 法 R Commander でのデータ 解 析 例 グラフのカタログ 各 メニューの 概 要 Graphic by (c)tomo.yun (http://www.yunphoto.net) 59
メニュー ファイル スクリプトファイルを 開 く:R のプログラムファイルを 開 く スクリプトを 保 存,スクリプトに 名 前 をつけて 保 存 :スクリプトウィンドウの 内 容 をファイルに 保 存 出 力 を 保 存, 出 力 をファイルに 保 存 :ログウィンドウの 内 容 をファイルに 保 存 R ワークプレースの 保 存, R ワークプレースに 名 前 をつけて 保 存 :R の 現 在 の 作 業 内 容 (データ, 関 数 など)をファイルに 保 存 終 了 :R Commander を 終 了 する(R 本 体 は 終 了 しない) 60
メニュー 編 集 ウィンドウをクリア:スクリプトウィンドウまたはログウィンドウの 内 容 を 消 去 する(カーソルがある 方 のウィンドウが 対 象 となる) 切 り 取 り,コピー, 貼 り 付 け, 削 除, 全 てを 選 択 :( 普 通 の 編 集 機 能 ) 検 索 :カーソルがある 方 のウィンドウを 対 象 として, 文 字 列 の 検 索 を 行 う 61
メニュー データ のおさらい Data 新 しいデータセット:セル 形 式 のウィンドウにデータを 手 入 力 する データセットのロード:R 上 で 作 成 したデータ(.rda)を 読 み 込 み データのインポート:txt,SPSS,Minitab,STATA,EXCEL, Access,dBase 形 式 のデータファイルを 読 み 込 む パッケージ 内 のデータ:R に 用 意 されているサンプルデータを 読 み 込 む アクティブデータセット: 解 析 用 データの 選 択 やデータの 加 工 を 行 う アクティブデータセット 内 の 変 数 の 管 理 :データの 加 工 を 行 う 62
メニュー データ 参 考 R では 以 下 の 外 部 データを 読 み 込 む 機 能 が 用 意 されている data.restore read.dbf read.dta read.epiinfo read.mtp read.octave read.spss read.ssd read.systat read.xport odbcconnect() はパッケージ RODBC の 関 数,その 他 はパッケージ foreign の 関 数 63
メニュー 統 計 量 統 計 量 様 々な 統 計 量 の 算 出 や 検 定 の 実 行,モデルの 作 成 が 出 来 る 要 約 統 計 量, 頻 度 集 計, 相 関 係 数 の 算 出 分 割 表 の 作 成, 分 割 表 に 対 する 検 定 平 均 値 に 対 する 検 定 (t 検 定, 分 散 分 析 ), 比 率 データに 対 する 検 定 分 散 についての 検 定 ( F 検 定,バートレットの 検 定 ) ノンパラ 検 定 (ウィルコクソン 検 定,クラスカル ウォリス 検 定 ) 次 元 解 析 ( 測 定 の 信 頼 性, 主 成 分 分 析, 因 子 分 析,クラスター 分 析 ) モデルの 作 成 統 計 量 のメニュー 選 択 データの 変 数 等 を 指 定 という 手 順 64
メニュー グラフ グラフ 様 々な 種 類 のグラフを 描 くことが 出 来 る インデックスプロット,ヒストグラム, 幹 葉 表 示 ( 幹 葉 図 ), 箱 ひげ 図,QQプロット, 散 布 図, 散 布 図 行 列, 折 れ 線 グラフ, 条 件 付 き 散 布 図, 平 均 のプロット, 棒 グラフ, 円 グラフ,3Dグラフ グラフをファイルに 保 存 することも 出 来 る 65
メニュー モデル モデル メニューの 統 計 量 モデル で 作 成 したモデルに ついて 詳 細 な 検 討 を 加 えることが 出 来 る モデルの 要 約 信 頼 区 間 の 算 出 仮 説 検 定 モデルの 診 断 モデルに 関 するグラフ 描 画 66
メニュー 分 布 連 続 分 布 正 規 分 布,t 分 布,χ2 分 布,F 分 布, 指 数 分 布, 一 様 分 布, ベータ 分 布,コーシー 分 布,ロジスティック 分 布, 対 数 正 規 分 布, ガンマ 分 布,ワイブル 分 布,ガンベル 分 布 ( 二 重 指 数 分 布 ) について 累 積 分 布 の 算 出, 確 率 点 の 算 出, 乱 数 の 算 出,グラフの 描 画 を 行 う 67
メニュー 分 布 離 散 分 布 2 項 分 布,ポアソン 分 布, 幾 何 分 布, 超 幾 何 分 布, 負 の2 項 分 布 について 累 積 分 布 の 算 出, 確 率 点 の 算 出, 確 率, 乱 数 の 算 出,グラフの 描 画 を 行 う 68
メニュー 分 布 例 :2 項 分 布 のグラフ 描 画 69
メニュー ツール パッケージのロード: R のパッケージを 呼 び 出 す Rcmdr プラグインのロード: R Commander 用 のプラグイン ( 追 加 機 能 )を 呼 び 出 す オプション:R Commander のウィンドウの 表 示 設 定 を 変 更 する 70
メニュー ヘルプ Commander のヘルプ:R Commander のヘルプを 表 示 R Commander:R Commander の 作 者 John Fox 氏 の 解 説 文 書 Getting Started With the R Commander. を 表 示 アクティブデータセットのヘルプ:データセットのヘルプを 表 示 (Rに 用 意 されているデータセットを 開 いている 場 合 ) Rcmdr について: R Commander の 概 要 を 表 示 71
参 考 文 献 R Commander 関 係 フリーソフトウェア R による 統 計 的 品 質 管 理 入 門 ( 荒 木 孝 治 編 著, 日 科 技 連 ) R と R コマンダーではじめる 多 変 量 解 析 ( 荒 木 孝 治 編 著, 日 科 技 連 ) Getting Started With the R Commander(John Fox) R with Rcmdr: BASIC INSTRUCTIONS (Murray Logan) R Commander ハンドブック( 舟 尾 暢 男 著, 九 天 社 ) 72