タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Similar documents
消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

スライド 1

tshaifu423

Microsoft Word - mstattext02.docx

スライド タイトルなし

初めてのプログラミング

13章 回帰分析

Microsoft PowerPoint ppt

Microsoft Word - Excel2.doc

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...

目次 はじめに P.02 マクロの種類 ---

2 / 16 ページ 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっている

ビジネス統計 統計基礎とエクセル分析 正誤表

統計的データ解析

グラフ作成 暮らしのパソコンいろは 表のデータをグラフにするとデータの内容が視覚化され とてもわかりやすくなります ネット通販売上件数 を表すグラフを作成しましょう Excel2013 資料 C を開いておきましょう 1. グラフの構成要素 ネットショッピング購入状況ネット通販年代別利用

情報処理 基 礎

Excel2013 シート・ブック間の編集と集計

tshaifu423

2 / 14 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっていることを確

314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション

Microsoft Word - appendix_b

次に Excel のメニューから 挿入 タブをクリックし 表示されたメニュー内の グラフ にある 折れ 線グラフ のボタンをクリックする するとサブメニューが表示されるので 左上の 折れ線 を選択する 挿入 メニューの グラフ クリック後 シート上の折れ線が追加される ここで 2 本グラフ があるの

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

A. 表の作成 はじめに 講座テキストページに保存されている表 1 の元データをエクセル 2010 にコピーします (No1) 講座テキスト (Web ページ ) に示した表 1 過去 12 年間の為替と外貨準備の推移 のデータ表を選択する この表 1 を選択した状態で WEB ページの 編集 コピ

スライド 1

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

スライド 1

Excelを用いた行列演算

スライド 1

Excelによるデータ分析

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

スライド 1

表計算ソフトの基礎 31 5 最小二 ( 自 ) 乗法 (Least squares method) 理工系の実験などでは, たいてい測定が行われる. ただし, 測定コストを減らすため, 粗い測定を行い, 得られた ( 誤差を含む ) 測定点群を説明することができる, 真の特性として何らかの関数 (

ANOVA

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

第4回

医用工学概論  Medical Engineering (ME)   3年前期の医用工学概論実習と 合わせ、 医療の現場で使用されている 医用機器を正しく安全に使用するために必要な医用工学(ME)の 基礎知識を習得する。

横浜市環境科学研究所

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

経営統計学

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

相関分析・偏相関分析

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

Microsoft Word MSExcel2010

3. 統計関数による回帰直線の導出 Excelが備えている関数を用いて 回帰直線の導出を行ってみることにする (1) 回帰係数の導出 ( 関数 SLOPE とINTERCEPT 1 ) Y=a+bX という回帰モデルにおいて SLOPE は回帰直線の傾き b を INTERCEPT は切片 a を求

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft Word - å“Ÿåłžå¸°173.docx

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft Word - lec_student-chp3_1-representative

Excel2013基礎 数式と表編集

正誤表(FPT1004)

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

6 シート見出しブックに入っている各シート名の名前が表示されます シートとは 表を作るための作業エリア 単にシートという場合はワークシートのことを指します シート上のセルにデータを入力しながら表を作っていきます シートには他にグラフシートもあります 7 数式バー現在操作の対象となっているセル内のデー

Microsoft Word - SPSS_Manual_I.doc

コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx

Excelで血圧記録表を作成しょう!

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

情報処理演習

関数の定義域を制限する 関数のコマンドを入力バーに打つことにより 関数の定義域を制限することが出来ます Function[ < 関数 >, <x の開始値 >, <x の終了値 > ] 例えば f(x) = x 2 2x + 1 ( 1 < x < 4) のグラフを描くには Function[ x^

Microsoft PowerPoint - 価格関数R3.pptx

Microsoft Word - P doc

文京女子大学外国語学部

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63>

各種パスワードについて マイナンバー管理票では 3 種のパスワードを使用します (1) 読み取りパスワード Excel 機能の読み取りパスワードです 任意に設定可能です (2) 管理者パスワード マイナンバー管理表 の管理者のパスワードです 管理者パスワード はパスワードの流出を防ぐ目的で この操作

Section1_入力用テンプレートの作成

(7) 表示されている [ オートフィルオプション ] をクリックして [ 書式なしコピ ー ] をクリックします (8)[ 評価 1] の結果が表示されます [ 評価 2] の列には [ 売上数量 ] が 1500 以上であれば 1000 以上であれば そ うでなければ と表示されるようにしてくだ

Microsoft Word - econome5.docx

(Microsoft Word - Excel\211\236\227p6\217\315.docx)

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

PowerPoint2007基礎編

初めてのプログラミング

PowerPoint2003基礎編

クイックスタートガイドデスクトップバージョン GeoGebra とは? ひとつの使いやすいパッケージになった, 動的数学ソフトウェアです すべての教育段階における学習や指導に使用できます 二次元および三次元の幾何 (geometry), 代数 (algebra), 表計算, グラフ, 解析, そして

2 列 B と 列 C の間にカーソルをあわせ, カーソルの形が変化したところでドラッグして右に移動し, 列 B の幅を約 に設定します 3 列 C の上でマウスをドラッグして右に移動し, 列 C, 列 D, 列 E の 3 列を一括選択します 一括選択ができたら, 列 C と 列 D

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

電磁波レーダ法による比誘電率分布(鉄筋径を用いる方法)およびかぶりの求め方(H19修正)

Microsoft Word - 操作マニュアル(PowerPoint2010).doc

PowerPoint プレゼンテーション

(Microsoft Word - \202v\202a\202s\203G\203N\203Z\203\213.doc)

Excel2013 ピボットテーブルを使った分析

第 14 講複数ソフトの組み合わせ テキストファイルを Excel で開く 2 / 17 テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 13 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Off

ことばを覚える

セル G5 に 大手町店 の合計を求めましょう 暮らしのパソコンいろは 1 セル G5 をクリックします 2 ホーム タブをクリックします 3 編集 グループの ( 合計 ) をクリックします セル G5 と数式バーに =SUM(D5:F5) と表示され セル範囲 D5:F5 が点滅する線で囲まれま

Microsoft Word - ExcelTable.docx

< F2D968382CC A837E B E9197BF2E6A7464>

暮らしのパソコンいろは早稲田公民館 ICT サポートボランティア

1 SmartArt の機能を使って, 要点を図形にまとめましょう Power Point2007 から, SmartArt という機能が追加されました これは, 図形を使って, 内容の要点 ( キーワード ) などを, 美しく, わかりやすく提示するための機能です この機能を使うときは, 内容に合

パソコンで楽チン、電力管理3169編

問題 1 次の文章は Excel の作業環境について述べたものである 下線部の記述の正誤を判断し 解答群 { } の記号で答えよ ただし 下線部以外の記述に誤りはないものとする 設問 1. クイックアクセスツールバーには アプリケーション名やファイル名が表示される 設問 2. 数式バーのる ボタンを

hokou

図 2 エクスポートによるシェープファイルの新規保存 新規保存するファイルは, より分かりやすい名前をつけて適切なフォルダ (shape フォル ダにまとめておくのがよい ) 上に保存しておく 2 / 10

Microsoft Word - 操作マニュアル-Excel-2.doc

セミナー標準カリキュラム4.0

コンピュータリテラシ

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

Microsoft Word - ASMMAC_6

MoreStudy 第 6 章 MoreStudy 第 6 章 第 1 節 貼り付け 3 [ 形式を選択して貼り付け ] ダイアログから [Microsoft Excel ワークシート ] を選択し [OK] ボタンを 押します 1 Excel ワークシートで貼り付け [Pastespec] リボン

Transcription:

Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく 散布図による確認総人口と輸送トンキロ数との関係を散布図で示してみよう グラフを作成するには, シート中の連続するデータをあらかじめドラッグしておくのが原則であるが, 総人口 (E 列 ) と輸送トンキロ数 (J 列 ) のように不連続な範囲を指定したい時には,Ctrl キーを使ったドラッグが有効である 図 1 のように, まず, どちらかの連続範囲を通常の ( セル範囲を指定する ) ドラッグ操作で指示しておき, 離れた場所にある範囲を指示する際にキーボードの Ctrl キーを押しながらドラッグ操作を行う 1 通常のドラッグ操作で指定 2 キーボードの Ctrl キーを押しながら 2 つめの範囲をドラッグ操作で指定 図 1 Ctrl キーを使った不連続な範囲のドラッグ指定の手順 その後のグラフの作成手順の詳細は省略するが, 図 2 を参考に仕上げてみよう 1/9

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があるように思 われる 相関の強さを数値的に示すには, 相関係数 1 を用いることが多い 相関係数はデータ数や 数値の大きさによらず,-1 から +1 の値を示すので, 異なるデータ群の比較にも利用できる Excel では,SUM 関数などと同様にワークシート中で利用できる組込み関数として CORREL 関数が用意されており, これを使用することで, 容易に相関係数を求めることが できる 1 特に断らない場合は,Pearso( 人名 ) の積率相関係数を指す 他に Spearma の順位相関係数と呼ばれるものもある 積率相関係数は, 個のデータの組,(x1,y1),(x2,y2), (x,y) 1 ( xk x)( yk y) k 1 が与えられた時に, rxy で計算される ( x や y はそれぞ 1 2 1 2 ( xk x) ( yk y) k 1 れ x や y の算術平均 ) 分子は x と y の共分散, 分母は x の分散と y の分散の幾何平均の形になっている k 1 2/9

ワークシート中の適当なセルで, =CORREL(E2:E14,J2:J14) と入力すると,(E2~E14 の範囲の ) 総人口と (J2~J14 の範囲の ) 輸送トンキロ数との相関係数が求められる POP と TK の相関係数 0.9711 散布図への近似曲線の追加による回帰分析次に, 人口と輸送量との関係を, 数式モデルとして与えることを考える 散布図で見ると, 人口の増加に伴って輸送量がいわば 直線的に 伸びていることが予見されるが, これを, 輸送量 ( 輸送トンキロ ) 傾き 人口 切片のように, 人口によって輸送量が決まるといった現象を ( 二次元グラフ上の直線という ) 数式で示してみることで, 人口の推計値によって輸送量も推計できる, という予測のツールとして利用が可能になる 上式で, 切片や傾きは決める必要があるが, それには今知られている輸送量と人口のデータからなるべく乖離しないように, 合理的に決める必要がある その決定方法には, いくつかの種類があるが, 最も単純なものは最小自乗法と呼ばれ, Excel にもその数値解を求める機能が備わっている 一般に既知のデータから数値モデルのパラメータ ( 上の場合は切片や傾き ) を決める手法を回帰分析 2と呼んでいる 後述の 分析ツール を使う手段もあるが, 二次元の場合 3には, 散布図のオプション ( 近似曲線の追加 ) によって, 直線式や多項式の当てはめ ( つまり回帰分析 ) の結果をグラフ上に重ね書きすることができる 図 3 のように, 散布図を描いた後で, グラフツール デザイン グラフ要素を追加 近似曲線からその他の近似曲線オプションを選択する 2 直線に当てはめる場合は, 式の形が一般に線形結合と呼ばれることから, 線形回帰分析と限定して呼ぶこともある ちなみに式が線形でない場合は, 非線形回帰分析と呼ぶ 3 説明される変数 ( 被説明変数あるいは従属変数, この場合は輸送量 ) に対して説明変数 ( あるいは独立変数 ) が 1 つの場合を特に単回帰分析と呼ぶ ( 複数の場合は重回帰分析と呼ぶ ) 3/9

あらかじめグラフをクリックして選択しておく グラフ上に数式と R 2 ( 決定 係数 ) を示す 図 3 近似曲線の追加 を用いた散布図上での簡便な ( 単 ) 回帰分析の手順 4/9

結果の例を図 4 に示す オプションによって指示した回帰分析の結果がグラフ上に示されることが分かる この場合は, 先に想定した式に当てはめると, 輸送量 ( 輸送トンキロ ) 11.88 人口 9614543 と求められたことを示している 4 ただし, この結果が統計学的にどの程度の信頼性を持っているかは示されないので, より精緻な検証を行うには,Excel の 分析ツール や SPSS などの統計処理ソフトを用いる必要がある ( 近似曲線で示す手順はあくまで簡便法ということ ) 図 4 散布図上に近似曲線 ( 回帰分析による直線 ) を追加した例 ( 輸送トンキロ =11.88 人口 -961543 で, 決定係数 ( 説明力 ) は 94.31%) 分析ツールによる回帰分析 前述のように, 統計的な信頼性を示す必要がある場合や, 説明変数が複数のモデル ( 重 回帰分析 ) を扱う場合には, 統計処理用のソフトを使う必要がある Excel でも限定的な機 能ながら, 回帰分析を行うソフト 5 が組み込まれているので, これを使った分析手順を紹介 しておく 分析ツールは, データリボンから呼び出す データリボンに見えていない場合には, 図 5 4 決定係数は, この式によって, 全体のバラツキをどの程度説明できることになるかという目安を示す割合と考えればよい 5 アドイン ( メインのソフト ( この場合は Excel) と連動する, 追加的なソフトのこと アドオン, プラグインも同様 ) として提供されている 分析ツール この機能の一部として 回帰分析 が使用できる 5/9

の手順で分析ツールを使用できるように設定し直し, あらためてデータリボンに切り替え る 分析ツールが使用可能になったら, 回帰分析用の設定パネルを呼び出し, 図 6 に示す 手順で, 必要なデータ範囲をドラッグ操作で示せばよい ファイルを選択 アドインを選択 管理 :Excel アドインを選択して 設定 をクリック オプションを選択 図 5 分析ツール アドインの設定 ( データリボンに分析ツールが表示されていない場合の設定手順 ) 6/9

1 の範囲をドラッグで指示 この場所をクリックしてから 2 の範囲をドラッグで指示 12 の先頭行が名前である場合にチェック 必要に応じて適宜チェック ( 今回は 残差グラフの作成 のみ選択 ) 2 1 図 6 回帰分析 の進め方 OK をクリックして処理を進めると, 図 7のような結果が新しいワークシート上に示される 見るべきポイントは 4 点ほどある 1. 補正 R2 データ数や説明変数の数によって補正された決定係数 1を 100% とする割合として読み替えればよい 図 7 の例では, 説明力は,80.82% と読むことになる 一般的には 90% 以上となるのが望ましいが, 社会科学で扱うような事象では 60% 程度で 7/9

も良好とする場合が多い 低すぎる場合は説明変数の増減を検討する必要がある なお, グラフの近似曲線で示される決定係数は, 補正前の 重決定 R2 に相当しており, この値はデータ数を考慮していない ( 一般にデータ数が少ないと説明力は見かけ上高くなる ) ので, この値については参考程度に扱うべきである 2. 有意 F この値は確率として読み, 想定した数式モデル ( 直線式 ) の変数に関わる係数 ( 傾き ) が すべて 0 である 確率 6として示される 図 7の例では,3.41687E-08 7 なので, すべて 0 である 確率はほぼ 0 であるから, 少なくとも1つは 0 ではない = 数式は意味を持っている ことを示している このように, この値は小さいほどよく, 一般に 0.05(5%) 未満であれば (95% 以上の確率で意味がある 8 ということなので ) 良好とされる 3. 係数この値が, 想定した数式に対応する値 ( 切片や傾き ) となる 4.P- 値この値は確率として読み, 想定した数式モデル ( 直線式 ) の変数に関わる係数ごとに, その係数が 0 である 確率として示される 有意 F の読み方と同様に, この値は小さいほどよく, 一般に 0.05(5%) 未満であれば (95% 以上の確率で意味があるということなので ) 良好とされる 5% より大きな値を示すものがあれば, その変数は数式には無関係ということなので, 数式モデルの再考を検討する 6 統計学では, 仮説検定と呼ばれる手法の結果を示している 7 文字 E を含む数値の形式を指数形式と呼び, この例では 3.41687E-08 3.41687 10-8 0.0000000341687 と読みかえる ゆうい 8 このことを ( 統計的に ) 有意 と表現する 8/9

説明力 モデル全体の信頼性 モデル式の係数 係数の信頼性 図 7 分析例とその読み方 ( 注目点 ) ( 実際の結果を, 読みやすくなるように列幅を調整してある ) 演習余力のある人は, 説明変数を年代別の人口 (POP1~POP3) に変更して ( 図 6 における入力 X 範囲を B2~B14 に変えて ), 重回帰分析を行ってみなさい 決定係数の違いや係数の信頼性を検討した上で, 係数の大きさによって何が表されているか, 吟味してみなさい 9/9