Microsoft Word - appendix_b

Similar documents
Microsoft PowerPoint - e-stat(OLS).pptx

第4回

ビジネス統計 統計基礎とエクセル分析 正誤表

EBNと疫学

Microsoft Word - å“Ÿåłžå¸°173.docx

スライド 1

初めてのプログラミング

Microsoft PowerPoint - sc7.ppt [互換モード]

スライド 1

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

Microsoft Word - Stattext12.doc

Microsoft Word - 操作マニュアル-Excel-2.doc

tshaifu423

情報工学概論

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft Word - apstattext04.docx

スライド 1

Microsoft PowerPoint - Econometrics pptx

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

不偏推定量

Excelにおける回帰分析(最小二乗法)の手順と出力

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

スライド 1

Microsoft PowerPoint ppt

Microsoft Word - lec_student-chp3_1-representative

次の病院 薬局欄は 氏名 欄に入力された値によって入力すべき値が変わります 太郎の行く病院と花子の行く病院が必ずしも同じではないからです このような違いを 設定 シートで定義しておきましょう 太郎の行く病院のリストを 太郎 花子の行く病院のリストを 花子 として 2 つのリストが定義されています こ

A. 表の作成 はじめに 講座テキストページに保存されている表 1 の元データをエクセル 2010 にコピーします (No1) 講座テキスト (Web ページ ) に示した表 1 過去 12 年間の為替と外貨準備の推移 のデータ表を選択する この表 1 を選択した状態で WEB ページの 編集 コピ

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Medical3

スライド 1

PowerPoint プレゼンテーション

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

第7章

Medical3

Microsoft Word - Stattext13.doc

tshaifu423

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

統計的データ解析

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション

hokou

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft Word - mstattext02.docx

Microsoft Word - 補論3.2

基礎統計

Microsoft PowerPoint - ch04j

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

目次 はじめに P.02 マクロの種類 ---

ANOVA

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft Word - eviews6_

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft Word MSExcel2010

Microsoft PowerPoint ppt

関数の定義域を制限する 関数のコマンドを入力バーに打つことにより 関数の定義域を制限することが出来ます Function[ < 関数 >, <x の開始値 >, <x の終了値 > ] 例えば f(x) = x 2 2x + 1 ( 1 < x < 4) のグラフを描くには Function[ x^

【第一稿】論文執筆のためのワード活用術 (1).docx.docx

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

経済データ分析A

日心TWS

Microsoft PowerPoint - statistics pptx

-24- Word 2016 操作手順 第 5 章ワープロ A 24 ページを このページに差し替えてください ( 6 透かしの設定 を変更 ) 1 頁 3. タブ 6 字 とリーダー ( 任意 ) の設定 ( ウ )~( オ ) は 図 2 を参考に正しいものを記述してください ( 図 2) タブ

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63>

次に Excel のメニューから 挿入 タブをクリックし 表示されたメニュー内の グラフ にある 折れ 線グラフ のボタンをクリックする するとサブメニューが表示されるので 左上の 折れ線 を選択する 挿入 メニューの グラフ クリック後 シート上の折れ線が追加される ここで 2 本グラフ があるの

Microsoft PowerPoint - Statistics[B]

Microsoft Word - Excel2.doc

13章 回帰分析

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

1 SmartArt の機能を使って, 要点を図形にまとめましょう Power Point2007 から, SmartArt という機能が追加されました これは, 図形を使って, 内容の要点 ( キーワード ) などを, 美しく, わかりやすく提示するための機能です この機能を使うときは, 内容に合

スライド タイトルなし

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

正誤表(FPT1004)

Microsoft Word - 教科書大1b第12週06.doc

Probit , Mixed logit

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

講義「○○○○」

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

JUSE-StatWorks/V5 活用ガイドブック

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

MoreStudy 第 6 章 MoreStudy 第 6 章 第 1 節 貼り付け 3 [ 形式を選択して貼り付け ] ダイアログから [Microsoft Excel ワークシート ] を選択し [OK] ボタンを 押します 1 Excel ワークシートで貼り付け [Pastespec] リボン

経済統計分析1 イントロダクション

経営統計学

Microsoft Word - econome5.docx

Excelで血圧記録表を作成しょう!

8. 適用 を後 OK をしウインドウを閉じてください 2. パソコンと LCV3 を LAN ケーブルで接続し 設定を行います Windows パソコンの推奨環境は以下の通りです (2015 年 6 月現在 ) OS : Windows XP Vista 7 8 CPU : 32bit 64bit

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft Word - Stattext11.doc

Excelによるデータ分析

PowerPoint プレゼンテーション

[ ] 算定基礎届の CD 届出データ作成マニュアル 健保提供 ターンアラウンド CD の活用 概要 1) 健康保険組合が提供する 算定基礎届ターンアラウンド CD は 日本年金機構により示された 届書作成仕様書 ( 健康保険 厚生年金保険適用関係 届書 ) に基づく CD による算定

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

経済統計分析1 イントロダクション

Transcription:

付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし [ データ ] タブに [ データ分析 ] という項目があれば 本節は無視してください [ データ分析 ] がなければ 以下の手順に従って設定します エクセル画面左上の [ ファイル ] タブをクリックします そして左列の一番下にある [ オプション ] をクリック そうすると [Excel のオ プション ] ウィンドウ画面がでますから 下画面から [ アドイン ] を選んで 下画 面下にある [ 設定 ] をクリックします それから下画面で [ 分析ツール ] をクリックして OK とします これで [ データ ] 1

タブの 一番右に [ データ分析 ] という項目が加わります B.2 無作為抽出 1 章では無作為抽出の仕方として 10 面体のサイコロを使う方法を説明しました しかし エクセルを使えば無作為抽出を容易に行うことができます たとえば 1000 人の学生から 10 人を無作為抽出するときは まず全員に 1 から 1000 までの番号 (ID) を付けます 次に [ データ ] タブの [ データ分析 ] をクリックします そして [ サンプリング ] を選んでから OK をクリックします すると 左下の画面が出てきます ここで に情報を入力します A 列の 2 行から 1001 行まで番号が記録されていますから 入力範囲として $A$2:$A$1001 を入力します 入力が面倒であれば ボタンを押して データの入力範囲を画面上で範囲指定することもできます また 10 人を無作為抽出しますから データの個数 ( サンプルサイズ ) に 10 2

を入力します そして OK を押すと右下の画面となり 乱数が抽出されます この場合 選ばれた乱数は 113 941 310 360 792 9 75 156 835 246 です この番号に対応した 10 人の学生を選べば無作為抽出は完了です 1 B.3 特性値の計算方法エクセルを使った特性値の計算方法を説明します エクセルにはさまざまな特性値を計算するため 多くの関数が定義されています たとえば 平均であれば =AVERAGE( 配列 ) とすれば 配列指定したデータを使って 平均を計算してくれます ( 配列はデータ入力範囲 ) 代表的関数には平均 =AVERAGE( 配列 ) 中央値 =MEDIAN( 配列 ) 最頻値 =MODE( 配列 ) 分散 =VAR( 配列 ) 標準偏差 =STDEV( 配列 ) 共分散 =COVAR( 配列 1, 配列 2) 相関係数 =CORREL( 配列 1, 配列 2) となります 共分散と相関係数は 2 変数の関係を捉える指標ですから 配列が 2 つあります 下図は GDP を 1991~2004 年まで記録したものです A 列は年 B 列は GDP をとなります ここで C 列には GDP 成長率 ( 変化率 ) を計算しています C 列の 3 行目は 0.02451206 となっていますが これは =(B3-B2)/B2 として計算で 1 無作為抽出すると 同じ番号が重複することがあります 番号の重複を認める方法を復元抽出 認めない方法を非復元抽出といいます たとえば 番号 1~ 100 から 3 つを抽出したとき 乱数として 91 7 91 が抽出されたとしましょう 復元抽出なら 選ばれた乱数は 91 7 91 ですが 非復元抽出なら ( もう一度抽出したところ乱数 80 が得られたとする ) 選ばれた乱数は 91 7 80 です 非復元抽出は同一母集団からの抽出とならず i.i.d. の仮定は満たされません ただし 母集団規模が十分に大きければどちらでも変わりません 3

きます (1991 年の成長率を計算するためには 1990 年の GDP データが必要ですが データがないため 1991 年の成長率は計算できません ) そして このセル (C3) をコピーして C 列の 4~ 15 行までに貼り付ければ変化率を全て計算できます 関数を用いて特性値を計算してみましょう たとえば GDP の平均は =AVERAGE(B2:B15) として計算できます また GDP と成長率の相関は =CORREL( B3:B15, C3:C15) として計算できます ( 成長率は 1992 年から利用できるため 相関の計算では 3 行目からのデータを用いています ) B.4. 図の描き方ここでは図の書き方を説明します 下画面では 1991~2004 年までの GDP が記録されています 図を描くためには まず 下画面のようにデータ範囲を指定します 指定が終わってから [ 挿入 ] タブをクリックし 折れ線マークをクリックします ( 折れ線以外に 散布図 縦棒 横棒 円グラフなどがあります ) 4

そして折れ線の中で 自分が描きたい図の種類を選択します ここでは 左 上の図を選びましょう ここでは 左上の図を選びましょう そうすると 下図が出てきます 横軸は年 縦軸は GDP の規模となっています このままではあまりきれいな図ではありませんから 微調整して図を見やすくする必要があります 作成された図をクリックして [ デザイン ] タブを選ぶことでさまざまな微調整ができるようになります また 図の軸をクリックし 書式設定を選ぶことでも調整ができます 5200000 5100000 5000000 4900000 4800000 4700000 4600000 GDP( 名目 ) 4500000 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 5

B.5 相関係数の計算エクセルを使って標本相関係数を計算しましょう 4 章では 2007/1~ 2009/6 におけるトヨタ ホンダ ユニクロの株価の動きを紹介しました ここでは これら 3 系列の標本相関係数を計算します まず [ データ ] タブの [ データ分析 ] をクリックします そして [ 相関 ] をクリックして OK します そうすると 左下の画面が出てきます ここで について情報を入力します B ~ D 列の 1 ~ 43 行にデータが記録されていますから 入力範囲として $B$1:$D$43 を代入します ただし 最初のセルはデータ名ですから [ 先頭をラベルとして使用 ] をクリックしてください そうすると 最初のセルをラベルとして認識してくれます そして OK すると 右下の画面が出てきます 同じ系列同士では相関係数は 1 となりますから 対角要素は全て 1 です トヨタとホンダの相関係数は 0.956 トヨタとユニクロの相関係数は-0.697 ホンダとユニクロの相関係数は-0.629 となっています 6

B.6 確率の計算ここでは確率変数の確率を計算する方法を説明します Z は標準正規確率変数とします ここで P{Z<z} となる確率を求めたい場合には =NORMSDIST(z) と入力します たとえば P{Z<1.96} を求めるには= NORMSDIST(1.96) と入力すれば 0.9750 が得られます W は自由度 n の χ 2 確率変数とします このとき P{χ 2 n,α<w}=α となる χ 2 n,α の値を計算するには =CHIINV(α,n) と入力します たとえば χ 2 99,0.025 を求めるときは =CHIINV(0.025,99) と入力すれば 128.42 が得られます また χ 2 99,0.975 を求めたい場合は =CHIINV(0.975,99) と入力すれば 73.36 が得られます U は自由度 n の t 確率変数とします このとき P{t n,α < U }=α が成立する t n,α を計算するには =TINV(α,n) と入力します たとえば t 1,0.1 は =TINV(0.1,1) と入力すると 6.314 が得られます V は第 1 自由度 m 第 2 自由度 n の F 確率変数とします P{F m,n <V}=α となる F m,n の値を計算するには =FINV(α,m,n) と入力します α=0.05 m=n=2499 であれば =FINV(0.05, 2499, 2499) として 1.068 が得られます B.7. 回帰分析回帰分析の仕方とその解釈を説明します 2010/1/6~2010/12/30 の円ドルレートを使って 為替レートが予測できるのかを調べます t 日の為替レートを S t とし t 日の変化率 (ds と表記 ) を と表します ds = S S S ここでは被説明変数を t 日の変化率 (ds ) 説明変数を t-1 日の変化率 (ds ) とします ds =α+βds +u β が 0 から有意に異ならなければ為替の予測はできませんし β が有意に 0 か ら異なれば為替の予測が可能だといえます これは自己回帰 (AR) モデルとい われ 時系列分析で重要なモデルのひとつです ( 詳しくは 参考文献で紹介さ れている本を読んでください ) 7

[ データ ] タブの [ データ分析 ] をクリックします そして [ 回帰分析 ] を選択し て OK をクリックします すると下画面が表示されます ここで被説明変数 (Y) は C の列 (t 日の変化率 つまり ds t ) 説明変数(X) は D の列 (t-1 日の変化率 つまり ds t-1 ) となります したがって 入力 Y 範囲は C の列 $C$1:$C$244 とし 入力 X 範囲は D の列 $D$1:$D$244 と範囲指定します Y と X の入力範囲は 1 行目から始めていますが 1 行目はデータの名前 ( ラベル ) で データそのものではありません このため ラベルにチェックを入れて データではないことを明示しておきます また ここでは有意水準にチェックし 99 という値を入れておきます こうすることで信頼区間 99% を計算してくれます 最後に OK をクリックすると 以下の画面が表示されます 重要な情報とそ の意味を紹介していきます 8

最初のブロック ( 回帰統計 ) には 当てはまりの尺度である決定係数がまとめられています 重決定 R2 は決定係数で 0.012441 と あまり当てはまりはよくありません また 補正 R2 は自由度調整済み決定係数で 0.008343 ですから やはり当てはまりはよくありません 観測数はサンプルサイズで この場合 243 となります 最後のブロック ( 分散分析表 ) に 母数 (α β) の推定値 標準誤差 95% 信頼区間がまとめられています ( 有意水準をチェックし 99 を入力したため 99% 信頼区間も表示されています ) たとえば 切片 α は-0.00053 説明変数の係数 β は-0.11097 と推定されています それぞれの標準誤差は 0.00041 と 0.06369 です t 値は推定値を標準誤差で割ったもので それぞれ- 1.28724( =- 0.00053/0.00041) -1.7424( =- 0.11097/0.06369) となります この場合 α に関する t 値は 0 に近いため 帰無仮説 (H 0 : α=0) は採択されます これに対し β に関する t 値は-1.7424 と 0 から乖離しており 有意水準 10% で帰無仮説 (H 0 : β=0) が棄却され 対立仮説が支持されます 95% の信頼区間は 母数が 95% の確率でその範囲に含まれることを意味します たとえば α は 95% の確率で-0.00159 から 0.000537 の範囲に収まるといえます 最後に p 値は H 0 が正しいにもかかわらず t 統計量の絶対値が t 値 ( t*) の絶対値より大きな値をとる確率 (P{ t > t* }) です たとえば この表から βˆ β に関する t 値は t*=- 1.7424 で p 値は 0.082715 となっています p 値は H 0 が正しいもとで t 統計量の絶対値 ( t ) が t 値の絶対値 ( t* =1.7424) より大きく βˆ 9

なる確率ですから P{ t > -1.7424 }=0.082715 となっているのです p 値を見 βˆ れば何 % の有意水準で帰無仮説を棄却できるかが分かります かりに p 値が 1% を下回っていれば 1% の有意水準でも帰無仮説を棄却できます この場合 β の p 値は 0.082715 ですから 有意水準 10% なら帰無仮説を棄却することができます 10