計 量 経 済 学 講 義 第 回 記 述 統 計 の 基 礎 Part 0 年 0 8 ( ) 限 担 当 教 員 : 唐 渡 広 志 研 究 室 : 経 済 学 研 究 棟 階 号 室 email: kkarato@eco.u-toyama.ac.jp website: http://www.u-toyama.ac.jp/kkarato/
講 義 の 目 的 般 的 なデータの 集 約 法 や 記 述 法 につ いて 学 びます keywords: 度 数 分 布 表,ヒストグラム, 標 本 平 均, 偏 差, 偏 差 乗 和, 標 本 分 散, 標 本 標 準 偏 差 教 科 書 : pp. 6 8, 50( 第 章 )
度 数 分 布 表 とヒストグラム () pp.6-8 度 数 分 布 表 の 作 成 順 (Excel). 全 度 数 (データサイズ)を 調 べる[count 関 数 ]. 階 級 数 概 算 値 [+log ( 全 度 数 )]. 最 値 [min 関 数 ]. 最 値 [max 関 数 ] 5. 範 囲 [ 最 値 - 最 値 ] 6. 階 級 の 幅 (の 安 ) = 範 囲 / 階 級 数 を 計 算 7. 階 級 の 設 定 ( 以 上 未 満 ) 階 級 数 や 階 級 の 幅 は つの 安 と 考 える 階 級 の 幅 は 区 切 りのよい 間 隔 を 持 たせた がわかりやすい
度 数 分 布 表 とヒストグラム () 度 数 を 求 める 法 階 級 の 上 限 に 対 応 した 値 を 区 間 配 列 データとして 記 述 する 5 万 円 未 満 なので, 階 級 の 上 限 を.9 とする データ 配 列 区 間 配 列 frequency 関 数 を 利 して, 最 初 の 階 級 の 度 数 だけを 計 算 する = frequency (データ 配 列, 区 間 配 列 )
度 数 分 布 表 とヒストグラム () いま 計 算 した 最 初 の 階 級 の 度 数 と これから 計 算 予 定 の 度 数 のセルを 選 択 状 態 にする 数 式 バーの 番 左 側 をクリック Ctrl と Shift を 押 さえたまま Enter (この 技 のことを 配 列 コピー とよぶ) 完 成 ( 操 作 を 間 違 えたら Esc キー) ヒストグラム 作 成 挿 タブ 縦 棒 -D 縦 棒 5
母 集 団 と 標 本 pp.-6 部 の 情 報 だけを 利 して 全 体 の 構 造 を 予 測 全 体 の 構 造 の 予 測 推 定 検 定 全 体 の 構 造 ( 母 集 団 ) 集 団 の 平 均 分 散 一 部 分 を 利 用 標 本 抽 出 部 の 情 報 ( 標 本 ) 例 ( 推 定 ) : 標 本 から 計 算 できる 平 均 を いて, 集 団 の 平 均 を 予 測 する 標 本 から 計 算 できる 分 散 を いて, 集 団 の 分 散 を 予 測 する 6
母 集 団 (population) 集 団 : 観 察 の 対 象 となっている 事 柄 のあらゆ る 観 測 値 の 集 まり 観 察 の 対 象 ( 例 ) a. 0 年 0 現 在 の 本 の0 歳 の 男 性 の 体 重 b. A 市 で 働 いている 就 業 者 (5-9 歳 ) 0 年 の 年 収 c. 市 選 挙 での 投 票 結 果 d. サイコロを 投 げた 時 に 出 る e. 富 湾 深 海 のホタルイカの 卵 の 数 f. B 社 が 作 る 液 晶 テレビの 性 能 状 態 ( 初 期 不 良 があるか どうか) g. 世 紀 の C 国 で の 性 が 涯 に 産 む 供 の 数 7
標 本 (sample) と 標 本 の 大 きさ (sample size) 標 本 : 集 団 の 部 分 だけを 何 らかの 法 ( 実 験, 調 査, 観 察 など)で 観 測 し た 観 測 値 の 集 まり 標 本 抽 出 : 集 団 から 観 測 値 の 部 を 取 り 出 すこと 抽 出 された つ つの 観 測 値 のことを 観 測 データ または 単 に データ ともよぶ 母 集 団 就 業 者 ( 5-9 歳 )の 年 収 標 本 抽 出 観 測 値 or 観 測 データ or データ 標 本 60,09,99,56,80,,86,56,57,05 sample size: n = 0 集 団 から 取 り 出 した 標 本 内 の 観 測 データ の 数 のことを 標 本 の きさ( 標 本 サイズ, sample size) とよぶ. 標 本 数 とはよばな い! 記 号 n で 標 本 の きさを 表 す 8
例. 標 本 抽 出 (sampling)による 調 査 家 計 調 査 ( 総 務 省 ) 家 計 の 収 と 出 に 関 する 調 査 家 計 簿 的 な 統 計 本 全 体 の 世 帯 員 が 以 上 の 世 帯 数 は,00 万 ( 単 世 帯 を 含 めると,600 万 ) 家 計 調 査 で 標 本 抽 出 された 以 上 の 世 帯 数 ( 標 本 サイズ) は8,000 全 体 の 0.0% だけを 利 している. 労 働 調 査 ( 総 務 省 ) 就 業 状 態 についての 調 査 標 本 抽 出 される 世 帯 数 ( 標 本 サイズ)は 約 万 世 帯 (0 万 ) 00 年 の 失 業 者 数 は 万, 就 業 者 数 は657 万 9
標 本 の 数 と 標 本 の 大 きさ () 集 団 就 業 者 ( 5-9 歳 )の 年 収 標 本 抽 出 一 つの 標 本 = 観 測 値 0 個 の 塊 標 本 (a) 60, 09, 99, 56, 80,, 86, 56, 57, 05 標 本 (b) 5, 666, 8, 56, 65, 8, 6, 7, 08, 7 標 本 (c) 5,, 75, 0, 86, 06, 9, 76, 56, 8 標 本 の 大 きさ( 標 本 サイズ): n = 0 標 本 の 数 = 0 個 の 観 測 値 からなる 標 本 がセットある 状 態 注 意 : 標 本 抽 出 のたびに 異 なる 観 測 値 が 得 られる 0
標 本 の 数 と 標 本 の 大 きさ () 母 集 団 サイコロを 投 げたときに 出 る 目 標 本 抽 出 標 本 5 6 6 5 標 本 65 6 6 標 本 5 6 標 本 56 6 6 5 標 本 の 大 きさ ( 標 本 サイズ) n = 標 本 の 数 (セット)
観 測 データ 表 就 業 者 の 年 収 標 本 (a)を 例 に 観 測 データのまとめ 方 を 考 える 観 測 データ つ つに 観 測 番 号 をつける 任 意 の 観 測 番 号 を i という 記 号 で 表 す. 観 測 データ 表 標 本 サイズが n = 0 のとき i =,,,0 第 i 番 の 観 測 データを i という 記 号 で 表 す. 観 測 番 号 順 に 観 測 データを 並 べた 表 を 観 測 データ 表 とよぶ. 例 : 記 号 と 値 の 対 応 60 09
観 測 データ 定 義 サンプルサイズ n の 観 測 データの 塊,,, i n データの 塊 を { } で 括 って 表 わす は 省 略 の 記 号 例. 7,,,, 0 i
標 本 平 均 (Sample Mean) () 定 義 標 本 平 均 : 観 測 データ i の 平 均 n n :エックス バーと 読 む,, 5, 6 例.n, i のとき 5 6 6
標 本 平 均 (Sample Mean) () 標 本 平 均 は 左 右 のバランスがちょうど 取 れる 場 所 にある 標 本 平 均 5 6-0 6 8 0 0 6 7-0 6 8 0 Y 0-0 6 8 0 p.7 図.8 Z 5
平 均 周 りの 偏 差 () 各 データと 平 均 との 距 離 を 合 計 するとちょうど0になる. 各 データ と 平 均 との 距 離 を 平 均 まわりの 偏 差 とよぶ. deviation 偏 差 Z Z Z Z Z Z Z Z 0 0 9 9 0 Z 合 計 するとちょうど 0 になっている 6
平 均 周 りの 偏 差 () 偏 差 の 合 計 は 必 ずゼロになる n 個 の 観 測 データ:,,, を 標 本 平 均 とするとき, 必 ず が 成 り 立 つ. i n n 0 について 見 方 を 変 えると a a n a 0 のとき, 必 ずa 各 データからa という 値 を 引 いたときの 合 計 が0ならば, aの 値 は 標 本 平 均 に 等 しい. 7
練 習 問 題 () 手 計 算 6,,, の 偏 差 の 合 計 が になることを 確 認 しなさい. 観 測 データ 0 i 8
9 自 由 度? のとき, 以 下 の はどのような 値 か? つの 偏 差 のうちつまでわかっていれば, 残 り 一 つは 自 動 的 に 求 められる. 残 りつは 自 由 に 任 意 の 値 をとることができない( 情 報 として 必 要 ない). つのうちつは 任 意 の 値 をとることができる. ( n = のとき 自 由 度 はである)?? 5 88
練 習 問 題 () 手 計 算 [ ]. n 5の 観 測 データ bの 値 を 求 めなさい i 5 について 以 下 のことが わかっている b [ ]. n の 観 測 データ cの 値 を 求 めなさい Y i について 以 下 のことが わかっている Y Y Y Y Y Y c 0
データの ばらつき を 示 す 特 性 値 (pp.8-5) 偏 差 乗 和 (Sum of Squares) S xx n 分 散 (Variance): 偏 差 乗 和 を 由 度 で 割 った 値 s x S xx n 添 え 字 の x を 省 略 して s と 書 く 場 合 もある 標 準 偏 差 (Standard Deviation): 分 散 の 平 根 s x s x 添 え 字 の x を 省 略 して sと 書 く 場 合 もある 変 動 係 数 (Coefficient of Variation): 標 準 偏 差 を 平 均 で 割 った 値 CV s x
偏 差 乗 和 S xx 偏 差 を 合 計 すると 必 ず0になってしまう. 0 n どんなデータでも 必 ず 成 するので, 合 計 するだけでは 意 味 がない そこで, 偏 差 を 乗 してから 合 計 したものを 散 らばり 具 合 の 指 標 として 使 う( 乗 すると 符 号 は?) これを 偏 差 乗 和 とよぶ( 記 号 は S xx ) 定 義 n個 の 観 測 データ: を 標 本 平 均 とするとき 偏 差 乗 和 : S xx,, i, n について n 記 号 : 大 文 字 の S に 下 付 きの 添 え 字 xx
例. 偏 差 乗 和 の 計 算 0 : S xx 乗 和 偏 差
重 要 偏 差 乗 和 の 注 意 点 合 計 してから 乗 してはいけない 偏 差 の 合 計 は 0 であることに 注 意 偏 差 を 合 計 してから 乗 しても 0 になる. 和 の 乗 と 乗 の 和 は 意 味 が 異 なる 点 に 注 意 0 0 ) ( 乗 偏 差 の 和 の 0 ) ( S xx 乗 和 偏 差
練 習 問 題 (): 偏 差 乗 和 S xx を 計 算 しなさい. 5
標 本 分 散 s x,, について を 標 本 平 均 とするとき 定 義 n 個 の 観 測 データ: i, n 分 散 : s x S xx n 小 文 字 の s を 使 う n 分 散 = 偏 差 乗 和 を 自 由 度 で 割 った 値 n 偏 差 乗 和 を 由 度 n で 割 った 値 を 標 本 分 散 とよぶ. n を 由 度 とよぶ. なぜ 標 本 サイズ n ではなく, 由 度 n で 割 るのか. n 個 の 偏 差 のうち, 必 要 な 情 報 は n 個 で 分 だから 分 散 = 必 要 な 情 報 個 当 たり の 散 らばり 具 合 を 測 っている 実 は n で 割 った が, 集 団 分 散 の 良 い 推 定 になっている (nで 割 ると, 集 団 分 散 を 過 少 に 推 定 してしまうことが 知 られている) 6
母 集 団 と 標 本 の 対 応 関 係 : 標 本 分 散 は 母 集 団 の 分 散 を 予 測 するために 用 いられるもの 集 団 [ 観 察 の 対 象 ] 富 市 の0 歳 既 婚 性 の 供 の 数 有 限 集 団 700 母 集 団 の 平 均 :.9 人 母 集 団 の 分 散 :.09 標 本 抽 出 n =5 5 0 0 標 本 平 均 :.0 人 標 本 分 散 :.9 s x 標 本 のヒストグラム Sxx n 度 数 00 00 600 度 数 0 6 8 0 5 子 供 の 数 0 5 子 供 の 数 7
8 例. 標 本 分 散 の 計 算 0 n s x 分 散 偏 差 乗 和 を 計 算 してから 標 本 分 散 を 計 算 する
標 本 標 準 偏 差 定 義 n 個 の 観 測 データ: を 標 本 平 均, s x,, を 標 本 分 散 とするとき i, n について 標 準 偏 差 :s なぜ, 平 根 なのか? s 小 文 字 の s を 使 う 分 散 は 計 算 の 過 程 で 乗 しているので,データの 単 位 も 乗 されてしまう. 単 位 を 元 に 戻 すために 平 根 をとる 例. 例. T 学 K 済 学 部 年 男 07 名 の 分 散 : s x 標 準 偏 差 : s 0 x 0.86 平 均 : 分 散 : s x 標 準 偏 差 : s 7.57.9 x cm 単 位 はつかない.9 5.68 cm 9
Excel 関 数 平 均 average 関 数 (mean) 偏 差 乗 和 devsq 関 数 (sum of squared deviation) 標 本 分 散 var 関 数 (variance) 標 本 標 準 偏 差 stdev 関 数 (standard deviation) 例 題 8 (p.88) 演 習 問 題 問 { i } = {6, 6, 8, 0, 5} 0
まとめ,, について n 個 の 観 測 データ, i n