. 今 日 の 目 標 基 礎 経 済 統 計 統 計 の 初 歩 様 々な 代 表 値 を 理 解 する データの 分 布, 散 らばりを 把 握 するための データ 整 理 法 を 理 解 する 度 数 分 布,ヒストグラム. データの 中 心 の 代 表 値. 平 均 平 均 の 例 四 月 の 統 一 地 方 選 で 当 選 した 府 議 ( 百 十 二 人 )と 大 阪 市 議 ( 八 十 九 人 )の 資 産 が 七 日 公 開 された 一 九 九 六 年 施 行 の 資 産 公 開 条 例 に 基 づき 土 地 建 物 の 面 積 や 課 税 標 準 額 預 貯 金 などを 報 告 した 有 価 証 券 を 除 いた 土 地 建 物 の 課 税 標 準 額 と 預 貯 金 金 銭 信 託 を 合 計 した 平 均 額 は 府 議 が 二 千 八 百 五 十 二 万 円 市 議 が 四 千 百 九 十 万 円 一 億 円 を 超 えた 府 議 は 九 人 市 議 は 八 人 いた ( 年 月 8 日 読 売 大 阪 版 ). 中 央 値 中 央 値 の 例 [ 東 京 年 9 月 日 ] 主 要 エコノミスト 欧 州 中 銀 の 年 内 再 利 下 げを 予 想 ~ロイター 調 査 次 回 会 合 では 据 え 置 き 観 測 が 大 半 ~ ロイターが 主 要 エコノミスト6 人 に 実 施 した 調 査 によると 欧 州 中 央 銀 行 (ECB: Euopea Cetal Bak) が 今 年 後 半 に 再 度 の 金 利 引 き 下 げを 実 施 するとの 予 想 が 半 数 以 上 に 達 しました しかし 経 済 の 先 行 きに 楽 観 的 な 見 方 が 出 ているた め 大 幅 な 引 き 下 げの 可 能 性 は 縮 小 しています... 一 方 調 査 に 答 えたエコノ ミストのうち 人 は 世 界 の 株 価 が 上 昇 し 米 国 経 済 の 回 復 を 示 すデータが 増 え ていることを 踏 まえ 金 利 がすでに%で 底 を 打 ったと 予 測 しています 年 末 時 点 の 金 利 水 準 については.%から.%まで 予 測 の 幅 があり 中 央 値 は.7%でした 年 末 に 関 しては.7%から.%に 分 布 しており 中 央 値 は.%となっています 中 央 値 データを 大 きさ 順 に 並 べて 真 ん 中 をとる.しかし,データ 数 が 偶 数 の 場 合 は, 真 ん 中 のデータつの 平 均. 中 位 数,メディアンとも 呼 ばれる. なぜ 例 では 平 均 ではなく 中 央 値 をとったのか? 平 均 の 場 合, 極 端 な 予 測 のエコノミストの 影 響 を 受 けてしまう.しかし, 中 央 値 の 場 合, 極 端 な 予 測 には 影 響 を 受 けない... 最 頻 値 最 頻 値 の 例 PC Watch 読 者 環 境 調 査 年 7 月 今 回 の 調 査 では CPUクロックの 上 昇 がめざましく 初 めて ~.GHz が 最 頻 値 となった また HDD メモリの 大 容 量 化 傾 向 も 続 いている 周 辺 機 器 では マルチフォーマット 対 応 の 書 き 込 み/ 書 き 換 えDVDドライブと 7インチLCDディスプレイが 大 幅 に 伸 びている 接 続 環 境 はADSL/CATVの 普 及 が 一 服 したが FTTHは 引 き 続 きポイントを 伸 ばしている 今 回 の 最 頻 値 所 有 台 数 台 自 作 のデスクトップPC/AT 互 換 機 OS:Wdows XP Pofessoal CPU:Petum クロック:~.GHz メモリ:~MB HDD:~GB ディスプレイ:7インチCRT 解 像 度 ~,8,ドット インターネット 接 続 :DSL(フレッツADSL 除 く) 家 庭 内 LAN: 構 築 している (http://pc.watch.mpess.co.jp/docs//86/eq.htm) 最 頻 値 データのなかでもっともよく 現 れた 値. 極 端 な 値 の 影 響 を 受 けづらい 数 値 化 されていないデータでも 得 ることができる.. 平 均, 中 央 値, 最 頻 値 平 均 極 端 な 値 (はずれ 値, 異 常 値 )の 影 響 大 計 算 が 容 易 分 散 との 関 わり 中 央 値 はずれ 値 ( 異 常 値 )の 影 響 を 受 けない 一 度 順 序 で 並 べなければいけない. 多 数 のデータの 場 合 大 変 平 均 偏 差 との 関 わり 最 頻 値 はずれ 値 ( 異 常 値 )の 影 響 を 受 けない 最 頻 データ 以 外 を 完 全 に 無 視 している つの 関 係 ヒストグラムの 山 がつのとき, 平 均 - 最 頻 値 ( 平 均 - 中 央 値 )<ピア ソンの 式 >がほとんどの 場 合 成 り 立 つ. ( ),つまり, 中 央 値 は 平 均 と 最 頻 値 の 間 を: に 内 分 する.
. 散 らばりの 代 表 値. 分 散, 標 準 偏 差, 範 囲 標 本 分 散 ( 標 本 が 調 査 対 象 の 一 部 の 場 合 ) ( ) 分 散 ( 標 本 が 調 査 対 象 と 一 致 する 場 合 ) ( ) ( 標 本 ) 標 準 偏 差 ( ) 分 散, 標 準 偏 差 になると 経 済 ニュースにさえ も 出 てこない.これでいいんだろうか? 範 囲 最 大 値 ー 最 小 値..チェビシェフの 不 等 式 標 準 偏 差 からデータの 分 布 がある 程 度 分 か る チェビシェフの 不 等 式 (どんなデータにも 当 て はまる) k を 満 たす データの 割 合 は 全 標 本 数 の / k 以 下 である. 例 えば 標 本 平 均 から 標 準 偏 差 の 倍 以 上 離 れて いるデータは 全 体 の/ 以 下 である. 偏 差 値 7 以 上 は 絶 対 / 以 下 しかいない..その 他 散 らばりの 代 表 値 四 分 位 点 (しぶんいてん) 第 四 分 位 点 順 序 どおりに 並 べ 替 え,データを 分 割 する.その 分 割 点 のうち 最 も 小 さい 値.もし,その 分 割 点 にデータがなければ, 補 間 近 似 する. 具 体 的 には( ) の 整 数 部 番 目 のデータとその 次 の データの 半 分,または,( ) の 小 数 部 を 重 みにした 加 重 平 均 第 四 分 位 点 中 央 値 と 同 じ 第 四 分 位 点 順 序 どおりに 並 べ 替 え,データを 分 割 する.その 分 割 点 のうち 最 も 大 きい 値.もし,その 分 割 点 にデータがなければ, 補 間 近 似 四 分 位 範 囲 第 四 分 位 点 - 第 四 分 位 点 分 位 点 データを 分 割 パーセント 点 ( 百 分 位 点 ) データを 百 分 割. 例 の 解 説 例. 教 科 書 参 照 例. 中 間 階 層 はどこの 地 域 でも 似 たり 寄 ったりの 収 入 である. 例. ピアソンの 式 から 各 地 域 の 貯 蓄 額 の 最 頻 値 の 近 似 値 を 求 めてみよう. 例 北 海 道 ( ) 7 (7 698) 8. 度 数 分 布 表 とヒストグラム. 作 成 法 作 成 法 は 教 科 書 参 照 ヒストグラムの 高 さは 度 数 を 表 す. 階 級 数 の 決 め 方 スタージェスの 公 式.log は 標 本 数 (データ 数 ) 例 データ 数 が, 範 囲 が~7までのデータがあるとする. スタージェスの 公 式 から 階 級 数 は.log. 7.6 階 級 幅 範 囲 / 階 級 数 7., 従 って, 階 級 幅 はか. 幅 を 選 ぶと 階 級 の 下 限 は,,,,,,で6 個 の 階 級 幅 を 選 ぶと 階 級 の 下 限 は,,,,,の 個 図.7の 解 説 平 均 - 最 頻 値 ( 平 均 - 中 央 値 )<ピアソンの 式 >が 成 立 してい ない.このことは, 貯 蓄 の 分 布 のヒストグラムの 山 がつではないなど, かなり 変 形 された 分 布 であることを 示 している. 階 級 分 割 度 数 分 布 表 の 作 り 方 p. 参 照 階 級 値 は 階 級 の 中 点 データのカウント 度 数 の 計 算 各 階 級 に 属 するデータ 数 をカウントする 度 数 分 布 の 記 入 累 積 度 数 の 計 算 度 数 累 積 度 数 相 対 度 数 最 初 の 階 級 だけ 次 の 階 級 から 度 数 /データ 数 累 積 相 対 度 数 累 積 度 数 /データ 数
- - - - - - - -. 度 数 分 布 表 による 代 表 値 の 計 算 考 え 方 階 級 値 のところにデータが 度 数 個 集 まっている 平 均 ( ) ( ) ただし, 階 級 内 平 均 が 与 えられている 場 合 は 階 級 値 の 代 わりにそれを 使 う 標 本 分 散 {( ) }. 度 数 分 布 表 とパーセント 点 算 出.. 算 出 法 pパーセント 点 m 番 目 の 階 級 で 初 めて 累 積 相 対 度 数 がp/を 超 えると する. この 授 業 では m 本 当 は( 教 科 書 の 決 め 方 でもある) m p ( m ) m 中 央 値 は% 点, 第 四 分 位 点 は% 点.. 本 当 の 式 の 説 明 ある 階 級 に 属 すデータが 階 級 内 に 均 等 分 布 m- 番 目 の 累 積 相 対 度 数 は,m 番 目 はs,s-はm 番 目 の 階 級 の 相 対 度 数 (データは 個 あると 仮 定 ) p p-:s-pに 内 分 s m p / ( m ) m. 度 数 分 布 表 による 最 頻 値 算 出 この 授 業 では 最 も 度 数 の 高 かった 階 級 の 階 級 値 とする 本 当 は 二 つの 方 法 がある m. データの 散 らばりとヒストグラム 散 らばりが 小 さいデータのヒストグラムと 大 きいデータのヒス トグラム 比 較 のためには 高 さは 本 当 は 相 対 度 数, 階 級 幅 は 一 致 させる ヒストグラム ヒストグラム ヒストグラムの 作 り 方 度 数 分 布 表 を 棒 グラフ ヒストグラム 度 数 分 布 表 を 折 れ 線 グラフ 度 数 多 角 形 累 積 度 数 表 を 棒 グラフ 累 積 ヒストグラム データ 区 間 データ 区 間 今 後 はデータの 散 らばりをヒストグラムの 形 状 で 表 す
. 発 展 したデータの 代 表 値 () 刈 り 込 み 平 均 最 大 値, 最 小 値,およびその 周 辺 の 値 を 平 均 値 の 算 出 からはずす 加 重 平 均 w w, w 平 均 は 重 み w / となっている 加 重 平 均 刈 り 込 み 平 均 は 最 大 値, 最 小 値,およびその 周 辺 の 値 に 関 する 重 みをにした 加 重 平 均. 発 展 したデータの 代 表 値 () 幾 何 平 均 成 長 率 などその 効 果 が 積 によって 累 積 していく 指 標 の 平 均 に 利 用 考 え 方 年 目 が% 成 長, 年 目 が% 成 長. 年 あたりの 平 均 成 長 率 は?.. a となるaを 求 める 問 題 になる a...9.9% 注 意 :()/%%ではない ( ) 容 易 に 計 算 する 方 法 : log log log log( ) log( ) 度 数 分 布 表 を 使 用 する 場 合 は,log 値 の 平 均 を 出 す { }. 季 節 調 整.. 季 節 変 動 と 季 節 調 整 季 節 変 動 鉱 工 業 生 産 の 場 合 月 8 月, 月 に 落 ち 込 む 休 みなどのため これでは, 景 気 の 指 標 と して 鉱 工 業 生 産 指 数 を 利 用 することはできない. 季 節 調 整 季 節 変 動 を 取 り 除 く.... 9. 9. 8. 8. 9 8 鉱 工 業 生 産 指 数 998 998 9989 999 999 9999 9 9 9.... 9. 9. 8. 8. 7 6 鉱 工 業 生 産 指 数 998 999.. 季 節 調 整 と 移 動 平 均 季 節 調 整 単 純 移 動 平 均 あるデータと 前 後 同 一 数 の データの 平 均 例 えば 前 後 期 のデータも 考 えて 平 均 をとる 加 重 移 動 平 均 単 純 平 均 だと 前 後 のデータ も 同 一 の 比 重 で 考 慮 現 在 のデータに 比 重 をおく 単 純 平 均 ではなく 加 重 平 均 をとる 加 重 の 仕 方 には 色 々ある. ( 教 科 書 は 一 例 ) これらは 単 純 な 方 法 で 初 歩 的 分 析 に 適 する.... 9. 9. 8. 8. 998 9987 998 999 9997 999 7 7 7 単 純 移 動 平 均 加 重 移 動 平 均 鉱 工 業 生 産 指 数. 変 動 係 数 散 らばりを 比 較 する 平 均 が 同 じくらい 分 散 や 範 囲, 四 分 位 範 囲 を 比 較 すればよい 平 均 が 異 なるデータの 比 較 平 均 で 標 準 化 した 標 準 偏 差 変 動 係 数 四 分 位 分 散 係 数 四 分 位 範 囲 の 半 分 を 中 央 値 で 割 ったもの» 四 分 位 の 半 分 は 片 側 の 変 動 幅 を 示 す 十 分 位 分 散 係 数 変 数 データの 整 理. 散 布 図 変 数 の 関 係 を 視 覚 的 に 捉 える 散 布 図 データ 値 の 組 み 合 わせを 座 標 と 考 えて,データ 毎 に 点 をプ ロットする.( 単 位 億 円 ) 横 軸 :GDP, 縦 軸 : 民 間 消 費 6
. 標 本 相 関 係 数 (). 標 本 相 関 係 数 () 変 数 の 関 係 の 深 さを 数 値 化 する. 共 分 散 ( ) ( y y) ( ) 分 散 を 計 算 するのにで 割 ったか-で 割 ったかによってきめる 共 分 散 の 性 質 の 値 がその 平 均 を 上 回 るときにはyもその 平 均 を 上 回 る 様 な 場 合, 共 分 散 の 式 の 分 子 は 正 になる( 右 上 がりの 傾 向 ) の 値 がその 平 均 を 上 回 るときにはyはその 平 均 を 下 回 る 様 な 場 合, 共 分 散 の 式 の 分 子 は 負 になる( 右 下 がりの 傾 向 ) の 値 とyの 値 に 関 係 がない 場 合 は,になる( 無 相 関 ) S y 共 分 散 の 困 った 点 右 の 上 下 の 図 はともに とyに 線 形 の 関 係 がある 場 合 の 散 布 図 しかし, 上 の 場 合 の 共 分 散 は/で, 下 は つまり, 共 分 散 の 絶 対 値 が 相 関 の 強 さを 表 し ていない. やyの 散 らばり 方 が 大 きい 方 が 共 分 散 は 大 き くなってしまう... - -. - -... -. - -. -.. - -. - -... -. - -. - 7. 標 本 相 関 係 数 () 共 分 散 をとyの 標 準 偏 差 で 標 準 化 なぜ 分 散 で 標 準 化 しないのか 単 位 をそろえる. 分 子 は, 乗 の 単 位 分 母 も 乗 の 単 位 でないと 困 る.すると,,yともに 乗 の 単 位 に ならなければならない. 散 らばりを 表 す 乗 の 単 位 の 代 表 例 が 標 準 偏 差 標 本 相 関 係 数 Sy y S S 標 本 共 分 散 をで 割 って 求 めたら, 標 本 分 散 ( 標 準 偏 差 )もで 割 る N-で 割 ったら, 分 母 氏 で 統 一 すること,そうしないと 相 関 係 数 が を 超 える 場 合 もある y. 標 本 相 関 係 数 () 計 算 例 () {(,y)}{(,),(,),(-,),(,)}の 場 合 平 均 の 計 算 { ( ) } y ( ) 分 散 の 計 算 S S {( ) ( ) ( ) ( ) } 6. {( ) ( ) ( ) ( ) }. YY 裏 スライド() なんで 相 関 係 数 の 式 なの? データの 平 均 からの 偏 差 ベクトル * (,, L, ) yデータの 平 均 からの 偏 差 ベクトル * y ( y y, y y, L, y) の 偏 差 ベクトルとyの 偏 差 ベクトルの 内 積 * * y y y ( )( ) の 偏 差 ベクトルの 長 さ(yも 同 様 ) * L ( ) ( ) ( ) 裏 スライド() の 偏 差 ベクトルとyの 偏 差 ベクトルとのなす 角 をθとすると * * ( )( y y) y SXY cos θ * * y SXSY ( ) ( y y) つまり, 相 関 係 数 は 相 関 の 強 さをの 平 均 か らの 偏 差 とyの 平 均 からの 偏 差 のなす 角 の cos(cosθ)で 計 っていたのだ. y
裏 スライド() 裏 スライド() cosθって? * ŷ を 右 図 の 緑 のベクトルとする * * と ŷ βˆ となるβが 存 在 する. e を 右 図 の 青 のベクトルとする と, * * y ŷ e であり, cos ŷ * θ e つまり,yの 偏 差 をの 偏 差 の 方 向 とそれに 直 交 する( 無 相 関 ) 方 向 に 分 解 したときyの 偏 差 の 長 さとの 偏 差 方 向 の 分 解 成 分 の 長 さの 比 がcosθである.つ まり,yの 偏 差 のどれだけが 偏 差 方 向 の 成 分 で 説 明 できるか を 示 す y * θ * ˆ * ŷ β e * とおくと ˆ * e ( e y β e,e, L, e ) となるが, ベクトルの 成 分 表 示 で 書 くと ( y y, L, y y) βˆ (, L, ) ( e, L, e ) となる.ベクトルの 同 一 性 の 定 義 から ˆ e y y β( ) e となる.これは,yの 偏 差 を(の 偏 差 の 定 数 倍 と 無 相 関 な 誤 差 )と 表 したということ.さらに,ここ から, α ˆ βˆ y とおくと y ˆ β ( βˆ y) e y βˆ α ˆ e * ( ) (,.e. ) 裏 スライド() だから,cosθはyをの 一 次 式 とXと 無 相 関 な 成 分 に 分 解 したときにyの 偏 差 のうちどれだ けがの 一 次 式 の 偏 差 で 表 せるかと 言 うこと 三 平 方 の 定 理 y * e * * y ŷ e ( y y) β ˆ ( ) e θ * ˆ * ŷ β y cos θ y * 裏 スライド(6) * * βˆ 以 外 のβも 考 えて y β u とする,つまり, 成 分 ごとに 考 えて, y とすると, y β( ) u u e となる.すなわち, y * e u u { ( y y) β( ) } θ * * ˆ * ŷ β e β { ( y y) βˆ ( ) } * u をyの 偏 差 をの 偏 差 の 定 数 倍 で 表 したとき の 誤 差 と 考 えると,その 誤 差 の 二 乗 和 が 最 小 なのは β β ˆ のとき.( 最 小 二 乗 法 ). 標 本 相 関 係 数 (). 標 本 相 関 係 数 (6) 計 算 例 () 共 分 散 の 計 算 ( )( ) ( )( ) ( )( ) ( )( ) S XY /. 相 関 係 数 の 計 算 SXY XY S S XX YY...8... 散 布 図 散 布 図 6 - - Y 線 形 (Y) 6
7. 標 本 相 関 係 数 (7) 標 本 相 関 係 数 の 性 質 符 号 は 相 関 の 方 向 を 表 す が 平 均 より 大 きかったらyも 平 均 より 大 きい 傾 向 符 号 は 正, 正 の 相 関 を 持 つと 呼 ぶ が 平 均 より 大 きかったらyは 平 均 より 小 さい 傾 向 符 号 は 負, 正 の 相 関 を 持 つと 呼 ぶ 絶 対 値 は 相 関 の 強 さ, 関 係 の 深 さを 表 す 大 きいほど 関 係 は 深 い ~の 間 ( 絶 対 値 がの 場 合 はyはの 一 次 式 ) 標 本 相 関 係 数 はー 以 上 以 下 例 題 {(,y)}{(,),(,-),(,-)}のとき,とyの 標 本 相 関 係 数 を 求 めよ. yがの 次 式 なので 標 本 相 関 係 数 の 絶 対 値 は yとが 負 の 相 関 を 示 すので, 標 本 相 関 係 数 の 符 タイトル 号 は 負 よって- - - -6-8 - - - y 線 形 (y) 7. 標 本 相 関 係 数 (8) GDPと 消 費 の 例 では 標 本 相 関 係 数 は.999 相 関 係 数 の 限 界 相 関 係 数 は 線 形 関 係 が 完 全 に 成 立 している 場 合 を 基 準 にしている< 相 関 係 数 を 計 算 する 前 に 散 布 図 を 書 こう> 非 線 形 関 係, 例 えば, 次 式 の 関 係 などは 表 せない. 教 科 書 の 例 では, 相 関 係 数 がなのに 非 線 形 の 関 係 がある 見 せかけの 相 関 二 つの 変 数 とも, 第 の 変 数 と 相 関 を 持 っていて,その 結 果, 両 変 数 に 関 係 があるように 見 える 場 合 がある. 例 えば, 時 系 列 データの 場 合 に, 二 つの 変 数 が 時 間 とともに 増 加, または, 減 少 している 場 合 7. 標 本 偏 相 関 係 数 第 の 変 数 と 両 方 とも 相 関 を 持 っていて,そのためにつの 変 数 の 相 関 が 強 いように 見 える 場 合 の 対 策 第 の 変 数 (zとする)の 影 響 を 取 り 除 いたうえで, 二 つの 変 数 の 相 関 を 調 べる. 標 本 偏 相 関 係 数 y zzy y z ( )( ) z zy 子 のつく 名 前 は 頭 がいい 女 子 高 校 の 子 の 付 く 名 前 の 生 徒 の 比 率 とその 高 校 の 偏 差 値 に 相 関 しかし, 第 の 変 数 と 関 係 があるだけではないか? 第 の 変 数 候 補,その 家 庭 の 所 得, 親 の 資 産, 皇 室 への 関 心 度 このような 変 数 との 相 関 が 容 易 には 調 べられないのをいいことに,さも 直 接 的 な 関 係 があるように 見 せているのでは? 分 割 表 は 教 科 書 参 照 のこと 7