理科教科内容指導論 I : 物理分野 物理現象の定量的把握第 4 回
( 実験 ) データの眺め ~ 統計学の基礎続き 統計のはなし 基礎 応 娯楽 (Best selected business books) 村平 科技連出版社 1836 円
前回の復習と今回以降の 標 東京 学 善 郎 Web サイトより データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布 ( ヒストグラム ) が分かれば代表値や散らばりは計算できる à 集団の分布 のパターンを理解することが重要 集団の分布 のパターンの重要な つである 正規分布 を理解
前回の復習と今回以降の 標 データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布 ( ヒストグラム ) が分かれば代表値や散らばりは計算できる à 集団の分布 のパターンを理解することが重要 集団の分布 のパターンの重要な つである 正規分布 を理解する
集団の分布のパターンの表し ヒストグラムを使えば良い à ヒストグラムの 積は その値の範囲に属するデータの数と 例する この 積が 60~80 点の 数に 例 この考え を連続的な数にも拡張したものを確率密度分布と呼ぶ à 積がその値の範囲に属するデータの割合と 例する 割合 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 本 成 男性の の分布 0 150 155 160 165 170 175 180 185 190 (cm) この 積が 175~180 cm の の割合に 例
様々な分布 集団の分布 à 割合の分布 à 確率の分布 ( 確率分布 ) 分布のパターンは様々 指数分布 ワイブル分布 確率 ( 割合 ) 事故と事故の間の時間の分布 確率 ( 割合 ) 様々な部品の故障までの時間の分布 値 値 http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/statdist.html 様分布 パレート分布 コーシー分布 超幾何分布 etc... 興味があれば統計学の教科書 ( 統計学 など ) を読んでみいて下さい 案外 いです
正規分布 無限に広がる 釣鐘状の左右対称な分布 最頻値と中間値と平均値が 致した素直な分布 々な物がこの分布に従うことが知られている 物の 体重 試験の点数 ( 厳密には違う )etc. 測定の誤差 ( 誤差分布 ) 平均値の分布... 中 極限定理 数の法則正規分布 確率 ( 割合 ) 値
正規分布 平均 μ ( ミュー ) と標準偏差 σ ( シグマ ) の値を決めると分布の形が決まる 平均 μ 標準偏差 σ の正規分布を N(μ, σ 2 ) と表記する 確率 ( 割合 ) f 平均 μ f (x) = 1 2πσ exp " $ (x µ) 2 # 2σ 2 標準偏差 σ 2 % ' & 値 x
正規分布 平均 μ ( ミュー ) と標準偏差 σ ( シグマ ) の値を決めると分布の形が決まる 平均 μ 標準偏差 σ の正規分布を N(μ, σ 2 ) と表記する 確率 ( 割合 ) f 0.4 0.3 0.2 0.1 N(0,1) N(0,2 2 ) N(0,3 2 ) f (x) = N(3,2 2 ) 1 2πσ exp " $ (x µ) 2 # 2σ 2 2 % ' & 0-10 -5 0 5 10 値 x
正規分布の特徴 平均 μ から標準偏差 σ を単位としてある幅をとると その範囲の 積がどんな正規分布 N(μ,σ 2 ) の場合にも等しい値になる 0.5 μ=0 確率 ( 割合 ) f 0.4 0.3 0.2 0.1 N (0,1 2 ) 68.3 % -1σ +1σ=1 95.5 % -2σ +2σ=2 0-10 -8-6 -4-2 0 2 4 6 8 10 値 x
正規分布の特徴 平均 μ から標準偏差 σ を単位としてある幅をとると その範囲の 積がどんな正規分布 N(μ,σ 2 ) の場合にも等しい値になる 0.5 確率 ( 割合 ) f 0.4 0.3 0.2 0.1 μ=0 N (0,2 2 ) 68.3 % -1σ +1σ=2 95.5 % -2σ +2σ=4 0-10 -8-6 -4-2 0 2 4 6 8 10 値 x
正規分布の特徴 平均 μ から標準偏差 σ を単位としてある幅をとると その範囲の 積がどんな正規分布 N(μ,σ 2 ) の場合にも等しい値になる 0.5 確率 ( 割合 ) f 0.4 0.3 0.2 0.1 μ=3 N (3,2 2 ) 68.3 % -1σ +1σ=2 95.5 % -2σ +2σ=4 0-10 -8-6 -4-2 0 2 4 6 8 10 値 x
正規分布表 ( 上側確率 ) 他に表の流儀は幾つかあります EXCEL でも 1-NORMSDIST(z) で計算可能 例えば μ+1.24σ 以上が全体に占める割合は 10.7% μ https://staff.aist.go.jp/t.ihara/normsdist.html zσ
( 例題 ) 松坂 輔と 翔平 松坂 は 本 男性の中ではどれくらい背が い か? 183.0 cm 彼らより背の い 本 男性は全体の何 % いるか? 本 男性の の分布は正規分布だと仮定して計算してみる H25 年度 30~34 歳 本 男性 平均 μ 172.5 cm 標準偏差 σ 5.5 cm ( 総務省統計局 https://www.estat.go.jp/sg1/estat/gl02020101.domethod=xlsdownload&fileid =000007744784&releaseCount=2) 193.0 cm Wikipedia
( 例題 ) 松坂 輔と 翔平 H25 年度 30~34 歳 本 男性 平均 μ 172.5 cm 標準偏差 σ 5.5 cm ( 総務省統計局 http://www.estat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 183.0 cm 松坂 輔 平均からズレ 183.0-172.5=10.5 cm 標準偏差でこのズレを表すと 10.5/5.5 = 1.91 σ 1.91σ 以上が占める割合は 2.81 % 1/(2.81 10-2 )=36 松坂より背の い 本 男性は全体の 2.81 % で 36 に 1 くらい 193.0 cm Wikipedia
( 例題 ) 松坂 輔と 翔平 H25 年度 30~34 歳 本 男性 平均 μ 172.5 cm 標準偏差 σ 5.5 cm ( 総務省統計局 http://www.estat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 183.0 cm 翔平 193.0 cm より背の い 本 男性は全体の % で に 1 くらい Wikipedia
( 例題 ) 松坂 輔と 翔平 H25 年度 30~34 歳 本 男性 平均 μ 172.5 cm 標準偏差 σ 5.5 cm ( 総務省統計局 http://www.estat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 翔平 平均からズレ 193.0-172.5=20.5 cm 標準偏差でこのズレを表すと 20.5/5.5 = 3.73 σ 3.73σ 以上が占める割合は 9.57 10-3 % 1/(9.57 10-5 )=1.04 10 4 より背の い 本 男性は全体の 9.57 10-3 % で 1.04 10 4 に 1 くらい 193.0 cm 183.0 cm Wikipedia
( 例題 ) 東 理 III はどのくらい凄いのか? 受験 の学 ( 得点 ) は正規分布だと仮定する この仮定はあまり正しくないです http://resemom.jp/article/img/2015/01/23/22531/93360.html
標準得点 ( 偏差値 ) 標準得点 " Z i = 50 +10 x i x % $ ' # σ & 平均や標準偏差の異なる集団に属するデータを 集団の中でどの辺りに位置するか で表すことで 互いに 較できるようにする 数 400 350 300 250 200 150 100 50 0 平均 400 点標準偏差 150 点 550 点 0 100 200 300 400 500 600 700 800 900 1000 得点 700 点 平均 600 点標準偏差 100 点 ある模試の得点分布 どちらも標準得点 ( 偏差値 ) は 60
( 例題 ) 東 理 III はどのくらい凄いのか? 受験 の学 ( 得点 ) は正規分布だと仮定する この仮定はあまり正しくないです 偏差値 ( 標準得点 ) は平均 50 標準偏差 10 にした得点 N(50, 10 2 ) の分布 μ=50 σ=10 2016 年度偏差値 74.8 http://daigakujuken-plus.com/nyuushi-hensati-ranking/toudai/rika3rui/ 東 理 III に るには全受験 の上位 % 以上に る必要がある
( 例題 ) 東 理 III はどのくらい凄いのか? 受験 の学 ( 得点 ) は正規分布だと仮定する この仮定はあまり正しくないです 偏差値 ( 標準得点 ) は平均 50 標準偏差 10 にした得点 N(50, 10 2 ) の分布 μ=50 σ=10 2016 年度偏差値 74.8 à 2.48σ http://daigakujuken-plus.com/nyuushi-hensati-ranking/toudai/rika3rui/ 2.48σ 以上の占める割合は 0.657% 東 理 III に るには全受験 の上位 0.657% 以上に る必要がある 希少性 という意味では 186.1 cm (=172.5+2.48 5.5) 以上の男性と同じ
正規分布の加法性 N(μ 1,σ 12 ) の分布の x と N(μ 2,σ 22 ) の分布の y がある時 ax+by の分布は N(aμ 1 +bμ 2, (aσ 1 ) 2 +(bσ 2 ) 2 ) となる ( 正規分布の加法性 ) 本 男性成 の分布 N(172.5 cm, (5.5 cm) 2 ) 本 性成 の分布 N(158.7 cm, (5.3 cm) 2 ) H25 年度 30~34 歳 ( 総務省統計局 http://www.e-stat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 無作為に 本 成 男 2 名を選び出すと その の和の分布は N(172.5+158.7 cm, 5.5 2 +5.3 2 cm 2 ) =N(331.2 cm, 58.3 cm 2 ) =N(331.2 cm, (7.6 cm) 2 ) 平均 μ=331.2 cm 標準偏差 σ=(58.3) 0.5 =7.6 cm
正規分布の加法性 N(μ 1,σ 12 ) の分布の x と N(μ 2,σ 22 ) の分布の y がある時 ax+by の分布は N(aμ 1 +bμ 2, (aσ 1 ) 2 +(bσ 2 ) 2 ) となる ( 正規分布の加法性 ) 確率 ( 割合 ) 0.1 0.08 0.06 0.04 y: 性 N(158.7, 5.3 2 ) x: 男性 N(172.5,5.5 2 ) 確率 ( 割合 ) 0.1 0.08 0.06 0.04 x+y: 任意の男 の の和 N(331.2,7.6 2 ) 0.02 0.02 0 140 150 160 170 180 190 (cm) 0 310 320 330 340 350 (cm)
正規分布の加法性 N(μ 1,σ 12 ) の分布の x と N(μ 2,σ 22 ) の分布の y がある時 ax+by の分布は N(aμ 1 +bμ 2, (aσ 1 ) 2 +(bσ 2 ) 2 ) となる ( 正規分布の加法性 ) 本 男性成 の分布 N(172.5 cm, (5.5 cm) 2 ) 本 性成 の分布 N(158.7 cm, (5.3 cm) 2 ) H25 年度 30~34 歳 ( 総務省統計局 http://www.e-stat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 無作為に 本 成 男 2 名を選ぶと その の差の分布は N( cm, ( cm) 2 ) もし世の中の男 カップルが 差とは無作為に相 を選んでいるとしたら 逆 差カップル ( 性の が い ) は全体の % 差カップル ( 男性の が 30 cm 以上 い ) は全体の %
0.1 0.08 x-y: 任意の男 の の差 ( 男 - ) の分布 確率 ( 割合 ) 0.06 0.04 0.02 0-10 0 10 20 30 40 男性 性の 差 (cm)
0.1 0.08 x-y: 任意の男 の の差 ( 男 - ) の分布 この分布の μ と σ は? 確率 ( 割合 ) 0.06 0.04 逆 差 ( 性の が い ) カップル 差 ( 男 差 30 cm 以上 ) カップル 0.02 0-10 0 10 20 30 40 男性 性の 差 (cm)
正規分布の加法性 N(μ 1,σ 12 ) の分布の x と N(μ 2,σ 22 ) の分布の y がある時 ax+by の分布は N(aμ 1 +bμ 2, (aσ 1 ) 2 +(bσ 2 ) 2 ) となる ( 正規分布の加法性 ) 本 男性成 の分布 N(172.5 cm, (5.5 cm) 2 ) 本 性成 の分布 N(158.7 cm, (5.3 cm) 2 ) H25 年度 30~34 歳 ( 総務省統計局 http://www.e-stat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 無作為に 本 成 男 2 名を選び出すと その の差の分布は N(172.5-158.7 cm, 5.5 2 +(-5.3) 2 cm 2 ) =N(13.8 cm, 58.3 cm 2 ) =N(13.8 cm, (7.6 cm) 2 ) 平均 μ=13.8 cm 標準偏差 σ=(58.3) 0.5 =7.6 cm
正規分布の加法性 N(μ 1,σ 12 ) の分布の x と N(μ 2,σ 22 ) の分布の y がある時 ax+by の分布は N(aμ 1 +bμ 2, (aσ 1 ) 2 +(bσ 2 ) 2 ) となる ( 正規分布の加法性 ) 本 男性成 の分布 N(172.5 cm, (5.5 cm) 2 ) 本 性成 の分布 N(158.7 cm, (5.3 cm) 2 ) H25 年度 30~34 歳 ( 総務省統計局 http://www.e-stat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 確率 ( 割合 ) 0.1 0.08 0.06 0.04 y: 性 N(158.7, 5.3 2 ) x: 男性 N(172.5,5.5 2 ) 0.1 0.08 0.06 0.04 x-y: 任意の男 の の差 N(13.8,7.6 2 ) 0.02 0.02 0 140 150 160 170 180 190 (cm) 0-10 0 10 20 30 40 (cm)
正規分布の加法性 N(μ 1,σ 12 ) の分布の x と N(μ 2,σ 22 ) の分布の y がある時 ax +by の分布は N(aμ 1 +bμ 2, (aσ 1 ) 2 +(bσ 2 ) 2 ) となる ( 正規分布の加法性 ) 本 男性成 の分布 N(172.5 cm, (5.5 cm) 2 ) 本 性成 の分布 N(158.7 cm, (5.3 cm) 2 ) H25 年度 30~34 歳 ( 総務省統計局 http://www.e-stat.go.jp/sg1/estat/xlsdl.do?sinfid=000027237853) 無作為に 本 成 男 2 名を選ぶと その の差の分布は N(13.8 cm, (7.6 cm) 2 ) もし世の中の男 カップルが 差とは無作為に相 を選んでいるとしたら 逆 差カップル ( 性の が い ) は全体の 3.44% (1/29) (0-13.8)/7.6=-1.82σ 差カップル ( 男性の が 30 cm 以上 い ) は全体の 1.66% (1/60) (30-13.8)/7.6=2.13σ
中 極限定理 数の法則 中 極限定理 どんな確率分布であれ たくさんのランダムな数の和の分布は 正規分布に近づく 例 ) サイコロ ( 様分布 ) を 100 回振った和の分布は 正規分布に近づく この定理のため 正規分布は世の中のあちこちに現れる 数の法則 サンプル数を増やしていくと サンプルから計算した平均は真の平均に近づく 例 ) 本 男性 10 から計算した平均 より 1000 から計算した平均 の が 本 男性の真の平均 に近い 当たり前 ただし 正規分布の加法性と中 極限定理が 数の法則の成 を保証している
興味があれば こちらをどうぞ... 統計学 ( 基礎統計学 I) 東京 学教養学部統計学教室東京 学出版 3024 円