2 ( 生物統計学 ) データを大きさの順に並べてデータが奇数個なら中央に位置するデータの値, データが偶数個なら中央に位置する2つのデータの平均である 例 1 11,14,15,17,20 例 2 2,4,8,10,12,16 3 集めたデータの中で, 最も多く現れた値あるいは階級のこと. 名目デ

Similar documents
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F195BD8BCF82C695AA8E B835E82CC977696F12E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - lec_student-chp3_1-representative

Microsoft PowerPoint - 基礎・経済統計6.ppt

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft PowerPoint - stat-2014-[9] pptx

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft PowerPoint ppt

講義「○○○○」

Microsoft PowerPoint - statistics pptx

経営統計学

Microsoft PowerPoint - statistics pptx

EBNと疫学

基礎統計

情報工学概論

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

不偏推定量

Microsoft PowerPoint - データ解析基礎2.ppt

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

統計学の基礎から学ぶ実験計画法ー1

ビジネス統計 統計基礎とエクセル分析 正誤表

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft PowerPoint - Statistics[B]

テレビ講座追加資料1105

Microsoft PowerPoint - 測量学.ppt [互換モード]

モジュール1のまとめ

Microsoft Word - 保健医療統計学112817完成版.docx

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

散布度

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

_KyoukaNaiyou_No.4

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

スライド 1

Microsoft PowerPoint - statistics pptx

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

Medical3

第4回

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft Word - Stattext12.doc

0415

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - e-stat(OLS).pptx

数値計算法

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

スライド 1

統計的データ解析

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

スライド 1

データ解析

stat-base_ppt [互換モード]

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

経済統計分析1 イントロダクション

Microsoft PowerPoint - Inoue-statistics [互換モード]

【指導のポイント】

untitled

代表値

Microsoft Word - apstattext01b.docx

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード]

stat-base [互換モード]

Microsoft PowerPoint - 資料04 重回帰分析.ppt

第7章

学習指導要領

PowerPoint プレゼンテーション

Microsoft Word - Stattext11.doc

日心TWS

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

基礎統計

Microsoft PowerPoint 確率レジュメA

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

経済統計分析1 イントロダクション

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

数値計算法

Microsoft PowerPoint - CVM.ppt [互換モード]

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

統計学入門 練習問題解答集

2 散布図を書く意義 1) 視覚的にどんな関係かを考えることができる 2つの変数間の関係をどう表現するか 1 直線的関係 2 2 次関数 3 指数 対数 双曲線など 4 その他今回の授業では直線的関係についてしか学ばないが,2つの変数間の関係を曲線で表す方がよい場合も多い. 2) 異常値などを発見で

Transcription:

第 2 回統計学の基礎 生物統計学 教材 生物統計学 _ 代表値の計算 2013 を予習しながら空所を埋めておくこと A. データの要約と代表値 1.100 個以上のデータを要約する 1 中心を表す代表値を考える 2 を考える 平均メジアンモード 松江城 ( 赤 ) 石見銀山 ( 青 ) 2. 中心を表す代表値 1 例題 5 羽のにわとりはそれぞれ 1,2,0,2,0 個の卵を産んだ. 平均でいくつの卵を産んだか? * 補足算術平均 ( 相加平均 ) と幾何平均 ( 相乗平均 ) ふつう, 平均というと今回紹介したすべての観測値を足し合わせて, 観測数で割るものをさす. しかし, 年平均成長率のように指数関数的成長をもとにした平均は幾何平均 ( 相乗平均 ) といってかけ算したものを n 乗根する平均を計算する. 成長率の場合は注意が必要である. 1

2 ( 生物統計学 ) データを大きさの順に並べてデータが奇数個なら中央に位置するデータの値, データが偶数個なら中央に位置する2つのデータの平均である 例 1 11,14,15,17,20 例 2 2,4,8,10,12,16 3 集めたデータの中で, 最も多く現れた値あるいは階級のこと. 名目データではモードを代表値とする 例題 5 羽のにわとりはそれぞれ 1,2,0,2,0 個の卵を産んだ. モードはいくらですか? モードの例 名目データの場合アサガオを 20 株調べた.10 株は青い花,6 株は紫の花,4 株は白い花だった. 花の色のモードは? ミニトマト 5 品種の着果数のデータの場合, 以下のように度数分布をまとめたら, モードは松江城では 101~120 個, 出雲大社では 81~100 個, 石見銀山では 161~180 個, 三瓶山では 101 ~120 個と 121~140 個, アクアスでは 161~180 個がモードである. この場合, 三瓶山ではモードが 2 つある. 3. データのばらつきを表す代表値データがばらつくとは? 偏差 2

平方和 平均からの偏差の二乗の和 生物統計学 V 単位は元の値の 2 乗となる. S. D. V 最大値と最小値の差もっとも両極端な値を使っているので信頼は低い両方とも異常値であることもある. 四分位範囲第 3 四分位点と第 1 四分位点の差である. 第 1 四分位点はデータを大きさの順に並べて, 最小値から数えて, 全体の4 分の1 番目に当たるデータの値である. 第 3 四分位点は同じく全体の4 分の3 番目に当たるデータの値である. メジアンは第 2 四分位点と一致する. 標準偏差を平均で割ったものでばらつきの大きさを相対的に評価する時に使う. おおまかに 5% 以下だと小さいばらつき,6-14% はふつうのばらつき,15% 以上は大きいばらつきと考える B. 代表値の計算の実際次のデータから平均, 分散, 標準偏差, メジアン, レンジ, 変動係数 (%) を計算せよ. 例題山を調査して発見したツキノワグマの頭数 3, 5, 6, 8, 11 頭 1. エクセルの関数を使う計算方法 3

2. エクセルの分析ツールを使う計算方法 1 データ データ分析 ( エクセル 2003 ではツール 分析ツール ) 生物統計学 2 基本統計量を選ぶ 3 入力範囲にデータの範囲を入れる. データの最初にラベル ( データ名 ) があるときはチェックを入れる. 出力先を指定する. 4 指定した出力先に計算結果が出る. 次のデータから平均, 分散, 標準偏差, メジアン, レンジ, 変動係数 (%) を計算せよ. 1 農園で収穫したミカンの数 11, 13, 15, 17, 22, 27, 36, 41, 55 個平均分散標準偏差メジアンレンジ変動係数 (%) 2 根の長さ 1.4, 2.7, 5.9, 6.3, 10.5, 13.1, 15.0, 18.2, 22.7cm 平均分散標準偏差メジアンレンジ変動係数 (%) 4

生物統計学 分散の単位は cm 2 のように 2 乗がつくことが多い. エクセルで 2 乗を示すのは以下のようにすればよい. 予習問題 平均メジアン分散標準偏差レンジ変動係数 (%) モード 問 2. 右のデータはカエルのジャンプした距離を 100 回測定したものである. 1 平均, メジアン, 分散, 標準偏差, レンジ, 変動係数を計算せよ. 2 問 1-2 で作成した 3 つのヒストグラムそれぞれについて, モードを求めよ. 番号距離 (cm) 1 64 2 58 3 51 4 74 5 45 6 28 7 31 8 47 9 25 10 45 11 44 12 65 13 33 5

4. データの要約について 1) データの全体的な傾向を表す表にまとめる大きさの順に並べる, 度数分布 2) などの図を書く 3) 平均など 化の傾向を示すような値を求める 4) を評価する値を求める 生物統計学 C. 要約されたデータから何を読みとるか? それぞれの統計量は何を意味するのか? どういう利用価値があるのか? 1. 中心化の傾向を表す代表値として 1 平均平均は分布に ( ) のないとき にもっとも有用な統計量である. とくに母集団が ( ) を示すときに非常に有用である. 分布がゆがんでいるとき, 平均の利用には注意が必要である 2 メジアン右の給与分布の場合, 平均値とメジアンにはずれがある. 一般的な年収の人を考えるとき, 年収が平均の人とメジアンの人を選べば, それぞれ別のタイプの人になる. メジアンは正規性のないデータあるいは標本全体を同時に調査できないようなデータ ( 性成熟日数, 生存日数, 電球の寿命のような打ち切り標本, 以上 以下を含む標本など ) などの形質に用いる. データに異常値があるときのように, 極端に離れた値を含む標本では平均よりメジアンを用いる方が無難である. (%) 8 6 4 2 0 日本の世帯別貯蓄高の分布 (2007 年 ) 0 1000 2000 3000 4000 5000 6000 貯蓄高 ( 万円 ) 3 モード色などの名目 ( 質的 ) データならモードを使うしかない. 右の表はある交差点を通過した車の色を調べた結果である. この場合, モードは白となる. 白 47 黒 10 黄 8 赤 7 緑 2 青 1 その他 6 量的データでは度数分布の階級のとりかたによってモードが変わる. 宿題のカエルのジャンプのデータでは3つの度数分布 ( ヒストグラム ) それぞれについてモードを求めることができる. 6

生物統計学 このように量的データではデータのまとめ方次第でモードが変わるので, モードの使用には注意が必要となる. 2. ばらつきを評価する指標として分散 標準偏差たいていの場合, 平均と分散 ( 標準偏差 ) の2つをばらつきの指標としたらよい レンジ計算が簡単なので, 標準偏差の代用とすることもある. 異常値に左右されやすいので, 信頼性は低い 四分位範囲あまり使わないが, メジアンといっしょに分布のゆがんだデータで利用される. 演習問題 A 君はある昆虫の体重を 100 匹測定した. その結果はエクセルファイルにある. 1 平均, メジアン, 分散, 標準偏差, レンジ, 変動係数を計算せよ. 2 度数分布とヒストグラムをかけ. 3 2 をみて, この昆虫の集団の平均的な姿を考えよ. 7

生物統計学 D. 代表的な離散分布 教材 生物統計学 _ 二項分布 2013 を予習しながら空所を埋めておくこと 1. 二項分布 1 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 10 回振ったときに 1 の出る回数 x の確率分布は二項分布に従う. 1 この場合, n 10, p の二項分布になる 6 さいころを 10 回振ったときに 1 が 0 回出る ( x 0) 確率は, P( 0) 0. 162 である. さいころを 10 回振ったときに 1 が 3 回出る ( x 3 ) 確率は, P( 3) 0. 155 である. 二項分布では母平均 np, 母分散 np(1 p) となる. 2 エクセルでの計算例さいころを 10 回振ったときに 1 の出る回数 x の確率分布は二項分布に従う. 1 n 10, p の二項分布になる 6 エクセルでは P( x) BINOMDIST ( x, n, p, false) 例をエクセルで計算すると以下の通りになる. 上の結果をグラフで示すと右のようになる. 8

生物統計学 予習での練習 A 社のチョコレートにはくじが入っていて, 当たる確率は 0.15 である.10 個買って1つも当たりが入っていない確率,2つだけ当たりの入っている確率を求めよ. さらに下の表を完成させよ. n, p 当たりの数 エクセルでの計算式 確率 0 1 2 3 4 5 6 7 8 9 10 2 二項分布の利用二項分布すると考えられる場合, それを利用していくつかの予測や推論を立てることができる. (1) 確率の計算例 : シロクマチョコレートを買うと,20 個に 1 個の割合でシロクマのぬいぐるみが当たる. どうしてもシロクマのぬいぐるみがほしいAさんはシロクマのぬいぐるみが手に入る確率を 95% 以上にするにはいくつシロクマチョコレートを買えばよいか?99% 以上にするにはいくつ買えばよいか? 95% 以上の確率にするにはいくつ買えばよいか? 求める確率 =1-( ひとつもシロクマのぬいぐるみが当たらない確率 ) である. 99% 以上の確率にするにはいくつ買えばよいか? 9

生物統計学 (2) 信頼区間の計算当たる個数確率例 : シロクマチョコレートを買うと,20 個に 1 個の割合でシロクマのぬ 0 0.358 1 0.377 いぐるみが当たる. シロクマチョコレートを 20 個買うと, シロクマの 2 0.189 ぬいぐるみが当たる個数はいくつか? 3 0.060 4 0.013 5 0.002 平均すれば 1 個当たるけれども, 実際には1つも当たらない場合もあれば, 6 0.000 7 0.000 2 つ当たることもある. このような場合, 決められた確率で何個から何個 8 0.000 まで当たると表現する. これを区間推定といい, このような範囲を信頼区 9 0.000 10 0.000 間, 決められた ( 宣言した ) 確率を信頼率という ( 詳細は第 4 回の授業で 11 0.000 学ぶ ). 12 0.000 13 0.000 14 0.000 20 個のシロクマチョコレートを買うと 1 個ぬいぐるみが当たる確率が一 15 0.000 16 0.000 番高いといっても 0.377 の確率であり, それほど確実に起こることではな 17 0.000 い. そこで 92% の確率で 0 個から 2 個当たるというように確率を宣言し 18 0.000 19 0.000 て, 範囲で示す. 20 0.000 (3) 真偽を推測する : 例 : シロクマチョコレートを買うと,20 個に 1 個の割合でシロクマのぬいぐるみが当たる. どうしてもシロクマのぬいぐるみがほしいAさんはシロクマチョコレートを 50 個買ったのに 1つも当たらなかった.Aさんはシロクマチョコレート株式会社はうそつきだと断定した. しかし, その推論は正しいか? 50 個シロクマチョコレートを買っても 1 つもシロクマのぬいぐるみが当たらない確率は二項分を利用すると である. この確率はあまりにも小さいから不自然なのでシロクマチョコレート株式会社は嘘をついたと判断できるだろうか? あるいはたまには起きそうなことなので嘘をついたとは断言できないだろうか? 20 個に 1 個の割合でシロクマのぬいぐるみが当たるのだから 20 個買うと 1 個は当たりそうにふつうの人は期待する. しかし,20 個シロクマチョコレートを買って, ぬいぐるみが少なくとも 1 個当たる確率は である. これほど確率が低いのは 20 個シロクマチョコレートを買って,2 個以上当たる幸運な人がいるからで, その確率は である. このように確率分布を使うと標本 ( この場合, 数を決めて購入したシロクマチョコレートのくじ ) から母集団 ( シロクマチョコレート株式会社が作るすべてのシロクマチョコレートのくじ ) について推論することができる. このような確率分布を利用した推論 ( 推定と検定 ) については第 4 回以降の授業で学ぶ. 10

生物統計学 3 演習問題 1 A 釣り堀には 1 種類の魚がたくさん泳いでいる. この魚のうち,20% は雌である. 魚はランダムに泳ぐので, 釣り針にもランダムにかかるとしよう. この釣り堀で 5 匹の魚を釣ったときに雌が 3 匹以上いる確率を計算せよ. 4 演習問題 2 B 園芸にある植物を 10 株納めてほしいという注文が来た. しかし必ず赤い花が咲いた条件で納めることという条件がついていた. この植物は 30% の確率で赤い花が咲く. それではいくつ鉢を準備したら,95% 以上の確率で赤い花を 10 株準備できるだろうか? 教材 生物統計学 _ ポアソン分布 2013 を予習しながら空所を埋めておくこと 2. ポアソン分布 1 ポアソン分布ポアソン分布は一定の長さの時間, 一定の大きさの空間においてごくまれに起こる事象を表現するときに用いる. 二項分布において p をどんどん小さくする一方で, n を無限大にすると得られる. 非常に大きな集団においてきわめて起こりにくい事象を対象としたときの分布である. 二項分布と違って, 分布の大きさ n は必要ない. 例えば, 交通事故死はきわめてまれなものである. その対象となる n はしかも何人か決めようがない. 運転者や歩行者の数は毎日異なるからである. そういうときにポアソン分布は有効である. 例ある島では毎年, 何千羽ものヒナが生まれる. 毎年平均 0.5 羽の出現率で黄金色の羽をもつヒナが生まれるという. 0. 5 であるから, 黄金の羽を持つヒナが 0,1,2 羽, 出現する確率はそれぞれポアソン分布に従う.( ここでは毎年それぞれ誕生するヒナの数が何千羽であるかを正確にわかっていなくてもよいし, 異なっていたとしてもよい. そこが二項分布と違う.) ポアソン分布の計算には母平均だけが必要である. ここでは母平均 0. 5 である. エクセルでは, P( x) POISSON ( x,, false) 11

ポアソン分布では平均 が決まると分布の形が決まる. 生物統計学 ポアソン分布では, 母平均 と母分散 は等しい. 2 0.9 0.8 0.7 0.6 0.5 μ=0.2 μ=0.5 μ=1 μ=2 μ=5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 予習での練習 A 君は 1 時間, 夜空を見上げると流れ星を平均 0.4 個みるという. ポアソン分布に従うとすれば,1 時間で流れ星を 0, 1, 2 個見る確率を計算せよ. 当たりの数エクセルでの計算式確率 0 1 2 E. 予習と宿題予習と宿題は https://moodle.cerd.shimane-u.ac.jp/moodle/ を見てください. 12