<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

Similar documents
Microsoft PowerPoint - データ解析基礎2.ppt

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft Word - lec_student-chp3_1-representative

stat-base_ppt [互換モード]

Microsoft PowerPoint - 基礎・経済統計6.ppt

stat-base [互換モード]

Blue circle & gradation

経営統計学

データの種類とデータの分布

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

代表値

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

3章 度数分布とヒストグラム

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

【指導のポイント】

Microsoft Word - apstattext04.docx

散布度

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

3章 度数分布とヒストグラム

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

第4回

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint ppt

Microsoft Word - 保健医療統計学112817完成版.docx

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

DVIOUT-mem

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

経済統計分析1 イントロダクション

EBNと疫学

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - -

PowerPoint プレゼンテーション

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

平成 28 年度山梨県学力把握調査 結果分析資料の見方 調査結果概況 正答数分布グラフ 分布の形状から児童生徒の解答状況が分かります 各学校の集計支援ツールでは, 形状だけでなく, 県のデータとの比較もできます 設問別正答率 無解答率グラフ 設問ごとの, 正答率や無解答率が分かります 正答率の低い設

情報工学概論

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

Microsoft PowerPoint - 12統計の分析と利用_1-1.pptx

_KyoukaNaiyou_No.4

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

基礎統計

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

初めて学ぶ統計-公務員のためのオンライン講座-コースポイント集

ビジネス統計 統計基礎とエクセル分析 正誤表

0415

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

Microsoft Word - apstattext01b.docx

これに対する度数分布表は次のようになる : 階級 階級値 度数 相対度数 累積度数 累積相対度数 ( 以上 ) ~ ( 未満 ) 0 ~ (3/50 = ) ~ (2/50 = ) ~ (6/5

青焼 1章[15-52].indd

Microsoft PowerPoint - 測量学.ppt [互換モード]

C3 データ可視化とツール

Microsoft Word - Stattext11.doc

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

2 Office 65 Solo Office 65 Solo とは Office 65 Solo とは Office 2 Office 65 Solo Office Windows Mac Office Office 65 Skype Office 1, , W

学力スタンダード(様式1)

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft Word - Stattext12.doc

本日のテーマ 1. データの分類 2. データを簡単にまとめる (1 変数の場合 ) 特に, 代表値と散布度 3.2 変数を合わせてまとめる ~ここまでのクイズ~ 4. 推定と検定 略 5. まとめたデータから解析手法へ 2

データ解析

Microsoft PowerPoint - A1.ppt [互換モード]

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63>

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

データ 統計 情報 計算 分析 ( 数量的情報 定性的情報 ) 上の図にもあるように 統計学 の目的の一つとして データ ( 中学校では資料と呼んでいた ) や 統計 を正しく分析し 我々の判断や 行動に役立つ 情報 を導き出す力を養うことが挙げられる ( 度数分布表とヒストグラム ) 1 年 A

Microsoft PowerPoint - e-stat(OLS).pptx

2. 幹葉図数表はデータの詳細な値を知ることができますが, 一見してデータ全体の傾向を読み取るのは困難です. 一方, グラフはデータ全体の傾向を視覚的に捉えることができますが, 細かい値を知るには適していません. 幹葉図はこの両面性を備え, かつ, データの集計にも使えるという方法です. 例 次のデ

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

[12]SPSS_01.indd

学習指導要領

§2-2 記述統計と推測統計

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

2) 数値データを整理して情報を得る 作成案を考える 数値データの整理方法を考える個人の合計点数と各問の平均点 最高点 最低点は 各問の点数を使って求めることができます それぞれの点数を 表のどの位置に どのような方法で求めるのがよいか考えましょう 1 個人の合計点数を求める 生徒一人一人の合計点数

年生 章資料の活用 ( 基本問題練習 ) 入試問題を解くための準備問題です 1 に適当なことばを入れなさい 資料のとる値のうち, 最大のものから最小のものをひいた差を ア という 度数分布表において, 資料を整理するための区間を階級といい, その幅を 3 右の表は, 生徒 人のある日の睡眠時間を,

Microsoft Word - SPSS2007s5.doc

Medical3

Microsoft PowerPoint - CVM.ppt [互換モード]

基礎統計

Microsoft Word - スーパーナビ 第6回 数学.docx

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

基礎統計

学習指導要領

Microsoft Word - Stattext07.doc

PowerPoint プレゼンテーション

Microsoft Word - apstattext05.docx

テレビ講座追加資料1105

画像類似度測定の初歩的な手法の検証

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

スライド 1

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

講義「○○○○」

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

学習指導要領

Microsoft PowerPoint - Statistics[B]

DataAnalysisI02.pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

[1] の問題は四分位数の計算方法を知っているだけでは解けず, 四分位数や箱ひげ図の意味がわかり, また,2 回目とのデータの比較について箱ひげ図からわかることの判断といったことができるかどうかが問われていた しかも (2) と (3) はそれぞれ選択肢を 4 個と 2 個答えるが, それぞれ完答を

Microsoft Word - appendix_b

Transcription:

統計の種類 統計学 データの種類データのグラフ化中心を表す特性値 記述統計母集団 ( 調査対象の集団 ) をすべて調査でき その調査結果に基づき データをまとめる統計 推測統計母集団 ( 調査対象の集団 ) をすべて調査できないが 一部のデータから母集団の状況を推測する統計 外れ値 データの中には 他の観測値に比べて著しく離れた値が含まれている場合があります ( 入力ミスではなく ) このような値のことを外れ値といいます 外れ値は測定の誤り 測定対象の異常 記録時のミスなどによって起こり データ解析の結果に影響を与える場合もあります 欠損値 またデータの中には 観測対象により一部のデータが取れない場合があります このような値のことを欠損値といいます 欠損値は単純に除いて分析を行うこともありますが 推測統計においては単純に除くことは注意が必要です 統計データ イリス セトーサ (A 群 ) イリス ヴェルシコロール (B 群 ) イリス ヴィルジニカ (C 群 ) がくの がくの 花弁の 花弁の がくの がくの 花弁の 花弁の がくの がくの 花弁の 花弁の 長さ 幅 長さ 幅 長さ 幅 長さ 幅 長さ 幅 長さ 幅 5.1 3.5 1.4 0.2 7.0 3.2 4.7 1.4 6.3 3.3 6.0 2.5 4.9 3.0 1.4 0.2 6.4 3.2 4.5 1.5 5.8 2.7 5.1 1.9 4.7 3.2 1.3 0.2-3.1 4.9 1.5 7.1 3.0 5.9 2.1 4.6 3.1 1.5 0.2 5.5 2.3 4.0 1.3 6.3 2.9 5.6 1.8 5.0 3.6 1.4 0.2 6.5 2.8 4.6 1.5 6.5 3.0 5.8 2.2 5.4 3.9 1.7 0.4 5.7 2.8 4.5 1.3 7.6 3.0 6.6 2.1 4.6 3.4 1.4 0.3 6.3 3.3 4.7 1.6 4.9 2.5 4.5 1.7 5.0 3.4 1.5 0.2 4.9 2.4 3.3 1.0 7.3 2.9 6.3 1.8 4.4 2.9 1.4 0.2 6.6 2.9 4.6 1.3 6.7 2.5 5.8 1.8 4.9 3.1 1.5 0.1 5.2 2.7 3.9 1.4 7.2 3.6 6.1 2.5 5.4 3.7 1.5 0.2 5.0 2.0 3.5-6.5 3.2 5.1 2.0 4.8 3.4 1.6 0.2 5.9 3.0 4.2 1.5 6.4 2.7 5.3 1.9 4.8 3.0-0.1 6.0 2.2 4.0 1.0 6.8 3.0 5.5 2.1 4.3 3.0 1.1 0.1 6.1 2.9 4.7 1.4 5.7 2.5 5.0 2.0 5.8 4.0 1.2 0.2 5.6 2.9 1.2 1.3 5.8 2.8 5.1 2.4 5.7 4.4 1.5 0.4 6.7 3.1 4.4 1.4 6.4 3.2 5.3 2.3 5.4 3.9 1.3 0.4 5.6 3.0 4.5 1.5 6.5 3.0 5.5 1.8 標本 ( データ ) の種類 質的データ 量的データ 名義尺度 順序尺度間隔尺度 比尺度 1

名義尺度 性別や所属などを表すデータ また それらに数値を対応させる場合もある A さん B さん C さん D さん E さん 数値で表された名義尺度の場合 数値間の演算や差には何の意味もありません! 単純の 2 つのデータが等しい (=) か等しくない ( ) という情報しか得られません 男 女 男 男 女 2 1 2 2 1 順序尺度 好感度や好きな食べ物の順番など順位がつけられているデータ データ間の順序性 (<,>) があるため データ値の順にデータを並び変えたりできます < 例 > 次の食べ物の中で好きな順に順位をつけて下さい りんご いちご みかん ブルーベリー Aさん :1. ブルーベリー 2. いちご 3. りんご 4. みかん 間隔尺度 順序性だけではなく数値自身が意味を持ち 数値の間隔が等しくはないデータ 統計の本に最も良く現れるデータ 数値の加減法 ( 足す 引く ) ができ その数値に意味があるデータ < 例 > 気温昨日の気温は 15 で 今日の気温は 19 です 今日の気温は昨日の気温より 4 (= 19-15 ) 暖かい 比尺度 データの数値同士を掛けたり 割ったりしても意味のあるデータ このデータは 足したり引いたりしても意味のある数値が得られる 同一性 順序性 加法性 等比性 (=, ) (<,>) (+,-) (, ) 名義尺度 質的データ順序尺度 間隔尺度 量的データ比尺度 間隔尺度と比尺度 間隔尺度のデータと比尺度のデータはどちらも数値であり 等比性の有無だけが異なる より分かりやすい見分け方は 各データにおける 0( 零 ゼロ ) の意味を考えるとよい 間隔尺度の 0 は 基準としての 0 であり 比尺度の 0 は 無としての 0 である 2

データの種類によって 使える集計法は異なります 2 つの変数間の関係 質的データ 名義尺度 度数分布表 最頻値 質的データ クロス集計 ( 棒グラフ ) 順序尺度 度数分布表 最頻値 中央値 量的データ 間隔尺度 比尺度 度数分布表 最頻値 中央値 平均 標準偏差 分散など 量的データ 相関係数 散布図 ( 棒グラフ ) 棒グラフ ( 名義尺度 ) データのグラフ化 新車販売台数 ( 平成 25 年 7 月 ) 新車販売台数 ( 平成 25 年 7 月 ) 160,000 140,000 120,000 新車販売台数 100,000 80,000 60,000 40,000 S/ 標準 20,000 0 M/ 標準 メーカー 昇順や降順に並び替えると グラフは見やすくなる 3

棒グラフ ( 順序尺度 ) 棒グラフ ( 経時データ ) 順序尺度の場合 昇順 降順に並べる必要はない 折れ線グラフ ( 経時データ ) 円グラフ ドーナツグラフ 帯グラフ 4

学食でよく食べる昼食 ラーメン系カレーライスうどん そばパスタ系洋食系 学食でよく食べる昼食 ラーメン系カレーライスうどん そばパスタ系洋食系 女性 (100 人 ) 25.4% 20.1% 28.4% 14.9% 11.2% 女性 (100 人 ) 34 27 38 20 15 ラーメン系は女性 男性で同人数くらいの人が食べているうどん そばは男性よりも女性の方が多くの人が食べている男性の 2 倍の女性がパスタ系を食べている ラーメン系は女性 男性で同人数くらいの人が食べているうどん そばは男性よりも女性の方が多くの人が食べている男性の 2 倍の女性がパスタ系を食べている 男性 (262 人 ) 25.8% 23.6% 17.3% 7.4% 25.8% 男性 (262 人 ) 70 64 47 20 70 幹葉図 ヒストグラム (1) 51.5, 51.5, 51.6, 51.7, 51.9 という 5 個のデータをまとめた この数字を棒状に塗りつぶしたものがヒストグラムである ヒストグラム (2) ヒストグラム (3) 区間幅によって データ傾向の印象が異なることが分かる スタージェスの式 このデータではスタージェスの式に依る区間幅は 7.7mm である 5

ヒストグラム = 棒グラフ? 箱ひげ図 後述するデータの縮約値を用いた図である 階級を割り当てる 度数を割り当てる 縦軸 横軸に何を割り当てても良い データの分布を知る 棒の高さで互いの量を比較する 数種類のデータをグラフ化 バブルチャート 散布図 相関図 レーダーチャート星座グラフ (4 次元データ ) iris data 0 1-1 0 1 (http://aoki2.si.gunma u.ac.jp/r/constellation.html 参照 ) 6

顔グラフ (18 次元データ ) まとめ データを視覚的に分かり易くするものとして統計グラフがある データの種類によって 使用するグラフを選ぶ必要がある (http://aoki2.si.gunma u.ac.jp/r/face.html 参照 ) グラフの描き方により データ傾向の印象が異なる場合もあるため 注意しながら使用する必要がある 母集団分布 中心を表す特性値 ( 記述統計 ) 母集団に含まれている調査対象の興味ある値を観測してデータを得ますが それらの分布状況を母集団分布といいます 母集団全体を調査し 表やグラフにまとめると母集団分布の特徴が視覚的に分かりやすくなります この母集団分布を知ることが統計を使う目的です 60 人の新生児体重 母 数 データ区間 頻度 累積 % -2000 0 0.00% 14 2001-2250 2 3.33% 12 2251-2500 2 6.67% 10 2501-2750 8 20.00% 2751-3000 11 38.33% 8 3001-3250 10 55.00% 6 3251-3500 13 76.67% 4 3501-3750 5 85.00% 2 3751-4000 3 90.00% 0 4001-4250 4 96.67% 4251-4500 1 98.33% 4501-4750 1 100.00% 4751-0 100.00% 母集団分布の特徴を表す特性値のことを一般には母数と呼びます この中には数種類の特性値があり 代表的なものは中心的傾向を表すものと散らばり傾向を表すものです 授業では扱いませんが 対称性 や とがり具合 を表す特性値も存在します ( 教科書 32 ~34ページ ) 7

60 人の新生児体重 データ区間頻度累積 % -2000 0 0.00% 平均は3179.2gになる 14 2001-2250 2 3.33% 12 2251-2500 2 6.67% 10 2501-2750 8 20.00% 2751-3000 11 38.33% 8 3001-3250 10 55.00% 6 3251-3500 13 76.67% 4 3501-3750 5 85.00% 2 3751-4000 3 90.00% 0 4001-4250 4 96.67% 4251-4500 1 98.33% 4501-4750 1 100.00% 4751-0 100.00% 中心的傾向を表す特性値 いま 母集団からデータが得られているとする 平均 ( 算術平均 ) 世の中で最もよく使われている特性値である 60 人の新生児体重 60 人の新生児体重 ( 単位変換 ) 470-450 -80-470 280-160 -480 350 610 430 20 320-210 50 620 260 320 800-360 360 320 1100-280 1050 850 380 40-290 1150 200 1120-220 220-220 -510-50 -420-980 10-990 -200 760 1480-10 700-40 -680 60 200 380 100-160 -10 100 530 270-400 640 300 1570 変換後の平均 を定数として全データを 平均の短所 平均は 60 点ですが 分布状況は二峰です このようなデータに対する平均はデータの中心を表しているとは言い難く 多峰性のあるデータに平均を使用するのは注意が必要です と変換したとき これらの平均は 300 250 英語の得点分布 200 頻度 150 100 50 もとの平均を倍してを加えればよい 0 0 10 11 20 21 30 31 40 41 50 51 60 61 70 71 80 81 90 91 100 データ区間 8

表にまとめられた平均 (p.25) 中心的傾向を表す特性値 中央値 ( メディアン ) データを大きさの順に並べ 中央に位置するデータの値 データ数が偶数個の場合は 中央に位置する二つのデータの平均とする 少年 :1, 1,, 1 (171 人 ) 2,2,,2 (81 人 ) 3,3,,3 (46 人 ) 4,4,,4 (37 人 ) 5,5,,5 (25 人 ) という 360 個のデータの平均であるので データが平均を中心として左右対称でないとき 有効である 60 人の新生児体重 平均 : 中央値 : データを大きさの順に並べると 2010 < 2020 < < 3100 < 3200 < < 4480 < 4570 1 番目 30 番目 31 番目 60 番目 平成 26 年年収データ 階級 代表値パーセント 月額 20 18 100 万円以下 50 8.78 30,304 16 100 万円台 150 15.17 90,910 14 200 万円台 250 16.88 151,516 12 300 万円台 350 17.33 212,122 10 400 万円台 450 13.95 272,728 8 6 500 万円台 550 9.47 333,334 4 600 万円台 650 5.90 393,940 2 700 万円台 750 3.99 454,546 0 800 万円台 850 2.63 515,152 900 万円台 950 1.73 575,758 1000~1500 万円台 1250 3.12 757,576 1500~2000 万円台 1750 0.64 1,060,607 2000~2500 万円台 2150 0.20 1,303,031 2500 万円超 3000 0.23 1,818,182 中央値平均 平均 :413.3 万円 ( 月額約 25 万円 ) 中央値 :302.9 万円 ( 月額約 18.4 万円 ) であるので 中央値は 調和平均 平均の速さや並列に接続された全抵抗のなど 120km 120km 40km/h 120km/h 3h 1h 平均の速さ :(40km/h+120km/h) 2=80km/h 平均の速さ :(120km+120km) (3h+1h)=60km/h 平均の速さ : 相乗平均 売上高 売上高の伸び率 1 月 180,000 2 月 270,000 50.0% 150.0% 3 月 370,000 37.0% 137.0% 4 月 380,000 2.7% 102.7% 算術平均 29.9% 相乗平均 128.3% 29.9% ずつ売上高がのびた場合 28.3% ずつ売上高がのびた場合 売上高 売上高の伸び率 売上高 売上高の伸び率 1 月 180,000 1 月 180,000 2 月 233,820 29.9% 2 月 230,940 28.3% 3 月 303,732 29.9% 3 月 296,296 28.3% 4 月 394,548 29.9% 4 月 380,148 28.3% このような前月比の割合の平均には 相乗平均が有効です 9

最頻値 ( モード ) データの中でもっとも頻繁に出現しているデータの値 α% トリム平均データを大きさの順に並べ 大きい方からと小さい方から [α 100 ( データ数 ) 2] 個のデータを除いて残ったデータの平均値 最頻値 トリム平均 最頻値 :3320g は 3 人いて一番多く出現しているので これが最頻値 10% トリムド平均 : [10 100 60 2] 個 =3 個 つまりデータを大きさの順に並べ 大きい方と小さい方から 3 個ずつデータを除いた 54(=60-6) 個のデータの平均値 2010<2020<2320<2490< <3100<3200< <4120<4150<4480<4570 1 番目 3 番目 30 番目 31 番目 58 番目 60 番目 60 人の新生児体重 ある医院で1ヶ月間に生まれた新生児の体重を調査した (g) 4120 2780 3220 2780 2490 2950 2580 1500 3010 1050 いま あるデータが 2 個変わりました それに伴い 平均 : 3179.2g 3154.5g 中央値 : 3150g 3150g 最頻値 : 3320g 3320g 10% トリム平均 : 3170.4g 3170.4g と変化しました 中心的傾向を表す特性値 平均は極端に大きい値のデータや極端に小さい値のデータに影響を受けやすいが 中央値 トリム平均値はこれらの影響を受けにくい 母集団分布が平均を中心として左右対称である場合 これら平均 中央値 トリム平均値は同じくらいの値を示す 母集団分布が平均を中心として左右対称でない場合 平均は中央値 トリム平均値に比べ少し大きめまたは小さめの値になる 演 習 A さん所属している総務課の人たちの通勤時間を調べたところ次のようであった 総務課の通勤時間の平均 中央値 トリム平均 ( 大きい 2 つのデータと小さい 2 つのデータを除いた 6 個平均 ) を求めよ 10, 65, 45, 95, 80, 120, 40, 30, 85, 80 ( 分 ) 10