る そんな解析もしてみたい と 好奇心が刺激されます 二つ目の理由は 統計解析を受け止める立場の話です 猛烈に発信されるデータは 現在 さまざまに解釈されながらマスコミ等で発表されています 困ったことは その解析は必ずしも正しいとは限らないことです です 一を聞いて十を知る という諺がありますが 1

Similar documents
EBNと疫学

Microsoft PowerPoint ppt

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63>

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Taro-小学校第5学年国語科「ゆる

040402.ユニットテスト

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - stat-2014-[9] pptx

参考 調査員調査の対象者へのアンケート ( 平成 21 年 4 月実施 ) の概要 1 目的総務省統計局が調査対象者から直接 調査員調査の実施状況を把握し 平成 20 年度の委託業務の中で調査員調査の検証を行うとともに 今後の民間調査機関への指導についての参考資料を得る また 本アンケートでは 回答

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

不偏推定量

Microsoft PowerPoint - statistics pptx

Microsoft Word - Stattext13.doc

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft Word - Stattext12.doc

Microsoft Word - CygwinでPython.docx

Microsoft PowerPoint - statistics pptx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

モジュール1のまとめ

総合的な探究の時間 は 何を 何のために学ぶ学習なのか? 総合的な探究の時間 は与えられたテーマから みなさんが自分で 課題 を見つけて調べる学習です 総合的な探究の時間 ( 総合的な学習の時間 ) には教科書がありません だから 自分で調べるべき課題を設定し 自分の力で探究学習 ( 調べ学習 )

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

ANOVA

生徒用プリント ( 裏 ) 入力した内容はすべて記録されている!! 印 : 授業で学んだこと 管理者のパソコンには どのパソコンから いつ どのような書き込みがされたか記録されています 占いだけではなく メールや掲示板の内容も同じように記録されています もし 悪意のある管理者から個人情報が洩れたらど

Excelによる統計分析検定_知識編_小塚明_1_4章.indd


ビジネス統計 統計基礎とエクセル分析 正誤表

学習指導要領の領域等の平均正答率をみると 各教科のすべての領域でほぼ同じ値か わずかに低い値を示しています 国語では A 問題のすべての領域で 全国の平均正答率をわずかながら低い値を示しています このことから 基礎知識をしっかりと定着させるための日常的な学習活動が必要です 家庭学習が形式的になってい

============================== < 第 6 章 > 高校生 大学生 社会人の反応 ============================== 本調査研究では 高校生が社会に出ていく上での実効性のある資質 能力の重要性が感じられ また 調査問題そのものについての興味 関

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft Word - apstattext05.docx

Microsoft Word - Stattext07.doc

派遣社員の評価に関する 派遣先担当者調査結果

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

PowerPoint プレゼンテーション

Microsoft Word - 【6.5.4】特許スコア情報の活用

DSOC_DSR-04

Microsoft PowerPoint - e-stat(OLS).pptx

第 2 回 (4/18) 実力診断の解説と表作成の復習

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

基礎統計

Microsoft Word - histgram.doc

研修シリーズ

最初に あなたの働く目的は何ですか? という質問をしたところ 20~50 代のすべての年代において 生活 家族のため と答えた人が最も多かった その割合は 20 代が 63.6% 30 代が 74.0% 40 代が 83.8% 50 代が 82.5% だった また 全年代共通で 第 2 位が 自由に

リスク分析・シミュレーション

指導方法等の改善計画について

スライド 1

Medical3

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

Microsoft Word - 佐々木和彦_A-050(校了)

1. 期待収益率 ( 期待リターン ) 収益率 ( リターン ) には次の二つがあります 実際の価格データから計算した 事後的な収益率 将来発生しうると予想する 事前的な収益率 これまでみてきた債券の利回りを求める計算などは 事後的な収益率 の計算でした 事後的な収益率は一つですが 事前に予想できる

Microsoft Word - 博士論文概要.docx

 

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

ニュースレター 報道関係各位 2018 年 10 月 26 日 株式会社ベネッセホールディングス広報 IR 部 小学生の読書に関する実態調査 研究 読書は学力が低い子どもたちに大きなプラス効果 自分で調べる 話題が増える 幅広いメリットが明らかに 株式会社ベネッセホールディングスの子会社 株式会社ベ

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

【第一稿】論文執筆のためのワード活用術 (1).docx.docx

◎phpapi.indd

リサイクルの効果って どう考えればいいの? プラスチック製容器包装を例に どんなリサイクル方法があるの? パレットの原料にする 化学製品の原料にする 発電の燃料にする パレット = フォークリフトなどで荷物を運ぶときの台 下敷き リサイクルするってどういうことなの? リサイクルする 途中から作る こ

統計的データ解析

スライド 1

Microsoft PowerPoint - 矢部SPIJAPAN2013_発表用.pptx

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

PowerPoint プレゼンテーション

年 9 月 24 日 / 浪宏友ビジネス縁起観塾 / 法華経の現代的実践シリーズ 部下を育てない 事例甲課乙係のF 係長が年次有給休暇を 三日間連続でとった F 係長が三日も連続で休暇をとるのは珍しいことであった この三日の間 乙係からN 課長のところへ 決裁文書はあがらなかった N

1 BCM BCM BCM BCM BCM BCMS

年賀状作成時の重視点 2 1. は メッセージ重視 は ビジュアル重視 とに今年の年賀状作成時の重視点を聞いたところ とに今年の年賀状作成時の重視点を聞いたところ は ビジュアル ( 絵柄や写真 ) よりもメッセージ ( 言葉 ) を重視は ビジュアル ( 絵柄や写真 ) よりもメッセージ ( 言葉

スライド 1

平成 22 年度全国学力 学習状況調査結果の概要と分析及び改善計画 調査実施期日 平成 22 年 4 月 20 日 ( 火 )AM8:50~11:50 平成 22 年 9 月 14 日 ( 火 ) 研究主任山口嘉子 調査実施学級数等 三次市立十日市小学校第 6 学年い ろ は に組 (105 名 )

Microsoft Word - no103.docx

Microsoft Word - 中学校数学(福島).doc

【NEM】発表資料(web掲載用).pptx

日本版WISC-IVテクニカルレポート #6

10SS

13章 回帰分析

国語科学習指導案様式(案)

fmm151021完.pdf

ていくことが可能となるわけです このようにあるべき姿を思い浮かべて それに適した 機能を検討していけば かなりの応用が利くことになりますし そもそもアクセスの機能 をすべて知らなくても その都度 調査をしていけばよいのです 最終的には アクセス開発を通じて 一般論としてのシステム開発手法なり そもそ

DVIOUT

課題研究の進め方 これは,10 年経験者研修講座の各教科の課題研究の研修で使っている資料をまとめたものです 課題研究の進め方 と 課題研究報告書の書き方 について, 教科を限定せずに一般的に紹介してありますので, 校内研修などにご活用ください

横浜市環境科学研究所

宗像市国保医療課 御中

< F2D838F815B834E B B>


<4D F736F F D E7793B188C D915F88E48FE38BB E646F63>

売れる! インターネット活用術 < 第 3 回 > SEO の基礎知識 株式会社スプラム 代表取締役竹内幸次 ( 中小企業診断士 ) SEO で新規顧客を導く 世界一の検索サイト Google で http とだけ入力して検索すると 252 億ページがヒットします ( 見つかります ) 日本語のペー

青焼 1章[15-52].indd

はじめに この式を見るとインドの人たちは間髪を入れずに という答が出るそうです インドの小学校の子どもたちは までのかけ算の答をすべて丸暗記しているからです ( 日本では 9 9 までのかけ算の答を九九の暗唱で覚えますね ) そればかりではありません 6

(2) -2,4,1 3 y=-x-2 をかいた ( 人 ) 4 (1) y=2x-9,y=2x,y=3x+3 (2) y=x+11 (3) 指導観校内の研究テーマが 考える力を引き出す授業のあり方 ということで, 数学科では考える力とは何かを分析し,11 項目に整理した 1 帰納的に考える力 2

DVIOUT

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

高齢者におけるサルコペニアの実態について みやぐち医院 宮口信吾 我が国では 高齢化社会が進行し 脳血管疾患 悪性腫瘍の増加ばかりでなく 骨 筋肉を中心とした運動器疾患と加齢との関係が注目されている 要介護になる疾患の原因として 第 1 位は脳卒中 第 2 位は認知症 第 3 位が老衰 第 4 位に

Transcription:

はじめに 統計解析って 統計学とどう違うんだろう? そんな疑問をもっている方が多いのではないでしょうか 実際 統計学がわかる といった本を読んで なんとなく理屈がわかったとしても そのあと 現実の場で統計の知識を活かして使っている方はほとんど見あたりません それは 統計解析の知識が不足しているから といってよいでしょう 統計解析というのは 統計学の知識を応用しつつ 実際に統計データの分析を行なえるようにすること なのです ですから 統計解析を身につけることは統計の知識を実践的に使うことであり また 特別な準備も不要です 本書では統計をイチから説明していますし その使い方がわかるよう具体的な事例を通して伝えていきます ただ あなたに一つだけ用意しておいてほしいのは 統計学とは何か? 統計学はどう利用されるのか? という好奇心だけです 情報化時代といわれて久しいですが 最近ではツイッター ブログなども含め 日々新しく生まれるデータがますます巨大化し それらのデータが互いに融合し 複雑化しています それを ビッグデータの時代 などとも呼んでいます このような時代にあって 統計的分析能力の素養を身につけておくことは ますます重要さを増しています それには二つの理由があります 一つ目の理由は 統計解析を活用する立場から見たものです IT 社会であふれるデータの活用法を知らないと データは単にゴミの山にしか見えません けれども ほんの少しでも統計解析の素養を持っていると それは情報の宝の山にも変容します データに対して こんな見方もでき 3

る そんな解析もしてみたい と 好奇心が刺激されます 二つ目の理由は 統計解析を受け止める立場の話です 猛烈に発信されるデータは 現在 さまざまに解釈されながらマスコミ等で発表されています 困ったことは その解析は必ずしも正しいとは限らないことです です 一を聞いて十を知る という諺がありますが 1を調べてすべてを知る ことが統計的推定の極意なのです 翌日 A 君は 平均値が99.7gである という事実を上司に報告しました すると 今度は次のように命じられました しかし ほんの少しの統計解析の素養さえ持っていれば その誤りを見抜 くことができます 統計の扱いを評した有名な言葉があります なるほど 原因としては 製造ラインの機械が狂っているのかも しれないし 単なる誤差かもしれないな 確かめてみなさい 確かに たまたま検査した 100 袋の平均値が 99.7g にすぎず 1 万袋を There are three kinds of lies: lies, damned lies, and statistics. ( 世の中には 3 つのウソがある ウソと大ウソ そして統計だ ) 検査してみれば 100g だったかもしれません とすると 製造誤差の許 容範囲内ともいえますが もしこれが 99.5g だったらどうなのか さて どう対応すればよいものか と またまた A 君は悩みました これは 19 世紀後半のイギリスの首相ベンジャミン ディズレーリの言 葉です ディズレーリは 統計のウソ はウソの中でも最大級だとして いるわけですが それだけに 統計のウソ を見抜くには統計解析の素 このような問題に応えるのが検定 ( 統計的検定ともいう ) です 得られ た少ないデータから 製品の内容量は 100g で正しい という仮定が正 しいか否か それを判定する手段を提供してくれます 養が必要なのです さて その統計解析ですが 具体的にはどんなものなのでしょうか 次 の A 君の話からイメージが得られると思います こうして A 君は上司に対してどうにか報告を済ませたところ 数か月 後 再び難題が降りかかりました スナック菓子 S の製造ラインの効率を 上げるために 3 案 X Y Z が出されたのですが それらの優劣を確かめ 工場の製品管理部門に回された新入社員の A 君は次のように上司から命 じられました 当社の人気商品のスナック菓子 S の内容量が 100g ずつ正確に入って いるかどうか 調べなさい そこで A 君は製造ラインから 100 袋を無 む さく作 い為 ( アットランダム ) に抜き 出し調べました その平均値を計算すると 99.7g となりました この値か ら A 君はどうやってラインで製造される菓子の平均内容量を知ることが できるでしょうか このようなケースに対処する統計解析法が推定 ( 統計的推定ともいう ) るためのチーム主任に任命されたのです そこで A 君は実験用ラインを設け 従来方式も含めて各案をテストす ることにしました 各案を採用したラインから1 分間に製造される製品数 を5 回に分けて計測すると 次の結果が得られました 1 回目 2 回目 3 回目 4 回目 5 回目 平均 従来 30 29 31 33 32 31.0 X 案 31 32 30 33 32 31.6 Y 案 31 33 29 33 33 31.8 Z 案 32 33 31 33 34 32.6 4 5

X ~ Z の各案はすべて 従来方式よりも 1 分間当たりの製造数は増え ています その中でも Z 案が最も優れた結果を出しています しかし たった 5 回しかテストしていないのですから 誤差の範囲とも思えます などの統計データとともに 予報官の経験やカンが蓄積としてあるわけで す ベイズ統計はこれらの個人的な蓄積も情報として取り入れて確率を算 出できます 人間味のある統計学なのです A 君の報告書しだいでは 会社は製造ラインの変更という大きな投資を決 定するかもしれないので A 君は心配です A 君はこの場合 改善の効果はあった という報告書を書くべきなのでしょうか それとも 従来方式に比べ どの案も新規に採用するほどの効果は見いだせなかった と報告すべきなのでしょうか このA 君の疑問に応えるのが分散分析です 分散分析は得られたデータから 効果の有無を検証してくれます 改善案の違いの効果はあった などという結論を勘 ( カン ) ではなく 統計的に導き出してくれるのです 以上のA 君の例で 統計解析の日常性と重要性 そして面白さが垣間見えたと思います 最初に示したように 統計学のアイデアや それを実現する解析法をマスターするのにむずかしい準備は不要です 面倒な計算はExcel 等の統計解析ツールが実行してくれるからです 大切なことは 何が問題で どうやってその結論が出るのか その過程を理解しておくことです 本書はそのために 例題を通してそれらが身につくように詳述してあります 例題の意図と解決の流れをゆっくり追っていけば 統計解析のエッセンスが つかめるはずです 報告書作成に疲れたA 君は 週末 山に行くことにしました ホームページで週末の天気予報を調べると 雨の確率が 30% と表示されています A 君 雨の確率が 30% か それを聞いた同僚の B 子さんは A 君に質問しました B 子 雨の確率が 30% ってどう意味かしら? A 君 同じ条件の日が100 日あったなら そのうちの30 日に雨が降る という意味だと思うけど と 教科書的に応えました するとB 子さんは次のように反論したので 本書の解説には 中学までの数学しか利用していません 代わりに 統計学で訴えたいアイデアはグラフに示しています 掲載したグラフを眺めながら 本文の意味を確認していただければと思います 本書によって 情報化社会においてデータの山に呑まれず 情報の海に染まらず それらを活用する素養が提供されることを深く希望します 今後 私たちの周りはますますネットワーク化され データ 情報が氾濫していくでしょう それに対応するためにも この社会を楽しめる武器として統計解析の力を身につけてください す B 子 気象って複雑でしょ 同じ条件の日が100 日もあるわけはないでしょう そういわれると もっともな話です A 君は確率に関する知識が不足していることを知り 困惑してしまいました A 君のこの困惑に応えるのがベイズ統計学です 気象予報には気圧配置 涌井 貞美 6 7

1. 統計学を2つに分類すると ~ 一部から全体を推し量る 世の中では 統計学 という言葉がいろいろな意味に使われているけれ ど 大きく分けると記述統計学と推測統計学に 記述統計学は見やすくまとめること 統計学の狙いを一言でいえば データの裏にある本質を理解すること にあります そのアプローチの方法によって 統計学は記述統計学と推測 統計学の 2 つに大きく分類することができます 調査や実験で集めたデータをまとめて整理し 表にしたりグラフ化する のが記述統計学です 得られたデータをビジュアルにして直感的に理解で きるようにすることで データの裏にある本質に迫ろうとするわけです さらにまた 次のグラフは棒グラフです これは 2 人以上の世帯がどれ くらいの貯蓄額があるかを示したグラフです ( 平成 23 年調べ ) 帯グラフ 以上に データの特性を細かく表示するのに向いています たとえば 次のグラフを見てみましょう これは 1 世帯あたり (2 人以上 ) の平均貯蓄額 1664 万円 ( 平成 23 年 ) が預金や株など どのような形で保有されているかを示したもので 帯グ ラフです 帯グラフは このように 全体に占める構成の割合 を示す のに優れています 次ページのグラフは 2 人以上の勤労者世帯の平均可処分所得の月額 420,500 円 ( 平成 23 年 ) がどのような構成かを表わしたグラフです 帯 グラフに加え 中央に円グラフが載せられています 円グラフも帯グラフ 同様 全体に占める構成の割合を示すのに優れています さて この最後のグラフには中央値 平均値という言葉が記入されてい ます これらは資料の代表値と呼ばれる数です 集めた膨大なデータを整 14 1 章 統計学 にもいろいろある 1. 統計学を 2 つに分類すると 15

理し 大まかな数 として表現します そうすることで 細部に入り込みすぎると見えにくくなる大きな全体の姿が見えるようになります 木を見て森を見ず という表現がありますが そうならないために不可欠な表現法です グラフ表示だけでなく このような数値化も記述統計学の大切な仕事です 推測統計学は 一部から全体を推し量る 統計学のもう一つの分野である推測統計学を見てみましょう 次の2つの統計的な記述を見てください たとえば 上記の喫煙率の例でいうと たかだか2 万人から得た 喫煙率 21.1% というデータから 1 億人以上の日本人成人全体の喫煙率が本当にわかるのか? という疑問が生まれます わずか0.02% の人から取ったアンケート結果 ( 標本調査 ) なのですから 当然です この疑念 難問に応えようとするのが推測統計学の仕事なのです 我々の目にする資料の多くは標本調査によるものです アンケート調査 品質調査 実験結果などは ほとんどが全数調査ではなく ほんの一部を抜き出して調査します そこで 推測統計学の出番は非常に多いことがわかります 警察庁の発表によると 2011 年の女性の運転免許保有者数の割合は 44% である 平成 24 年全国たばこ喫煙者率調査 (JT) によると 約 2 万人を対象にした調査の結果 日本人成人の平均喫煙率は 21.1% であった 統計数字に惑わされてはならない統計学というのは 資料を扱う幅広い分野を指します その1 分野に統計解析があります 統計解析は 最初に述べた記述統計学 ( グラフ表示など ) ではなく あとで説明した 推測統計学 を中心とする 実用的な統 計分析の手法を提供します 統計的な推定 検定 分散分析 相関分析な 前者の 女性の運転免許保有者数の割合は 44% という数値は 警察 庁が日本全国からデータを収集して算出した結果です 日本人すべての運 転免許保有者数を対象にしていますから これを全数調査と呼びます 全 数調査は多くの手間と時間 そして予算が必要になります それに対して後者の 喫煙率が 21.1% という数値は 日本人すべてを 対象にした結果ではありません 1 億人余りの日本人成人の中から 2 万人 む を無 さく作 い為に選び出し 喫煙実態を調査した結果です このように たくさ んの中から一部を取り出して調査する方法を標本調査と呼びます 標本調 査の良い所は対象が小さい分 時間と手間と予算が節約できることです 推測統計学が本領を発揮するのは この標本調査により得られた資料の 分析です ただし 標本調査には常に 次のような疑念が伴います 一部から得られた結果を全体にあてはめて大丈夫か? どが具体的なテーマなのです ところで 統計学の対象となるデータは人が集めるものであり 統計学 の結果を発表するのも人 発表された結果を受け止めるのも人です した がって 扱い方によって解釈はさまざまで 誤用され 意図して悪用され ます それを言い表わしたのが はじめに にも示した次の言葉です 重要な言葉ですので もう 1 回 掲載してみました There are three kinds of lies: lies, damned lies, and statistics. ( 世の中には 3 つのウソがある ウソと大ウソ そして統計だ ) 統計学の分析結果は単純に数値であり それを解釈するのは人間です たいじそのことを常に肝に銘じ 統計学の結果に対して公平無私の態度で対峙す る習慣をつけることが最も大切なことなのです 16 1 章 統計学 にもいろいろある 1. 統計学を 2 つに分類すると 17