母集団と標本

Size: px
Start display at page:

Download "母集団と標本"

Transcription

1 3. 標本の整理この章では母集団と標本の関係について述べる 数学的取り扱いの基礎である単純無作為抽出を議論する 標本の整理に関しては 度数分布表 分割表 ヒストグラム 度数分布多角形を取り扱う 医学などでの標本の取り方を簡単にまとめる 3.. 母集団と標本多くの研究では収集されたデータそのものより そのデータが抽出されたより大きな集団について興味を持っている その集団を母集団 (populatio) という いま 00 人の学生を対象にして 体格検査をしたとき 種々の属性に関する結果の集合を標本 (sample) あるいはデータ (data) といい 標本は学生全体の母集団がもつ特徴や傾向を表す 上の例での観察単位 (observatioal uit) は学生個人であるが 動物 植物あるいは細胞組織が観察単位になることもある 標本は母集団についての情報を得るための母集団の部分集合と定義できる 医学の研究では 健常者を用いて新薬の副作用を検討する研究 ( 第一相臨床試験 ) や広く特定疾患の患者を対象として新薬効果を検討する研究 ( 第三相臨床試験 ) などが行われる この場合の母集団は調査された期間および機関での健常者や患者であり 標本はそれら母集団の特徴を知るためのものである このような研究では 母集団に関しての情報解析だけでなく 実際に新薬や治療法を適用すべき患者に関しての効果を期待している この仮想の患者群は解析対象の母集団とは異なり 標的母集団 (target populatio) と呼ばれる 従って 母集団とは標本を抽出し 標本がその部分集合であり かつ実際に研究する集団である 一方 標的母集団は我々が研究結果を適用したいと思う集団である 上の第一相臨床試験では 試験を行う製薬会社や大学の健常者がボランティアで参加する場合が多く 母集団はその会社や大学内の健常者集合で 標的母集団は一般の健常者集団である 母集団に関する研究を行うために標本を用いる理由は 研究の実行可能性が大きな理由である 母集団全員を調べられれば良いが 母集団が非常に大きな場合 全数調査 (cesus) は費用や時間の面から容易に実行できない 例えば 国勢調査では膨大な調査員と実行に際しての費用が必要である また 調査員の事前打ち合わせ さらに調査対象の全員から回答を得ることの難しさがある 回答拒否や訪問調査が出来ない個人がいることも考えられ その結果は調査の精度を劣化させる原因である 標本調査は母集団の一部を用いるために 欠測が出来るだけないような調査の実施が比較的に容易である 標本に基づいて母集団に関する推測を行うが その際の推測の精度を考慮した研究報告や意思決定を行う必要がある 3.. 標本抽出法と乱数標本抽出は単純無作為抽出 (simple radom samplig) が基本である 単純無作為抽出は次の つの条件を満たす抽出方法である () 母集団内の全ての個体が等しい確率で抽出されること () ある個体の抽出が他の個体の抽出確率に影響を与えないこと

2 例えば から 6 の自然数を書いた札を容器に入れ その中から札を 3 回抜き取る試行を考える サイコロを 3 回振って 出た目の札を取り出し その度に札を容器に戻す試行 ( 復元抽出 ) を行えば この標本抽出法は単純無作為標本抽出法である この場合は同じ札が複数回抽出される可能性がる しかし 札を抜き取った後で 容器に戻さずに 3 回抽出する場合 ( 非復元抽出 ) は条件 () を満たすが () が成立しないので 無作為抽出であるが単純無作為抽出法にならない すなわち 回目の抽出では 任意の札が /6 で抽出されるが 回目と 3 回目はそれぞれ残りの札が /5 と /4 で抽出されるからである ( 条件付き確率 ) しかし 全ての札は同じ確率 /6 で抽出されている () この例では母集団は から 6 の自然数を書いた 6 枚の札である ここで 母集団が大きい場合 例えば地域 A の成人の集合の場合は非復元抽出による無作為抽出は単純無作為抽出の近似的方法になる 単純無作為抽出を用いる利点は 多くの数理統計学的な方法がこの標本抽出を前提に置いていて 母集団に関する推論を行うためには標本抽出が重要になる 次の表は 歳の男子の身長データである このデータを母集団として 0 人を単純無作為抽出する エクセルを用いて単純無作為抽出するために A 列と B 列にそれぞれ 関数 =ROUNDUP(*RAND(),0) (A,A,,A0) =ROUNDUP(0*RAND(),0) (B,B,,B0) を設定する 関数 ROUNDUP(x,) は実数 x を切り上げて小数第 位に表す関数である この操作で (9,9), (6,5), (7,9), (5,7), (6,5), (4,9), (,8), (6,6), (8,0), (4,6) を得る この自然数の組に対応する数値を表 3. から抽出すると 36., 5.7, 39.5, 40., 5.7, 36., 33., 48., 44.7, 34.7 になる この標本は 0 人分のもので 標本サイズ (sample size) は 0 である この集合が標本であり 対象の母集団に関する情報を含んでいるが 偶然に変動するものである このことを十分理解して 統計解析後の解釈を行う必要がある 表 3. を母集団としたときの母平均 (populatio mea) は 39.5cm である 上の方法を用いて標本の大きさ 0 の標本抽出を行い その標本平均をグラフにした ( 図 3.) 母平均を標本平均で推定する場合の変動の大きさが視覚的に理解される 実際のデータ解析では母数の推定値とその変動の大きさを示す指標 ( 標準誤差 ) を合わせて 結論をまとめる必要がある

3 身長 標本平均の変動 母集団平均標本平均 実験回数 図 3.. 標本平均の変動 問 3.. 表 3. から標本サイズ 5 の標本を 0 回抽出し その標本平均の変動を図. のよう にまとめよ 表 3.. 身長データ 次にトランプ (5 枚 ) からカードをスペード クラブ ダイヤ ハートそれぞれから 3 枚ず つ単純無作為抽出する A, B, C, D 列の,, 3 行にそれぞれ 3

4 =ROUNDUP(3*RAND(),0) (A,A,A3) =ROUNDUP(3*RAND(),0) (B,B,B3) =ROUNDUP(3*RAND(),0) (C,C,C3) =ROUNDUP(3*RAND(),0) (D,D,D3) を入れて乱数を発生させた 結果はスペード : 8, 0, 5; クラブ : 3,, 8; ダイヤ : 6, 4, 4; ハート : 7, 3, 5 であった この場合は カードの種類毎に単純無作為標本抽出であり このような抽出法を層別標本抽出 (stratified samplig method) という 特定の属性 ( 男女 ) の誤差を排除し 層間の比較をする場合は適している また 属性のカテゴリに対する部分母集団の大きさに大きな差がある場合は良い方法である 例えば 工学部の学生では男女の比率に著しい差がある このとき 工学部の学生に対して標本抽出を行うと 女子学生は殆ど標本に入らない可能性がある 3.3. 度数分布表とヒストグラム母集団からのデータそのものでは データの概要が把握できないので その様相を視覚的に捕らえやすい表や図が作成される データを整理する場合に 最初に範囲 (rage) R = データの最大値 最小値 (3.) を考える 表 3. では R = = 37.6 である この範囲を参考にして データを幾つかの階級 ( クラス, class) に分けて その度数 (frequecy) を集計した表を度数分布表 (frequecy table) という 階級の数については 標本の大きさ により を参考にして決 定すると良いと思われる この場合は であるので 階級数を 0 として度数分 布表を作成する R として.0cm から 4cm 幅で階級を構成する 階級に入る度数をまとめた表を度数分布表 ( 表 3.) という 第 5 列は度数を総度数 0 で割ったもので これを相対度数という 階 級の中央値を階級値という 各階級値に度数を対応させて描いた図を度数分布多角形 ( 図 3.) いう この図より分布の形状が視覚的に捉えられる また 階級を底辺に 度数を高 さにした長方形で度数分布を表したものをヒストグラムという ( 図 3.3) 4

5 度数 表 3.. 身長データの度数分布表 階級番号 階級 階級値 度数 相対度数 [.0,6.0) [6.0,30.0) [30.0,34.0) [34.0,38.0) [38.0,4.0) [4.0,46.0) [46.0,50.0) [50.0,54.0) [54.0,58.0) [58.0,6.0) 合計 0.00 度数分布多角形 身長 図 3.. 度数分布多角形 5

6 (cm) 身長 図 3.3. ヒストグラム 問 3.. 次のデータは医学科学生に実施したある科目の試験結果である このデータから度数分布表とヒストグラムを作成せよ 表 3.3. ある教科の試験結果 統計量統計調査および実験では母集団に関する情報を標本として得て 母集団に関する推論をすることが目的で その推論結果は判断 意志及び行動決定に利用される 母集団分布の特徴を示す量を母数 (parameter) といい 統計的推論はその母数に関する推論である 例えば 変量の平均 分散および共分散などは母数である 調査は母集団からの無作為標本を用いて行うのが基本である また 実験では条件を管理した人工の母集団が解析の対象で 独立な実験の反復によりデータが得られる 調査および実験ではその目的が十分反映される複数の観測項目の設定が重要であり 観測での欠測値が出来るだけ尐なくなるような配慮が必要である 例えば 質問紙で項目が多過ぎる場合は回答者の負担が大変であり 欠測値や故意に不正確な回答をする場合が考えられる 従って 質問項目は簡明で 回答者の 6

7 負担を考えて 調査の目的に絞る必要がある 母集団から標本 ( データ ) を得た場合の最初の過程は 度数分布表 分割表 ヒストグラムおよび相関図などの表や図を用いて標本を要約することである この段階は標本の様相を視覚的に把握するために有益で 詳細な統計解析のための準備である 次の過程では基本的ないくつかの数量を用いて 標本の情報を縮約する手順をとる 定義 3.. 標本 X, X,,X に対して その関数 h(x, X,,X ) を統計量 (statistic) という この場合の標本 X i はベクトルの場合も含む 次に基本的な統計量を挙げる (i) 標本平均標本 X, X,,X に対して X X i i を標本平均 (sample mea) という (ii) 標本分散 (sample variae) (i) の標本と標本平均に対して S X i X i を標本分散という この統計量は S i X i X と変形できる 標本分散の正の平方根 S は標本標準偏差である (iii) 不偏分散 (ubiased sample variace) (i) の標本と標本平均に対して U X i X i (3.) (3.3) (3.4) を不偏分散という 本によっては この統計量を標本分散とするものもある U と S の関係は U S であり 標本数が大きいときは 両者は近似的に等しい (iv) 標本共分散標本 (X,Y ),(X,Y ),,(X,Y ) に対して または S U XY XY X ix Y iy i X i X Y i Y i (3.5) (3.6) 7

8 胸囲 を標本共分散という 標本共分散は標本分散の拡張であり その行列 S S = S XX YX S S XY YY を標本分散共分散行列という この多次元への拡張は容易である (v) 標本相関係数 (iv) の共分散行列に対して S XY r (3.7) S S XX YY を標本相関係数という この統計量は 次元ベクトル (X - X,X - X,,X - X ) と (Y - Y,Y - Y,,Y - Y ) の余弦としての意味をもつ この統計量は r を満たし 等号成立は上の つのベクトルが平行関係をもつときのみである 例 3.. 次のデータの基本的統計量を求める 表 3.4. 学生の座高 X と胸囲 Y 学生番号 X Y 相関図 (x,y) 座高 図 3.4. 座高 X と胸囲 Y の相関図 8

9 表 3. のデータを平面の打点した相関図が図 3.4 である 座高 X と胸囲 Y の相関性が視角的 に理解される 基本的な統計量は表 3.5 に与えた 論文や報告書では表 3.3 のデータの代わ りに データの概要が理解できるように表 3.5 のように要約統計量を示す場合が多い 表 3.5. データの要約統計量 標本平均 標本分散 標本標準偏差 X 標本相関係数 Y (vi) 標本メジアン ( 中央値 ) 標本 {x,x,,x } を大きさの順に並べたものを x () x () x () とする このとき メジアン = x x x ( は奇数 ) ( は偶数 ) である 例えば標本 5,, 7, 5, 3,, 6 を大きさの順に並べると,, 3, 5, 5, 6, 7 であるから 4 番目の 5 がメジアンである 標本が, 5,, 7, 5, 3,, 6 のときは 4 番目が 3 で 5 番目が 5 であるから メジアンは となる 平均とメジアンは分布の位置を表す母数である 複数の分布あるいは母集団の位置を比較する場合にはこれらが用いられる 表 3.5 はある高校での A と B クラスの数学の試験結果である このデータの標本数は共に 45 であるので メジアンは小さい方から 3 番目の標本値である したがって A と B のメジアンはそれぞれ 43 と 39 となる また それぞれの標本平均は 44.4 と 39.6 である メジアンと標本平均はほぼ同じ値であり このことから クラス A の生徒の成績が良いように思われる メジアンを含めて 3 個の四分位数 (quartile) Q i (i =,,3) が定義され Q は下半分の分布を 分割する点 Q は分布を 等分し Q 3 は分布の上半分を二等分する点である 従って Q はメジアンになる 標本については メジアンと同じ要領で Q と Q 3 が求められる 標本, 5,, 7, 5, 3,, 6 のとき 標本数が 8 個であるので 小さいほうから 番目と 3 番目のデータを平均した数が Q また 6 番目と 7 番目のデータを平均したものが Q 3 である 従って 9

10 Q 56, Q である 第 四分位と第 3 四分位の差は四分位範囲 (iterquartile rage (IQR)) と呼ばれ 外れ 値 (outlier) や極端な値 (extreme value) の検討に用いる 四分位範囲は IQR = Q3 Q である Q.5 IQR 以下とQ.5 IQR 以上の標本については 外れ値の検討対象と 3 なる 標本の共変量情報や記入ミスなどがないか見直す方が妥当である 検討の結果で妥 当な理由があれば標本値の修正をし 異常値であれば削除によってデータ解析が行われる 問 3.3. 表 3.6 をそれぞれ度数分布にまとめよ また 分散 標準偏差を計算せよ また 第 四分位と第 3 四分位を求め 外れ値等の検討をせよ 表 3.6. 数学のテスト結果 クラス 点 数 A B (vii) 標本歪度歪度はν 3 /σ 3 で定義される ここに ν 3 =E{(X-μ) 3 }, μ = E(X) である 平均に関して対称な分布については この母数は 0 である 従って 正規分布では歪度は 0 である 標本歪度は に対して ˆ ˆ 3 3 / S X i X i 3 で与えられる (viii) 標本尖度 (sample curtosis) 尖度はν 4 /σ 4 で定義される ここに ν 4 =E{(X-μ) 4 } であり 標本尖度は ˆ 4 3 X i X i である 正規分布の尖度は である 4 0

11 以上のような統計量で標本を縮約し 標本の概要を記述する方法を記述統計 (descriptive statistics) という 標本歪度や尖度はデータの正規性を調べるために用いられる 問 3.3. 次のデータは男子学生 30 人の身長 X と体重 Y のデータである 標本平均 標本分散 標本標準偏差および標本相関係数を求め 表にせよ 表 3.7. 身長と体重のデータ 学生 X Y 学生 X Y 学生 X Y 多施設からの標本 医学での調査では多施設で調査し 統計解析を行う場合が多い この際に不用意に全て のデータを合併して解析すると結論を誤る危険性がある 多施設間での調査者の技量や施 設で扱う患者背景の差が混合されて 目的の治療効果や実態が解析できない場合や 時に は逆の結論が導かれる可能性がある 次の分割表を考える 表 3.8. 施設 のデータ 表 3.9. 施設 のデータ 属性 属性 属性 あり () なし (0) 計 属性 あり () なし (0) 計 あり () あり () なし (0) なし (0) 表 3.0. 合併データ属性 属性 あり () なし (0) 計 あり () なし (0) 施設,, および合併データに関して 属性 を与えたときの 属性 ( あり ) の相対度数をそれぞれ F ( i), F ( i), F T ( i) (i=0,) とすると F ( ) = 80/00 = 4/5, F ( 0) = 4/5 (3.8) F ( ) = /3, F ( 0) = /3, (3.9)

12 F T ( ) = 9/3, F T ( 0) = 8/7 (3.0) を得る (3.7) と (3.8) から施設 と では二つに関連性が認められないが このデータを合併すると 属性 が に影響を与えているような結論を導いてしまう危険性がある このような誤やまった解析を避けるために 多施設や多母集団からの標本の合併は注意を要する この場合 属性 についての応答には施設が関連していることになる 単純無作為標本抽出が好ましい理由は 統計解析での数学的な取り扱いがこの標本抽出法を基本としているからである 従って 通常の統計解析ではこの標本抽出法に基づくことが 後の解析を容易にする 3.6. 統計的研究の型 調査 survey, cross-sectioal study 調査研究では被験者は因子 処置 結果等が同時に 回だけ観測され 複数の観測項目の観測を行っても 原因と結果 ( 因果 ) の関係は分析できない ( 例えば表 3.) 成人男性の患者群で喫煙の有無と慢性気管支炎の有無についての調査をした場合に その研究からは喫煙が気管支炎の原因であるとの結論は引き出せない 調査データから言えることは属性間の関連性だけである 高い流行の疾病や暴露因子および選挙などの行動や意識調査に関する研究に適している しかし 例.5 で触れたヒト T 細胞白血病ウイルス I 型のキャリアの調査では キャリアが希薄であり 一般的な調査は適当でない 日本ではこのキャリアはおよそ % と推定されていて 000 人程度の大きな調査でもキャリアとして観察される人数は僅かになる可能性が高い 献血データなどの数万人規模のデータを用いた解析を行う必要がある ( 表 3., ) 表 3. と は献血に基づく HTLV-I 感染者の大規模な調査データである 年齢や性別と感染者数や比率との関連性に関する分析は このウイルスの感染経路と感染力等を十分考慮して分析しなければならない 母子感染と男女間の性感染が主な感染経路で 男女間の感染は男性から女性への感染力が高いことが既知であるので その知識用いた解析が必要である 表 3.. 大分県での HTLV-I に関する血液データ (989 年 ) 年齢群男性女性献血者数感染者数相対度数献血者数感染者数相対度数 [5,9] [0,9] [30,39] [40,49] [50,65] 合計

13 表 3.. 大分県での HTLV-I に関する血液データ (999 年 ) 年齢群 男性 女性 献血者数 感染者数 相対度数 献血者数 感染者数 相対度数 [5,9] [0,9] [30,39] [40,49] [50,65] 合計 また このデータは時間的な感染者の推移の解析もでき 感染者が減尐傾向にあることが 分かる 実験 experimet 実験研究では因子水準を設定し その水準を実験単位に暴露させ そして一定の時間後に結果を観測する 実験単位はヒト 動物 および細胞組織などである 因子に 水準を仮定する場合は処置 (treatmet) と対照 (cotrol) が通常考えられる プラセボ または標準薬 ( 処置 ) が対照群に割り付けられ 新治療法との比較検討を行う このとき 処置水準に従って 結果が異なると判断されれば処置と結果の間に因果関係が結論付けられる 例えば 一定期間 ある薬剤の異なる投与量で患者群を治療したときに 採血検査で血中成分に差が見られれば この薬剤と血中成分量に因果関係が認められる 実験で条件や因子の水準を複数設定して 物質に関する種々の計測や人に対する観察が行われる場合も考えられる 実験研究は人工的に作られる現象の観測と解析である 実験の順序や 条件水準の割り付け方からくる偏りを排除するように実験を実行する必要がある 表 3.3. 貯蔵食品と含水量 食品含水量 Y ij Y i A A A A A フィッシャーは実験計画の三原則として () 無作為化の原則 () 反復の原則 (3) 局所管理の原則 を揚げている () は因子水準や実験順序を実験単位 ( 物質や人など ) に割り付けるときの 3

14 原則である () は条件や因子水準を与えたときの 測定誤差や散布度 ( 分散 ) の推定のための原則である また (3) は実験を行う場の管理に関する原則である 表 3.3 は貯蔵食料品 A,A,,A 5 の 00g に含まれる含水量 (g) の検査結果である この実験では () と () の原則を満たせばよく このような実験を一元配置実験という この場合の因子は食品で 貯蔵された食品それぞれから 4 袋を無作為抽出し 水分検査を行う この実験では各食品を 4 袋取り出しているので 反復の原則を満たされている 水分検査の順番を全ての袋に関して無作為に行う必要がある このことは 測定順序の効果を誤差にするためである 実験計画法に関する詳細は後の章で説明する 臨床試験 cliical trial 研究対象は患者であり 毒性 (toxicity) および効果 (efficacy) の実験研究を行う この際に (i) 参加者から実験に参加するための同意 (ii) 患者の基準や (iii) 処置の修正および試験の早期終了に関する環境または条件の検討が必要になり 試験は複雑な研究になる また 患者は個々に処置を受けるので 十分な例数確保には長い年月と他施設による試験の実施が伴う 結果評価に当たっては 患者と患者に関わる専門家や評価者に患者に割り付けられた因子水準を知らせずに試験を行う二重盲検法 (double-blid trial) がとられる この方法が必ずしも可能でない場合もある 試験は第 相 (phase) から 4 相までがある 第 相 : 尐数の健常志願者に対する安全性の検討第 相 : 尐数の患者に対する安全性と有効性の検討第 3 相 : 多くの患者に対する標準薬と新薬との比較検討第 4 相 : 市販後の副作用と有効性の追跡調査 (6 年後に再審査 ) 表 3.4 は乳がん患者に対して行った第 3 相試験の患者背景データである この試験は患者群を用いる薬剤 A と B に関する 群に無作為割付を行った 試験前に患者群に偏りが無いことを確認する意味でこの表は必要である それぞれの群の患者は各薬剤を毎日決められた用量で服用する この際に この服用が遵守されるように管理する必要がある この表から 群間の患者特性に差が無いと考えてよく 投薬試験による差は用いた薬剤によるものと考えられる 図 3.5 から 3.7 は全コレステロール 低コレステロール および高コレステロールの治療中の推移である 図には 実験開始時点と 3 ヶ月 6 ヶ月 ヶ月および 4 ヶ月時点での 群に比較が 標本平均と標準偏差を用いて示してある これらの図では中心の点が平均で その上下に線分で示した幅が標準偏差である データが正規分布の場合はこれらの線分の間にデータのおよそ 68% が入ることになる このように 平均と標準偏差または標準誤差で示した図を平均比較図 (mea compariso chart) という 4

15 mg/dl 表 3.4. 患者背景 ( 特徴 ) 投与薬剤 A B 平均年齢 ( 年 ) 64 6 平均身長 (cm) 53 5 平均体重 (kg) BMI (media, kg/m ) 腫瘍 度数 度数 T0 0 Tab Tb 0 Ta エストロゲンレセプター 度数 度数 正 9 4 不明 4 7 外科処置乳房切除術 58 6 乳房温存 + 放射線術 乳房温存術 0 30 T-CHOL 0 0 (A) (B) 70 Before 3M* 6M M 4M 図 3.5. 血中の全コレステロール値推移 :M= moth 月 5

16 mg/dl mg/dl LDL (A) (B) 80 Before 3M 6M M 4M 図 3.6. 血中の低コレステロール値推移 :M= moth 月 70 HDL 65 (A) 60 (B) Before 3M 6M M 4M 図 3.7. 血中の高コレステロール値推移 :M= moth 月 6

17 第 4 相臨床試験は薬剤の効果や副作用についての実地での調査であり 大きな標本が要求されている 表 3.5 はある輸液の試験結果の一部であり 標本は 483 ある このデータの解析では 性別による薬剤効果の検討が目的である このような大標本に基づく結果が厚生省に提出され 薬剤の市販後の安全性と効果に対しての再審査となる 表 3.5. 男女別の輸液効果 著効 有効 やや有効 無効 計 男 女 計 前向き研究 prospective study この研究では観測時間に対して 反復測定がなされる 通常は人工的な介入 (treatmet) は行われない コホート研究は同一母集団に対して 反復して標本が取られ パネル研究では同一の標本について反復測定される パネル研究では同一の被験者や個体が対象となるので 経時的な観測で被験者が出来るだけ脱落しないような配慮が必要になる 実際の解析では脱落した被験者のデータを除いて解析されるが 脱落数があまりに多い場合の統計解析は不可能である 前節で示した乳がん患者を用いた追跡調査はパネル研究の例である 実際の解析では脱落した被験者のデータを除いて解析されるが 脱落数があまりに多い場合の統計解析は不可能である 3.6. 節の HTLV-I データは人々の外部からの流入や外部への移動が無視できれば 同一母集団からの反復測定と見なされる 000 年以降は献血により HTLV-I 感染が陽性の人に通知し 次回からの献血を断っている 従って 000 年以降のデータは母集団からの無作為抽出とは考えられず 通常のデータ解析は不適当で スクリーニングの効果を考慮したモデルを構築して解析する必要がある ケース コントロール研究 case-cotrol study ケース ( 患者 ) を最初に収集し 可能なリスク因子に対して時間を遡って 記録を調査する 稀な疾患 ( ガンなど ) の場合には 通常の標本抽出を行えば 標本中にほとんど患者がいないか または希薄であるために 解析が巧く行えない 献血データなどの大規模なものがあれば良いが 一般には解析に適する患者数を通常の標本抽出で得ることは難しい 従って 先に患者を抽出して その共変量または因子情報を解析することで リスク因子の分析を行うが リスク要因を断定できない 7

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 ) データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散, . 無作為標本. 基本的用語 推測統計における基本的な用語を確認する 母集団 調査の対象になる集団のこと 最終的に, 判断の対象になる集団である 母集団の個体 母集団を構成する つ つのもののこと 母集団は個体の集まりである 個体の特性値 個体の特性を表す数値のこと 身長や体重など 特性値は, 変量ともいう 4 有限母集団と無限母集団 個体の個数が有限の母集団を 有限母集団, 個体の個数が無限の母集団を

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

Microsoft PowerPoint - CVM.ppt [互換モード]

Microsoft PowerPoint - CVM.ppt [互換モード] 遺伝子組み換えコーン油を事例とした CVM 質問 問 1 現在 遺伝子組み換えトウモロコシを原料として使っているコーン油が 1 本 900gあたり約 600 円で販売されています もし 遺伝子組み換え原料を完全に使っていないコーン油を販売しようとすれば それは 流通管理を徹底しなければならないことから 値段がより高くなることが予想されます あなたは 900g のコーン油 1 本について 追加的な値上がりが何円までだったら

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63> 第 5 回統計的推定 実験計画学 A. 統計的推定と検定母集団から無作為抽出した標本から母集団についてなんらかの推論を行う. この場合, 統計から行う推論には統計的 ( ) と統計的 ( ) の 2つがある. 推定統計的に標本の統計量から母集団の母数 ( 母平均, 母標準偏差など ) を推論することを統計的推定という. 例 : 視聴率調査を 200 人に対して行い, 番組 Aの視聴率を推定した. 検定統計的に標本の統計量から母数に関する予想の真偽を検証することを統計的検定という.

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

散布度

散布度 散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C> 統計の種類 統計学 データの種類データのグラフ化中心を表す特性値 記述統計母集団 ( 調査対象の集団 ) をすべて調査でき その調査結果に基づき データをまとめる統計 推測統計母集団 ( 調査対象の集団 ) をすべて調査できないが 一部のデータから母集団の状況を推測する統計 外れ値 データの中には 他の観測値に比べて著しく離れた値が含まれている場合があります ( 入力ミスではなく ) このような値のことを外れ値といいます

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 春学期統計学 I 記述統計と推測統計 担当 : 長倉大輔 ( ながくらだいすけ ) 1 本日の予定 本日はまず記述統計と推測統計の違い 推測統計学の基本的な構造について説明します 2 記述統計と推測統計 統計学とは? 与えられたデータの背後にある 特性 法則 を 検証 発見 分析 するための手法の開発 その応用などに関わる学問の事です 3 記述統計と推測統計 データの種類 データの種類はおおまかに

More information

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード] データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

モジュール1のまとめ

モジュール1のまとめ 数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次 夏期講習高 センター数学 ⅠA テキスト第 講 第 講 三角比 データの分析 ABC は AB=,BC=,AC= を満たす ⑴ cos B= アイ である 辺 BC 上に点 D を取り, ABD の外接円の半径を R とするとき, AD R = ウであり, 点 D を点 B から点 C まで移動させるとき,R の最小値はエである ただし, 点 D は点 B とは異なる点とする ⑵ ABD の外接円の中心が辺

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 千早高校学力スタンダード 自然数 整数 有理数 無理数の用語の意味を理解す る ( 例 ) 次の数の中から自然数 整数 有理 数 無理数に分類せよ 3 3,, 0.7, 3,,-, 4 (1) 自然数 () 整数 (3) 有理数 (4) 無理数 自然数 整数 有理数 無理数の包含関係など

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0 統計学 Ⅱ(06) 0 章 0 章 0 章標本抽出と標本分布. 母集団と標本 () 視聴率調査 () 有限母集団と無限母集団 (3) データと母集団. 標本抽出法 () 全数調査と標本調査 () 無作為抽出と有意抽出 (3) 単純無作為抽出法 (4) 層別抽出法 (5) 多段抽出法 (6) 系統抽出法 (7) その他の抽出法 3. 標本平均 の標本分布 () 標本平均の標本分布の例 () 標本平均

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n 0, p 6 の二項分布になる さいころを 0 回振ったときに が 0 回出る

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

8 A B B B B B B B B B 175

8 A B B B B B B B B B 175 4.. 共分散分析 4.1 共分散分析の原理 共分散分析は共変数の影響を取り除いて平均値を比較する手法 (1) 共分散分析 あるデータを群間比較したい そのデータに影響を与える他のデータが存在する 他のデータの影響を取り除いて元のデータを比較したい 共分散分析を適用 共分散分析 (ANCOVA:analysis of covariance アンコバ ) は分散分析に回帰分析の原理を応 用し 他のデータの影響を考慮して目的のデータを総合的に群間比較する手法

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 自然数 整数 有理数 無理数の包含関係など 実数 の構成を理解する ( 例 ) 次の空欄に適当な言葉をいれて, 数の集合を表しなさい ア イ 無理数 整数 ウ 無理数の加法及び減法 乗法公式などを利用した計 算ができる また 分母だけが二項である無理数の 分母の有理化ができる ( 例 1)

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

ロペラミド塩酸塩カプセル 1mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにロペラミド塩酸塩は 腸管に選択的に作用して 腸管蠕動運動を抑制し また腸管内の水分 電解質の分泌を抑制して吸収を促進することにより下痢症に効果を示す止瀉剤である ロペミン カプセル

ロペラミド塩酸塩カプセル 1mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにロペラミド塩酸塩は 腸管に選択的に作用して 腸管蠕動運動を抑制し また腸管内の水分 電解質の分泌を抑制して吸収を促進することにより下痢症に効果を示す止瀉剤である ロペミン カプセル ロペラミド塩酸塩カプセル 1mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにロペラミド塩酸塩は 腸管に選択的に作用して 腸管蠕動運動を抑制し また腸管内の水分 電解質の分泌を抑制して吸収を促進することにより下痢症に効果を示す止瀉剤である ロペミン カプセル 1mg は 1 カプセル中ロペラミド塩酸塩 1 mg を含有し消化管から吸収されて作用を発現する このことから

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 3 章度数分布とヒストグラム データの中の分析 ( 記述統計 ) であれ データの外への推論 ( 推測統計 ) であれ まず データの持つ基本的特性を把握することが重要である 1 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する 3 章 グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える 4 5 6 章 データが母集団からのランダムサンプルならば 母集団についての推測を行う

More information

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - Statistics[B] 講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 kkarato@eco.u-toyama.ac.jp

More information

(3) 摂取する上での注意事項 ( 該当するものがあれば記載 ) 機能性関与成分と医薬品との相互作用に関する情報を国立健康 栄養研究所 健康食品 有効性 安全性データベース 城西大学食品 医薬品相互作用データベース CiNii Articles で検索しました その結果 検索した範囲内では 相互作用

(3) 摂取する上での注意事項 ( 該当するものがあれば記載 ) 機能性関与成分と医薬品との相互作用に関する情報を国立健康 栄養研究所 健康食品 有効性 安全性データベース 城西大学食品 医薬品相互作用データベース CiNii Articles で検索しました その結果 検索した範囲内では 相互作用 販売しようとする機能性表示食品の科学的根拠等に関する基本情報 ( 一般消費者向け ) 商品名蹴脂粒食品の区分 加工食品 ( サプリメント形状 その他 ) 生鮮食品機能性関与成分名キトグルカン ( エノキタケ抽出物 ) 表示しようとする機能性本品はキトグルカン ( エノキタケ抽出物 ) を配合しており 体脂肪 ( 内臓脂肪 ) を減少させる働きがあります 体脂肪が気になる方 肥満気味の方に適しています

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint slide2forWeb.ppt [互換モード] 講義内容 9..4 正規分布 ormal dstrbuto ガウス分布 Gaussa dstrbuto 中心極限定理 サンプルからの母集団統計量の推定 不偏推定量について 確率変数, 確率密度関数 確率密度関数 確率密度関数は積分したら. 平均 : 確率変数 分散 : 例 ある場所, ある日時での気温の確率. : 気温, : 気温 が起こる確率 標本平均とのアナロジー 類推 例 人の身長の分布と平均

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

Microsoft Word - 第14回定例会_平田様_final .doc

Microsoft Word - 第14回定例会_平田様_final .doc クロスオーバー実験のデザインと解析 - テレメトリー法によ る QT/QTc 試験の実データを用いた検討 - II. クロスオーバー実験の統計解析 4) 有意差検定と信頼区間方式の解析の比較 平田篤由 薬理統計グループ安全性薬理チーム 要約 : ヒトの QT/QTc 評価試験における判断基準は,QTc 間隔の 95% 信頼区間の上限が 10ms を越えるかどうかである. 一方, 非臨床試験のイヌを用いたテレメトリー

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 度数分布とヒストグラム データとは 複雑な確率ゲームから生まれたと考えてよい データ分析の第一歩として データの持つ基本的特性を把握することが重要である 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える データが母集団からのランダムサンプルならば 母集団についての推測を行う 度数分布とヒストグラムの作成

More information

統計学の基礎から学ぶ実験計画法ー1

統計学の基礎から学ぶ実験計画法ー1 第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3

More information

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算 統計学テキストの69ページに 平均偏差 分散 標準偏差 変動係数 標準誤差 信頼区間に関する記述がある 分布を考える分布の中心の位置 ( 例 ) 65 53 44 78 50 の数値の算術平均は (65+53+44+78+50)/5=58 である 此れだけでは 分布の状態がわからない ばらつきの程度を表すには最大値と最小値との差 (78-44)=34 これをレンジ ( 範囲 ) と言う しかし 両端の数字だけでは

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第1章 母集団と統計データ 本章では, ビジネスのさまざまな場面において統計データを扱ううえで, もっとも基本的事項となる母集団の概念と統計データの種類についてまとめています 母集団の統計的性質を調べるためにとても重要な概念であるサンプリングについて述べるとともに, ランダムサンプリングの重要性についても説明します 統計分析の考え方 ビジネスの多くの場面において, 統計分析は重要です この場合の統計分析とは,

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 都立大江戸高校学力スタンダード 平方根の意味を理解し 平方根の計算法則に従って平方根を簡単にすることができる ( 例 1) 次の値を求めよ (1)5 の平方根 () 81 ( 例 ) 次の数を簡単にせよ (1) 5 () 7 1 (3) 49 無理数の加法や減法 乗法公式を利用した計算がで

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 絶対値の意味を理解し適切な処理することができる 例題 1-3 の絶対値をはずせ 展開公式 ( a + b ) ( a - b ) = a 2 - b 2 を利用して根号を含む分数の分母を有理化することができる 例題 5 5 + 2 の分母を有理化せよ 実数の整数部分と小数部分の表し方を理解している

More information

学力スタンダード(様式1)

学力スタンダード(様式1) (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 稔ヶ丘高校学力スタンダード 有理数 無理数の定義や実数の分類について理解し ている 絶対値の意味と記号表示を理解している 実数と直線上の点が一対一対応であることを理解 し 実数を数直線上に示すことができる 例 実数 (1) -.5 () π (3) 数直線上の点はどれか答えよ

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

memo

memo 数理情報工学特論第一 機械学習とデータマイニング 4 章 : 教師なし学習 3 かしまひさし 鹿島久嗣 ( 数理 6 研 ) kashima@mist.i.~ DEPARTMENT OF MATHEMATICAL INFORMATICS 1 グラフィカルモデルについて学びます グラフィカルモデル グラフィカルラッソ グラフィカルラッソの推定アルゴリズム 2 グラフィカルモデル 3 教師なし学習の主要タスクは

More information

Ecel 演習問題 Work Shee 解答 第 章 Ecel 演習問題 WorkShee 解答 問題 - 4 8 7 転置行列 4 8 7 TRANSPOSE( ) 問題 - X.6 4 4.8 8 4.9 6. 7 48 8. X 転置行列 4 8 7 4 6 48 TRANSPOSE( ).6 4.8.9. 8. 問題 -.6 4 4.8 8 y.9. 7 8. 転置行列 4 8 7 TRANSPOSE(

More information

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt 主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで

More information

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって

More information

stat-base_ppt [互換モード]

stat-base_ppt [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 髙木廣文東邦大学看護学部国際広域保健分野 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは? アンケート調査で学生のアルバイト実施を調べる

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領 数と式 (1) 式の計算二次の乗法公式及び因数分解の公式の理解を深め 式を多面的にみたり目的に応じて式を適切に変形したりすること 東京都立町田高等学校学力スタンダード 整式の加法 減法 乗法展開の公式を利用できる 式を1 つの文字におき換えることによって, 式の計算を簡略化することができる 式の形の特徴に着目して変形し, 展開の公式が適用できるようにすることができる 因数分解因数分解の公式を利用できる

More information

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - 三次元座標測定 ppt 冗長座標測定機 ()( 三次元座標計測 ( 第 9 回 ) 5 年度大学院講義 6 年 月 7 日 冗長性を持つ 次元座標測定機 次元 辺測量 : 冗長性を出すために つのレーザトラッカを配置し, キャッツアイまでの距離から座標を測定する つのカメラ ( 次元的なカメラ ) とレーザスキャナ : つの角度測定システムによる座標測定 つの回転関節による 次元 自由度多関節機構 高増潔東京大学工学系研究科精密機械工学専攻

More information

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ 区間推定に基づくサンプルサイズの設計方法 7.7. 株式会社応用数理研究所佐々木俊久 永田靖 サンプルサイズの決め方 朝倉書店 (3) の 章です 原本とおなじ 6 種類を記述していますが 平均値関連 4 つをから4 章とし, 分散の つを 5,6 章に順序を変更しました 推定手順 サンプルサイズの設計方法は, 原本をそのまま引用しています R(S-PLUS) 関数での計算方法および例を追加しました.

More information

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2 春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.jp website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 中学校学習指導要領解説数学統計関係部分抜粋 第 3 節各学年の内容 [ 第 1 学年 ] D 資料の活用 (1) 目的に応じて資料を収集し, コンピュータを用いたりするなどして表やグラフに整理し, 代表値や資料の散らばりに着目してその資料の傾向を読み取ることができるようにする アヒストグラムや代表値の必要性と意味を理解すること イヒストグラムや代表値を用いて資料の傾向をとらえ説明すること 用語 記号

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

シプロフロキサシン錠 100mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにシプロフロキサシン塩酸塩は グラム陽性菌 ( ブドウ球菌 レンサ球菌など ) や緑膿菌を含むグラム陰性菌 ( 大腸菌 肺炎球菌など ) に強い抗菌力を示すように広い抗菌スペクトルを

シプロフロキサシン錠 100mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにシプロフロキサシン塩酸塩は グラム陽性菌 ( ブドウ球菌 レンサ球菌など ) や緑膿菌を含むグラム陰性菌 ( 大腸菌 肺炎球菌など ) に強い抗菌力を示すように広い抗菌スペクトルを シプロフロキサシン錠 mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにシプロフロキサシン塩酸塩は グラム陽性菌 ( ブドウ球菌 レンサ球菌など ) や緑膿菌を含むグラム陰性菌 ( 大腸菌 肺炎球菌など ) に強い抗菌力を示すように広い抗菌スペクトルを有し 上気道感染症 尿路感染症 皮膚感染症などに有効なニューキノロン系の合成抗菌剤である シプロキサン 錠

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

基礎統計

基礎統計 基礎統計 第 4 回講義資料 本日の講義内容 第 3 章 : 次元データの整理 散布図 [ グラフ ] 共分散と相関係数 [ 数値 ] 回帰分析 [ 数値とグラフ ] 偏相関係数 [ 数値 ] 第 3 章 次元のデータ 第 3 章 : 次元のデータ ( 目的 ) 変数間の関係を探る 相関と回帰 ( 相関 ) 変数を区別せず対等にみる ( 相関関係 ) 身長と体重, 教科目の成績 ( 回帰 ) 一方が他方に影響を与える

More information

【指導のポイント】

【指導のポイント】 教材 -B-() の解答資料の活用 分析 さいひんち 度数 最頻値 の解決のために さいひんち最頻値の相対度数の求め方 説明文 相対度数は ( 相対度数 )=( 最頻値の階級の度数 ) ( ( ア ) ) で求めることができる 最頻値の階級の度数は ( イ ), ( ア ) は, ( ウ ) であるから求める ( イ ) 相対度数は, =.9 となる ( ウ ) ( ア ) 度数の合計 ( イ )

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 時系列分析 変量時系列モデルとその性質 担当 : 長倉大輔 ( ながくらだいすけ 時系列モデル 時系列モデルとは時系列データを生み出すメカニズムとなるものである これは実際には未知である 私たちにできるのは観測された時系列データからその背後にある時系列モデルを推測 推定するだけである 以下ではいくつかの代表的な時系列モデルを考察する 自己回帰モデル (Auoregressive Model もっとも頻繁に使われる時系列モデルは自己回帰モデル

More information

学習指導要領

学習指導要領 (1 ) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 自然数 整数 有理数 無理数の包含関係など 実 数の構成を理解する ( 例 ) 次の空欄に適当な言葉をいれて, 数の集合を表しなさい 実数の絶対値が実数と対応する点と原点との距離で あることを理解する ( 例 ) 次の値を求めよ (1) () 6 置き換えなどを利用して 三項の無理数の乗法の計

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

相関係数と偏差ベクトル

相関係数と偏差ベクトル 相関係数と偏差ベクトル 経営統計演習の補足資料 07 年 月 9 日金沢学院大学経営情報学部藤本祥二 相関係数の復習 r = s xy s x s y = = n σ n i= σn i= n σ n i= n σ i= x i xҧ y i തy x i xҧ n σ n i= y i തy x i xҧ x i xҧ y i തy σn i= y i തy 式が長くなるので u, v の文字で偏差を表すことにする

More information

_KyoukaNaiyou_No.4

_KyoukaNaiyou_No.4 理科教科内容指導論 I : 物理分野 物理現象の定量的把握第 4 回 ( 実験 ) データの眺め ~ 統計学の基礎続き 統計のはなし 基礎 応 娯楽 (Best selected business books) 村平 科技連出版社 1836 円 前回の復習と今回以降の 標 東京 学 善 郎 Web サイトより データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布

More information

学習指導要領

学習指導要領 (1) 数と式 ア整式 ( ア ) 式の展開と因数分解二次の乗法公式及び因数分解の公式の理解を深め 式を多面的にみたり目的に応じて式を適切に変形したりすること (ax b)(cx d) acx (ad bc)x bd などの基本的な公式を活用して 二次式の展開や因数分解ができる また 式の置き換えや一文字に着目するなどして 展開 因数分解ができる ( 例 ) 次の問に答えよ (1) (3x a)(4x

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information