数表 4-1. つづき i\n
|
|
|
- あおい たかにし
- 7 years ago
- Views:
Transcription
1 第 4 章正規性の検定分布を利用する検定,t- 検定, 分散分析および各種多重比較 範囲検定などは, 正規分布が前提となる. 同時に群間の分散の一様性も要求される. しかし, 一般的に等分散性の検定は利用されているが, 正規分布の検定を実施した後の多重比較検定などの例は極めて少ない ( 野村,2002). おそらく等分散性を確認すれば正規性をカバーできるということで正規性の検定を省略していると考えられる. 正規性の検定法は, あまり使用していないためかその手法について知られていない. 正規性を検定するためには, いつかの手法 ( 武藤,2000) が紹介されている. 標本が抽出された母集団の分布は正規分布である という帰無仮説を検定する. 下記に幾つかの解析法を示した. Kolmogorov-Smirnov 検定 Lilliefors 検定 Shapiro-Wilk の W 検定 ( 後述 ) カイ分布を用いる適合度検定 ( 後述 ) 1. Shapiro-Wilk( シャピロウィルク ) の W 検定計算し易いように少数例を用い説明する. 表 1 は F344 ラットの 3 週間の増体重である. 表 1. 雄若齢 F344 ラットの増体重 動物番号 増体重 (g) 観察度数 Shapiro-Wilk の W 検定の計算 ( 椿ら, 2001) 平方和 = =52, =32, =16, =10, =2 これら算出した値はいずれもバラツキを表す値である. 標本数が奇数の場合, 残った値は使用しない. 次にこれらの値と算出した係数 ( 数表 4-1) との積を算出して結合する. この場合, 標本数は,10(n) で i=1, 2, 3, 4, 5 に対する値,0.5739, , , , を下記の式に代入する. (0.5739)(52)+(0.3291)(32)+(0.2141)(16)+(0.1224)(10)+(0.0399)(2)=45.10 そして, 統計量 W を算出する. W = = 数表 4-2 から は P>0.95 (P=0.95~0.98) で, これらの 10 個の値は, 非常に正規分布に近いことがわかる. SAS JMP による解析結果を表 2 に示した. 表 2. SAS JMP による Shapiro-Wilk の W 検定結果 (W 値と P 値 ) W P 値 (Prob<W) 数表 4-1. Coefficient for Shapiro-Wilk Test (Conover, 1999) i\n
2 数表 4-1. つづき i\n 数表 4-1. つづき i\n 数表 4-1. つづき i\n
3 数表 4-1. つづき i\n 数表 4-2.Quantiles of the Shapiro-Wilk Test Statistic n
4 数表 4-2. つづき n
5 SAS JMP による解析結果を下記に示した. 41
6 SAS JMP では, サンプルデータの ダイェット の Quack および Quick の体重変化を開く. 分析 一変量の分布 Quack および Quick の体重変化を Y, 列へ アクション OK 各図の赤三角をクリック 表示オプション より高次のモーメントのひずみ度およびとがり度を読み取る. 表 3 にひずみ度ととがり度からデータの分布を把握する. 表 3. ひずみ度ととがり度の把握 データ Quack の体重変化 Quick の体重変化 ひずみ度 とがり度 ワイド Skewness: 歪度 歪み度 ゆがみ : ひずみ度は, 左右対称か否かを判定する統計量である. 正規分布では, 歪み度は 0 である. 右に裾を引く場合は, 正である. 左に裾を引く場合は, 負になる. スキューネスと読む. センド Kurtosis: 尖度 尖り度 : とがり度は, 正規分布の場合 0 となる. 扁平の分布は負となる. カート-シスと読む ( 新村,2000). 歪み度と尖り度を加えて絶対値 2 以上の場合, 正規性は保証できない傾向にある. 同様の例題 ( 表 1) に対してカイ分布を用いた適合検定によって実施してみる. 解析ソフトは群馬大学の青木先生の無料ソフト ( ) を使用した. 解析結果を表 3 に示した. 正規分布へのあてはめ ( 面積を計算する方法 ) 平均値 = ( 各クラスにおける個体数を入力するため前述の とは異なる. したがって, 分散および標準偏差も同様に異なる ) 分散 = 標準偏差 = 表 3. 雄若齢 F344 ラットの増体重の分布 階級開始値 観察度数 相対度数 理論比 期待値 合計 適合度の検定 最初の 3 カテゴリーを併合した. 最後の 3 カテゴリーを併合したカイ二乗値 = 自由度 = 1( カテゴリーマイナス 3= 4-3=1), したがって, カテゴリー ( 区間 ) は 4 以上を設定する. 有意確率 = 有意差を認めず正規性を確認できた. したがって, この場合 Shapiro-Wilk の W 検定と同一の結果となった. 42
7 2. カイ分布を用いた手計算 ( 柴田,1970) および SAS JMP による Shapiro-Wilk の W 検定ある学生が Crimson clover の花粉粒の直径を測定しクラス分けをした結果 ( 表 4) である. この標本の母集団は正規分布をしているといえるか? カイ分布を用いた手計算および SAS JMP による Shapiro-Wilk の W 検定の結果を示す. カイ分布を用いた計算 適合検定, 標本分布 ( 観測値 ) が正規分布 ( 理論値 ) に一致しているかどうかを検定する. 表 4. Crimson clover の花粉粒の 直径を測定 クラス * 観測値 (x) * 接眼ミクロメータの目盛り数. 1 目盛は約 1.43μs である. この表では観測値の実際の分布よりも上下 1 区間 ( クラス ) 各々余分にとっている. これは正規分布が限りなく続くことを考慮してある. 表 4 から計算に必要な数値を表 5 の如く作成する. x - x 表 5. 計算に必要な諸数値 x - x Sx ( 面積 )* の差 の差 N ** x は観測値, x は平均値 =29.90,Sx は標準偏差 =3.55,N は総観察数 =137 * 正規分布の面積表 ( 数表 4-3) による.** ここだけは和で, = とする. 43
8 数表 4-3. 正規分布の面積と高さ ( 柴田,1970) Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積
9 数表 4-3. つづき Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積
10 数表 4-3. つづき Z* 高さ 面積 Z* 高さ 面積 *= σ X クラス 粒数 観測値 (x) 表 6. 計算過程および計算結果 理論値 の差 N=T x - T 2 ( x - T ) ( x - T ) T = = Total のカイ二乗値 = = この場合の自由度であるが, 当初は 12 にクラス分けされたが, 理論値 5 以下のクラス分けに統合したため T= の差 N で見られる如く 7 クラスになった. 故に自由度は 7-3=4 である. カイ二乗計算値 = X 2 = 7.007( 表 6) 自由度 4,X 2 の分布表 ( 数表 4-3) から に対する確率は,5% 水準値が でこの値より小さいことから 5% 水準で有意 (P>0.05) を認められなかったことになる. カイ分布から逸脱していないことがわかる. すなわち, 標本の母集団は正規分布をしていると結論される. 本検定法は階級幅 ( クラス ) を幾つに設定するかによって有意水準が異なってくる. 2 46
11 数表 4-3. カイ二乗分布のパーセント点 ( 吉村ら,1987) 有意水準点,α 階級 第 4 章正規性の検定 クラス ( 階級幅 ) の設定により有意差が変化する.3 種類のクラス設定による検出力の違いを表 7 に示した ( 前述の青木先生のプログラムによる ). データの整理 表 7. クラス ( 階級幅 ) の設定による有意差の変化 観測値 観察個数 クラス 観測値 観察個数 クラス 観測値 観察個数 クラス クラスの数 カイ二乗値 自由度 9-3=6 5-3=2 4-3=1 有意水準 ( 直接確率 ) P=0.223 P=0.030 P=0.043 判定 正規性 非正規性 非正規性 区間の分けの選び方は, 自由度を, なるべく 5 以上 20 以下に設定する. 自由度は, クラス数を k で表せば k-3 で表される. この理由は, 通常は k-1 となるが, 平均値と標準偏差を標本から推定したので自由度はさらに 2 へるから,D.F.= (k-1)-2= k-3 となる. したがって, 正規性の検定は, 解析者によって検出力が異なることが示唆される. 47
12 SAS JMP による解析結果を下記に示した. Shapiro-Wilk の W 検定の結果は, より大きな値をとる確率が であることを示している. したがって, 標本は正規母集団より抽出されたものではないと統計処理の結果は述べている. 数表 4-2 では自由度が 50 までにとどまっているため正確な棄却はできないが, 自由度が大きくなるにしたがって,W 値が でも正規性が棄却されることから はおそらく高い水準で有意差を示したことになることが推測される. カイ分布を用いる適合度検定とは, 結果が大きく異なる. しかし,Shapiro-Wilk の W 検定は, 極端に大きい数値から極端に小さい数値の差を利用していることから, 分布の違いを検定していることが肌で感じられる. 3. ほぼ同一分布で標本数が異なるデータに対する Shapiro-Wilk の W 検定の検出力 Shapiro-Wilk の W 検定は, 標本数の違いによって検出力が異なることが示唆されることからほぼ同一の分布を設定して, 標本数を異なる場合を想定して Shapiro-Wilk の W 検定を実施した. 使用したデータはラットの 3 週間の増体重から抜粋したデータを使用した. 例 1 では,70, 80, 85, 90, 94, 99, 101, 102, 104, 105, 108, 111, 112, 114, 121, 125, 131 の 17 標本. 例 2 では, 例 1 のデータを 2 回 (34 標本 ) 繰り返し使用した. 例 3 では, 例 1 のデータを 3 回 (51 標本 ) 繰り返し使用した. 例 4 では, 例 1 のデータを 4 回 (68 標本 ) 繰り返し使用した. 48
13 例 1: 標本数 17 ラット 13 週間の増体重 (g), N=17 例 2: 標本数 34 ラット 13 週間の増体重 (g), N=34 49
14 例 3: 標本数 51 ラット 13 週間の増体重 (g), N=51 例 4: 標本数 68 ラット 13 週間の増体重 (g), N=68 50
15 以上の結果を表 8 に集約する. 表 8. 数の違いによる Shapiro-Wilk の W 検定の検出力変動係数 Shapiro-Wilk の W 検定標本数ヒストグラム平均値 (%) W 値有意水準 (NS) (NS) (NS) (S) N=68 NS, 有意差を示さない, 正規性を示す.S, 有意差を示す. 正規性を示さない. ほぼ同一な分布 ( ヒストグラム ) の場合, 標本数が小さいと W 値が大きくなる. 標本数が大きくなるに従って正規性の検出が低下する. カイ分布を利用した場合は, グループ数を適当に調節できるが,Shapiro-Wilk の W 検定ではグループの設定ができない. したがって, 大標本の場合,Shapiro-Wilk の W 検定は, 正規性の確保が難しいことが推測される. 以上を総括するとカイ分布を用いる適合度検定とは, 階級幅の設定の違いによって正規性の判断が異なる. すなわち, 階級に所属する個体数が大きい場合, 正規性を保つことが困難となり, 逆にクラス数を多く設定すると正規性が保たれる傾向にある. 実際の使用場面では,Shapiro-Wilk の W 検定またはカイ分布を用いる適合度検定のどちらを選択するかは, 試験責任者にお任せする. 4. 正規分布の不思議実際の毒性試験から得られた定量データに対して正規分布の検定を実施した結果, 興味ある現象が認められたので報告する. 定量値の中でも最も正規分布が保証されている項目の 1 つに体重がある.Table 9 に示すように 10 試験の各対照群は正規分布をしているが群内標本数が増加すると正規分布は保たれなくなる. 次に正規分布が保証できないといわれている血小板について同様に吟味した結果を Table 10 に示した. 各試験に用いる対照群で正規分布を示さない項目は, 群内標本数が増加しても正規分布は保証されない. このように正規性の検定は, 標本数が増加することによって, 正規分布は保証できなくなる. Table 9. Influence of number of samples on normal distribution of body weight of F344 control male rats at week 52 obtained from 10 toxicity studies Item Study No Mean±S.D. 355±20 396±26 344±24 351±21 361±22 384±20 355±18 358±18 371±29 358±16 N CV (%) Skewness Kurtosis W value P (Prob<W) P (Prob<W) for cumulative effect
16 Table 10. Influence of number of samples on non-normal distribution of platelet counts of F344 control male rats at week 104 obtained from 7 toxicity studies Study No. Item Mean±S.D. 611± ± ± ± ± ± ±150 N CV (%) Skewness Kurtosis W value P (Prob<W) < < < < P (Prob<W) for cumulative effect < < < 正規分布を利用した段階の評価正規分布は, ガウス (Gauss, 1777~1855) によって発見された分布です. ガウスの活躍は幅広く, 純粋数学から物理, 天文学, 測地学などに至る. その中の天文学において, 天体の位置を測定するときできる誤差から誕生した分布で, 一度は皆さんも受験のとき目にした分布である. ヒトを含めた生物から得られる多くの定量値のデータは, 正規分布を示すといわれている. したがって, 多くの正書では, 正規性を確認してから群間比較の手法を用いることを奨めている (NTP report, 1997). しかし, 一般的には等分散性の検定のみで正規性は, 確認されず分散を利用した解析法で検定しているのが現状である. 正規分布の特性図 1 に示すように綺麗な釣り鐘状の分布となる. すなわち,[ 平均値 標準偏差 ]~[ 平均値 標準偏差 ] の間にあるのは全体のうちの 95% に相当する. 同じようにして次のよく使われる数値が得られる. [ 平均値 +1 標準偏差 ]~[ 平均値 -1 標準偏差 ] の間にあるのは全体のうちの 68.3% [ 平均値 +3 標準偏差 ]~[ 平均値 -3 標準偏差 ] の間にあるのは全体のうちの 99.7% 図 1. 標準正規分布. 正規分布の性質は, (1)y 軸に対し左右対称になっている. 面積は左半分 0.5, 右半分 0.5. (2) 平均は, 対称軸になっている. (3) 平均のところで最も大きな値を持つ. 正規分布の利用ある 200 点満点の模擬テストを 5000 人に行い, 平均 点, 標準偏差 21.3 点を得た. このとき, (1)180 点以上取った学生は何人いるか? 変数 x = u を計算する = =
17 から の計算は, 数表 4-4 から 2.653% 点に対応する上側確率 である. + の場合は以上 (180 点 ) を示す. 数表 4-4. 規準正規分布のパーセント点 両側確率 上側確率 % 点 2α α u(α)
18 両側 5% 点は,2α=0.05 に対応する u(α) の列より となる. したがって, となり, =20 人となる. (2)50 点から 100 点までの間に何人の学生がいるか? = = = = ~ ~0.1 の間は とした. したがって, マイナスの数値は以下を示すので 100 点以下から 50 点以下を引く = となる =675 人となる. 54
19 5 段階評価正規分布を利用してあるデータを段階に評価してみる. この手法は, 小中学校の成績評価に応用されているようである. 某本学の成績評価指針 (A, B, C および D) に記載されている. ここでは 5 段階評価のための計算法を手計算にて説明する. 表 11 のデータは, 著者が担当していた 年度の 多変量解析 / 慶大 の実際の試験結果である.2 名を除外して 100 名に改変した. 表 11. 試験結果 100, 100, 100, 100, 98, 98, 98, 96, 96, 96, 96, 95, 95, 94, 93, 92, 92, 92, 92, 91,90, 90, 90, 90, 90, 89, 88, 87, 86, 86, 86, 86, 84, 84, 84, 84, 84, 83, 82, 82,80, 80, 80, 78, 78, 78, 77, 77, 76, 76, 75, 75, 74, 74, 74, 74, 72, 72, 71, 70,70, 70, 70, 70, 69, 68, 68, 68, 68, 66, 66, 65, 65, 65, 63, 62, 62, 60, 58, 56, 54, 52, 51, 51, 50, 50, 48, 47, 46, 41, 40, 40, 37, 32, 32, 27, 27, 27, 20, 4 SAS JMP による解析結果を下記に示した. SAS JMP で正規性を吟味した結果, 正規性 (W= ) は認められなかった (P<0.001). 55
20 SAS JMP のヒストグラム結果を参照して下さい. ヒストグラムと曲線のズレはさほど大きいとはいえないが統計学的には大きなズレがあるようである. Shapiro-Wilk の W 検定では正規性が 0.1% 水準で棄却されている. 正規性がないということになる. 新村 (2000) は, 正規分布からの呪縛からの解放の項で 正規分布であれば, 平均は分布のよい代表値であり, 標準偏差は, データのバラツキを表している. そしてこの 2 つのパラメータで, 完全に正規分布は決定される. さらに, 歪み度と尖り度は,0 になる. 多くのデータを分析すると, 特に人が介在するような人文社会学分野で観測される変数は, 正規性にならず右に裾を引く様な分布がよく現れる. このような場合, 平均値の代わりに中央値, 標準偏差の代わりに四分位偏差を用いるべきである. そして歪み度と尖り度でもって, 分布の形状が分かる と述べています. 前述のように正規性の検定法はいくつかあり標本数の変化によっても検定結果が大きく左右される. 著者は, Shapiro-Wilk の W 検定をあまり推奨していない. 標本数が増加すると正規性が保たれにくい傾向にある (Kobayashi, 2004). 5 段階評価の結果正規性を認めた試験得点データの入手は難しいようである. したがって, 表 11 データを使用して各段階に評価 ( 表 12) する. 平均得点 72, 標準偏差 21, 受験者 100 人.N(72, 21 2 ) と表示する. 表 段階評価の結果 計算式 点数の範囲 修正点数の範囲 評点 人数 割合 (%) 以上 ~83 99~ ~62 82~ ~41 61~ 以下 40 以下 図 2. 正規分布データを 5 段階評価したときの 各段階に占める割合表 12 と図 2 を比較するとかなりのズレがある. (1)83 点以上取った学生は何人いるか? 変数 x = u - 72 を計算する = = を数表 1 の規準正規分布のパーセント点から 0.3 を導き出す. 100 人 0.3=30 人となる. 実際は 38 人となる. 非正規性のためと推測する. 56
21 附録 : 分布を利用した検定のための正規分布と等分散検定一般的には, 二標本の t- 検定は, 正規分布かつ等分散である必要があり, 正規分布でも, 不等分散の場合には,Welch の方法が必要になる. 等分散とは各群のヒストグラムの形が似ているものである. 等分散の検定には, 二群間検定の場合は,F 検定が用いられる. 三群以上の場合は,Bartlett や Levene の等分散検定がある. 図 3. 2 群とも正規分布で等分散図 4. 非正規分布で等分散図 5. 非正規分布で不等分散 正規性の検定 (Shapiro-Wilk 検定など ) では, データ数が 30 程度は必要である. よって, 少数例では正規性の確認ができない. この場合どうするかというと, あまりにせず,t- 検定や分散分析を行ってもよいというものと, 正規性が確認できない場合には, 最初からノンパラメトリック法を使用すべきという学者がいる. 正規分布と等分散との組み合わせを図 3~5 に示した. 図 3 の場合が最も検出力が高く統計解析に適している. 附録 ;SAS JMP による男女の差の検定 : 生データは獲得点に対する男女の区別がある. ここでついでに, 男女間の得点差について吟味する.SAS JMP による結果を図 6, 表 13 および表 14 に示した. 得点 F 図 6. 男女による得点の一元配置分析 男女 M ペアごと Student の t 検定 0.05 表 13. 平均と標準偏差 水準 数 平均 標準偏差 F M 表 14. 検定結果 水準 平均 F A M B 同じ文字でつながっていない水準は有意に異なります. 結論 : 男女間の差 11 点は 5% 水準で有意差を認めた. したがって, 女性の方が男性に比較して点数が 11 高いことになる. 57
22 引用文献および引用資料 柴田寛三 (1970): 生物統計学講義, 東京農業大学, 東京. 椿美智子, 椿広計共訳 (2001): 医学研究のための統計的方法,pp , サイエンティスト社, 東京. 新村秀一 (2000): パソコン楽々統計学,pp53, ブルーバックス B-1198, 講談社, 東京. 野村護 (2002):GLP 試験の日 欧相互承認協定発効に伴う統計解析の問題点, 医薬安全性研究会会報, No. 47, pp41, サイエンティスト社, 東京. 武藤眞介 (2000):STATISTICA によるデータ解析, 朝倉書店, 東京. Conover, W.J. (1999): Practical nonparametric statistics, Third edition, pp , and John Wiley & Sons Inc. New York, U.S.A. Katsumi Kobayashi: Evaluation of toxicity dose levels by cluster analysis, Journal of Toxicological Science, 29, No. 2, , National Toxicology Program (1997): Toxicology and carcinogenesis studies of t-butylhydroquinone, No. 459, pp27, National Institutes of Health (NIH), USA. 58
Microsoft Word - Stattext12.doc
章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ
Microsoft Word - 保健医療統計学112817完成版.docx
講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.
EBNと疫学
推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定
Medical3
Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー
第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均
第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差
第 7 章順位和検定 第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, ス
第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, スコア化データおよび等分散検定で有意差を示した集団について用いられる. 一部の統計学者は, 生物の反応に対して順位和検定の方が分布を利用した検定法と比較して有用と述べている.
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST
Microsoft Word - apstattext04.docx
4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1
Microsoft Word - å“Ÿåłžå¸°173.docx
回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw
自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好
. 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :
Medical3
1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー
基礎統計
基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t
PowerPoint プレゼンテーション
学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: [email protected]) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合
(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説
第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない
<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>
第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(
Microsoft PowerPoint - A1.ppt [互換モード]
011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)
PowerPoint プレゼンテーション
1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定
モジュール1のまとめ
数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差
ビジネス統計 統計基礎とエクセル分析 正誤表
ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります
スライド 1
データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小
スライド 1
データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える
<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>
3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては
目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順
SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3
青焼 1章[15-52].indd
1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし
Microsoft PowerPoint - statistics pptx
統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email [email protected] webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:
Microsoft Word - lec_student-chp3_1-representative
1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )
Microsoft PowerPoint - e-stat(OLS).pptx
経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数
統計的データ解析
統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c
Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (
http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています
横浜市環境科学研究所
周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.
経営統計学
5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており
Excelによる統計分析検定_知識編_小塚明_5_9章.indd
第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,
講義「○○○○」
講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数
Microsoft PowerPoint - 測量学.ppt [互換モード]
8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,
解析センターを知っていただく キャンペーン
005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図
ANOVA
3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め
Microsoft PowerPoint - ch04j
Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う
Microsoft PowerPoint - Statistics[B]
講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 [email protected]
森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て
. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,0 年に 回の渇水を対象として計画が立てられる. このように, 水利構造物の設計や, 治水や利水の計画などでは, 年に 回起こるような降雨事象 ( 最大降雨強度, 最大連続干天日数など
Microsoft PowerPoint - 基礎・経済統計6.ppt
. 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別
MedicalStatisticsForAll.indd
みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18
Microsoft PowerPoint ppt
情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています
. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)
内容. 感性評価 官能評価. 感性評価 官能評価の考え方 測定方法. 測定方法. 統計学 ( 概略 ). 感性評価 官能評価 官能評価と感性評価 官能評価 ヒトの感覚に基づいて評価をおこなうこと 感性評価 ヒトの感性に基づいて評価をおこなうこと イメージや嗜好などを含む 測定尺度 分析型官能評価 (Ⅰ 型官能評価 ) S.S. Stevens 人間が測定器のかわり 品質検査や工程管理嗜好型官能評価
分散分析表を表 に示した. 表. 分散分析表 要因 平方和 自由度 分散 分散比 確率 全体 群間 P<0.001 誤差 F- 分布表,0.1% 水準の数表 6-1 の縦軸 7, 横軸 の交点 と比較して, 算出された値の
第 6 章 3 群以上の多群間検定 ( 分布を利用した検定 ) 1. 1 元配置の分散分析 (One-way Analysis of Variance, ANOVA) 三群以上の設定の場合に用いる. 一般的には, この検定で有意差が検出された場合, どこの群間かは不明である. したがって, どこの群間に有意差があるかはいつかの検定法で吟味する. ここの項では, 一元配置の分散分析を説明する. 毒性試験では,
経済統計分析1 イントロダクション
1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,
講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成
講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する
2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]
JMP を用いた ARIMA モデルのあてはめ SAS Institute Japan 株式会社 JMP ジャパン事業部 2013 年 2 月作成 1. はじめに JMP の時系列分析では 一変量の時系列データに対する分析や予測を行うことができ 時系列データに対するグラフ表示 時系列モデルのあてはめ モデルの評価 予測まで 対話的に分析を実行することができます 時系列データにあてはめるモデルとしては
仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています
MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良
簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟
濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟度別クラス編成を実施している 本稿では さらにの導入へ向けて 既存のプレイスメントテストを活用したクラス編成の可能性について検討した 3 教科に関するプレイスメントテストの偏差値を説明変数
切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (
統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない
はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式
統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値
Microsoft Word - mstattext02.docx
章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で
平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )
データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65
Microsoft Word - SPSS2007s5.doc
第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では
統計学の基礎から学ぶ実験計画法ー1
第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3
スライド 1
計測工学第 12 回以降 測定値の誤差と精度編 2014 年 7 月 2 日 ( 水 )~7 月 16 日 ( 水 ) 知能情報工学科 横田孝義 1 授業計画 4/9 4/16 4/23 5/7 5/14 5/21 5/28 6/4 6/11 6/18 6/25 7/2 7/9 7/16 7/23 2 誤差とその取扱い 3 誤差 = 測定値 真の値 相対誤差 = 誤差 / 真の値 4 誤差 (error)
際 正規分布に従わない観測値に対して通常の t 検定を適用した場合 どのような不都合が生じるかを考える 一般に通常の t 検定や Wilcoxon 検定などの仮説検定を行う場合 2つの処理の間に差がないことが真実であるにもかかわらず差があると主張する過誤確率 ( 第 1 種の過誤確率 ) 2つの処理
連載 第 2 回 医学データの統計解析の基本 2 つの平均の比較 * 朝倉こう子 濱﨑俊光 Fundamentals of statistical analysis in biomedical research:two-sample tests for comparing means 1 基礎研究や臨床研究を問わず医学研究において 新しい化合物や治療法を発見し その性能を特徴づける場合 何らかの対照
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 使用する標本は母集団から無作為抽出し 母集団を代表している値と考える 標本同士を比較して得た結果から
日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー
日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チーム 日本新薬 ( 株 ) 田中慎一 留意点 本発表は, 先日公開された 生存時間型応答の評価指標 -RMST(restricted
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>
第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを
Microsoft PowerPoint - Econometrics pptx
計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: [email protected] webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます
分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の
JMP によるオッズ比 リスク比 ( ハザード比 ) の算出と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2011 年 10 月改定 1. はじめに 本文書は JMP でロジスティック回帰モデルによるオッズ比 比例ハザードモデルによるリスク比 それぞれに対する信頼区間を求める操作方法と注意点を述べたものです 本文書は JMP 7 以降のバージョンに対応しております
3章 度数分布とヒストグラム
3 章度数分布とヒストグラム データの中の分析 ( 記述統計 ) であれ データの外への推論 ( 推測統計 ) であれ まず データの持つ基本的特性を把握することが重要である 1 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する 3 章 グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える 4 5 6 章 データが母集団からのランダムサンプルならば 母集団についての推測を行う
Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ
カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では
CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研
CAE シミュレーションツール を用いた統計の基礎教育 ( 株 ) 日本科学技術研修所数理事業部 1 現在の統計教育の課題 2009 年から統計教育が中等 高等教育の必須科目となり, 大学でも問題解決ができるような人材 ( 学生 ) を育てたい. 大学ではコンピューター ( 統計ソフトの利用 ) を重視した教育をより積極的におこなうのと同時に, 理論面もきちんと教育すべきである. ( 報告 数理科学分野における統計科学教育
<4D F736F F D204A4D5082C982E682E991CE B A F2E646F63>
JMP による対話的パーティショニング SAS Institute Japan 株式会社 JMP ジャパン事業部 2009 年 5 月 1. はじめに JMP では メニュー パーティション により 決定木の分析を行うことができます 本文書は このパーティションのメニューに関 する技術的事項を述べます 2. パーティションに関する Q&A この章では JMP のパーティションについての疑問を Q&A
散布度
散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (
Microsoft PowerPoint - データ解析基礎2.ppt
データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ
カイ二乗フィット検定、パラメータの誤差
統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,
Probit , Mixed logit
Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,
Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]
R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ
