Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (
|
|
|
- あおし ゆきしげ
- 6 years ago
- Views:
Transcription
1 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( /shopdetail.html?brandcode= &search= &sort=) を参考にしています この講義では 2 つの平均値を比較する をとりあげます 具体的には 2 つの平均値を比較する方法の学習 つまり (1) 独立な 2 群の平均値差の検定と (2) 対応のある 2 群の平均値差の検定 について学びます 学習項目です : 2 つの平均値を比較するケース独立な 2 群の t 検定 t 検定の前提条件対応のある t 検定関数のまとめ演習問題 2 つの平均値を比較するケース物語 : ある心理学の教授は考えました 今までの講義では教育効果があがらない そこで指導方法を変えてみよう ( 例えば アクティブラーニングを取り入れる 毎回宿題を出して学習を促進する ) 一方 試験では今までと同程度の問題を出して 指導方法を変えたことによる効果があったか 検証することにしました 本当に効果があったか調べるには 今までの指導法による試験のデータと 指導方法を変えた後の試験のデータ ( 指導法データ と呼びます ) を比較すればよいのだが 具体的にはどうすればよいのだろう??? 2 つの平均値を比較することが必要とされる場合 : 独立な 2 群の t 検定 ( 独立な 2 群 とは何か に注意 ) 男女で心理学テストの平均値に差があるかどうか統計の好き嫌いで統計テストの平均値に差があるか --- 統計が好きである人の統計テストの点数の分布と 統計が嫌いな人の統計テストの点数の分布の比較対応のある 2 群の t 検定 ( 何と何が対応しているか に注意 ) 同じ対象者に対して指導法の違いが成績に影響するかどうか 2 群の標本から 2 つの群の母平均の比較を行うことが目的 1 / /01/11 10:24
2 独立な 2 群の t 検定 2 群が独立である具体的な例 : 男女それぞれの心理学テストの成績 統計が好きな人と嫌いな人それぞれの統計学テストの成績 というように 2 群がそれぞれ別々の標本から得られたデータが対象 --- t 検定を実施するための条件については あとで述べる t 検定の前提条件を参照のこと μ 1, μ 2 σ 2 X 1, X 2 X 1 N( μ 1, σ 2 ) X 2 N( μ 2, σ 2 ) 平均がそれぞれ かつ分散が等しい 正規分布に従う母集団から無作為抽出された標本を 考える : 式で書くと, その平均値の差 ( ここでn 1 とn 2 はそれぞれの群のサンプルサイズとする ) X 1 X 2 はやはり正規分布に従う : これを標準化する ( 問題 : 標準化とは?): X 1 X 2 N( μ 1 μ 2, σ ( + )) n 1 X 1 X 2 ( μ 1 μ 2 ) 1 1 σ n 1 + n 2 ここで母分散 σ 2 が未知であるなら標本から推定する : σ 2 pooled = ( ここで とはそれぞれの群の不偏分散 --- 問題 : とを合わせた標本の不偏分散の値とこのσ 2 pooled との関係は?) n 2 N(0, 1) ( n 1 1) σ ( n 2 1) σ 2 2 n 1 + n 2 2 σ 2 1 σ 2 2 X 1 X 2 この値によって次の検定統計量を導く : t = こうして導かれた検定統計量 t の標本分布は 帰無仮説 df = n 1 + n 2 2 X 1 X 2 ( n 1 1) σ 2 1+( n 2 1) σ ( + ) n 1 + n 2 2 n 1 n 2 H 0 : μ 1 = μ 2 のもとで 自由度のt 分布にしたがう この検定統計量を用いて 2つの平均値の差に関する検定を行うことができるようになる ( 問題 : 対立仮説はどうなる?): Python を使った実習例題 : 統計テスト 1 (StatTest1) の得点の平均値に男女で有意な差があるかどうかを有意水準 5% 両側検定で検定せよ StatTest1Male = np.array([6,10,6,10,5,3,5,9,3,3]) StatTest1FeMale = np.array([11,6,11,9,7,5,8,7,7,9]) 2 / /01/11 10:24
3 次のステップで行う : 1. 帰無仮説と対立仮説をたてる : 帰無仮説 (2つの母平均は等しい) 対立仮説 H 1 : μ 1 μ 2 (2つの母平均は等しくない) 2. 検定統計量の選択 : X 1 X 2 を検定統計量とする これは 自由度のt 分布に従う 3. 有意水準の決定 : 両側検定で 有意水準 5% つまり 4. 検定統計量の実現値の計算 : まず 2つの標本の平均と不偏分散を求め print(np.mean(stattest1male)) 6.0 print(np.mean(stattest1female)) 8.0 print(np.var(stattest1male, ddof=1) print(np.var(stattest1female, ddof = 1)) 4.0 次に プール標準偏差 (PooledStd) σ pooled を求める n1 = len(stattest1male) n2 = len(stattest1female) PooledStd = (((n1-1)*np.var(stattest1male,ddof=1)+(n2-1)*np.var(stattest1female,ddof=1)) / (n1+n2-2))**0.5 print(pooledstd) 最後に検定統計量の実現値を計算する : H 0 : μ 1 = μ 2 t = ( n 1 1) σ 2 1+( n 2 1) σ ( + ) n 1 + n 2 2 n 1 n 2 df = n 1 + n 2α 2 = 0.05 tdivider =PooledStd * (1.0/n1+1.0/n2)**0.5 tdividend = np.mean(stattest1male)-np.mean(stattest1female) t = tdividend / tdivider # 検定統計量 検定統計量の実現値がt = -1.84と求まった 5. 帰無仮説の棄却か採択かの決定 : 帰無仮説によればこの検定統計量は自由度のt 分布に従う 有意水準は5% 両側検定の時の棄却域を求める df = = 18 import scipy.stats as st st.t.ppf(0.025,18) # 検定統計量 df=18 下側確率 0.05/2 = 0.025となる tの値を求める # 下側確率であるから この値よりもt 値が小さければ棄却される st.t.ppf(0.975,18) # df=18 上側確率 /2 = 0.975となるtの値を求める # 上側確率であるから この値よりもt 値が大きければ棄却される t < 2.10 t > 2.10 この結果 棄却域はまたはとなるので tの値は棄却域に入らないため 帰無仮説は棄却されない ゆえに 検定の結果は 有意水準 5% で有意差が見られなかった となるなおcdf 関数を用いて 直接 p 値を求めることもできる : st.t.cdf( ,18) # 下側確率 # 下側確率とすれば p 値は0.04という値 ( < 0.05) 2*st.t.cdf( ,18) # 両側検定なので2 倍する / /01/11 10:24
4 In [12]: # 以上の実行 from future import division StatTest1Male = np.array([6,10,6,10,5,3,5,9,3,3]) StatTest1Female = np.array([11,6,11,9,7,5,8,7,7,9]) print(np.mean(stattest1male)) print(np.mean(stattest1female)) print(np.var(stattest1male, ddof=1)) print(np.var(stattest1female, ddof = 1)) In [13]: n1 = len(stattest1male) n2 = len(stattest1female) PooledStd = (((n1-1)*np.var(stattest1male,ddof=1)+(n2-1)*np.var(stattest1female,ddof=1)) / ( print(pooledstd) In [16]: tdivider =PooledStd*(1.0/n1+1.0/n2)**0.5 tdividend = np.mean(stattest1male)-np.mean(stattest1female) t = tdividend / tdivider # 検定統計量 print(t) In [19]: import scipy.stats as st print(st.t.ppf(0.025,18) ) # 検定統計量 df=18 下側確率 0.05/2 = 0.025となるtの値を # 下側確率であるから この値よりもt 値が小さければ棄却される print(st.t.ppf(0.975,18)) # df=18 上側確率 /2 = 0.975となるtの値を求める # 上側確率であるから この値よりもt 値が大きければ棄却される In [21]: print(st.t.cdf( ,18)) # 下側確率 # 下側確率とすれば p 値は0.04という値 ( < 0.05) print(2*st.t.cdf( ,18)) # 両側検定なので2 倍する # 両側検定であるから2 倍したp 値は0.08という値 (> 0.05) In [ ]: help(st.ttest_ind) In [30]: Out[30]: st.ttest_ind(stattest1male,stattest1female) Ttest_indResult(statistic= , pvalue= ) 課題 5-1 独立な2 群のt 検定では それぞれN( μ 1, σ 2 ) とN( μ 2, σ 2 ) に従う2つの標本 X 1 とX 2 に対し その平均値の差がN( μ 1 μ 2, σ 2 ( 1 1 n + ) に従う ということが前提となっていた ( ただしここで はそれぞれの 1 n 2 n 1, n 2 標本のサイズ ) このことを 今まで学んだことから示せ [ ヒント ] 正規分布に従う標本平均の標本分布がどのような分布に従うかは前項の 標本分布を求める 節 (Python-statistics3.ipynb#makingSample) で述べられている また それぞれ正規分布にしたがう 2 つの標本データの和 ( 差 ) がどのような分布に従うかは Python で確率を学ぶ の主要な確率分布の項 (Intro2Probab.ipynb#NormalDistribution) で述べられている これらを組み合わせえて考えよ 4 / /01/11 10:24
5 解答欄 課題 5-2 今の例題の計算において 次のものは何を計算しているのか 式と照らしあわせて確認せよ : (1) プール標準偏差,(2) t 分母 (3) t 分子 (4)t 統計量 σ pooled 解答欄 t 検定の前提条件 t 検定を実行するには次の 3 つの条件が必要 1. 標本が無作為に行われていること ( 無作為抽出 ) 2. 母集団の分布が正規分布にしたがっていること ( 正規性 ) 3. 2 つの母集団の分散が等質であること ( 分散の等質性 ) 分散の等質性の検定 2 群の分散が等しいことを この 2 群の分散は等質である といいます t 検定では 2 群の分散が等質であることが前提です それには 分散の等質性の検定 を行う必要があります これは検定統計量を F としているため F 検定とも呼ばれています まずそれぞれの分散 ( とする ) を求め その比 ( ) を検定統計量とします ここで 分散の大きい方 を分母にとる必要があります ( 今の例ではと仮定した ) この値は 2 群のサイズをそれぞれと すると 分子の自由度 分母の自由度のF 分布に従うので scipy.stats.fモジュールのcdf 関数によってp 値を求めます ( このとき 帰無仮説は 等質である 対立仮説は 等質ではない となることに注意 ) 以下では例を用いて示します : σ1 2, σ 2 2 F = σ 1 2 σ 2 2 σ 2 > σ 1 F n 1, n 2 df 1 =n 1 1 df 2 =n 2 1 In [1]: import scipy.stats as st ClassA = np.array([54,55,52,48,50,38,41,40,53,52]) ClassB = np.array([67,63,50,60,61,69,43,58,36,29]) print("variance of ClassA = %f, ClassB = %f" % (np.var(classa), np.var(classb))) variance of ClassA = , ClassB = In [32]: # ClassBの分散が大きいので それを分母にとる F = np.var(classa)/np.var(classb) print(st.f.cdf(f, len(classa)-1, len(classb)-1)*2) # 両側検定のため 2 倍する 5 / /01/11 10:24
6 この例では p 値が 0.03 であるため 帰無仮説が棄却されます つまりこの例では 2 つの変数の分散が等質であるという仮定は成り立ちません そのため この 2 つの変数に対しては t 検定ができない ということになります その場合でも 2 つの群の平均値の比較の検定は可能です その一つの方法が 次で紹介する Welch( ウェルチ ) の検定です [ なぜ分散が等質でないと判断されたか ] 今の説明で p 値が 0.03であるため 帰無仮説が棄却された ( つまりこの例では2つの変数の分散が等質であるという仮定は成り立たない ) という点に疑問を持った人のために 解説します ここで行ったのは 2つの群が等質である ことを示すための検定ではないのです 行ったのは 等質でない ( これが 対立仮説 帰無仮説は 等質である ) ことの検定でした そして有意水準を5% とすると p < 0.05ですから 帰無仮説が棄却され 対立仮説が採択されたのです つまり この例では2つの変数の分散が等質であるという仮定は成り立たない という結論になります In [ ]: help(st.f.cdf) Welch の検定 母分散が等質でないときは t 検定は使えないので Welch 検定を使う ---st.ttest_ind 関数で equal_var=false というオプションをつけて実行します : In [33]: Out[33]: st.ttest_ind(classa, ClassB, equal_var=false) Ttest_indResult(statistic= , pvalue= ) この結果は p 値が 0.28 なので 帰無仮説が棄却されない つまりクラス A とクラス B の平均に有意な差はない という結論になります 課題 5-3 独立な 2 群の t 検定の例題のデータ つまり StatTest1Male と StatTest1Female のデータに対して 分散の等質性の検定を行え また分散の等質性が成り立たないと仮定して Welch の検定を行い その結果を前の例題の結果と比較せよ In [ ]: 6 / /01/11 10:24
7 対応のある t 検定 対応のあるデータ : 例えば 同じ被験者について複数の測定が行われている場合例 : 統計の指導を受ける前と後のテスト得点である 統計テスト 1 と 統計テスト 2 対応あるデータについては 独立な 2 群の t 検定ではない別の方法が必要です 対応のあるデータでは 変化量 ( あるいは差得 ) を考えます 統計テスト1の得点を 統計テスト2の得点を 変化量( 差得点 ) をDとすれば X 1 X 2 D = X 2 X 1 X 1, X 1, D D = X 2 X 1 さらに これらの標本平均の間にはという関係がなりたちます D N( μ D, σ 2 σd D) n D N( μ D, 2 ) 差得点と仮定 s, データ数をとすると その標本平均 n となります この標本分布を標準化すると D μ D Z = N(0, 1) σ D / n ここで σ D が未知なので これを標本から求めた標準偏差 σ D で代用すると t = D μ D σ D / n は自由度 のt 分布にしたがいます df = n 1 7 / /01/11 10:24
8 Pythonを使った実習例題 : 指導の前後に行った 統計テスト1 (StatTest1) と 統計テスト2 (StatTest2) で有意な差があるかどうかを有意水準 5% 両側検定で検定せよ StatTest1 = np.array([6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9]) StatTest2 = np.array([10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7]) 次のステップで行う : 1. 帰無仮説と対立仮説をたてる : 帰無仮説 H 0 : μ D = 0(2つのテストの差の母平均は0) 対立仮説 H 1 : μ D 0 (2つのテストの差の母平均は0) ではない ) 2. 検定統計量の選択 : t = D μ D を検定統計量とする ( 帰無仮説の下ではμ なので σ D / n D = 0 t = D σ D / n これは 自由度 df = n 1 のt 分布に従う 3. 有意水準の決定 : 両側検定で 有意水準 5% つまりα = 検定統計量の実現値の計算 : Difference = StatTest2 - StatTest1 print(np.std(difference, ddof=1)) tdivider = np.std(difference, ddof=1)/(len(difference))**0.5 tdividend = np.mean(difference) t = tdividend / tdivider print(t) この結果 検定統計量の実現値は t= 帰無仮説の棄却か採択かの決定 : 帰無仮説によればこの検定統計量は自由度分布に従う 有意水準は5% 両側検定の時の棄却域を求める st.t.ppf(0.025,19) # 検定統計量 df=19 下側確率 0.05/2 = 0.025となるtの値を求める # 下側確率であるから この値よりもt 値が小さければ棄却される st.t.ppf(0.975,19) # df=19 上側確率 /2 = 0.975となるtの値を求める # 上側確率であるから この値よりもt 値が大きければ棄却される t < 2.09 t > 2.09 df = 20 1 = 19 この結果 棄却域はまたはとなるので tの値は棄却域に入るため 帰無仮説は棄却される ゆえに 検定の結果は 5% 水準で有意差が見られた となるなお scipy.statsモジュールのttest_rel 関数によっても対応のあるt 検定を求めることができる : st.ttest_rel(stattest1, StatTest2) Ttest_relResult(statistic= , pvalue= ) # 検定統計量と p 値 この結果 p 値が という小さな値であるので 帰無仮説が棄却され 検定の結果は 有意水準 5% で 統計テスト 1 と統計テスト 2 では有意な差があった となる の t In [34]: import scipy.stats as st StatTest1 = np.array([6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9]) StatTest2 = np.array([10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7]) 8 / /01/11 10:24
9 In [36]: Difference = StatTest2 - StatTest1 print(np.std(difference, ddof=1)) tdivider = np.std(difference, ddof=1)/(len(difference))**0.5 tdividend = np.mean(difference) t = tdividend / tdivider print(t) In [37]: print(st.t.ppf(0.025,19)) # 検定統計量 df=19 下側確率 0.05/2 = 0.025となるtの値を求める # 下側確率であるから この値よりもt 値が小さければ棄却される print(st.t.ppf(0.975,19) ) # df=19 上側確率 /2 = 0.975となるtの値を求める # 上側確率であるから この値よりもt 値が大きければ棄却される In [38]: Out[38]: st.ttest_rel(stattest1, StatTest2) Ttest_relResult(statistic= , pvalue= ) 課題 5-4 今の例題の計算において 次のものは何を計算しているのか 式と照らしあわせて確認せよ : (1) 変化量,(2) 分母 t (3) 分子 t (4) t 統計量 解答欄 課題 5-5 今の例題のデータに対して 対応なしの場合の検定 を行え そして対応ありの場合と対応なしの場合では どのような違いがあるか 具体的に述べよ 解答欄 関数のまとめ注 : numpy を np, numpy.random を random matplotlib.pyplot を plt pandas を pd scipy.stats を st と略記する 目的関数名とモジュール使い方 分散の等質性の検定 (F 検定 ) における p 値 独立な 2 群の検定 Welch の検定 ( 分散が等質でない場合 ) 対応のある t 検定 st.f.cdf(f, 分子の自由度, 分母の自由度 ) st.ttest_ind( データ 1, データ 2) st.ttest_ind( データ 1, データ 2, equal_var=false) st.ttest_rel( データ 1, データ 2) st.f.cdf(np.var(classa)/np.var(classb),len(classa)-1,len(classb)-1) # ClassA と ClassB の分散の等質性の検定のための p 値 (np.var(b) > np.var(a) と仮定 ) st.ttest_ind(stattest1male,stattest1female) st.ttest_ind(classa, ClassB, equal_var=false) st.ttest_rel(stattest1, StatTest2) 9 / /01/11 10:24
10 演習問題 5 演習問題 5-1 以下は 統計学が好きな人の得点と嫌いな人の得点のデータである 統計学が好きか嫌いかという 2 群について 平均値に有意な差があるかどうかを 有意水準 5% の両側検定で調べよ StatLovers = np.array([6, 10, 6, 10, 11, 6, 11, 7]) StatHaters = np.array([5, 3, 5, 9, 3, 3, 9, 5, 8, 7, 7, 9]) [ ヒント ] 統計学好き (StatLovers) と 統計学嫌い (StatHaters) の 2 変数は 分散が等質かどうか不明である そこで まず (1) 分散の等質性の検定を行い その結果 (2a) 分散が等質であれば t 検定を行い (2b) 分散が等質でなければ Welch の検定を行う In [39]: StatLovers = np.array([6, 10, 6, 10, 11, 6, 11, 7]) StatHaters = np.array([5, 3, 5, 9, 3, 3, 9, 5, 8, 7, 7, 9]) 演習問題 5-2 以下は 心理学テストにおける 男と女のデータである 男女で平均値に有意な差があるかどうかを 有意水準 5% の両側検定で調べよ PsycTestMale= np.array([13, 14, 7, 12, 10, 6, 8, 15, 4, 14]) PsycTestFemale = np.array([9, 6, 10, 12, 5, 12, 8, 8, 12, 15]) [ ヒント ] 心理学テスト男 (PsycTestMale) と 心理学テスト女 (PsycTestFemale) の 2 変数は 分散が等質かどうか不明である そこで まず (1) 分散の等質性の検定を行い その結果 (2a) 分散が等質であれば t 検定を行い (2b) 分散が等質でなければ Welch の検定を行う In [40]: PsycTestMale= np.array([13, 14, 7, 12, 10, 6, 8, 15, 4, 14]) PsycTestFemale = np.array([9, 6, 10, 12, 5, 12, 8, 8, 12, 15]) 演習問題 5-3 以下はビデオ視聴によるダイエットプログラムに参加した 10 名の プログラム参加前後の体重のデータである ( 単位は kg) このデータから ダイエットプログラムは効果があったと言えるかどうかを判定せよ 有意水準を 5% 両側検定とする Before = np.array([61, 50, 41, 55, 51, 48, 46, 55, 65, 70]) After = np.array([59, 48, 33, 54, 47, 52, 38, 50, 64, 63]) [ ヒント ] 同じ人についてのプログラム参加前 (Before) と後 (After) のデータなので 対応のある t 検定 を行う In [ ]: Before = np.array([61, 50, 41, 55, 51, 48, 46, 55, 65, 70]) After = np.array([59, 48, 33, 54, 47, 52, 38, 50, 64, 63]) 10 / /01/11 10:24
11 演習問題 5-4 shidouhou.csv ( は区切り記号がコンマの CSV 形式のファイルである このデータをデータフレームとして読み込み 統計テスト 1 と心理学テストの母平均に差があるかどうか 検定を行え [ 参考 ] 区切り記号がコンマの csv ファイルを読み込み その内容をデータフレームとして取り込むには pandas モジュールの read_csv 関数を用いる もっとも中にはちゃんと読み込めないこともあるので ファイルの中身と読み込み形式とを確認すること そして読み込めない場合は 区切り記号を適切なものにセットしたりすることも考えよう In [ ]: 11 / /01/11 10:24
<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>
第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(
Microsoft Word - Stattext12.doc
章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ
基礎統計
基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t
Microsoft PowerPoint - statistics pptx
統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email [email protected] webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:
Excelによる統計分析検定_知識編_小塚明_5_9章.indd
第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,
ビジネス統計 統計基礎とエクセル分析 正誤表
ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります
EBNと疫学
推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定
Microsoft PowerPoint - Statistics[B]
講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 [email protected]
講義「○○○○」
講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数
(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説
第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない
Microsoft PowerPoint - e-stat(OLS).pptx
経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数
統計的データ解析
統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c
Medical3
Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー
Microsoft PowerPoint - stat-2014-[9] pptx
統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: [email protected] website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を
不偏推定量
不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)
Microsoft PowerPoint - statistics pptx
統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: [email protected] website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 使用する標本は母集団から無作為抽出し 母集団を代表している値と考える 標本同士を比較して得た結果から
自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好
. 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :
PowerPoint プレゼンテーション
学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: [email protected]) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>
第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを
第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均
第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差
2017/11/2 Python-statistics4 Python で統計学を学ぶ (4) この内容は 杉澤 村井 (2008) R によるやさしい統計学 (
Python で統計学を学ぶ (4) この内容は 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop/shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています この講義では 統計的仮説検定 をとりあげます これは 統計的仮説検定の 順の理解と
Microsoft PowerPoint - A1.ppt [互換モード]
011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)
モジュール1のまとめ
数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差
経済統計分析1 イントロダクション
1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,
スライド 1
データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える
Microsoft Word - apstattext04.docx
4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1
Medical3
1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー
スライド 1
データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小
統計学の基礎から学ぶ実験計画法ー1
第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う
Microsoft Word - å“Ÿåłžå¸°173.docx
回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw
PowerPoint プレゼンテーション
1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定
Microsoft PowerPoint - ch04j
Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数
切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (
統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない
医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =
1.. 統計学の基本的な概念 1.1 統計学とは何ぞや? 統計学は沢山のデータを要約し 中に含まれている情報を把握しやすくするための手段 データデータ データデータ データデータ 要約値 ( 統計量 ) 実質科学的評価 < 例 >100 人の日本人について体重を測定した場合 100 個のデータを眺めただけでそこに含まれる情報を読み取るのは困難 100 個のデータのほぼ真ん中を表す要約値として平均値を求める
経営統計学
5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており
<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>
3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては
様々なミクロ計量モデル†
担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル
青焼 1章[15-52].indd
1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし
Microsoft PowerPoint - Econometrics pptx
計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: [email protected] webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます
講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成
講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する
. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)
内容. 感性評価 官能評価. 感性評価 官能評価の考え方 測定方法. 測定方法. 統計学 ( 概略 ). 感性評価 官能評価 官能評価と感性評価 官能評価 ヒトの感覚に基づいて評価をおこなうこと 感性評価 ヒトの感性に基づいて評価をおこなうこと イメージや嗜好などを含む 測定尺度 分析型官能評価 (Ⅰ 型官能評価 ) S.S. Stevens 人間が測定器のかわり 品質検査や工程管理嗜好型官能評価
Microsoft PowerPoint - 測量学.ppt [互換モード]
8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,
ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル
時系列分析 変量時系列モデルとその性質 担当 : 長倉大輔 ( ながくらだいすけ 時系列モデル 時系列モデルとは時系列データを生み出すメカニズムとなるものである これは実際には未知である 私たちにできるのは観測された時系列データからその背後にある時系列モデルを推測 推定するだけである 以下ではいくつかの代表的な時系列モデルを考察する 自己回帰モデル (Auoregressive Model もっとも頻繁に使われる時系列モデルは自己回帰モデル
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
ANOVA
3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.
カイ二乗フィット検定、パラメータの誤差
統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,
Microsoft PowerPoint - 資料04 重回帰分析.ppt
04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit [email protected] http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline
Microsoft PowerPoint - 基礎・経済統計6.ppt
. 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別
スライド 1
計測工学第 12 回以降 測定値の誤差と精度編 2014 年 7 月 2 日 ( 水 )~7 月 16 日 ( 水 ) 知能情報工学科 横田孝義 1 授業計画 4/9 4/16 4/23 5/7 5/14 5/21 5/28 6/4 6/11 6/18 6/25 7/2 7/9 7/16 7/23 2 誤差とその取扱い 3 誤差 = 測定値 真の値 相対誤差 = 誤差 / 真の値 4 誤差 (error)
目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順
SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3
Probit , Mixed logit
Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め
データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2
春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの
Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx
都市工学数理 浅見泰司 東京大学大学院工学系研究科教授 Yasushi Asami 1 0. 統計学的検定の基本 母集団と標本 世論調査では 日本人全員に聞くというのは事実上不可能 そこで 日本人全員 (= 母集団 ) から 一部 (= 標本 ) を選んで そこで得られた傾向 (= 仮説 ) が日本人全体にもある程度の信頼性で成り立つかどうかを考える (= 検定 ) 注意 サンプリングの方法 ランダムサンプリングが基本
ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル
春学期統計学 I 記述統計と推測統計 担当 : 長倉大輔 ( ながくらだいすけ ) 1 本日の予定 本日はまず記述統計と推測統計の違い 推測統計学の基本的な構造について説明します 2 記述統計と推測統計 統計学とは? 与えられたデータの背後にある 特性 法則 を 検証 発見 分析 するための手法の開発 その応用などに関わる学問の事です 3 記述統計と推測統計 データの種類 データの種類はおおまかに
はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式
統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値
Microsoft PowerPoint - Inoue-statistics [互換モード]
誤差論 神戸大学大学院農学研究科 井上一哉 (Kazuya INOUE) 誤差論 2011 年度前期火曜クラス 1 講義内容 誤差と有効数字 (Slide No.2~8 Text p.76~78) 誤差の分布と標準偏差 (Slide No.9~18 Text p.78~80) 最確値とその誤差 (Slide No.19~25 Text p.80~81) 誤差の伝播 (Slide No.26~32 Text
したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算
統計学テキストの69ページに 平均偏差 分散 標準偏差 変動係数 標準誤差 信頼区間に関する記述がある 分布を考える分布の中心の位置 ( 例 ) 65 53 44 78 50 の数値の算術平均は (65+53+44+78+50)/5=58 である 此れだけでは 分布の状態がわからない ばらつきの程度を表すには最大値と最小値との差 (78-44)=34 これをレンジ ( 範囲 ) と言う しかし 両端の数字だけでは
JUSE-StatWorks/V5 ユーザーズマニュアル
計数値の検定 推定 ここでは不良率や欠点数などの計数値のデータを取り扱います. 不良率は n 個の製品をランダムに選んだとき, そのうち何個が不良品だったか, 欠点数は 製品中にきずがいくつ見つかったか などを示すデータですが, 検定や推定にあたってそれぞれ二項分布や, ポアソン分布を想定します. 機能構成ここでは 5 種類の検定 推定を用意しており, 検定 推定の種類を選択すると仮説の条件設定,
Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる
Microsoft Word - 補論3.2
補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は
