九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : II : 3 群以上の場合の有意差検定 高木, 英行九州大学大学院芸術工学研究院

Size: px
Start display at page:

Download "九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : II : 3 群以上の場合の有意差検定 高木, 英行九州大学大学院芸術工学研究院"

Transcription

1 九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : II : 3 群以上の場合の有意差検定 高木, 英行九州大学大学院芸術工学研究院 出版情報 : システム / 制御 / 情報 : システム制御情報学会誌. 58 (10), pp , システム制御情報学会バージョン : 権利関係 :

2 432 システム / 制御 / 情報,Vol. 58, No. 10, pp , 2014 講 座 使える! 統計検定 機械学習 II 3 群以上の場合の有意差検定 高木英行 * 1. はじめに 使える! 統計検定 講座は, 統計検定の数学的側面 の解説ではなく, ユーザとしての利用ノウハウを説明するシリーズで, 読者が どのような場合に, どの検定手法を, どのように使えばよいのか を理解して実際に使えるようになっていただくことを目的としている. 残念なことに, 実験結果のグラフを見て 視覚的に 差がありそうだというだけで, 自分の提案手法が有効であると主張する発表がいまだにあるのが現状である. この状況下, 統計検定ユーザとしての筆者の利用ノウハウを書くだけでも多少はお役に立つであろうと考えたことが本解説をお引き受けした背景である. 本解説の対象者は, 統計検定をしなくちゃならないので, 小難しいことはどうでもいいから, すぐ使えるようにちょちょっと教えてほしい. 高価な商用の統計解析ソフトは持っていないし, フリーでも統計解析用プログラミング言語 R をインストールしたり覚えたりするのは面倒だ.Excel なら少しは使える, という読者を想定している. 連載第 1 回目の解説 [1] では第 1 図の左半分の 2 群の場合を扱った. 第 2 回目の本解説では図の右半分, すなわち, 三つ以上のデータグループ ( 標本, 群 ) の各平均値の差が統計的な意味を持った差なのか, それとも, 誤差の範疇なのかを判定する検定手法について説明する.k 個のパターン認識手法や最適探索手法やニューラルネット学習手法などの性能比較をし, 他手法に比較して有意に優れた手法がありうるかどうかを判定するような場合がその応用事例である. なお, 本連載の内容のスライドはダウンロード可能である [2]. 2. 検定手法選定のための 3 条件 本連載のハイライトである どの検定手法をどのように選ぶか の解答が第 1 表の 3 点をチェックすることである. この結果, 第 1 図の 2 3 通りの場合分けができ, 読者が選択すべき統計検定手法が確定する. 連載第 2 回目の本解説では, 三つ以上の手法の平均性能値の間に有意な性能差があるかどうかを判定する場合を扱うので, 第 1 表の第 1 判定条件はもちろん 3 群以上 九州大学大学院芸術工学研究院 Key Words: statistical tests, analysis of variance, ANOVA, Kruskal-Wallis test,friedman test,multiple comparison. 第 1 図 本連載講座で扱う平均値間の差を検定する手法一覧 第 1 表 検定手法選択のための三つの判定条件 (1) 比較対象数が 2 群か 3 群以上か? (2) 各群のデータが正規分布をしているか否か? (3) 各群のデータに対応関係があるか否か? である. 第 2 の判定条件は, 各群のデータが正規分布をしていると見なせるかどうかである. 第 2 図は三つの進化計算手法の探索性能を複数の試行の平均収束曲線で比較する例で, 第 g 世代で 3 手法間に有意な性能差があるかどうかを示すには, 第 g 世代での 3 手法の性能値データがおのおの正規分布をしているかどうかを検定 ( 正規性の検定 ) することから始める. 講座連載第 1 回目で紹介したように, 正規性の検定手法にはいろいろあり, フリーの Excel 用のアドイン 1 もあるので, この正規性検定を行い, すべてのデータグループのデータが正規分布をしていると判断できれば 3. の分散分析を適用する 2. そうでなければ 4. の Kruskal-Wallis 検定か Friedman 検定を選択する. 第 3 の判定条件は, 群間にデータの対応関係があるかどうかである. たとえば, 日本人, 米国人, 北欧人の身長データの場合は, 同じ人のデータではないので対応関係がないといえる. 食前, 食中, 食後の血糖値を調べ 1 たとえば, 執筆時現在, にフリーの正規性検定ツールがある で述べるが,Excel の分散分析には正規性だけでなく等分散性も要求される. 38

3 高木 : 使える! 統計検定 機械学習 II 433 第 4 図一元配置 ( 要素が一つ ) と二元配置 ( 要素が二つ ) 第 2 図 第 g 世代で性能差に有意な差があるかどうかを調べ たい収束曲線の例 あるかないかの違いが, 一元配置か二元配置の違いになる. 第 2 図の例でいえば, 第 n 世代での収束性能値を第 5 図 (a) のように集めて検定する場合, 要因は比較するアルゴリズムだけなので一元配置である. 第 3 図 Excel2013 で用意されているデータ分析ツール たデータでは, 同じ人の食前, 食中, 食後の血糖値がわかっているので, 対応関係があるといえる. データに対応関係がある場合の方が, 情報量が多いため有意差の検出力が高い. 本連載第 1 回目の解説 [1] で述べたように, 実験計画の段階でデータに対応関係をもたせるようにすれば, 提案手法の優位性を統計的に示すことができるかもしれない. 3. データに正規性がある場合 3.1 データに対応関係がない場合 : 一元配置の分散分析 Excel メニューで データ データ分析 1 を選択すると,3 種類の分散分析が見つかる ( 第 3 図 ). データが正規分布をしておりデータに群間の対応関係がない場合は 分散分析 : 一元配置 を選択する. 第 4 図左のように, データグループ 2 間のデータに対応関係がない場合の要素はデータグループだけで, 同図右のように対応関係がある場合はデータグループとデータの二つの要素がある, と考えて, 前者を single factor ( 一元配置 ), 後者を two-factor( 二元配置 ) とよぶ.3.1 と 3.2 のようにデータグループ間のデータに対応関係が 1 初めて利用する場合は,Excel の ファイル オプション アドイン から 分析ツール を有効にすること. 2 統計の分野では 群 標本 の用語が使われるが, 第 2 表 (b),(c) のように,Excel の分散分析表出力では 列 と表現される. つぎに 3 群以上の場合の等分散性検定手法である Bartlett の検定 3 をしてすべてのデータグループの分散が等しいといえるかどうかを調べる. 講座連載第 1 回目では,F 検定を用いて正規分布するデータの等分散性を調べ, 分散が等しい場合の t- 検定, または, 等しくない場合の Welch の t- 検定を選んだ [1]. 分散分析でも同様に等分散性がある場合の分散分析と成り立たない場合の分散分析 (Welch の分散分析 ) がある. 最近の統計解析パッケージや R 言語には両者が用意されているが,Excel の分析ツールには Welch の分散分析が用意されていない ( 第 3 図 ) ので, 正規性はあるが等分散性が成り立たない場合は,Excel を諦めて Welch の分散分析の入った統計パッケージを持っている人にお願いをしよう. Excel 分析ツールから 分散分析 : 一元配置 を実行すると, 第 2 表 (a) のような分散分析表が得られる 4. この中の p 値が 0.05 あるいは 0.01 以下であれば, 危険率 5% あるいは 1% でデータグループの平均間のどこかに有意な差があると結論付ける. どこか では困る, という検定ユーザは 5. の多重比較を行う. 3.2 データに対応関係がある場合 : 二元配置の分散分析データが正規分布をしておりデータに対応関係がある場合は二元配置の分散分析を選択する. 前節同様, Bartlett の検定で等分散性が成り立たない場合は Excel での二元配置分散分析を諦めて 4.2 の Friedman 検定を選択するか,Welch の分散分析の入った統計パッケージを持っている人にお願いをしよう. 二元配置には 繰り返しのない二元配置 と 繰り返しのある二元配置 がある. 第 5 図 (b) のように同じ初 3 執筆現在, にフリーの Bartlett 検定ツールがある. 4 第 2 表は分散分析表の形式を示すためにダミーデータで作成したものである. 39

4 434 システム / 制御 / 情報第 58 巻第 10 号 (2014) 第 2 表 Excel 分散分析表の例 (a) 分散分析: 一元配置 変動要因 変動 自由度 分散 観測された P- 値 F 境界値 分散比 グループ間 グループ内 合計 (b) 分散分析: 繰り返しのない二元配置 変動要因 変動 自由度 分散 観測された P- 値 F 境界値 分散比 行 列 誤差 合計 (c) 分散分析: 繰り返しのある二元配置 変動要因 変動 自由度 分散 観測された P- 値 F 境界値 分散比 標本 列 交互作用 繰り返し 誤差合計 第 5 図 分散分析のためのデータ形式.(a) 一元配置. 比較 するアルゴリズムだけが要素.(b) 繰り返しのない 二元配置. 比較するアルゴリズムと初期探索点が要素.(c) 繰り返しのある二元配置. 比較するアルゴリズムとベンチマーク関数が要素で, 各関数でいろいろな初期探索点からの収束性能値を調べる.(d) 繰り返しのない三元配置. 期探索点同士でアルゴリズムを比較する場合, 初期探索点が第 2 の要素に加わる. 同じ条件で比較するという情報量が増えたぶん第 5 図 (a) の一元配置よりも有意差の検定力が上がる. しかし, 繰り返しのない二元配置では, あるアルゴリズムのある初期探索点でのデータが一つしかないため, 二つの要素について解析しようにも, 平均値も分散も計算できない. 初期探索点の代わりにベンチマーク関数を第 2 の要素としても同じことである. 二つの要因間の交互作用がないと仮定できる場合にのみ正規性の検定や等分散性の検定などができるが, 交互作用の有無についての検定もできないので, 得られた分散分析結果も近似と割り切ったほうが無難である. これらのことから, 各条件で複数のデータをとって繰り返しのある二元配置分散分析を行うことが望ましい. 第 5 図 (c) は, アルゴリズムとベンチマーク関数の 2 要素に対して, ベンチマーク関数で複数の初期探索点で性能評価した場合で, 繰り返しのある二元配置という. 上述の繰り返しのない二元配置の問題が解決できる. また, 第 2 表 (c) のように交互作用も検定できるので, たとえば, ある特性のベンチマーク関数には強いが別の特性の関数には弱いようなアルゴリズムが含まれるかどうかの情報が得られる. さらに情報量を増やして第 5 図 (d) のデータ配列にすると, アルゴリズム, ベンチマーク関数, 初期探索点という三つの要素を解析する三元配置になる. Excel では第 3 図の 2 種類の二元配置分散分析 ( 分散分析 : 繰り返しのない二元配置 と 分散分析 : 繰り返しのある二元配置 ) が用意されており, これらを選択して実行すると, 第 2 表 (b)(c) のような分散分析表が得られる 1. データグループの各平均値間に有意な差があるかどうかを判定するには, 分散分析表に複数ある p 値の中から 列 の p 値に注目し,0.05 あるいは 0.01 以下かどうかで有意差判定をする. 3.1 で述べたように, この分散分析でデータグループ間に有意な差があることがわかっても, どこか に有意な差があること以上はわからない. どこに 有意な差があるかを知るには 5. の多重比較をする必要がある. 1 第 2 表 (c) の中で 標本 とあるのは, データグループ ( 群 ) ではなくおのおののデータサンプルを意味している. 統計分野では標本 = 群とすることが多いので, この Excel 表現は紛らわしい. 40

5 高木 : 使える! 統計検定 機械学習 II データに正規性がない場合 4.1 データに対応関係がない場合 : Kruskal-Wallis 検定講座連載第 1 回目の 2 群間の有意差検定 [1] と同様, データが正規分布しているとはいえない場合はノンパラメトリックな検定方法を選択する. ノンパラメトリック検定方法はデータ値の大小の順位関係を利用して有意に偏っているかどうかを判定する. データに対応関係がない場合は, 第 1 表から Kruskal- Wallis 検定を選択する. 検定手順は以下のとおりである. (step 1) 全データに順位 (rank) を付ける 1. (step 2) 4 種類の数値 (N, k, n i, R i ) を求める. (step 3) 検定のための H 値を計算する. 12 k Ri 2 H = 3(N +1) (1) N(N +1) n i i=1 (step 4) H を付録第 A1 表の Kruskal-Wallis 検定表に照らし合わせて有意差判定を行う. データ規模が大きくて付録第 A1 表が使えない場合は,H が自由度 k 1 の χ 2 に従うものとして χ 2 検定表で有意差判定を行う. データ数が 6 個,5 個,6 個から成る三つのデータグループ ( 群数 = 3) の第 6 図の例を使って検定方法を見てみよう. (step 1) まず図のように全データに第 1 位 ~ 第 17 位までの順位を付ける. (step 2) つぎに 4 種類の数値を求める. データ総数 N = 17 個, グループ数 k =3, 各データ数 (n 1,n 2,n 3 )= (6,5,6) 個, 順位の累積数 (R 1,R 2,R 3 )=(38,69,46), を求める. (step 3) これらの数値を (1) 式に代入すると 12 k Ri 2 H = 3(N +1) N(N +1) n i=1 i ( ) = 17(17+1) (17+1) 6 =6.609 (step 4)H =6.609 を付録第 A1 表と比較する. 表の (n 2,n 1,n 3 ) = (5,6,6) の危険率 5% と 1% の H の有意点 (H =5.765 および H =8.124) と比較する. すると, 第 7 図のような関係がある. この図の斜線部分は, 全体面積のうちの 1% を占める領域であり,H =6.609 はこのわずかな領域に入るような危険率で有意な差があるとはいえないが, 危険率 5% の領域 ( 有意点の右側の領域 ) には入っているので, 少なくとも危険率 5% では三つのデータグループ間のどこかに有意な差があるといえる. 1 Excel にはデータ値から順位を求める RANK() 関数が用意されている. 順位は昇べき順でも降べき順でもよい. 同順位には平均順位を割り振る. 第 6 図 Kruskal-Wallis 検定の例題. 計算にはまず,N: 全データ個数,k: データグループ数 ( 群数 ),n i : 第 i 番目のデータグループのデータ数,R i: 第 i 番目のデータグループの各データに割り振られた順位の総和, を求める. 第 7 図 H =6.609 を危険率 5% と 1% の有意点と比較する. どこに 有意な差があるかを調べるには 5. の多重比較を行う. データ総数 N が 17 を超えたり, 四つ以上のデータグループ間の比較をする場合は, 付録第 A1 表が使えない. この場合は,H が自由度 k 1 の χ 2 分布に従うものとして, 統計の教科書などにある χ 2 検定表で有意差判定を行う.Excel には CHISQ.INV.RT( 確率, 自由度 ) 関数が用意されているので,χ 2 分布での危険率 1% と 5% の有意水準を CHISQ.INV.RT(0.01, k 1) と CHISQ.INV.RT(0.05, k 1) から求め,H をこれらと比較した方が簡単であろう. 4.2 データに対応関係がある場合 : Friedman 検定データグループ間のデータに対応関係がある場合は, 第 1 表から Friedman 検定を選択する. この検定方法は, 対応するデータ間の順位を求め, データグループごとの順位に偏りがないかを調べる. 検定手順は以下のとおりである. (step 1) データグループ間の対応のあるデータの間で順位 (rank) を付ける. (step 2) 3 種類の数値 ( データグループ数 ( 群数 )k, 各グループのデータ数 ( 群サイズ )n, 第 i 番目のデータグループの順位の合計 R i ) を求める. (step 3) 検定のための χ 2 r 値を計算する. 41

6 436 システム / 制御 / 情報第 58 巻第 10 号 (2014) 第 3 表 Friedman 検定のための例題 :4 手法 (a,b,c,d) そ れぞれを評価問題 (A,B,C,D) に適用した場合の 性能表評価手法問題 a b c d A B C D 第 4 表第 3 表を変換した性能の順位表評価手法問題 a b c d 評A B C D (n = 4) 合計順位 } {{ } 手法 ( a,b,c,d) の数 (k = 4) 第 8 図 第 3 表を図的化し, 対応する 4 データ内で第 1 位 から第 4 位の順位を付けたもの χ 2 r = 12 nk(k +1) k Ri 2 3n(k +1) (2) i=1 (step 4) χ 2 r を付録第 A2 表の Friedman 検定表に照ら し合わせて有意差判定を行う. 群数や総データ数が多い場合は,χ 2 r が自由度 k 1 の χ 2 分布に従うも のとして χ 2 検定表で有意差判定を行う. Friedman 検定の演習をしてみよう. 第 3 表は 4 種類の手法 (a,b,c,d) を評価問題 (A,B,C,D) に適用し,4 種類の手法の間に有意な性能差があるかどうかを検定する例である. (step 1) 同じ評価問題で 4 手法 (a,b,c,d) の性能競争ができるので ( すなわち, データに対応関係があるので ), 第 8 図のように評価問題ごとに性能順位を求め, 順位表 ( 第 4 表 ) に書き直す. (step 2) この順位表から 3 種類の数値を求めると,k =4 グループ,n =4 データ,(R 1,R 2,R 3,R 4 ) =(15, 6, 7, 12). 価問題数(step 3) これらの数値を (2) 式に代入する. χ 2 12 k r = Ri 2 3n(k +1) nk(k +1) i=1 12 ( = ) 3 4 (4+1) 4 4 (4+1) =8.1 (step 4) 得られた χ 2 r =8.1 を付録第 A2 表の Friedman 検定表に照らし合わせると, 危険率 5% の有意点 (7.8) < 8.1 < 危険率 1% の有意点 (9.6) なので, 危険率 1% で有 意な差があるとはいえないが, 危険率 5% で四つのデータ グループの間のどこかに有意な差があるといえる. データグループ数が k =5 以上の場合は,4.1 で述べたように χ 2 検定表か Excel の CHISQ.INV.RT() 関数を使って有意差判定を行う. どこに 有意な差があるかを調べるには次節の多重比較を行う. 5. 多重比較 本解説で紹介したすべての検定方法で, 有意差がありと判定された場合は多群間のどこかに有意な差がある, という表現をした. これは, 多群間に有意な差はない という帰無仮説が否定されても どこに 有意な差があることを示すことにはならないためである. しかし現実問題として, 自分の提案手法が従来法よりも優れていることを実験的に示したいがために統計検定をする読者にとって, どこかに有意差がある といわれても困る. 連載第 1 回目の解説 [1] で 2 群の平均値の差の検定方法を学んだのだから, それぞれの平均値間にこの検定法を適用すれば どこに 有意な差があるのかが簡単にわかるではないか, との声が聞こえてきそうである. しかし, 単純に 2 群の検定手法を複数回適用して 3 群以上の場合の検定の代用としてはいけない.m 回適用して 1 回でも有意差を検出したら本解説の 3 群以上の場合の検定方法 1 回で有意差検出をしたことに相当するので, この場合の信頼水準は (2 群の差の検定の信頼水準 ) m になってしまう. たとえば, 三つの平均値間に危険率 5% の t- 検定を 3 回適用すれば, 危険率 14%(=1 (1 0.05) 3 ) の分散分析をしたことに相当するので, 甘い検定をしていることになる 1. では,2 群の判定を厳しくして複数回適用し, 全体としてちょうどよい有意水準になるようにすればよいのではないか, という考えが生まれよう. これが多重比較である. これまで多くの多重比較法が提案されており, どの手法を使うべきか迷ってしまう. まずは全体像が見えるように, すべての群間の対比較 ( データグループのすべて 1 有意というべきでない状況を有意と判断してしまう誤りを第 1 種の過り ( または偽陽性,α 過誤 ) という. その逆に有意というべき状況を有意ではないという誤りを第 2 種の過り ( または偽陰性,β 過誤 ) という. 42

7 高木 : 使える! 統計検定 機械学習 II 437 第 5 表 文献 [4] の表 1.3 の一部を抜き出し加筆した多重比 較法.* は等分散性 / 非等分散性にかかわらず適用 可能な手法で, そのほかは等分散性データへの適用 手法. の記号は有意差の検出力の高い順を 示す. 比較 1: すべての群間の対比較への適用, 比較 2: 対照群との対比較への適用, 分布 1: データが正規分布している場合への適用, 分布 2: データが正規分布以外の分布をしている場 合への適用. 手法 比較 1 比較 2 分布 1 分布 2 Tukey-Kramer 法 Dunnett 法 Sheffé 法 Steel-Dwass 法 Steel 法 Bonferroni 法 Holm 法 Shaffer 法 Holland-Copenhaver 法 Tukey-Welsch 法 Peritz 法 Dunnett の 逐次既客型検定法 の二つの平均値間の差の検定 ) をする場合の代表的な多重比較法と, 対照群との対比較 ( 一つのデータグループとその他すべてのデータグループとの平均値間の差の検定 ) をする代表的な多重比較法を第 5 表に示す. 文献 [5] にも同様に多重比較法の選択フローチャートがある. 第 5 表を眺めると,Bonferroni 法とその改良版である Holm 法が使えるようになれば, オールマイティに利用できそうである. ほかの手法を使いたい場合は, 統計パッケージに各検定方法に合った多重比較法がセットにされていることが多いので, その中から使えばよい. フリーのソフト 1 もある. Bonferroni 法の計算は非常に簡単なので統計ソフトを探す必要はない. データグループ ( 群 ) 数を k としよう. 連載第 1 回目 [1] の 2 群の検定手法を適用する回数 ( すべての群間対比較なら k C 2 回, 対照群との対比較なら k 1 回 ) で有意水準を割って検定を厳しく補正するだけである ( 逆に p 値にこの回数を掛けても同じこと ). たとえば,4 群の検定を行うために 6 回の 2 群の検定手法を適用して 6 個の p 値を求めた場合は, これらの p 値を 0.05/6 および 0.01/6 と比較することで, 危険率 5% および 1% で有意差があるかどうかを検定する.Bonferroni の補正は簡単であるが, 検定結果が厳しくなる傾向にある. Holm の方法は Bonferroni 法のこの点を改良したもので,Excel や電卓で簡単に計算できる. データグループ 1 たとえば, 執筆時現在, にフリーの多重検定ツールがある. 第 6 表 4 群に Holm 法を適用した例 2 群間 p 値 補正 p 値式 補正 p 値 群 1 群 =p 値 * 群 2 群 =p 値 * 群 2 群 =p 値 * 群 1 群 =p 値 * 群 3 群 =p 値 * 群 1 群 =p 値 * ( 群 ) 数を k,2 群用の検定を適用する回数を r としよう. (step 1) データグループ ( 群 ) のすべての群間に, 第 1 図の 2 群の検定手法を適用し p 値を求める. 適用する検定手法は連載第 1 回目 [1] を参照のこと. (step 2) 得られた p 値を昇べき順に並べ替える. (step 3) i を並べ替えた順とすると, 補正 p 値 = p 値 (r +1 i) を求める. (step 4) 並び替えた順に補正 p 値が危険率 5%, または,1% で有意差判定を行う. 有意水準を超えた段階で判定をやめ, それ以降の群間には有意差なしとする. k =4 群の場合の適用例を示す.(step 2) の状態が第 6 表の第 1 列, 第 2 列であるとしよう. 第 3 列が, r = k C 2 =6とする (step 3) の計算式で, 第 4 列がその結果である. 危険率 5% の場合,( 群 1 群 2) と ( 群 2 群 4) のみが有意差ありと判断する.( 群 1 群 4) の補正 p 値は 0.05 未満であるが,(step 4) にしたがって補正 p 値上位第 2 位までのみを有意な差と判断する. 6. おわりに 講座連載第 2 回目の本解説は,3 群以上の場合の平均値間に有意な差があるかどうかを検定する手法の選択方法と使い方について説明した. 連載第 1 回目と第 2 回目をご覧いただければ, まずはどの検定手法を使えばよいかの判断がつき, 具体的に計算ができると思う. 講座連載第 3 回目は, 主観評価実験によく使われる検定手法について解説する予定である. 謝 本解説は数理統計学がご専門の永田靖教授 ( 早稲田大学創造理工学部 ) に監修をいただいた. 御礼申し上げる. また九大大学院芸術工学研究院の大草孝介助教には資料提供とコメントをいただいた. 御礼申し上げる. (2014 年 6 月 2 日受付 ) 辞 参考文献 [1] 高木 : 使える! 統計検定 機械学習 I 2 群間の有意差検定 ; システム / 制御 / 情報, Vol. 58, No. 8, pp (2014) [2] takagi/ TAKAGI/downloadablefileJ.html 43

8 438 システム / 制御 / 情報第 58 巻第 10 号 (2014) [3] 市原 : バイオサイエンスの統計学 正しく活用するための実践理論, 南江堂 (1990) [4] 永田, 吉田 : 統計的多重比較法の基礎, サイエンティスト社 (1997) [5] 対馬 : 多重比較法, pteiki/research/stat/multi.pdf 第 A1 表 付 録 Kruskal-Wallis の検定表. 危険率 5% と 1% の H の有意点.n 1, n 2, n 3 は群数 3 の場合のデータ個 数 ([3] のデータをもとに本表を作成 ). データ数 危険率 データ数 危険率 n 1 n 2 n 3 5% 1% n 1 n 2 n 3 5% 1% 第 A2 表 たか高 ぎ木 Friedman 検定表. 危険率 5% と 1% の χ 2 r の有意 点.k は群数, n はデータ個数.([3] のデータをも とに本表を作成 ). k n p < 0.05 p < 0.01 ひで英 ゆき行 著者略歴 1956 年 7 月生 年九州芸術工科大 学修士課程修了.1981~1995 年松下電器産業 ( 株 ),1991~1993 年 UC Berkeley 客員研究員,1995 年九州芸術工科大学助 教授,2003 年統合により九州大学助教授, 現在九州大学教授. 人間要素を取り込む計 算知能等の研究に従事. 博士 ( 工学 ). 信学会篠原記念学術奨励賞 (1989), 知能情報ファジィ学会論文賞 (2003), 最優秀論文賞 (KES 97, IIZUKA 98, ICOIN-15, ICGEC 12), 功労賞 ( スロバキア人工知能学会 2002,IEEE SMC 学会 2003), IEEE SMC 学会 Best Associate Editor 賞 (2005),2009 IEEE Most Active SMC Technical Committee 賞 (2010), 各受賞. 日本ファジィ学会理事 監事 ( ),IEEE SMC 学会 Vice-President ( ), 進化計算学会理事 ( ),IEEE SMC 学会日本支部長 ( ). 44

九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : I : 2 群間の有意差検定 高木, 英行九州大学大学院芸術工学研究院 出版情報

九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : I : 2 群間の有意差検定 高木, 英行九州大学大学院芸術工学研究院   出版情報 九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : I : 2 群間の有意差検定 高木, 英行九州大学大学院芸術工学研究院 http://hdl.handle.net/2324/1467638 出版情報 : システム / 制御 / 情報 : システム制御情報学会誌. 58 (8), pp.345-351,

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378> 3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Microsoft Word - apstattext05.docx

Microsoft Word - apstattext05.docx 5 章 群間の量的データの検定 5. 対応のない検定手順例えば 男女の成績を比較しようとして試験を実施した場合 男性の集団 ( 群 ) と女性の集団 ( 群 ) との比較になりますから つの集団に同一人物は 人もいません しかしその試験で英語と国語の平均点を比較する場合 英語と国語を受験した集団には必ず同じ人がいます 前者のような場合を対応のないデータ 後者の場合を対応のあるデータと呼びます 対応のあるデータについては特別の処理ができるので

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - Statistics[B] 講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 kkarato@eco.u-toyama.ac.jp

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : III : 主観評価実験のための有意差検定 高木, 英行九州大学大学院芸術工学研究院

九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : III : 主観評価実験のための有意差検定 高木, 英行九州大学大学院芸術工学研究院 九州大学学術情報リポジトリ Kyushu University Institutional Repository 使える! 統計検定 機械学習 : III : 主観評価実験のための有意差検定 高木, 英行九州大学大学院芸術工学研究院 http://hdlhandlenet/2324/467640 出版情報 : システム / 制御 / 情報 : システム制御情報学会誌 58 (2), pp54-520,

More information

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8> 第 8 回 t 分布と t 検定 生物統計学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

データ科学2.pptx

データ科学2.pptx データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研 CAE シミュレーションツール を用いた統計の基礎教育 ( 株 ) 日本科学技術研修所数理事業部 1 現在の統計教育の課題 2009 年から統計教育が中等 高等教育の必須科目となり, 大学でも問題解決ができるような人材 ( 学生 ) を育てたい. 大学ではコンピューター ( 統計ソフトの利用 ) を重視した教育をより積極的におこなうのと同時に, 理論面もきちんと教育すべきである. ( 報告 数理科学分野における統計科学教育

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ 今回のプログラミングの課題 次のステップによって 徐々に難易度の高いプログラムを作成する ( 参照用の番号は よくわかる C 言語 のページ番号 ) 1. キーボード入力された整数 10 個の中から最大のものを答える 2. 整数を要素とする配列 (p.57-59) に初期値を与えておき

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.jp website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

EBNと疫学

EBNと疫学 ノンパラメトリック検定 94 質的変数と質的変数の関連性を調べる - クロス表 行周辺度数 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 列周辺度数 95 クロス表 - 行パーセント 各行のセルの度数を行周辺度数で割って 100 をかけたもの 行周辺度数 肺がん合計発生発生しない 10%(100

More information

解析センターを知っていただく キャンペーン

解析センターを知っていただく キャンペーン 005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 17 回 講義 母平均の区間推定 Part- 016 年 6 14 ( )3 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u toyama.ac.jp website: http://www3.u toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

JUSE-StatWorks/V5 活用ガイドブック

JUSE-StatWorks/V5 活用ガイドブック 4.6 薄膜金属材料の表面加工 ( 直積法 ) 直積法では, 内側に直交配列表または要因配置計画の M 個の実験, 外側に直交配列表または要因配置計画の N 個の実験をわりつけ, その組み合わせの M N のデータを解析します. 直積法を用いることにより, 内側計画の各列と全ての外側因子との交互作用を求めることができます. よって, 環境条件や使用条件のように制御が難しい ( 水準を指定できない )

More information

モジュール1のまとめ

モジュール1のまとめ 数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

第 7 章順位和検定 第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, ス

第 7 章順位和検定 第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, ス 第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, スコア化データおよび等分散検定で有意差を示した集団について用いられる. 一部の統計学者は, 生物の反応に対して順位和検定の方が分布を利用した検定法と比較して有用と述べている.

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

040402.ユニットテスト

040402.ユニットテスト 2. ユニットテスト ユニットテスト ( 単体テスト ) ユニットテストとはユニットテストはプログラムの最小単位であるモジュールの品質をテストすることであり その目的は結合テスト前にモジュール内のエラーを発見することである テストは機能テストと構造テストの2つの観点から行う モジュールはプログラムを構成する要素であるから 単体では動作しない ドライバとスタブというテスト支援ツールを使用してテストを行う

More information

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学) 回帰分析の用途 実験計画法の意義 グラフィカルモデリングの活用 早稲田大学創造理工学部 経営システム工学科 永田靖, The Institute of JUSE. All Rights Reserved. 内容. 回帰分析の結果の解釈の仕方. 回帰分析による要因効果の把握の困難さ. 実験計画法の意義 4. グラフィカルモデリング 参考文献 : 統計的品質管理 ( 永田靖, 朝倉書店,9) 入門実験計画法

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X ( 第 週ラプラス変換 教科書 p.34~ 目標ラプラス変換の定義と意味を理解する フーリエ変換や Z 変換と並ぶ 信号解析やシステム設計における重要なツール ラプラス変換は波動現象や電気回路など様々な分野で 微分方程式を解くために利用されてきた ラプラス変換を用いることで微分方程式は代数方程式に変換される また 工学上使われる主要な関数のラプラス変換は簡単な形の関数で表されるので これを ラプラス変換表

More information

仮説検定の手順

仮説検定の手順 2018 年 4 月 4 日 ( 東京 ) 仮説検定とその手順 基礎編 折笠秀樹 ( 富山大学 ) 折笠秀樹富山大学 で検索 折笠秀樹教室 前提 統計学には 記述統計 Descriptive statistics ( ナイチンゲール コレラ ) 推測統計 Inferential statistics (R.A. フィッシャー ) 仮説検定 (Hypothesis testing) 推定 信頼区間 (Estimation/

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

分散分析表を表 に示した. 表. 分散分析表 要因 平方和 自由度 分散 分散比 確率 全体 群間 P<0.001 誤差 F- 分布表,0.1% 水準の数表 6-1 の縦軸 7, 横軸 の交点 と比較して, 算出された値の

分散分析表を表 に示した. 表. 分散分析表 要因 平方和 自由度 分散 分散比 確率 全体 群間 P<0.001 誤差 F- 分布表,0.1% 水準の数表 6-1 の縦軸 7, 横軸 の交点 と比較して, 算出された値の 第 6 章 3 群以上の多群間検定 ( 分布を利用した検定 ) 1. 1 元配置の分散分析 (One-way Analysis of Variance, ANOVA) 三群以上の設定の場合に用いる. 一般的には, この検定で有意差が検出された場合, どこの群間かは不明である. したがって, どこの群間に有意差があるかはいつかの検定法で吟味する. ここの項では, 一元配置の分散分析を説明する. 毒性試験では,

More information

Microsoft Word - Stattext07.doc

Microsoft Word - Stattext07.doc 7 章正規分布 正規分布 (ormal dstrbuto) は 偶発的なデータのゆらぎによって生じる統計学で最も基本的な確率分布です この章では正規分布についてその性質を詳しく見て行きましょう 7. 一般の正規分布正規分布は 平均と分散の つの量によって完全に特徴付けられています 平均 μ 分散 の正規分布は N ( μ, ) 分布とも書かれます ここに N は ormal の頭文字を 表わしています

More information

因子分析

因子分析 因子分析 心理データ解析演習 M1 枡田恵 2013.6.5. 1 因子分析とは 因子分析とは ある観測された変数 ( 質問項目への回答など ) が どのような潜在的な変数 ( 観測されない 仮定された変数 ) から影響を受けているかを探る手法 多変量解析の手法の一つ 複数の変数の関係性をもとにした構造を探る際によく用いられる 2 因子分析とは 探索的因子分析 - 多くの観測変数間に見られる複雑な相関関係が

More information

Microsoft Word - 第14回定例会_平田様_final .doc

Microsoft Word - 第14回定例会_平田様_final .doc クロスオーバー実験のデザインと解析 - テレメトリー法によ る QT/QTc 試験の実データを用いた検討 - II. クロスオーバー実験の統計解析 4) 有意差検定と信頼区間方式の解析の比較 平田篤由 薬理統計グループ安全性薬理チーム 要約 : ヒトの QT/QTc 評価試験における判断基準は,QTc 間隔の 95% 信頼区間の上限が 10ms を越えるかどうかである. 一方, 非臨床試験のイヌを用いたテレメトリー

More information

Microsoft Word - apstattext03.docx

Microsoft Word - apstattext03.docx 3 章質的データの検定これから検定の手法を順番に詳しく見て行きましょう 最初は質的データの検定についてです 質的データの検定は構成比率の検定で アンケートで賛成が過半数であるかとか 賛成の比率が男女で異なるかといったことを調べます これからは最初に例題を置き それについて College Analysis による回答を示します 理論のところではその検定のために使った公式を簡単に表示しますが 必要なければ無視してもらって結構です

More information

21世紀型パラメータ設計―標準SN比の活用―

21世紀型パラメータ設計―標準SN比の活用― 世紀のパラメータ設計ースイッチ機構のモデル化ー 接点 ゴム 変位 スイッチ動作前 スイッチ動作後 反転ばねでスイッチの クリック感 を実現した構造 世紀型パラメータ設計 標準 SN 比の活用 0 世紀の品質工学においては,SN 比の中に, 信号因子の乱れである 次誤差 (S res ) もノイズの効果の中に加えて評価してきた.のパラメータ設計の例では, 比例関係が理想であるから, 次誤差も誤差の仲間と考えてもよかったが,

More information

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅 周期時系列の統計解析 3 移動平均とフーリエ変換 io 07 年 月 8 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ノイズ の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分のがどのように変化するのか等について検討する. また, 気温の実測値に移動平均を適用した結果についてフーリエ変換も併用して考察する. 単純移動平均の計算式移動平均には,

More information

一元配置分散分析法 F 検定と Welch 検定 一元配置分散分析で一般的に使用される F 検定は すべてのグループが共通だが未知の標準偏差 (σ) を共有するという仮定に基づきます 実際には この仮定が当てはまることはまれで その結果 タイプ I 過誤率の制御が難しくなります タイプ I の誤りと

一元配置分散分析法 F 検定と Welch 検定 一元配置分散分析で一般的に使用される F 検定は すべてのグループが共通だが未知の標準偏差 (σ) を共有するという仮定に基づきます 実際には この仮定が当てはまることはまれで その結果 タイプ I 過誤率の制御が難しくなります タイプ I の誤りと MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです 一元配置分散分析 (ANOVA) 概要 一元配置分散分析は 3 つ以上のグループの平均を比較し 互いに有意に異なるかどうかを判断するために使用されます もう

More information

Microsoft Word - mstattext01.docx

Microsoft Word - mstattext01.docx 基礎から学ぶシリーズ 4 College Analyss で学ぶ 多変量解析 福井正康 福山平成大学経営学部経営学科 はじめにこのシリーズ 基礎からの統計学では データの集計方法と検定 推定について少し理論に踏み込んで勉強しました その際処理はすべて Excel を使い 何を計算しているのか分かるようにしました ただこの本は経済 経営系の大学院に進もうとする人に基礎を学んでもらう目的で作ったもので

More information

Microsoft PowerPoint - C4(反復for).ppt

Microsoft PowerPoint - C4(反復for).ppt C 言語プログラミング 繰返し ( for 文と while 文 ) 例題 (10 個のデータの平均を求める ) 手順 入力データをx1,x2,,x10 として, (x1+x2+x3+x4+x5+x6+x7+x8+x9+x10)/10 を計算する データ数が,1000 個,10000 個, となったらどうする? データ数個分の 変数の宣言, scanf 関数の呼出し, 加算式の記述 が必要 1 総和を求めること

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

データ構造

データ構造 アルゴリズム及び実習 7 馬青 1 表探索 定義表探索とは 表の形で格納されているデータの中から条件に合ったデータを取り出してくる操作である 但し 表は配列 ( 連結 ) リストなどで実現できるので 以降 表 の代わりに直接 配列 や リスト などの表現を用いる場合が多い 表探索をただ 探索 と呼ぶ場合が多い 用語レコード : 表の中にある個々のデータをレコード (record) と呼ぶ フィールド

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 使用する標本は母集団から無作為抽出し 母集団を代表している値と考える 標本同士を比較して得た結果から

More information

Microsoft PowerPoint - mp11-02.pptx

Microsoft PowerPoint - mp11-02.pptx 数理計画法第 2 回 塩浦昭義情報科学研究科准教授 shioura@dais.is.tohoku.ac.jp http://www.dais.is.tohoku.ac.jp/~shioura/teaching 前回の復習 数理計画とは? 数理計画 ( 復習 ) 数理計画問題とは? 狭義には : 数理 ( 数学 ) を使って計画を立てるための問題 広義には : 与えられた評価尺度に関して最も良い解を求める問題

More information

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63>

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63> 3 も 飲酒習慣 に替えておきましょう( 図 12) その上で 飲酒分類 をフィールドリストにドラッグして消します 同じように 高血圧判定 もグループ化を図り 1 を 正常血圧 2-4 を 血圧異常 とします 高血圧判定 2 を作り もとの 高血圧判定 を消します これで飲酒と血圧のクロス集計が完成しました ページの選択で 男女の結果 ( 図 13) 男女別の結果( 図 1 4 15) が得られます

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

DVIOUT

DVIOUT 第 章 離散フーリエ変換 離散フーリエ変換 これまで 私たちは連続関数に対するフーリエ変換およびフーリエ積分 ( 逆フーリエ変換 ) について学んできました この節では フーリエ変換を離散化した離散フーリエ変換について学びましょう 自然現象 ( 音声 ) などを観測して得られる波 ( 信号値 ; 観測値 ) は 通常 電気信号による連続的な波として観測機器から出力されます しかしながら コンピュータはこの様な連続的な波を直接扱うことができないため

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散, . 無作為標本. 基本的用語 推測統計における基本的な用語を確認する 母集団 調査の対象になる集団のこと 最終的に, 判断の対象になる集団である 母集団の個体 母集団を構成する つ つのもののこと 母集団は個体の集まりである 個体の特性値 個体の特性を表す数値のこと 身長や体重など 特性値は, 変量ともいう 4 有限母集団と無限母集団 個体の個数が有限の母集団を 有限母集団, 個体の個数が無限の母集団を

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information

Microsoft Word - NumericalComputation.docx

Microsoft Word - NumericalComputation.docx 数値計算入門 武尾英哉. 離散数学と数値計算 数学的解法の中には理論計算では求められないものもある. 例えば, 定積分は, まずは積分 ( 被積分関数の原始関数をみつけること できなければ値を得ることはできない. また, ある関数の所定の値における微分値を得るには, まずその関数の微分ができなければならない. さらに代数方程式の解を得るためには, 解析的に代数方程式を解く必要がある. ところが, これらは必ずしも解析的に導けるとは限らない.

More information

pp2018-pp9base

pp2018-pp9base プログラミング入門 Processing プログラミング第 9 回 九州産業大学理工学部情報科学科神屋郁子 ( pp@is.kyusan-u.ac.jp ) 時限 クラス 水 1 機械 ( クラス 3) 水 2 機械 ( クラス 1) 水 4 電気 (B1 B2) 後ろ 5 列は着席禁止 3 人掛けの中央は着席禁止 今後の予定 第 9 回 : 複数の図形 (2) 繰り返しと座標変換第 回 : 画像の表示と音の再生

More information

Microsoft PowerPoint - exp2-02_intro.ppt [互換モード]

Microsoft PowerPoint - exp2-02_intro.ppt [互換モード] 情報工学実験 II 実験 2 アルゴリズム ( リスト構造とハッシュ ) 実験を始める前に... C 言語を復習しよう 0. プログラム書ける? 1. アドレスとポインタ 2. 構造体 3. 構造体とポインタ 0. プログラム書ける? 講義を聴いているだけで OK? 言語の要素技術を覚えれば OK? 目的のプログラム? 要素技術 データ型 配列 文字列 関数 オブジェクト クラス ポインタ 2 0.

More information

サーバに関するヘドニック回帰式(再推計結果)

サーバに関するヘドニック回帰式(再推計結果) 2012 年 3 月 日本銀行調査統計局 企業物価指数 サーバ に関するヘドニック回帰式 ( 再推計結果 ) 企業物価指数 サーバ の品質調整に適用するヘドニック回帰式について 1 最新のデータを用いて再推計しましたので その結果をお知らせします 1. サーバのヘドニック推計に関する基本方針 留意事項推計頻度 年 1 回 (2 月 ) 適用範囲 国内品 輸出品 輸入品に対し 同一の推計式を適用 2

More information

1. 共通数値の計算 1.1 単純梁の曲げモーメントと撓み (INFSBEAMV.XLSのシートPanel1のコピー) パネル数 n= 1 パネル間隔 λ= 支間 L/nとして利用する [T 1 ] の計算 (-1,2,-1) の係数をマトリックスに構成する (1/2) 倍しない係数に注意 連続する

1. 共通数値の計算 1.1 単純梁の曲げモーメントと撓み (INFSBEAMV.XLSのシートPanel1のコピー) パネル数 n= 1 パネル間隔 λ= 支間 L/nとして利用する [T 1 ] の計算 (-1,2,-1) の係数をマトリックスに構成する (1/2) 倍しない係数に注意 連続する 連続梁の影響線 ( デモ版 )INFCONTBVN.xls 理論と解析の背景 連続梁は 種々の境界条件と弾性条件があります ここでは標準的な等断面 等径間の 1 等分した格点で 二径間 (1:1) と三径間 (1:1:1) 連続梁の影響線だけの計算をまとめます 不等径間比の連続梁の影響線 格点分割数の計算は 応用計算として別にまとめます 連続梁の計算には 単純梁の曲げモーメントや撓みの影響線などを使います

More information

Microsoft Word - 18環設演付録0508.doc

Microsoft Word - 18環設演付録0508.doc Excel の関数について 注 ) 下記の内容は,Excel のバージョンや OS の違いによって, 多少異なる場合があります 1. 演算子 等式はすべて等号 (=) から始まります 算術演算子には, 次のようなものがあります 内が,Excel 上で打ち込むものです 足し算 +, 引き算 -, かけ算 *, わり算 /, べき乗 ^ 2. 三角関数 メニューバーの [ 挿入 ] ダイアログボックスの

More information

PowerPoint ファイルの HTML ファイルへの変換ツール MakeHTML 1 瀬河久美子 2 井上仁 1. はじめに 現在, 九州大学ではコース管理システム WebCT を運用しており [1], 多くの授業で活用されている [2-10] WebCT には, 教材の作成と提示, シラバス,

PowerPoint ファイルの HTML ファイルへの変換ツール MakeHTML 1 瀬河久美子 2 井上仁 1. はじめに 現在, 九州大学ではコース管理システム WebCT を運用しており [1], 多くの授業で活用されている [2-10] WebCT には, 教材の作成と提示, シラバス, 九州大学学術情報リポジトリ Kyushu University Institutional Repository PowerPoint ファイルの HTML ファイルへの変換ツール MakeHTML 瀬河, 久美子九州大学情報基盤センター 井上, 仁九州大学情報基盤センター https://doi.org/10.15017/1470232 出版情報 : 九州大学情報基盤センター広報 : 学内共同利用版.

More information

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m 知識工学 ( 第 5 回 ) 二宮崇 ( ninomiya@cs.ehime-u.ac.jp ) 論理的エージェント (7 章のつづき ) 証明の戦略その 3 ( 融合法 ) 証明の戦略その 1 やその 2 で証明できたときは たしかにKKKK ααとなることがわかるが なかなか証明できないときや 証明が本当にできないときには KKKK ααが成り立つのか成り立たないのかわからない また どのような証明手続きを踏めば証明できるのか定かではない

More information

Microsoft Word - データベース.doc

Microsoft Word - データベース.doc 1 データベース 世の中には膨大なデータが満ちあふれていますが それらは活用されない限り 情報 としての価値を持ちません データが 情報 として活用されるためには 検索されやすい形で整理 保管され 必要に応じて抽出できることが必要となります 本章ではデータの整理 保管 抽出機能を持ったデータベースについての概要を学習します STEP1 STEP1 データベースを使ってみよう データを 情報 として利用するためには

More information