第２回回帰と分散分析

Size: px

Start display at page:

Download "第２回回帰と分散分析"

あおいたけはな
5 years ago
Views:

1 1 環境統計学ぷらす第 2 回分散分析と回帰高木俊 shun.takagi@sci.toho-u.ac.jp 2013/10/31

2 2 予定第 1 回 : Rの基礎と仮説検定第 2 回 : 分散分析と回帰第 3 回 : 一般線形モデル交互作用第 4 回 : 一般化線形モデルモデル選択第 5 回 : 一般化線形混合モデル第 6 回 : 多変量解析

3 3 今日やること R 操作編 RエディタからのRの実行データフレームの操作統計編分散分析回帰表現編 plotのオプション関数たちエラーバー付き棒グラフ分散分析表

4 4 R の操作 R エディタからの実行データフレームの操作

5 5 作業の前に作業ディレクトリの設定 R を起動しファイル > ディレクトリの変更 R ショートカットのプロパティ作業フォルダ - にパスを入力作業ディレクトリの確認は getwd() で

6 6 R でのスクリプトの実行 R 上で計算させるにはコンソールウィンドウにコマンドを打ってやれば良いがコンソールウィンドウコマンドが長いとミスしやすい読み返しにくい後から編集しにくいなど非常にストレスがたまる

7 R エディタの利用 1. ファイル > 新しいスクリプトで R エディタを呼び出してやる 1 2 2.

7 7 R エディタの利用 1. ファイル > 新しいスクリプトで R エディタを呼び出してやる R エディタにコマンドを書いて Ctrl+R を押すとコンソールウィンドウにコマンドが送られる 3. カーソル行のコマンドもしくは選択範囲のコマンドが実行可

8 8 スクリプトの保存書いた内容は保存 ( 拡張子.R) しておき再解析や修正したいときに呼び出せる開く保存ファイル名を kekka.new.r とかにするとよくわからなくなることが多いので日付を入れておくのがおすすめ (analysis r など )

9 9 テキストエディタの利用 R エディタは windows のメモ帳程度の残念な機能しかないので長いスクリプトを書くにはあまり向かない頻繁に使う人は矩形選択対カッコ色表示置換タブ表示などができるテキストエディタの利用がおすすめ Tinn-R サクラエディタ R に特化 Ctrl+R で R 実行可能直接の R 実行不可だが機能充実アイコンがおしゃれ

10 10 データの読み込みエクセルで整理したデータを R に読み込んで解析エクセルでデータ整理 csv で保存 txt で保存 ( クリップボード保存で読み込ませる手もあります ) read.csv() Rに読み込み read.txt() (dbf を読める関数もあります ) エクセルでのデータのまとめ方 1 行目にデータの名前 2 行目以降の各列にデータを縦に入れるデータにはスペースを入れない空白セルには NA を入れておくデータ名は数字で始めない ( なるべく ) データに # を入れない

11 11 データフレーム読み込んだデータはデータフレームという形で扱われる data2.1<- read.csv( data2.1.csv,header=true) data2.1<- read.csv( data2.1.csv,t) # 実は上と同じように処理される data2.1 station.no j.density n.density depth ( 略 ) data2.1$depth # 各列へのアクセスはデータフレーム名 $ 列名で可能 [1] ( 略 ) mean(data2.1$depth) #depthの平均を求めたければ [1] 1.06 復習 : データフレーム data2.1 の depth の標準誤差 (SE) を求めるには?

12 12 分散分析回帰

13 成長速度強熱減量 (%) 分散分析と回帰 Cnt N P NP 処理分散分析説明変数 X の種類 ( カテゴリー値 ) によって応答変数 Y がどのような値をとるか回帰泥の含有率 (%) 説明変数 X の変化 ( 連続値 ) に応じて応答変数 Y がどのように変化するか説明変数 X のタイプが異なる

14 成長速度 / 日成長速度 / 日群以上の平均値の差の検定 ( 分散分析 ) 説明変数 X の種類 ( カテゴリー値 ) によって応答変数 Y がどのような値をとるかを分析普通棒グラフでその関係性を示す ( とりあえずの傾向を見るなら箱ひげ図でも ) R では plot(y~x) で実行棒グラフ箱ひげ図 Cnt N P NP 処理 Cnt N P NP 処理図 2. 実験処理ごとの植物プランクトンの成長速度

15 15 分散分析の前提条件 t 検定と同様に母集団の正規分布を仮定しているので以下の条件を満たす必要あり正規性等分散性独立性各群のデータ ( の母集団 ) が正規分布に従うこと各群のデータ ( の母集団 ) の分散が等しいこと個々のデータは互いに独立であること正規分布を仮定しないノンパラメトリック法における代替法としては Kruskal-Wallis 検定 ( 対応なしの場合 ) kruskal.test() Friedman 検定 ( 対応ありの場合 ) friedman.test() がある

16 16 線形モデルへのあてはめ i 群 j 番目の観測値を y ij と表記観測値 y ij = 各処理の平均値 y i + 誤差 ij y D y B こいつが処理ごとに大きくばらついていて y A y C こっちのばらつきが十分に小さければ処理の効果があると言って良さそう A 群 B 群 C 群 D 群

17 17 ばらつきを分割する観測値のばらつき群間のばらつき群内のばらつき = 誤差 SS Y = SS Group +SS Error p n i=1 j=1 (y ij y) 2 p i=1 n i ( y i y) 2 p n i=1 j=1 (y ij y i ) 2

18 18 分散を分析する平方和 SS はデータ数が多いほど大きくなる指標なので分散を用いて比較 ( 不偏 ) 分散 : s 2 = 平方和自由度 = y i y 2 n 1 p: 処理の種類数 n: 処理内の繰り返し平方和 SS 自由度 df 平均平方 MS = SS df 処理 SS G p-1 SS G (p 1) 残差 SS E np-p SS E (np p) 全体 SS Y np-1 SS Y np 1 = s2

19 19 F 比 ( F 値 ) の計算処理の平均平方 ( 群間の分散 :MS G ) と残差の平均平方 ( 郡内の分散 :MS E ) の比をとったものが F 比平方和 SS 自由度 df 平均平方 MS (=SS/df) F 処理 SS G p-1 MS G MS G 残差 SS E np-p MS E MS E 帰無仮説 ( 処理間での成長率に差はない = 処理間分散はゼロ ) のもとで F 比は自由度 p-1,np-p の F 分布の従う

20 20 分散分析表 (ANOVA Table) 分散分析の結果は下記のような分散分析表に表す処理残差平方和 SS 自由度 df 3 16 平均平方 MS (=SS/df) F 218 P(F 3,16 218)= R で下の式を入れれば計算されます 1-pf(218,3,16) よって帰無仮説は棄却され処理間で成長率には違いがないとはいえない ( 違いがある )

21 21 R で分散分析 lm() と anova() を用いる aov() 関数でもできます > model<- lm(growth~trt,data2.2) > anova(model) Analysis of Variance Table #lm() 関数を用いてモデル式を建てる #anova() で分散分析 Response: growth 説明変数応答変数自由度 Df Sum Sq Mean Sq F value Pr(>F) trt e-13 *** 残差 Residuals 平方和平均平方 F 比 P 値 (F 比に基づく ) --- Signif. codes: 0 *** ** 0.01 * 処理間で成長率には違いが見られた (F 3,16 =205.8, P<0.001)

22 成長速度 / 日群間での多重比較処理間で成長率には違いが見られるはわかったがどの処理とどの処理の間で具体的に差があるかはわからない?? そこで 2 群ずつ検定してやる 2 群の差の検定 t 検定 4 群間の比較は 4 C 2 =6 通り Cnt N P NP 処理 6 回 t 検定すればすべての組み合わせでの差がわかる

23 23 多重検定の落とし穴統計学的有意性 : 帰無仮説のもとでデータより極端な値が得られる確率が十分に低い (α=0.05) α=0.05 の基準で検定した場合 20 回に 1 回は差がないものを差があると判断してしまう (Type-I Error 第一種の過誤 ) 一連の仮説の中で同じような検定を何度も繰り返す ( 多重検定 ) とどこかで Type-I Error を起こす確率が高い! 一連の検定のいずれでも Type-I Error を起こさないように α( もしくは P 値 ) を修正する必要がある Family-wise Type-I Error を調節する

24 24 Family-wise Type-I Error を考慮した多重比較 Tukey の HSD 法統計の詳細は省略 Bonferroni 法 TukeyHSD(aov(Y~X,data)) n 回多重比較するなら P 値を n 倍 (α を 1/n) しちゃえという発想 pairwise.t.test(y,x, bonferroni ) Sequential Bonferroni(Holm) 法 Bonferroni は厳しすぎて差があるものをないと言ってしまう危険 (Type-II Error) が高いので差が大きいものから検定を行い補正を厳しいものから徐々に緩める方法 pairwise.t.test(y,x, holm )

25 成長速度 / 日分散分析まとめ目的 :X のカテゴリー間での Y の差の検定原理 : カテゴリー間分散とカテゴリー内分散 ( 誤差 ) に分割してその比をみる箱ひげ図を書いてみる ( または棒グラフ ) plot(y~x) モデル式を当てはめる model<- lm(y~x) 分散分析から X の効果を判断 anova(model) Cnt N P NP 処理必要なら多重比較 TukeyHSD() pairwise.t.test()

26 強熱減量 (%) 線形回帰 ( 単回帰 simple linear regression) 変数 Y( 従属変数応答変数 ) の変数 X( 独立変数説明変数 ) に対する線形な関係を解析 X が高いほど Y が高い ( 低い ) といった単調増加 / 単調減少の関係を見たい場合の解析 Y に対して X が与える影響を見る ( 逆の因果関係はダメ ) 普通左のような散布図を書いてから解析する R では plot(y~x) で実行泥の含有率 (%) 図 1. 強熱減量と土壌中の泥の含有率の関係左の散布図だと有機物を多く含む泥の含有率が高い土壌ほど強熱減量が高くなるという因果関係を想定実験では実験者がコントロールできる要因を x 軸 ( 温度設定など ) 測定対象を y 軸 ( 成長率など ) におく

27 27 回帰の前提条件やはり母集団の正規分布を仮定しているので以下の条件を満たす必要あり正規性等分散性回帰からのばらつきが正規分布に従うこと個々のデータで回帰からの分散が等しいこと独立性個々のデータは互いに独立であること正規性等分散性等分散性 (% で示す指標など ) 上限下限にぶつかっているデータ逆正弦変換 Y = sin 1 y asin(sqrt(y)) ただし死亡率など整数 / 整数のデータは一般化線形モデル ( 次々回?) であてはめること

28 強熱減量 (%) モデルへの当てはめ地点 i における強熱減量の泥含有率に対する関係を式に表すと強熱減量 i = 切片 + 傾き泥の含有率 i + 誤差 i ( 一般的な式にすると :y i = β 0 +β 1 x i + ε i ) 回帰分析は回帰直線の切片 (β 0 ) と傾き (β 1 ) を誤差が最小になるように推定泥の含有率 (%)

29 29 回帰における誤差回帰直線からのデータのずれ ( 誤差 ) が最小になるように推定誤差ってどこ? y 軸方向のずれ 2 回帰直線との最短距離 3 x 軸方向のずれ正解は 1 どの誤差を最小化するかで回帰直線は異なる回帰は x に対する y の反応を見たい解析なので x 側は実験者が設定しているので誤差は生じない y 側には反応の誤差が含まれると想定

30 30 最小二乗法 ~ 誤差を最小化地点 i のデータにおける回帰直線からの誤差 ( 残差 ) の二乗は y i y i 残差観測値 i 回帰の期待値 i 2 = y i y i 2 = y i β 0 + β 1 x i 2 これを各点に対し計算し合計すると 2 残差合計 = y i y 2 i x i = y i β 0 + β 1 x i 2 分散分析の SS E ( 誤差平方和 ) と同じものこれを最小にする切片 β 0 と傾き β 1 を推定 ( 最小二乗法 )

31 31 R による推定 lm() 関数を用いる > model<- lm(kyounetu~mad,data2.1) > summary(model) # lm( 応答変数 ~ 説明変数 ) で表す # summary で結果表示 Call: lm(formula = kyounetu ~ mad, data = data2.1) # 推定したモデル式 Residuals: Min 1Q Median 3Q Max # 残差の情報 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** mad e-05 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: 1.85 on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 18 DF, p-value: 1.729e-05 # 係数表 # これが推定結果 # モデルの当てはまり # F 検定の結果など

32 32 係数表 (coefficient table) Coefficients: 切片 (β 0 ) 推定値推定値の標準誤差 t 値 P 値 (t 値に基づく ) Estimate Std. Error t value Pr(> t ) (Intercept) ** mad に対する傾き (β 1 ) mad e-05 *** P<0.01 の記号 P<0.001 の記号 --- Signif. codes: 0 *** ** 0.01 * この表からわかること強熱減量 i = 泥の含有率 i ± ± P=0.002 P<0.001 帰無仮説 : 係数の値は 0 であるに推定された

33 33 決定係数 r 2 この辺の値は ANOVA の部分で説明 Residual standard error: 1.85 on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 18 DF, p-value: 1.729e-05 r 2 = 回帰でどれくらいのばらつきが説明できたか (0~1 の値 ) r 2 = 回帰で説明できたばらつき y 全体の持つばらつき = SS Regression SS Y

34 34 回帰におけるばらつきの分割観測値のばらつき回帰で説明できるばらつき説明できないばらつき = 誤差 SS Y = SS Regression +SS Error n i=1 (y i y) 2 n i=1 ( y i y) 2 n i=1 (y i y i ) 2

35 35 回帰分散分析回帰の場合も同様に分散分析による検定を行う平方和 SS 自由度 df 平均平方 MS (=SS/df) F 回帰モデル SS R 1 MS R MS R 残差 SS E n-2 MS E MS E 全体 SS Y n-1 回帰の時の自由度は分子は 1, 分母は n-2 になる

36 36 分散分析表 (ANOVA Table) 回帰の結果の分散分析表平方和 SS 自由度 df 平均平方 MS (=SS/df) F mad Residuals P(F 1, )= R で下の式を入れれば計算されます 1-pf(33.55,1,18) よって帰無仮説は棄却され強熱減量は泥の比率によって説明されるという対立仮説を採用できる

37 37 R による検定 ( 分散分析 ) anova 関数を用いる > model<- lm(kyounetu~mad,data2.1) # lm( 応答変数 ~ 説明変数 ) で表す > #summary(model) # summary() で係数表を表示 > anova(model) # anova() で分散分析表を表示 Analysis of Variance Table 応答変数 Response: kyounetu 説明変数自由度平方和平均平方 F 値 P 値 (F 値に基づく ) Df Sum Sq Mean Sq F value Pr(>F) mad e-05 *** 残差 Residuals Signif. codes: 0 *** ** 0.01 * 強熱減量は泥の含有率によって異なった (F 1,18 =33.55, P<0.001)

38 38 回帰係数 or 相関係数 or 決定係数? 回帰係数 β 相関係数 r 決定係数 r 2 Y が X の変化に応じてどの程度変化するか [ ~ ] YとXが互いの変化に応じてどの程度変化するか [ 1~1] R では cor(x,y) Y のばら付きが X によってどの程度説明できたか [0~1] SS X = (x x) 2 ; SS Y = (y y) 2 ; SS XY = (x x)(y y) β = SS XY SS X r = SS XY SS X SSY r 2 = β2 SS X = SS 2 XY SS Y SS X SSY

39 強熱減量 (%) 回帰まとめ目的 : Y の X に対する直線的な関係の推定 (+ 分散分析による検定 ) 原理 : 誤差が最も小さくなる直線を当てはめる ( 推定 ) 回帰で説明できたばらつきと説明できない誤差を比較散布図を書いてみる plot(y~x) モデル式を当てはめる model<- lm(y~x) 係数表で回帰直線の推定結果 r 2 を見る summary(model) 泥の含有率 (%) 分散分析による検定結果を見る anova(model)

40 40 実は分散分析も回帰もほとんど同じ説明変数モデル式分散分析カテゴリカル変数 Y= 各カテゴリーの平均値 + 誤差回帰連続変数 Y= 切片 + 傾き説明変数 + 誤差検定 F= カテゴリー間誤差 F= カテゴリー内誤差回帰で説明される誤差説明されない誤差 y ij = β 0 + β i x ij + ε ij の形で記述できるモデル一般線形モデル (General Linear Model)

41 41 回帰分散分析の表現 plot 関数による作図回帰直線の追加 barplot 関数による作図エラーバーの追加分散分析表

42 y y とりあえず plot plot 関数は渡された変数の種類によって作図内容を変える a b c d X1: カテゴリカル変数 plot(y~x1) 箱ひげ図 X2: 連続変数 plot(y~x2) 散布図

43 43 散布図 plot のオプション設定 ( よく使うものの例 ) 引数内容例 main グラフタイトルを設定 main= 成長率 9 月 ylab,xlab 軸の名前を設定 xlab= 処理 ylim,xlim 軸の範囲を設定 ylim=c(0,1) log 軸を対数に log= x col 点の色を変更 col= red pch 点の種類を変更 pch= a cex プロットの点のサイズを変更 cex=2 las 軸の文字の方向を変更 las=2 R-tips のホームページなんかが参考になるかも

44 44 plot 例 y plot(y~x2) x2 plot(y~x2, main= 散布図, xlab= 連続変数 x, ylim=c(-3,3), col= blue, pch= a, cex=2, las=1) y a a a a a a a 散布図 a aa a a a a a a 連続変数 x a ただし日本語はパワポでグループ解除すると文字化けする Font family で設定可能??( 普段は英語で出力してパワポで修正するほうが楽かも )

45 45 col,pch の応用 col や pch は数字で指定できる col=gray(0.8) とかで黒 (0)~ 白 (1) も指定可能ベクトルでの指定もできる処理ごとに色や形を変えられる上段 (11-20); 下段 (1-10) trt<- rep(1:4,rep(5,4)) plot(y~x,col=trt)

46 kyounetu 練習問題沖と岸で色分けされた散布図 (Y 軸 :kyounetu X 軸 : mad) を Y 軸 5-25 の範囲で作図してみよう (data2.1) pch は指定なしもしくは pch=16 あたりが見やすい cex=2 くらいが見やすい oki kishi といったカテゴリー変数は引数 col の中ではアルファベット順に 1 2 といった数字で認識される岸沖 oki kishi 2 1 赤黒 mad

47 kyounetu 回帰線を引く lm() で推定された回帰係数を使って回帰直線を引く強熱減量 i = 泥の含有率 i > model<- lm(kyounetu~mad,data2.1) > summary(model) > > > abline(model) > curve( *x, col= red,add=t) mad abline(): 指定された切片と傾きの直線を引く lmで推定したモデルを指定すると回帰線を引いてくれる curve():xの関数であれば曲線でも引ける add=tで既存の図に追加

48 barplot() による棒グラフの描画放り込んだらエラーバー付きで書いてくれるわけではないエクセルで書く場合と同様の手順を踏む手順カテゴリーごとの平均を計算するカテゴリーごとの SD を計算するカテゴリーごとの n を集計するカテゴリーごとの SE を計算する平均を元に棒グラフを書く SE をもとにエラーバーを追加する Cnt N P NP

49 49 tapply 関数の利用 trt_id trt growth 1 cnt cnt cnt cnt cnt N N N N N P P P P P NP NP NP NP NP 処理ごとに平均と SE を計算したい! カテゴリーごとに同じ計算をあてはめたい場合に有効な関数類似した関数で行列を行方向もしくは列方向に関数をあてはめて集計する apply 関数もある tapply(data2.2$growth,data2.2$trt,mean) # growth を trt ごとに mean せよの意 cnt N NP P これを使ってカテゴリごとの SD[ 関数 sd()] および n[ 関数 length()] を集計し SE も計算できる

50 barplot() 平均値を使って棒グラフを書いてみる growth_mean<- tapply(data2.2$growth,data2.2$trt,mean) barplot(growth_mean,ylim=c(0,1)) 根本的な対処方法カテゴリーの順序を定義し直して再度集計 data2.2$trt<- factor(data2.2$trt, levels=c("cnt","n","p","np")) cnt N NP P NP と P 入れ替えたい! その場しのぎの対処方法 trt の名前を付け直して再集計 growth_mean2<- tapply(data2.2$growth, data2.2$trt2,mean) growth_mean の順番を入れ替えて描画 barplot(growth_mean[c(1,2,4,3)]) パワポで修正する作業量多くないならこれでも Cnt=1C,N=2N,P=3P,NP=4NP など振り直したもの

51 arrows() でエラーバーを追加する arrows() は矢印を書く関数始点と終点の座標を指定する必要 growth_se<-tapply(data2.2$growth,data2.2$trt,sd)/ sqrt(tapply(data2.2$growth,data2.2$trt,length)) arrows(x0= *c(1:4), y0=growth_mean, y1=growth_mean+growth_se, angle=90) cnt N P NP # x0=x1 の時 x1 は省略可 #angle は矢印の開きを調節 #angle=45 だとこんなの X 座標の *c(1:4) って? barplot のデフォルトで棒の間隔 0.2 棒の幅 1.0 に設定されているなので棒の中心の x 座標は 0.7 から 1.2 刻みで c(0.7, 1.9, 3.1, 4.3, ) になっている

52 論文中での表現棒グラフエラーバーを書いた場合それが SD( 標準偏差 ) なのか SE( 標準誤差 ) なのかを図の脚注に明記する必要がある有意差を示す * やアルファベットをふった場合も説明が必要 c b 図 1. 9 月の各処理における植物プランクトンの一日あたりの成長率 a a 平均 +SE を示す平均および標準誤差を示す棒の高さは平均値エラーバーは標準誤差異なるアルファベットの処理間では有意差が見られることを示す (P<0.05) cnt N P NP

53 53 論文中での表現分散分析表悪い例表 1. 9 月の ANOVA 解析の結果 Df Sum Sq Mean Sq F value Pr(>F) trt e-13 *** Residuals Signif. codes: 0 *** ** 0.01 * 改善例表 1. 9 月の植物プランクトンの成長率を目的変数とした分散分析表自由度平方和平均平方 F P 処理 <0.001 残差

54 54 論文中での表現方法以下にいくつかの例を列挙 ~ を目的変数 [ 応答変数従属変数 ] ~ を説明変数 [ 独立変数 ] として ( 一元配置 ) 分散分析 [ 単回帰分析 ] を行った分散分析で有意差が見られた場合各処理間での差に関して TukeyHSD 法による多重比較を行った ~ とした分散分析を行った後各処理間での差に関して t 検定を行った多重比較の際の P 値は Bonferroni 法による補正を行ったすべての統計解析はR3.0.2 (R Core Team 2013) によって行った citation() で確認できます

55 55 論文中での表現結果以下にいくつかの例を列挙泥含有率が高い地点ほど強熱減量も高い傾向が見られた ( 強熱減量 = 泥含有率, r 2 = 0.65, F 1,18 = 33.55, P < 0.001, 図 2) ~が多くなるにつれ~が少なくなる傾向が見られた ( 表 1, 図 2) # 図表をみれば統計量や推定値 P 値がわかる場合 ~は処理によって異なり ( 表 1) 処理 Aは他の処理の2 倍近く高い値を示した ( 図 3) 砂の含有率と泥の含有率の間には負の相関が見られた (r=- 078) # ただの因果のない関係性の記述なら相関でよいかも ( 方法でもそのように書く ) 図 1 は ~ と ~ の関係であるより ~ と ~ の間には ~ な関係が見られた ( 図 1) が好ましい ( 前者は図の脚注に書くべき内容 )

56 56 次回予告 R 編 : データの型連続変数とカテゴリカル変数パッケージのインストール統計編 : 一般線形モデル二元配置分散分析交互作用重回帰分析共分散分析表現編 : グラフ表現いろいろ (?)

> usdata01 と打ち込んでエンターキーを押すと V1 V2 V : : : : のように表示され読み込まれていることがわかるここで V1, V2, V3 は R が列のデータに自動的につけた変数名である ( variable

> usdata01 と打ち込んでエンターキーを押すと V1 V2 V : : : : のように表示され読み込まれていることがわかるここで V1, V2, V3 は R が列のデータに自動的につけた変数名である ( variable R による回帰分析 ( 最小二乗法 ) この資料では 1. データを読み込む 2. 最小二乗法によってパラメーターを推定する 3. データをプロットし回帰直線を書き込む 4. いろいろなデータの読み込み方について簡単に説明する 1. データを読み込む以下では read.table( ) 関数を使ってテキストファイル ( 拡張子が.txt のファイル ) のデータの読み込み方を説明する 1.1

第２回 回帰と分散分析

第２回回帰と分散分析