スライド タイトルなし

Size: px
Start display at page:

Download "スライド タイトルなし"

Transcription

1 2008 年度兵庫県立大学公開講座アンケート調査とデータ解析 JMP による多変量解析入門 兵庫県立大学 大学院応用情報科学研究科 教授有馬昌宏 1

2 多変量解析とは? 1 複数の対象 ( 企業 自治体 人間 製品など ) に対して ケース (case) オブザベーション(observation) サンプル(sample) 2それらの持つ特性 ( 属性 ) を測定 観測 調査 記録することによって収集された 変量 (variate) 変数(variable) 33つ以上の属性に関するデータの集まり ( データセット データベース データウェアハウス ) を対象に 多変量 (multivariate) 4 仮説に基づく検証や探索的にデータの持つ特徴を捉えていこうとするプロセスを通じて 仮説 (hypothesis) 探索的 (exploratory) 5 問題解決のために有益な情報を引き出そうとする活動を支援するための 6 統計的手法群 重回帰分析判別分析主成分分析生準相関分析クラスター分析 数量化理論第 Ⅰ 類数量化理論第 Ⅱ 類数量化理論第 3 類 因子分析潜在構造分析分散分析共分散分析ロジスティック回帰など 2

3 情報とは 自然科学分野での最広義の定義物質 = エネルギーの時間的 空間的な そして定性的 定量的な パターン 人間は 自ら情報を生成するとともに 五感を通じて外界からの情報を認識する N.Wiener の情報概念 我々が外界に適用しようと行動し またその調整行動の結果を外界から感知する際に 我々が外界と交換するものの内容 Wiener はCyberneticsの理論の創始者 C.E.Shannon の情報概念不確実性の量を減らす働きをするもの不確実性 : 今 あるシステムにおいて 起こり得る状態として Z 1,Z 2,,Z n が考えられる が このうちのどれが実際に起こるかが完全には分からないとき このシステムは 一定量の不確実性を持っている という Shannonは通信理論の確立者 A.M.McDonough による情報概念 データ : 特定の状況において それらの持つ価値が評価されていないメッセージ情報 : 特定の状況における評価されたデータに対する表示知識 : 情報の概念のより一般的な表現で 知っていることによって役立つ事柄の全般的貯蔵あるいは蓄積 J.Marschak による情報概念不確実性下の意思決定に直面している人間にとって最大期待効用を増大させるもの 3

4 多変量解析と多変数解析 多変量解析 ( multivariate analysis ) 多変量データ解析, 多次元データ解析 などの呼称 統計学, 確率論, 線形代数などと関連する分野 データ解析では変数と変量の区別は曖昧 複数の変数に関する測定データ ( 多変量データ行列または変動行列 ) を分析 目的は次元縮小 予測 分類 判別など 多変数解析 ( analysis of several variables ) 関数解析 ( 複素関数論など ) の分野の呼称 ( 出典 : 鈴木督久氏ウェブサイト 4

5 データの収集 能動的検証的高価少量 1. 実験データ 2. 調査データ 3. 実績データ受動的探索的安価大量 実験データ : 農業試験, 新薬開発 ( 実験計画 小標本 ) 調査データ : 世論調査, 社会調査 ( 標本計画 大標本 ) 実績データ : 景気指標, レジ記録 ( 実績蓄積 大規模 ) ( 出典 : 鈴木督久氏ウェブサイト 5

6 データのタイプ 量的変数 ( 定量データ ) quantitative 連続変数 ( 実数 )continuous 離散変数 ( 整数 )discrete 質的変数 ( 定性データ ) qualitative 分類変数 classification カテゴリカルデータcategorical) 二値変数 binary, dichotomous ダミー変数 ( 論理値 )0-1 型変数 ( 出典 : 鈴木督久氏ウェブサイト 数字で表わされるデータが定量的データか? 6

7 データのタイプ 比率尺度 ( 比例 ) ratio C 絶対温度 身長 体重 金額 ( 量的 計量 ) 属性の強さと変数値が比例関係.0 は属性量が 無 を意味. 絶対原点をもつ. 単位変換 ( 定数の乗算 )y = ax が許される 間隔尺度 ( 距離 ) interval C 摂氏, 華氏 知能 暦年 ( 量的 計量 ) 属性の強さの差 = 変数値差. 原点に 無 の意味なし. 単位と原点の変換 ( 一次変換 y = ax +b) が許される ( 華氏 =1.8 摂氏 +32) 順序尺度 ( 序数 ) ordinal O 等級 震度 鉱物の硬度 ( 量的 非計量 ) 単調関係. 任意の単調変換が許される ( 大小関係は保存される ) 名義尺度 ( 分類 ) nominal N 都道府県 背番号 銘柄 性別 ( 質的 非計量 ) 対象の質的な差異を示す ( 出典 : 鈴木督久氏ウェブサイト 7

8 JMP とは? 1989 年に SAS 社上席副社長の J.P.Sall によって開発された統計解析パッケージ GUI(Graphical User Interface) を最大限に活用し J.W.Tukey の提唱した探索的データ解析 (EDA:Exploratory Data Analysis) をサポートできるソフト Excel による多変量解析も可能であるが 9,800 円のソフト ( 廉価版の JMP IN 5) でここまで出来るということを見てしまうと 使わざるを得ない 機能的には SAS(Statistical Analysis System) に及ばないが かなりの基本的手法はカバーしており 操作性では SAS を凌駕

9 JMP がジャンプ? 優れたソフトウェア JMP + U = JUMP あなた (You) JMP が優れたソフトウェアであっても 分析する者がいなければ 単にそこには CD-ROM が置いてあるだけ 優れたソフトウェアであるJMPに あなた(you=U) が加わってJMPと対話しながらデータを解析したとき そのときはじめて JMPとあなたが一緒になってデータからJumpできる という思いを込めて命名されたとされる 当初の名前は John s Macintosh Product 9

10 JMP でのデータ解析 使用するデータ ( 圓川隆夫 多変量のデータ解析 朝倉書店 1988 年より ) バッチ番号 y: 収率 (%) x1: 圧力 ( 気圧 ) x2: 温度 ( ) 仮説 : ある化学製品の収率は反応過程の圧力と温度で決まるようだ 10

11 エクセルデータの読み込みと尺度の変更 ここをクリックして列情報で各種の設定 11

12 一変量の分布 12

13 一変量の分布のオプション (1) スケールを統一しておくと 分布の比較が容易になる 列の積み重ねで出力の並べ方を変更できる スクリプトをスクリプトウィンドウに保存し スクリプトに名前をつけて保存しておくと 実施した分析結果を後で再実行させることができる 13

14 一変量の分布のオプション (2) 14

15 箱ひげ図の見方 外れ値の箱ひげ図 分位点の 箱ひげ図 標本平均と 95% 信頼区間 15

16 ヒストグラムの書式設定 ここをダブルクリック 軸の指定ダイアログボックス 16

17 モーメントの解釈 平均のひし形 分散 ( 不偏分散 ): 偏差平方和をN-1で割った値 標準偏差はこの平方根 歪度 :0で左右対称 正で右に 負で左に裾が伸びている 尖度 :0で正規分布型 正で尖り 負で平坦になっている 変動係数 : 標準偏差を平均で割り 100を掛けて算出 17

18 変数間の関係を調べる 複数のバーを強調表示するには Shft キーを押しながら矢印ツールでクリック 強調を解除するには Ctrl キーを押しながら矢印ツールでクリック 18

19 スクリプトの保存 19

20 多変量の相関 計算されるのは Pearson の積率相関 散布図行列 図中で手のひらツールを動かしてみると? 20

21 多変量の相関のオプション 用語や操作が理解できなければ ヘルプツールを利用する 偏相関係数 :2 変数の間の相関を 他のすべての変数で調整して算出したもの 21

22 外れ値分析と投げ縄ツール 投げ縄ツールで外れ値をドラッグして囲い込み 点を強調表示できる 複数の範囲を強調表示する場合は Shift キーを押しながら投げ縄ツールを使う 強調表示を解除するには 点のない所を投げ縄ツールで囲う ラベルにする列は データテーブルウィンドウで 列のラベルあり / ラベルなしで設定 22

23 層別散布図を作成したい場合は By 変数を指定することにより 層別散布図を作成できる 23

24 2 変量の関係 24

25 指示に従って JMP による多変量解析の実際 - 市町村データから地域格差を知る - ヒストグラム作成 散布図作成 自治体規模別の指標平均値計算 回帰分析 平均値の差の検定 比率の差の検定 などを実行してみて下さい 25

26 回帰分析散布図に直線 ( の式 ) をあてはめる ) 26 26

27 直線の式 ( 回帰直線, 回帰式 ) y = b 0 + b 1 x + e 従属変数 誤差変数 独立変数 切片 定数項 母数 ( 偏 ) 回帰係数 ( 出典 : 鈴木督久氏ウェブサイト ttp:// スライド17まで ) 27 27

28 体重 どのように回帰式を選ぶか 直線 Y=-46.4 :y = b b 1 x 身長 直線は b 0 と b 1 で決まる 28 28

29 残差平方和の最小化 最小 2 乗法 符号の問題を解決する 2 乗すると, 大きい残差は, より大きく強調されるので, 大きい残差を排除しようとする 代数的 ( 数学的 ) に扱いやすい 29 29

30 weight height b1 = S b1 = b0 = y mean var = S xy xx = b x 1 s s xy xx, b = y b x = = = SSCP 体重 身長 体重 身長 COV 体重 身長 体重 身長 予測値 = 切片 * 身長 残差 = 体重 ( 実測値 ) ー予測値 30 30

31 単回帰分析 推定された回帰式 寄与率または決定係数 = 回帰による変動 / 全変動 確率誤差の標準偏差の推定値 = 誤差の平均平方の平方根 回帰式の優位性の検定 F 検定と t 検定 t 値は推定値の標準誤差に対する比率 p 値が 0.05 および 0.01 より小さいかどうか? 31

32 重回帰分析の手順 1 データ入力 2 変数の選択と散布図行列の表示 分析 多変量 多変量の相関 (Y, 列に相関関係を見たい変数名を割り当てる ) (By に変数を割り当てるとその変数で層別の散布図 行列が作成される ) 3 散布図を動かしてみる ( 外れ値の有無や相関関係の確認 ) ツール 手のひらツール 32

33 4 変数の選択と重回帰分析の実行 分析 モデルのあてはめ 1) 被説明変数 ( 従属変数 ) を 役割変数の選択 の Y に割り 当てる 2) 説明変数 ( 独立変数 ) を モデル効果の構成 に追加で 指定する 3) 手法を 標準最小 2 乗 に設定して モデルの実行 を クリックする 5 結果の解釈 1) 自由度調整 R2 乗 2) 分散分析の p 値 ( モデルの F 検定 ) 3) パラメータ推定値の p 値の列 ( 偏回帰係数の t 検定 ) 33

34 6 残差の分析 1) 応答 Y のプルダウンメニューの 列の保存 スチュー デント化された残差を選択 2) データテーブルにスチューデント化された残差が記録され るので このスチューデント化された残差と各説明変数と の間の無相関を散布図から確認する 最小 2 乗法によるモデルのあてはめの前提 1) 誤差項が各ケースで独立 2) 誤差項は平均が 0 で分散は一定 3) 誤差項は正規分布に従う 34

35 95% 信頼区間と平均線の表示 図示した 95% 信頼区間の曲線が平均線と交わっているかどうかで 5% 有意水準での回帰式の有意性の検定を視覚的に行うことができる 35

36 残差分析 残差分析 ( 残差 = 観測値 - 予測値 ) 残差をプロットすることにより 1 外れ値や異常値のチェックおよびこれによる隠された要因の検討 2 点の並び方のクセやトレンドから誤差の等分散性や系列相関 さらに非線形性のチェック 1) 残差のヒストグラムから正規分布にしたがっているといえるか? 2) 残差の + と - の符号の数は同数か? 3) 残差の中央値はゼロに近いか? 4) 残差と目的変数および説明変数との間の散布図から何らかの関係が見つからないか? を検討する ダービン ワトソン比 : 時系列データの自己相関のチェックに 2 を中心に 0 から 4 までの値を取る 36

37 回転プロット 37

38 3 次元表示で視覚的に確認 手のひらツールで回転させる Shift Alt の各キーを押しながら Ctrl 38

39 モデルのあてはめ 目的変数 従属変数 被説明変数 決定変数 独立変数 説明変数 39

40 あてはめ結果の解釈 1 自由度調整 R2 乗 ( 自由度調整済み決定係数 ) 2 分散分析表によるF 検定 ( 帰無仮説 : 回帰式は意味をもたない ( 切片を除く全ての回帰パラメータが0である )) 3 偏回帰係数のt 検定 ( 帰無仮説 : 真のパラメータはゼロである ) 4 偏回帰係数の推定値の符号 40

41 残差分析 効果の検定は 連続量の説明変数の場合には t 検定と同じ 残差分析 製造条件をチェック 他の要因はないか? 41

42 残差と変数との関係 スチューデント化された残差 :i 番目の残差について i 番目の残差を除いた他の残りの残差から計算された残差の標準偏差を用いて基準化した残差 外的にスチューデント化された残差とも言う 単に全残差の標準偏差で基準化された残差を標準化残差あるいは内的にスチューデント化された残差と言う 42

43 残差と各説明変数との間の関係 スチューデント化された残差と説明変数との間に何の関係も見られないことが望ましい 43

44 てこ比プロット 個々の偏回帰係数の有意性に関して 5% 有意水準で視覚的に判定できる 44

45 標準偏回帰係数 目的変数と説明変数のそれぞれのデータを標準化してデータテーブルに保存 この標準化されたデータを用いて重回帰分析を行うと 得られる偏回帰係数は ある説明変数が 1 標準偏差分だけ変化したとき 目的変数は何標準偏差分だけ変化するかを示すことになり 説明変数のスケール値やバラツキの大小には依存しないようにして 各説明変数の目的変数への影響度の比較を行うことができるようになる このようにして得られる偏回帰係数を標準偏回帰係数と呼ぶ 45

46 標準偏回帰係数の推定 46

47 重回帰分析演習 (1) 酸度の変数を追加して収率の変動を説明するモデルを構築せよ バッチ番号 y: 収率 (%) x1: 圧力 ( 気圧 ) x2: 温度 ( ) x3: 酸度 (ph)

48 相関分析 偏相関係数 他の変数の影響を取り除いた純粋な目的変数と 1 つの説明変数との間の相関の程度を表す尺度 目的変数と説明変数を残りの説明変数で回帰式にあてはめ それぞれの残差から求められる相関係数のこと 48

49 結果の解釈 1 自由度調整 R2 乗 ( 自由度調整済み決定係数 ) 2 分散分析表によるF 検定 3 偏回帰係数のt 検定 4 偏回帰係数の推定値の符号 49

50 重相関分析演習 (2) 粘度が追加された以下のデータを用いて収率を説明するモデルを作成せよ バッチ番号 y: 収率 (%) x1: 圧力 ( 気圧 ) x2: 温度 ( ) x3: 酸度 (p H) x4: 粘度

51 相関分析と相関 偏相関係数 51

52 結果の解釈 偏回帰係数の t 検定結果と偏回帰係数の推定値はどのように変化しただろうか? 52

53 偽相関 粘度を目的変数に 圧力と温度と酸度を説明変数に重回帰分析を行ってみよ 同じ説明変数を用いた 収率を目的変数とした重回帰分析の結果と比較してみよ 粘度は収率を説明する原因系の変数ではなく 収率と同様に圧力と温度と酸度で説明される結果系の変数ではないか 収率と粘度との間の高い単相関は 互いに共通した説明要因に起因する偽相関である可能性が強いようだ 53

54 説明変数の選択 Principle of Parsimony( ケチの原則 ) 目的変数の予測という立場からは 説明変数の数が増えるほど寄与率は高くなるが あまり寄与率は下げないで なるべく少数の説明変数で 簡潔にモデルを記述したいという考え方 有効な変数と不要な変数を選択して 最適な回帰式を求めるには? 変数選択の方法 1 総当り法 2ステップワイズ法 ( 逐次変数選択法 ) 1) 変数増加法 2) 変数減少法 3) 変数増減法 4) 変数減増法 3 対話型変数選択法 54

55 ステップワイズ法による変数選択 55

56 説明変数の選択方法の選択 方向で選択方法を選択 SSE: 誤差平方和 DFE: 誤差の自由度 MSE: 平均平方誤差 Cp:Mallow の Cp 基準 AIC: 赤池の情報量基準 AIC=nln(SSE/n) +2p AIC が最小であるモデルが最良のモデル 経験的に F 値が 2 以上であれば有効な変数 2 未満であれば不要な変数とされている 56

57 ステップワイズ法の結果 57

58 多重共線性 説明変数の中に互いに非常に相関の高い変数が含まれているときに起こる現象 発生する問題 1 偏回帰係数を求めるとき 大きな計算誤差を伴うか あるいは計算不能になってしまう 2 求められた偏回帰係数が 1つのオブザベーションの追加や ちょっとした誤差によって 大きく変化してしまう 3 求められた偏回帰係数の符号が単相関係数の符号と合わない 4 寄与率 ( 決定係数 ) は高いのに 個々の偏回帰係数は統計的に有意にならない 対策 1 互いに関係をもった説明変数の一部を除去する 2 多重共線性を弱めるようなデータを追加する 58

59 多重共線性の例 以下のデータを用いて重回帰分析を行ってみなさい ( 内田他 すぐわかる JMP による多変量解析 東京図書 2002 年より ) y x1 x2 x

60 質的変数を含んだ重回帰分析 これまでのデータには A と B の異なる原産地からの原料が含まれていることがわかった 原料の情報を新たな説明変数に加えて重回帰分析を試みよ バッチ番号 y: 収率 (%) x1: 圧力 ( 気圧 ) x2: 温度 ( ) x3: 酸度 (p H) x5: 原料 A B B A B A B B A B 60

61 結果の解釈 Marginal 法 推定された回帰式は? 61

62 0 ー 1 型ダミー変数の導入 62

63 結果の違いは? Partial 法 推定された回帰式は? 63

64 ダミー変数の作り方 partial 法 marginal 法 x1 x2 x3 x1 x2 x3 A B O AB 順序尺度の場合のJMP x1 x2 x

65 多項式回帰モデルと線形回帰モデル VTR 生産台数 ( 1000 台 ) 左に示すのは 1970 年から 1984 年までの国内 VTR 生産台数のデータである この生産台数の推移をうまく当てはめるモデルを推定しなさい ヒント 1 年の取り方に工夫されたい 2 グラフでプロットしてみて データの特徴を読み取られたい 32 次と 3 次の項を考えなさい 65

66 データ分析の例 店舗名 乗降客数 店の広さ 駐車台数 売上高 小田原 秦野 伊勢原 本厚木 海老名 藤沢 大和 相模大野 町田 新百合ヶ丘 成城学園前 経堂 下北沢 梅ヶ丘 代々木上原 出所 : Lotus1-2-3 活用多変量解析 ( 共立出版 ) 66

67 参考文献 内野治 松木秀明 上野真由美 すぐわかるJMPによる統計解析 東京図書 2002 年 内野治 松木秀明 上野真由美 すぐわかるJMPによる多変量解析 東京図書 2002 年 田久浩志 林俊克 小島隆矢 JMPによる統計解析入門 2002 年 圓川隆夫 多変量のデータ解析 朝倉書店 1988 JMP のヘルプファイルや統計関係のウェブサイトも参考になります ちなみに JMP をキーワードに検索エンジンで検索してみて下さい 67

68 多項式回帰 (1) 直線 ( 説明変数 x の 1 次式 ) y=a x + b 曲線 1( 説明変数の 2 次式 ) y = a x 2 + b x + c 曲線 2( 説明変数の 3 次式 ) y = a x 3 + b x 2 + c x + d 68

69 多項式回帰 (2) 列を追加して 計算式で説明変数 ( 西暦年 ) の 2 乗と 3 乗の列を作成する 69

70 多項式回帰 (3) 70

71 多項式回帰 (4) 71

72 多項式回帰 (5) 推定された多項式回帰モデルは y = x x 2 72

73 多項式回帰 (6) 推定された多項回帰式 : y = x x x 3 73

74 予測値のチェック 74

75 モデルは予測に使えるか? 1 マイナスの生産台数 23 次のモデル 1973 年から 76 年まで予測値が減少 年頃 ( 少量生産 ) と 1980 年頃 ( 大量生産 ) で等分散性を仮定してよいか? 75

76 VTR 生産台数の対数変換 VTR 生産台数を対数変換してみると 線形の関係が見られる 76

77 変数変換による線形回帰モデル 推定された回帰モデル : ln y = x このモデルで生産台数を予測するには? 77

78 予測値の逆変換 78

79 対数変換モデルによる予測 79

80 JMP での変数変換による重回帰分析 80

81 JMP での対数変換モデルの推定結果 ここに示された決定係数は 変換後のデータに対するもの 81

82 数量化理論第 Ⅰ 類 ダミー変数のみを用いた重回帰分析と同等 1987 年度プロ野球観客動員数と球団属性一覧観客動員数 リーグ 本拠地 親会社業種 前年度成績 読売 304 セ 首都圏 新聞 A 中日 201 セ その他 新聞 A 広島 112 セ その他 市 A ヤクルト 222 セ 首都圏 メーカー B 大洋 154 セ 首都圏 市 B 阪神 213 セ 関西 電鉄 C 西武 181 パ 首都圏 電鉄 A 阪急 123 パ 関西 電鉄 A 日本ハム 124 パ 首都圏 メーカー B 南海 88 パ 関西 電鉄 B ロッテ 78 パ 首都圏 メーカー C 近鉄 101 パ 関西 電鉄 C 82

83 モデルの仮説 セントラルリーグ パシフィックリーグ 新聞社メーカー電鉄市 観客動員数 A クラス B クラス C クラス 首都圏 関西 その他 プラスの効果 マイナスの効果 83

84 モデルのあてはめ 84

85 数量化理論第 Ⅰ 類の結果 (1) カテゴリスコア リーグ [ パ ] の係数 =-リーグ [ セ ] の係数 = 本拠地 [ 首都圏 ] の係数 =- 本拠地 [ 関西 ] の係数 - 本拠地 [ その他 ] の係数 = = アイテムのレンジ = アイテムのカテゴリスコアの 最大値 - カテゴリスコアの最小値 アイテムの有意性の判定 85

86 数量化理論第 Ⅰ 類の結果 (2) アイテムカテゴリー頻度カテゴリースコアレンジ リーグ セ パ 本拠地 首都圏 関西 その他 親会社業種 新聞 メーカー 市 電鉄 前年度成績 A B C

87 残差の分析 残差の分析からどのようなことが言えるであろうか? 87

88 数量化理論第 Ⅰ 類の応用 2003 年度のデータを使用してプロ野球の観客動員数の予測を行ってみなさい 兵庫県市町データを用いて 数量化理論第 Ⅰ 類を適用した分析を考えてみなさい 88

89 判別関数分析カード使用者の使用状態に関するプロフィールデータ サンプル番号 カード使用状態 家族構成数 年齢 年収 ( 出典 : 圓川隆夫著 多変量のデータ解析 朝倉書店 1988) 89

90 一変量の分布 ( 層別ヒストグラム ) カード使用状況とその他の変数との間には どのような関係が存在するか? 90

91 層別散布図 (1) 91

92 層別散布図 (2) 多変量の相関 で散布図行列を表示させ 2 つの変数を用いてカードの使用状況が判別できそうかどうかを検討する 92

93 回転プロット 93

94 判別関数分析 (1) 外的基準 ( 説明したい変数 ) を 0-1 型の変数に変換する 94

95 判別関数分析 (2) JMP 4J には判別関数分析が用意されていないので 外的基準を 0-1 型変数に変換した上で この外的基準を目的変数とする重回帰分析を行うと 判別関数分析が行える 0-1 型に変換された外的基準 JMP 5J では 分析 多変量 判別分析 を選択 95

96 判別関数分析 (3) 96

97 判別関数分析 (4) 97

98 判別関数分析 (5) 0-1 型変数の総平均を越えているかどうかで判別 0.5 以上であれば正常 ( ) 0.5 未満であれば異常 ( ) 98

99 判別関数分析 (6) 99

100 判別関数分析 (7) マハラノビスの汎距離による判別式を得るには 外的基準 y の値として Ⅰ 群に n 2 /(n 1 + n 2 ) Ⅱ 群に n 1 /(n 1 +n 2 ) を与える こうすれば 外的基準の値の総平均が 0 となり 予測値の正負で判別が可能になる また 重回帰分析の変数選択や偏回帰係数の有意性の検討が判別関数分析にも応用できる 100

101 判別関数分析 (8) z = x x 2 と なる直線 ( 線形判別関数 ) Ⅰ 群 ( 正常 ) に判別 Ⅱ 群 ( 異常 ) に判別 101

102 判別関数分析 (9) MANOVA( 多変量分散分析モデル ) を指定 説明変数を指定 外的基準を指定 102

103 判別関数分析 (10) 判別結果をデータテーブルに保存する 103

104 判別関数分析 (11) 各群の重心からオブザベーションまでのマハラノビスの距離 オブザベーションが各群に含まれる確率 判別結果 104

105 判別関数分析 (12) 説明変数として 家族構成員数と年齢に加えて 年収も入れて分析を行ってみよ 年収は判別に寄与していない! 105

106 数量化理論第 Ⅱ 類 (1) ダミー変数のみを用いた判別関数分析と同等 リーグを外的基準にして リーグの違いを分析してみよ 1987 年度プロ野球観客動員数と球団属性一覧 観客動員数 リーグ 本拠地 親会社業種 前年度成績 読売 304 セ 首都圏 新聞 A 中日 201 セ その他 新聞 A 広島 112 セ その他 市 A ヤクルト 222 セ 首都圏 メーカー B 大洋 154 セ 首都圏 市 B 阪神 213 セ 関西 電鉄 C 西武 181 パ 首都圏 電鉄 A 阪急 123 パ 関西 電鉄 A 日本ハム 124 パ 首都圏 メーカー B 南海 88 パ 関西 電鉄 B ロッテ 78 パ 首都圏 メーカー C 近鉄 101 パ 関西 電鉄 C 106

107 数量化理論第 Ⅱ 類 (2) リーグを 0 ー 1 型変数または 0.5 と -0.5 の値をとる変数に変換 107

108 数量化理論第 Ⅱ 類 (3) 分析結果を解釈してみると? R *2 =1-(S E /(n-p-1))/(s T /(n-1)) 108

109 数量化理論第 Ⅱ 類 (3) 109

110 主成分分析 (1) 多数の変数データから 変数間の内部関連に基づく少数の主成分と呼ばれる合成変数を構成する分析法 学生番号 国語 社会 数学 理科 音楽 美術 保健体育 技術家庭 英語

111 主成分分析 (2) 111

112 主成分分析 (3) x 1 x 2 x p の p 個の変数から新しい変数 z 1 z 2 z m を作成することを考える z 1 =a 11 x 1 +a 12 x 2 + +a 1p x p z 2 =a 21 x 1 +a 22 x 2 + +a 2p x p : : : : : z m =a m1 x 1 +a m2 x 2 + +a mp x p ここで z 1 から z m へと順に x 1 から x p までの情報が最大限に集約されるように係数 a ij を決めたい もとの変数の分散共分散行列の固有値と固有ベクトルを計算することに帰着される 112

113 主成分分析 (4) 通常は相関係数行列からを選択 分散共分散行列からを選択すると変数のスケールのとり方に依存して分散共分散行列の値が変化する 113

114 主成分分析 (5) 第 1から第 9までの主成分固有値の総和 =p ( 分散共分散行列からの場合は各変数の分散の総和 ) 第 k 主成分の寄与率 = 第 k 主成分の固有値 /p どこまでの主成分を考えるかの基準 1 累積寄与率 2 寄与率の低下の仕方 3 相関行列からの場合に固有値が 1 より大 114

115 主成分分析 (6) 主成分分析の結果 ( 各主成分の重み係数 = 主成分負荷量 = 固有ベクトル ) を保存 1 行ずれている! 115

116 主成分分析 (7) 主成分の解釈 ( 主成分の意味の検討 ) 各主成分の散布図行列から各主成分のもつ意味を検討する 116

117 主成分分析 (8) 117

118 主成分分析 (9) 第 1 主成分 綜合点 第 2 主成分第 3 主成分で特殊技能系文科系理科系が分離できる 主成分スコアから各オブザベーションの特徴を知る 118

スライド 1

スライド 1 経営系データ解析 回帰分析 散布図に直線を当てはめる 回帰直線の式 y = b + b x +... + b x + i 0 1 1i n ni e i 従属変数または被説明変数目的変数 定数項 ( 偏 ) 回帰係数 独立変数 または 説明変数 誤差変数誤差項 参考 URL: 回帰分析の基礎理論 : http://www.sci.kagoshima-u.ac.jp/~itls/japanese/chapter5/index.html

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

Microsoft Word - mstattext02.docx

Microsoft Word - mstattext02.docx 章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2 2 群の関係を把握する方法 ( 相関分析 単回帰分析 ) 2018 年 10 月 2, 4 日データサイエンス研究所伊藤嘉朗 本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2 相関分析 ( 散布図 ) セールスマンの訪問回数と売上高 訪問回数 売上高 38 523 25 384 73 758 82 813 43 492 66 678 38 495 29 418 71

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt 主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

因子分析

因子分析 因子分析 心理データ解析演習 M1 枡田恵 2013.6.5. 1 因子分析とは 因子分析とは ある観測された変数 ( 質問項目への回答など ) が どのような潜在的な変数 ( 観測されない 仮定された変数 ) から影響を受けているかを探る手法 多変量解析の手法の一つ 複数の変数の関係性をもとにした構造を探る際によく用いられる 2 因子分析とは 探索的因子分析 - 多くの観測変数間に見られる複雑な相関関係が

More information

Microsoft PowerPoint - データ解析演習 0520 廣橋

Microsoft PowerPoint - データ解析演習 0520 廣橋 JMP の使い方 京都大学教育学研究科 M1 廣橋幹也 JMP とは SAS Institute 社より発売されているビジュアル探索型データ分析ソフトウェア 解析結果は全てビジュアルで表現される JMP の特徴 データの編集機能が素晴らしい 直観的に図をいじれる 余計な機能が絞ってある 高度な分析手法も取り入れられている データの読み込み方 ファイル をクリックします 開く をクリックしてファイルを選びます

More information

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による R で学ぶ 単回帰分析と重回帰分析 M2 新屋裕太 2013/05/29 発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 回帰分析とは?

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

スライド タイトルなし

スライド タイトルなし 回帰分析 怪奇な現象を回帰分析で数学的に説明しよう! 回帰分析編 24 相関図 データ X に対応してデータ Y が決まるような (Xi,Yi) のデータの組を考えます これを X-Y 座標にプロットすると 次のような相関図ができます 正の相関相関がない負の相関 相関係数 :X と Y の関係の強さを示す (-1 相関係数 1) プロットの傾きではなく 線上への密集の度合いで強さが決まる 回帰分析

More information

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく

More information

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

重回帰式 y= x x 2 重症度 5 TC TC 重症度

重回帰式 y= x x 2 重症度 5 TC TC 重症度 3. 重回帰分析 3.1 重回帰分析の原理 重回帰分析は説明変数が複数になった回帰分析 (1) 重回帰モデル ある結果項目に影響を与えている原因項目が複数ありしかも原因項目間に相関関係がある 複数の原因項目間の相関関係を考慮して結果項目との間の因果関係の内容を検討したい 重回帰分析を適用重回帰分析は目的変数が 1 つで 説明変数が複数でお互いに相関がある時の回帰分析 目的変数には誤差変動があり 説明変数には誤差変動がないことを前提にしている

More information

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発 6.. ロジスティック回帰分析 6. ロジスティック回帰分析の原理 ロジスティック回帰分析は判別分析を前向きデータ用にした手法 () ロジスティックモデル 疾患が発症するかどうかをリスクファクターから予想したいまたは疾患のリスクファクターを検討したい 判別分析は後ろ向きデータ用だから前向きデータ用にする必要がある ロジスティック回帰分析を適用ロジスティック回帰分析 ( ロジット回帰分析 ) は 判別分析をロジスティック曲線によって前向き研究から得られたデータ用にした手法

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

Microsoft Word - SPSS2007s5.doc

Microsoft Word - SPSS2007s5.doc 第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では

More information

Microsoft Word - SDA2012kadai07.doc

Microsoft Word - SDA2012kadai07.doc 都市データ分析第 7 回課題書 年 5 月 3 日重回帰モデルによる地価推定担当鈴木勉 システム情報系 TA 高森賢司 システム情報工学研究科 茨城県の公示地価を重回帰モデルによって説明し 地価に影響を及ぼすと考えられる要因との関係を定量的に記述する.. 重回帰分析重回帰分析では一つの従属変数 被説明変数 を 複数の独立変数 説明変数 で説明することを考える. これによって どの独立変数が どの程度従属変数に影響を与えているかを知ることができる...

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

スライド 1

スライド 1 都市環境計画 都市環境計画のための 調査 分析 調査 分析手法の概論分析 ( 主に多変量解析 ) の概論 試験想定問題 多変量解析手法について以下のキーワードを用いて説明せよ 定量データ ( 量的データ ), 定性データ ( 質的データ ) 目的変数 ( 従属変数 ), 説明変数 ( 独立変数 ), 重回帰分析, 判別分析, 因子分析, 数量化 Ⅰ 類, 数量化 Ⅱ 類, 数量化 Ⅲ 類 利用者の利用実態や評価構造の解明等に関する研究

More information

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - Econometrics 計量経済学講義 第 回回帰分析 Part 4 7 年 月 7 日 ( 火 ) 限 担当教員 : 唐渡広志 研究室 : 経済学研究棟 4 階 4 号室 emal: kkarato@eco.-toyama.ac.jp webste: http://www.-toyama.ac.jp/kkarato/ 講義の目的 最小 乗法について理論的な説明をします 多重回帰分析についての特殊なケースについて 多重回帰分析のいくつかの応用例を検討します

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 調査統計法 ( 杉浦 ) 第 1 回 オリエンテーション ( 自己紹介 ) 京都警察 ~ 大和総研を経て独立 ユニクロやソフトバンクなどで IT マーケティングやデータ分析を支援 1 調査統計法で何を学ぶのか - 学術研究でもビジネスでも必要となるデータ分析の知識 - なぜ 統計学が最強の学問なのか? http://diamond.jp/articles/-/52085 エビデンスベースドメディスン

More information

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学) 回帰分析の用途 実験計画法の意義 グラフィカルモデリングの活用 早稲田大学創造理工学部 経営システム工学科 永田靖, The Institute of JUSE. All Rights Reserved. 内容. 回帰分析の結果の解釈の仕方. 回帰分析による要因効果の把握の困難さ. 実験計画法の意義 4. グラフィカルモデリング 参考文献 : 統計的品質管理 ( 永田靖, 朝倉書店,9) 入門実験計画法

More information

8 A B B B B B B B B B 175

8 A B B B B B B B B B 175 4.. 共分散分析 4.1 共分散分析の原理 共分散分析は共変数の影響を取り除いて平均値を比較する手法 (1) 共分散分析 あるデータを群間比較したい そのデータに影響を与える他のデータが存在する 他のデータの影響を取り除いて元のデータを比較したい 共分散分析を適用 共分散分析 (ANCOVA:analysis of covariance アンコバ ) は分散分析に回帰分析の原理を応 用し 他のデータの影響を考慮して目的のデータを総合的に群間比較する手法

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A>

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A> 主な多変量解析 9. 多変量解析 1 ( 重回帰分析 ) 目的変数 量的 説明変数 質的 あり量的 重回帰分析 数量化 Ⅰ 類 質的 判別分析 数量化 Ⅱ 類 なし 主成分分析因子分析多次元尺度構成法 数量化 Ⅲ 類数量化 Ⅳ 類 その他 クラスタ分析共分散構造分析 説明変数 : 独立変数 予測変数 目的変数 : 従属変数 基準変数 3 1. 単回帰分析各データの構造 y b ax a α: 1,,,

More information

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の JMP によるオッズ比 リスク比 ( ハザード比 ) の算出と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2011 年 10 月改定 1. はじめに 本文書は JMP でロジスティック回帰モデルによるオッズ比 比例ハザードモデルによるリスク比 それぞれに対する信頼区間を求める操作方法と注意点を述べたものです 本文書は JMP 7 以降のバージョンに対応しております

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

スライド 1

スライド 1 データ解析特論第 5 回 ( 全 15 回 ) 2012 年 10 月 30 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 をもっとやります 2 第 2 回 3 データマイニングの分野ではマクロ ( 巨視的 ) な視点で全体を捉える能力が求められる 1. コンピュータは数値の集合として全体を把握していますので 意味ある情報として全体を見ることが不得意 2. 逆に人間には もともと空間的に全体像を捉える能力が得意

More information

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch04j Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数

More information

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - Econometrics pptx 計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: kkarato@eco.u-toyama.ac.p webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 復習 ) 時系列のモデリング ~a. 離散時間モデル ~ y k + a 1 z 1 y k + + a na z n ay k = b 0 u k + b 1 z 1 u k + + b nb z n bu k y k = G z 1 u k = B(z 1 ) A(z 1 u k ) ARMA モデル A z 1 B z 1 = 1 + a 1 z 1 + + a na z n a = b 0

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ] JMP を用いた ARIMA モデルのあてはめ SAS Institute Japan 株式会社 JMP ジャパン事業部 2013 年 2 月作成 1. はじめに JMP の時系列分析では 一変量の時系列データに対する分析や予測を行うことができ 時系列データに対するグラフ表示 時系列モデルのあてはめ モデルの評価 予測まで 対話的に分析を実行することができます 時系列データにあてはめるモデルとしては

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

目次 はじめに P.02 マクロの種類 ---

目次 はじめに P.02 マクロの種類 --- ステップワイズ法による重回帰分析の 予測マクロについて 2016/12/20 目次 はじめに ------------------------------------------------------------------------------------------------------------------------------ P.02 マクロの種類 -----------------------------------------------------------------------------------------------------------------------

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

Excelによるデータ分析

Excelによるデータ分析 Excel による データ分析 多変量解析編 矢野佑樹 2013/07/27 Excel で学ぶデータ分析 ( 多変量解析編 ) 多変量解析では, 気温とアイスの売上個数の関係や, 最寄り駅からの距離と来店者数の 関係など,2 つ以上の変数を一度に分析します. では, 早速 2 つのデータ間の関係を Excel によって分析しましょう. < 散布図と相関 > 例 1. あるアイスクリーム販売店では,1

More information

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式 統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値

More information

Microsoft Word - econome5.docx

Microsoft Word - econome5.docx : 履修登録したクラスの担当教員名を書く : 学籍番号及びが未記入のもの, また授業終了後に提出されたものは採点しないので, 注意すること. 4. 重回帰分析 4.1 重回帰分析とは経済変数間の関係は, 組だけの変数だけで記述できるわけではありません. ミクロ経済で学んだように, 需要を変化させる要因は財価格以外に様々なものが考えられます. 例えば, うどんの需要はうどんの価格以外に, 所得や代替財のそばの価格や補完財のネギの価格などの需要を変化させる要因があります.

More information

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan 計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN 978-4-641-15028-7, Printed in Japan 第 5 章単回帰分析 本文例例 5. 1: 学歴と年収の関係 まず 5_income.csv を読み込み, メニューの モデル (M) 最小 2 乗法 (O)

More information

スライド 1

スライド 1 都市環境計画 都市環境計画のための 調査 分析 調査 分析手法の概論分析 ( 主に多変量解析 ) の概論 試験想定問題 多変量解析手法について以下のキーワードを用いて説明せよ 定量データ ( 量的データ ), 定性データ ( 質的データ ) 目的変数 ( 従属変数 ), 説明変数 ( 独立変数 ), 重回帰分析, 判別分析, 因子分析, 数量化 Ⅰ 類, 数量化 Ⅱ 類, 数量化 Ⅲ 類 1 調査

More information

主成分分析 -因子分析との比較-

主成分分析 -因子分析との比較- 主成分分析 - 因子分析との比較 - 2013.7.10. 心理データ解析演習 M1 枡田恵 主成分分析とは 主成分分析は 多変量データに共通な成分を探って 一種の合成変数 ( 主成分 ) を作り出すもの * 主成分はデータを新しい視点でみるための新しい軸 主成分分析の目的 : 情報を縮約すること ( データを合成変数 ( 主成分 ) に総合化 ) 因子分析の目的 : 共通因子を見つけること ( データを潜在因子に分解

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

相関分析・偏相関分析

相関分析・偏相関分析 相関分析 偏相関分析 教育学研究科修士課程 1 回生 田中友香理 MENU 相関とは 相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数 偏相関係数 SPSSによる偏相関係数 順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す 曲線回帰分析を行う 相関とは

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後 JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後の 2 章では JMP でのオッズ比 オッズ比の信頼区間の算出方法について サンプルデータを用いて解説しております

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

PowerPoint Presentation

PowerPoint Presentation 付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

様々なミクロ計量モデル†

様々なミクロ計量モデル† 担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル

More information

主成分分析 + 重回帰分析 a.2 変数群に対して, 以下のような手順を実行 ( 多変数群 ) では,2 変数群を組み合わせて実行 ) 説明変数群の主成分分析 2 基準変数群の主成分分析 3 説明変数群における 個の主成分得点に対して, 基準へ数群における主成分得点のすべてを用いて重回帰分析を反復

主成分分析 + 重回帰分析 a.2 変数群に対して, 以下のような手順を実行 ( 多変数群 ) では,2 変数群を組み合わせて実行 ) 説明変数群の主成分分析 2 基準変数群の主成分分析 3 説明変数群における 個の主成分得点に対して, 基準へ数群における主成分得点のすべてを用いて重回帰分析を反復 正準相関分析についての解説 0. 判別分析 (discriminant analysis) 多変量のデータを用い, 重みづけた説明変数 ( 独立変数 ) を合成して, 個々人の所属する集団を分ける基準変数 ( 従属変数 ) を予測 ( 判別 ) する多変量解析法を, 判別分析と総称する. 例 : ある患者に対する多種類の検査結果を総合して ( 説明変数 ), どのような病気かを診断する ( 基準変数

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

Ecel 演習問題 Work Shee 解答 第 章 Ecel 演習問題 WorkShee 解答 問題 - 4 8 7 転置行列 4 8 7 TRANSPOSE( ) 問題 - X.6 4 4.8 8 4.9 6. 7 48 8. X 転置行列 4 8 7 4 6 48 TRANSPOSE( ).6 4.8.9. 8. 問題 -.6 4 4.8 8 y.9. 7 8. 転置行列 4 8 7 TRANSPOSE(

More information

基礎統計

基礎統計 基礎統計 第 4 回講義資料 本日の講義内容 第 3 章 : 次元データの整理 散布図 [ グラフ ] 共分散と相関係数 [ 数値 ] 回帰分析 [ 数値とグラフ ] 偏相関係数 [ 数値 ] 第 3 章 次元のデータ 第 3 章 : 次元のデータ ( 目的 ) 変数間の関係を探る 相関と回帰 ( 相関 ) 変数を区別せず対等にみる ( 相関関係 ) 身長と体重, 教科目の成績 ( 回帰 ) 一方が他方に影響を与える

More information

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2 春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - Econometrics 計量経済学講義 第 0 回回帰分析 Part 07 年 月 日 ( 水 ) 限 ( 金曜授業実施日 ) 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 4 号室 mal: kkarato@co.-toama.ac.jp wbst: http://www.-toama.ac.jp/kkarato/ 講義の目的 ロジスティック関数の推定方法について学びます 多重回帰分析について学びます kwords:

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074> 重回帰分析 (2) データ解析演習 6.9 M1 荻原祐二 1 発表の流れ 1. 復習 2. ダミー変数を用いた重回帰分析 3. 交互作用項を用いた重回帰分析 4. 実際のデータで演習 2 復習 他の独立変数の影響を取り除いた時に ある独立変数が従属変数をどれくらい予測できるか 変数 X1 変数 X2 β= 変数 Y 想定したモデルが全体としてどの程度当てはまるのか R²= 3 偏相関係数と標準化偏回帰係数の違い

More information

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎

More information

C3 データ可視化とツール

C3 データ可視化とツール < 第 3 回 > データ可視化とツール 統計数理研究所 中野純司 nakanoj@ism.ac.jp データ可視化とツール 概要 データサイエンティスト育成クラッシュコース データサイエンティストとしてデータ分析を行う際に必要な可視化の考え方と それを実行するためのフリーソフトウェアを紹介する 1. はじめに 2. 静的なグラフィックス 3. 動的なグラフィックス 4. 対話的なグラフィックス 1.

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

解析センターを知っていただく キャンペーン

解析センターを知っていただく キャンペーン 005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

Microsoft Word - reg2.doc

Microsoft Word - reg2.doc 回帰分析 重回帰 麻生良文. 前提 個の説明変数からなるモデルを考える 重回帰モデル : multple regresso model α β β β u : 被説明変数 epled vrle, 従属変数 depedet vrle, regressd :,,.., 説明変数 epltor vrle, 独立変数 depedet vrle, regressor u: 誤差項 error term, 撹乱項

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

Microsoft PowerPoint - データ解析発表2用パワポ

Microsoft PowerPoint - データ解析発表2用パワポ 7/3 教育学研究科 M1 藤田弥世 SEM とは structural equation model の略 ; 構造方程式モデル ( 別名. 共分散構造分析 ) 多変量解析の色々な手法を統合したモデル 相関行列や共分散行列を利用して 多くの変数間の関係を総合的に分析する手法 共分散 ( 相関係数 ) の観点から 相関係数で関連の大小を評価することができるデータすべてに適用可能 パス解析との違い 前回の授業の修正点

More information

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49 要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49 N N Web x x y x x x y x y x y N 三井信宏 : 統計の落とし穴と蜘蛛の糸,https://www.yodosha.co.jp/jikkenigaku/statistics_pitfall/pitfall_.html 50 標本分散 不偏分散 図 1: 不偏分散のほうが母集団の分散に近付くことを示すシミュレーション

More information

Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる

More information

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研 CAE シミュレーションツール を用いた統計の基礎教育 ( 株 ) 日本科学技術研修所数理事業部 1 現在の統計教育の課題 2009 年から統計教育が中等 高等教育の必須科目となり, 大学でも問題解決ができるような人材 ( 学生 ) を育てたい. 大学ではコンピューター ( 統計ソフトの利用 ) を重視した教育をより積極的におこなうのと同時に, 理論面もきちんと教育すべきである. ( 報告 数理科学分野における統計科学教育

More information

プログラミング基礎

プログラミング基礎 C プログラミング Ⅱ 演習 2-1(a) BMI による判定 文字列, 身長 height(double 型 ), 体重 weight (double 型 ) をメンバとする構造体 Data を定義し, それぞれのメンバの値をキーボードから入力した後, BMI を計算するプログラムを作成しなさい BMI の計算は関数化すること ( ) [ ] [ ] [ ] BMI = 体重 kg 身長 m 身長

More information

Chapter 1 Epidemiological Terminology

Chapter 1 Epidemiological Terminology Appendix Real examples of statistical analysis 検定 偶然を超えた差なら有意差という P

More information

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン JMP 10 のグラフビルダーで作成できるグラフ SAS Institute Japan 株式会社 JMP ジャパン事業部 2012 年 9 月作成 1. はじめに グラフビルダーは グラフを対話的に作成するツールです グラフビルダーでは グラフの種類を選択することにより 散布図 折れ線グラフ 棒グラフなどさまざまなグラフを作成することができます さらに グループ変数を用いて グラフを縦や横に分割することができ

More information