Microsoft PowerPoint - 10問題発見6_クラスタ分析.pptx
|
|
|
- あつの いんそん
- 7 years ago
- Views:
Transcription
1 問題発見技法 00/6/6 00 年 6 月 9 日 ( 火 ) 問題発見技法 6.. クラスタ分析 情報学部堀田敬介 クラスタ分析 Coe クラスタ分析. クラスタ分析概要. 類似度の測定. クラスタ化の方法の決定 ( 類似度更新法 ) クラスタ分析 階層的方法階層的方法 の実施. Excelで計算したクラスタ分析,Rによるクラスタ分析. クラスター分析実施上の注意点 クラスタ分析 非階層的方法非階層的方法 6. 非階層的クラスター分析 K-mea 法 7. Rによるクラスター分析 K-mea 法
2 問題発見技法 00/6/6 クラスタリングを行う類似てない似度. クラスタ分析概要 クラスタ分析とは? 複数の対象 ( もの, 変数など ) を, その属性属性によって類似度 (imilaiy) をはかり, 均質な集団 (clue) に分類する方法の総称 どれとどれが似てる? ( 同じクラスター?). クラスタ分析概要 クラスタ分析の種類階層的方法 樹形図 ( デンドログラム ) を作成 目的により高さを決めてクラスタリング 非階層的方法 予めクラスタ数を決め (o 決まっていて ), 似てる 例 : つのクラスタに分類
3 問題発見技法 00/6/6. クラスタ分析概要 例 : 階層的方法 ( 対象の属性が つの場合 ) 属性 x 6 A F C どうやってクラスタ間の近さ を決めるのか G B D E どうやって類似度を測るのか例 )CとEの類似度? 例 ) クラスタ (G,B) とクラスタ (D) の近さ? x 属性. 類似度の測定 距離 間隔尺度間隔尺度 ユークリッド距離ユークリッド平方距離重み付きユークリッド距離マンハッタン距離ミンコフスキー距離マハラノビス汎距離 相関 間隔尺度間隔尺度 Peaoの積率相関係数ベクトル内積 相関 順序尺度順序尺度 Seamaの順位相関係数 Kedallの順位相関係数 類似度は尺度により距離や相関で測る ( 距離 : 近いほうが類似 ) ( 相関 : 高いほうが類似 ) 距離 名義名義尺度 [0, ] 類似比一致係数 Ruel-Rao R 係数 Roge-Taimoo 係数 Hama 係数ファイ係数 変量間類似度類似度 名義尺度名義尺度 平均平方根一致係数グッドマン クラスカルのλ クラスタ分析ノート.df
4 問題発見技法 00/6/6. 類似度の測定 データと尺度 量的データ ( 数値データ ) 学籍番号 氏名 性別 生年月日 身長 体重 問題発見技法成績 文教太郎 男 cm 69kg B 湘南花子 女 cm 8kg AA 厳密 質的データ ( カテゴリデータ ) 比率尺度 間隔尺度 順序尺度 名義尺度 曖昧 比に意味がある ( 絶対原点が存在 ) 例 ) 身長 80cm の A さんは息子 (00cm) の.8 倍背が高い 差に意味がある 例 ) 温度気温 0 より 0 の方が 0 高い 順序関係がある例 ) 成績評価 (A > B > C > D) 単なる分類例 ) 名前, 性別. 類似度の測定 個体間類似度ユークリッド距離 x (cf. l -ノルム) A マンハッタン距離 (cf. l -ノルム) ミンコフスキー距離 (cf. l -ノルム) (cf. l -ノルム) マハラノビス汎距離ユークリッド平方距離 クラスター分析でよく使われる ( 注 : 各ノルムとは 変量の差ベクトルに対するノルム ) 0 G l ( C, D) = = ( 7) ( ) l( C, D) = 7 = 7 l( C, D) =.98 = 7 l ( C, D) = = max{ 7, } l ( C, D) = = ( 7) ( ) B D 7 (,) F.98 E C 7 (7,) x
5 問題発見技法 00/6/6. 類似度の測定 個体間類似度ユークリッド距離 x x B (cf. l - ノルム ) マンハッタン距離 A A (cf. l -ノルム) x x ミンコフスキー距離左側の対象内での,A-B 間距離と (cf. l -ノルム) 右側の対象内でのA-B 間距離が (cf. l -ノルム) 異なる!( ユークリッド距離などでは同じ ) マハラノビス汎距離 マハラノビス汎距離 ( 変量 x, x 版 ) u u ρuu D ρ x μ x μ ただし,u, u は x, x の標準化変量で, u =, u = σ σ また,μ,μ はそれぞれ, 変量 x, x の平均, σ,σ は x, x の標準偏差,ρ は x, x の相関係数 B. クラスタ化の方法の決定 新たなクラスタ生成時の類似度の更新方法 クラスタ, クラスタ が一つのクラスタ になる場合, 他のクラスタ との類似度をどう更新する??. 最短距離法. 最長距離法. 群平均法. 重心法. 中央値法 6. ウォード法 ( : クラスタ, の類似度 )
6 問題発見技法 00/6/6. クラスタ化の方法の決定. 最短距離法 (eae eighbo mehod) 単連結法 (igle likage mehod) = mi{, } あるクラスタにおいて, クラスタ内の各対象が, そのクラスタ外の任意の対象よりも, そのクラスタ内の少なくともつの対象とより近接している. 類似度は, 対象間の類似度の大小関係だけで決まる. よって, 類似度 ( 距離 ) は順序尺度ならばよい.. クラスタ化の方法の決定. 最短距離法 = mi{, } 6
7 問題発見技法 00/6/6. クラスタ化の方法の決定. 最長距離法 (fuhe eighbo mehod) 完全連結法 (comlee likage mehod) = max{, } あるクラスタにおいて, クラスタ内の全ての対象が, そのクラスタ外の任意の対象との距離よりも常に近接している. 類似度は, 対象間の類似度の大小関係だけで決まる. よって, 類似度 ( 距離 ) は順序尺度ならばよい.. クラスタ化の方法の決定. 最長距離法 = max{, } 7
8 問題発見技法 00/6/6. クラスタ化の方法の決定. 群平均法 (gou aveage mehod) = : クラスタ に含まれる対象数 : クラスタ に含まれる対象数 類似度は, 間隔尺度ならば OK =. クラスタ化の方法の決定. 群平均法 = 8
9 問題発見技法 00/6/6. クラスタ化の方法の決定. 重心法 (ceoid mehod) = ( ) 導出過程より, 類似度 S はユークリッド平方距離の時のみ妥当. cf. ファイル クラスタ分析ノート.df : クラスタ に含まれる対象数 : クラスタ に含まれる対象数 x x x x x = x x はベクトル. クラスタ化の方法の決定. 重心法 = ( ) ( ) 9
10 問題発見技法 00/6/6. クラスタ化の方法の決定. 中央値法 (media mehod) = ( 重心法の簡易版, 重心の代わりに中央値を取る重心法で :=, := に相当 ) 導出過程より, 類似度 S はユークリッド平方距離の時のみ妥当. cf. ファイル クラスタ分析ノート.df x x : x x = x x x はベクトル. クラスタ化の方法の決定. 中央値法 = 0
11 問題発見技法 00/6/6. クラスタ化の方法の決定 6. ウォード法 (Wad mehod) = : クラスタ に含まれる対象数 : クラスタ に含まれる対象数 : クラスタ に含まれる対象数 導出過程より, 類似度 S はユークリッド平方距離の時のみ妥当. cf. ファイル クラスタ分析ノート.df. クラスタ化の方法の決定 6. ウォード法 =
12 問題発見技法 00/6/6. クラスタ分析の実施 Excel を用いて計算するクラスタ分析 : 例対象 : 人の学生対象の属性 :7 つ 属性 属性 属性 属性 属性 属性 6 属性 7 太郎 7 次郎 三郎 9 7 四郎 五郎 距離 : ユークリッド平方距離 l ( Tao, Jio) = ( 6) ( ) L ( ) クラスタ間の類似度更新方法 : 群平均法 = =. クラスタ分析の実施 Excel で計算によるクラスタ分析 : 例 属性 属性 属性 属性 属性 属性 6 属性 7 太郎 7 次郎 三郎 9 7 四郎 五郎 類似度の測定 : ユークリッド平方距離による 太郎次郎三郎四郎 l ( Tao, Jio) = 97 = ( 6) L ( 次郎 97 M 三郎 四郎 = 97 0 次郎 五郎 類似度の更新 : 群平均法による 四郎 太郎 ) 太郎次 & 四三郎次 & 四 00 三郎 86 9 五郎 =
13 問題発見技法 00/6/6. クラスタ分析の実施 Excel で計算によるクラスタ分析 : 例 太郎次 & 四三郎 次 & 四 00 三郎 86 9 五郎 類似度の更新 : 群平均法による 太 &( 次 & 四 ) 三郎 三郎 6.67 五郎 0 69 太 &( 次 & 四 ) 三郎 三郎 6.67 五郎 0 69 類似度の更新 : 群平均法による 次 & 四 0 = 太郎 = 三郎 五 &( 太 &( 次 & 四 )) 三郎. 66 五郎太郎次郎四郎三郎樹形図 ( デンドログラム ). クラスタ分析の実施 R によるクラスタ分析 :. 起動画面とデータファイル R 起動時画面 データを cv ファイルで用意 (Excel や edio で作成 ) ファイル daa-eieki.cv 算数 理科 国語 英語 社会 太郎 次郎 三郎 四郎 花子 寒子 湘子
14 問題発見技法 00/6/6. クラスタ分析の実施 R によるクラスタ分析 :. クラスタ分析の実施例 cvファイルを読み込み, 変数 eieki に格納 変数 eieki の中身確認 対象間の類似度を mahaa 距離で測定し, 変数 eieki.dに格納変数 eieki.dの中身確認 wad 法でクラスタ分析を実施し, 変数 eieki.hcに格納クラスタ化 :wad 法類似度 :mahaa 距離を確認! 対象の数 :7 結果を樹形図で表示 注 )wad 法を用いる場合, 距離はユークリッド平方距離を使うのが妥当. クラスタ分析の実施 R によるクラスタ分析 :. 結果 cf. 元データ 算数理科国語英語社会 太郎 次郎 三郎 四郎 花子 寒子 湘子
15 問題発見技法 00/6/6. クラスタ分析の実施 R によるクラスタ分析 :. 手法選択について 距離の測定 : 関数 di( ) 書式 :di( daa, mehod ) mehodの部分に距離の測定方法を指定 euclidea ユークリッド距離 (l ノルム ) ex) di( daa ) 指定無しだとこれ mahaa マンハッタン距離 (l ノルム ) ex) di( daa, mahaa ) mikowki ミンコフスキー距離 (l ノルム ) ex) di( daa, mikowki, = ) maximum l ノルム ex) di( daa, maximum ) 注 ) ユークリッド平方距離は, ユークリッド距離の計算後, 乗するクラスタ化の方法 : 関数 hclu( ) 書式:hclu( daa.d, mehod ) mehodの部分にクラスタ化の方法を指定 igle 最短距離法 ex) hclu( daa.d, igle ) comlee 最長距離法 ex) hclu( daa.d, comlee ) aveage 群平均法 ex) hclu( daa.d, aveage ) ceoid 重心法 ex) hclu( daa.d^, ceoid ) media 中央値法 ex) hclu( daa.d, media ) wad ウォード法 ex) hclu( daa.d^, wad ) 注 ) この つの手法では ユークリッド平方距離 を用いる (daa.d がユークリッド距離の計算結果でその 乗を使用 ). クラスター分析実施上の注意点 クラスター分析の長所 探索的手法なので, データ構造を事前に知らなくてよいあらゆる種類のデータに適用可能 : 数値 カテゴリー適用が簡単 クラスター分析の短所 類似度 ( 距離 ) 測定法の選択が困難な可能性がある類似度 ( 距離 ) 測定法の選択が困難な可能性があるクラスタ化更新法の選択が困難な可能性がある結果の解釈が困難な可能性がある
16 問題発見技法 00/6/6 6. 非階層的クラスタ分析 K-mea 法 事前にクラスタ数を Kとしてクラスタリングを行う 例 : つのクラスタに分類 6. 非階層的クラスタ分析 K-mea 法 Se0:Kを決める (ex. K:=) Se: 適当に種を置く Se: 何らかの距離により, もっとも近い種に含まれるよう境界線で分ける. (ex. Euclidea diace) (cf. Voooi diagam) x 6 G B A D F C E 0 6 7x 6
17 問題発見技法 00/6/6 6. 非階層的クラスタ分析 K-mea 法 Se0:Kを決める (ex. K:=) Se: 適当に種を置く Se: 何らかの距離により, もっとも近い種に含まれるよう境界線で分ける. (ex. Euclidea diace) (cf. Voooi diagam) x Se: 各クラスタごとに何らかの距離により, 重心を計算し, 新たな種とする. 6 G B A D F C E 0 6 7x 6. 非階層的クラスタ分析 K-mea 法 Se0:Kを決める (ex. K:=) Se: 適当に種を置く Se: 何らかの距離により, もっとも近い種に含まれるよう境界線で分ける. (ex. Euclidea diace) (cf. Voooi diagam) x Se: 各クラスタごとに何らかの距離により, 重心を計算し, 新たな種とする. Se- をクラスタが更新されなくなるまで繰り返す 6 0 G B A D F 6 7x C E 7
18 問題発見技法 00/6/6 6. 非階層的クラスタ分析 K-mea 法 Se0:Kを決める (ex. K:=) Se: 適当に種を置く Se: 何らかの距離により, もっとも近い種に含まれるよう境界線で分ける. (ex. Euclidea diace) (cf. Voooi diagam) x Se: 各クラスタごとに何らかの距離により, 重心を計算し, 新たな種とする. Se- をクラスタが更新されなくなるまで繰り返す 6 0 G B A D F 6 7x C E 6. 非階層的クラスタ分析 K-mea 法 Se0:Kを決める (ex. K:=) Se: 適当に種を置く Se: 何らかの距離により, もっとも近い種に含まれるよう境界線で分ける. (ex. Euclidea diace) (cf. Voooi diagam) x Se: 各クラスタごとに何らかの距離により, 重心を計算し, 新たな種とする. Se- をクラスタが更新されなくなるまで繰り返す 6 0 G B A D F 6 7x C E 8
19 問題発見技法 00/6/6 7. クラスタ分析の実施 R によるクラスタ分析 :.K-mea 法による結果 K-mea 法でクラスタ数をとして分析を実施し, 変数 eieki.kmに格納 結果 : clue: 花子 clue: 三郎, 四郎, 寒子 clue: 太郎, 次郎, 湘子 cf. 元データ 算数理科国語英語社会 太郎 次郎 三郎 四郎 花子 寒子 湘子 演習類似度をユークリッド平方距離で測定し, クラスタ間の類似度更新に最短距離法を用いてクラスタ分析をしよう! x 6 D E F C A G B x 9
20 問題発見技法 00/6/6 参考文献 田中豊 脇本和昌 多変量統計解析法 現代数学社 (98) 河口至商 多変量解析入門 Ⅱ 森北出版 (978,00) 金明哲 R によるデータサイエンス 森北出版 (007) 荒木孝治 R と R コマンダーではじめる多変量解析 日科技連 (007) 新納浩幸 R で学ぶクラスタ解析 オーム社 (007) 0
< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B>
クラスター分析に関するノート 情報学部堀田敬介 2004/7/32008/7/ 改訂, 2009/0/3 改訂 ) 類似度の測定 まずはじめに, 各データ間の距離を測るが, 尺度毎に様々な方法が提案されている. 尺度に対応した類似度測定の距離を示す.. 間隔尺度による類似度の測定 n 個の対象があり, 各対象は間隔尺度で m 個の属性 変量 ) が測定されているとする. このとき対象 と q を x
第13章 テキストのクラスター分析
第 13 章 テキストのクラスター分析 茨城大学工学部 高木真 概要 複数のテキストを分析する際に テキストの何らかの特徴にもとづいて似ているものごとにグループ分けする必要がある場合がある 本章ではテキスト間の類似度 ( または距離 ) にもとづいてテキストをグルーピングする方法やその応用例を説明する テキストのクラスター分析 テキストのクラスター分析 テキストの分散 相関 類似度や距離の情報を用いてグループ分けすること
Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt
主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで
プログラミング基礎
C プログラミング Ⅱ 演習 2-1(a) BMI による判定 文字列, 身長 height(double 型 ), 体重 weight (double 型 ) をメンバとする構造体 Data を定義し, それぞれのメンバの値をキーボードから入力した後, BMI を計算するプログラムを作成しなさい BMI の計算は関数化すること ( ) [ ] [ ] [ ] BMI = 体重 kg 身長 m 身長
Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx
統計の分析と利用. データとその扱い -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばり データの尺度 -. 二次元のデータ 堀田敬介 散布図 クロス集計二次元データの関係 : 相関係数 相関比 連関係数 0/9/30, Fri.~ -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット, =9, =-3, =4, =5, =3, 67 = 箱ひげ図,, 3,
データ構造
アルゴリズム及び実習 7 馬青 1 表探索 定義表探索とは 表の形で格納されているデータの中から条件に合ったデータを取り出してくる操作である 但し 表は配列 ( 連結 ) リストなどで実現できるので 以降 表 の代わりに直接 配列 や リスト などの表現を用いる場合が多い 表探索をただ 探索 と呼ぶ場合が多い 用語レコード : 表の中にある個々のデータをレコード (record) と呼ぶ フィールド
1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな
1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC
0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌
0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい
Microsoft PowerPoint - データ解析基礎2.ppt
データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ
目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順
SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3
バイオインフォマティクスⅠ
バイオインフォマティクス ( 第 5 回 ) 慶應義塾大学生命情報学科 榊原康文 多重アライメントの解 0 2 3 4 5 6 7 j Q T S Y T R Y Q T - Y T R K 0 0-9 -20-44 -52-63 -72-90 Q -6 2 0-6 -4-25 -34-52 2 S -32 5 30 4 6-5 -4-32 3 Y -48-4 2 38 27 8 0 4 P -64-27
画像類似度測定の初歩的な手法の検証
画像類似度測定の初歩的な手法の検証 島根大学総合理工学部数理 情報システム学科 計算機科学講座田中研究室 S539 森瀧昌志 1 目次 第 1 章序論第 章画像間類似度測定の初歩的な手法について.1 A. 画素値の平均を用いる手法.. 画素値のヒストグラムを用いる手法.3 C. 相関係数を用いる手法.4 D. 解像度を合わせる手法.5 E. 振れ幅のヒストグラムを用いる手法.6 F. 周波数ごとの振れ幅を比較する手法第
CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研
CAE シミュレーションツール を用いた統計の基礎教育 ( 株 ) 日本科学技術研修所数理事業部 1 現在の統計教育の課題 2009 年から統計教育が中等 高等教育の必須科目となり, 大学でも問題解決ができるような人材 ( 学生 ) を育てたい. 大学ではコンピューター ( 統計ソフトの利用 ) を重視した教育をより積極的におこなうのと同時に, 理論面もきちんと教育すべきである. ( 報告 数理科学分野における統計科学教育
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め
PowerPoint プレゼンテーション
総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく
経営統計学
5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており
Microsoft Word - 補論3.2
補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は
講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー
社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎
Microsoft PowerPoint - データ解析演習 0520 廣橋
JMP の使い方 京都大学教育学研究科 M1 廣橋幹也 JMP とは SAS Institute 社より発売されているビジュアル探索型データ分析ソフトウェア 解析結果は全てビジュアルで表現される JMP の特徴 データの編集機能が素晴らしい 直観的に図をいじれる 余計な機能が絞ってある 高度な分析手法も取り入れられている データの読み込み方 ファイル をクリックします 開く をクリックしてファイルを選びます
スライド 1
データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小
Excelによる統計分析検定_知識編_小塚明_1_4章.indd
第1章 母集団と統計データ 本章では, ビジネスのさまざまな場面において統計データを扱ううえで, もっとも基本的事項となる母集団の概念と統計データの種類についてまとめています 母集団の統計的性質を調べるためにとても重要な概念であるサンプリングについて述べるとともに, ランダムサンプリングの重要性についても説明します 統計分析の考え方 ビジネスの多くの場面において, 統計分析は重要です この場合の統計分析とは,
FLIRTools+デモ手順書
FLIRTools+ 簡易取扱説明書 FLIR Tools+ 手順書 1. FLIR ToolsをPCにインストールする 2. Tools+ ライセンス番号を認識させる 3. カメラの電源を入れ USBでPCと接続する 4. 表示設定 5. 静止画を撮影する 6. 動画記録スピードを設定する 7. 動画を記録する / 停止する 8. 動画からグラフを作成する 9. グラフデータ ( 温度値 ) をExcelにペーストする
JUSE-StatWorks/V5 ユーザーズマニュアル
1.1 主成分分析とは 1 主成分分析 1.1 主成分分析とは 目的主成分分析はたくさんの変数があるデータ表のもつ情報を要約し, データの裏にある構造を探索することを目的にしており, サンプルの特徴づけや製品のポジショニングなどに有用な手法です. 例えば,n 個の対象 ( サンプル ) について, 多数個の p 変数 x 1,x 2,,x p のデータが観測されているとき, その対象の特徴をできるだけ少数の総合指標
ビジネス統計 統計基礎とエクセル分析 正誤表
ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります
Microsoft PowerPoint - A1.ppt [互換モード]
011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)
<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>
重回帰分析 (2) データ解析演習 6.9 M1 荻原祐二 1 発表の流れ 1. 復習 2. ダミー変数を用いた重回帰分析 3. 交互作用項を用いた重回帰分析 4. 実際のデータで演習 2 復習 他の独立変数の影響を取り除いた時に ある独立変数が従属変数をどれくらい予測できるか 変数 X1 変数 X2 β= 変数 Y 想定したモデルが全体としてどの程度当てはまるのか R²= 3 偏相関係数と標準化偏回帰係数の違い
Microsoft PowerPoint - pr_12_template-bs.pptx
12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算
目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...
Microsoft Excel 2013 - グラフ完成編 - 明治大学教育の情報化推進本部 2017 年 2 月 1 日 目次 1. はじめに... 2 1.1. Excel シートからグラフの選択... 2 1.2. グラフの各部の名称... 3 2. 成績の複合グラフを作成... 4 2.1 各生徒の 3 科目の合計点を求める... 4 2.2 合計点から全体の平均を求める... 5 2.3
09.pptx
講義内容 数値解析 第 9 回 5 年 6 月 7 日 水 理学部物理学科情報理学コース. 非線形方程式の数値解法. はじめに. 分法. 補間法.4 ニュートン法.4. 多変数問題への応用.4. ニュートン法の収束性. 連立 次方程式の解法. 序論と行列計算の基礎. ガウスの消去法. 重対角行列の場合の解法項目を変更しました.4 LU 分解法.5 特異値分解法.6 共役勾配法.7 反復法.7. ヤコビ法.7.
【FdData中間期末過去問題】中学数学1年(負の数/数直線/絶対値/数の大小)
FdData 中間期末 : 中学数学 年 : 正負の数 [ 正の数 負の数 / 数直線 / 正の数 負の数で量を表す / 絶対値 / 数の大小 / 数直線を使って ] [ 数学 年 pdf ファイル一覧 ] 正の数 負の数 [ 負の数 ] 次の文章中の ( ) に適語を入れよ () +5 や+8 のような 0 より大きい数を ( ) という () - や-7 のような 0 より小さい数を ( ) という
<82D282A982C1746F95F18D908F57967B95B E696E6464>
1 2 (90cm 70cm 2015) 3 (68cm 28cm 30cm 12kg 2015) (77.5 109.5cm 2015) 4 (22cm 50cm 50cm 4.6kg 2015) (45cm 62.5cm 2015) (47.4cm 62.5cm 2014) 5 (28.5cm 23.5cm) (45cm 62cm 2015) (97cm 107cm 2015) 6 7 8 9
180 140 22
21 180 140 22 23 25 50 1 3 350 140 500cm 600 140 24 25 26 27 28 29 30 31 1/12 8.3 1/15 6.7 10 1/8 12.5 1/20 140 90 75 150 60 150 10 30 15 35 2,000 30 32 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 % 100 50 33.3
6 12 10661 93100 227213202 222208197 85kg cm 20 64.521 106856142 2 1 4 3 9767 100 35 cm 7747 208198 90kg 23 5828 10661 93100 cm 227213202 10639 61 64.521 85kg 78kg 70kg 61 100 197204.5 cm 15 61
講義「○○○○」
講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数
スライド 1
都市環境計画 都市環境計画のための 調査 分析 調査 分析手法の概論分析 ( 主に多変量解析 ) の概論 試験想定問題 多変量解析手法について以下のキーワードを用いて説明せよ 定量データ ( 量的データ ), 定性データ ( 質的データ ) 目的変数 ( 従属変数 ), 説明変数 ( 独立変数 ), 重回帰分析, 判別分析, 因子分析, 数量化 Ⅰ 類, 数量化 Ⅱ 類, 数量化 Ⅲ 類 利用者の利用実態や評価構造の解明等に関する研究
主成分分析 -因子分析との比較-
主成分分析 - 因子分析との比較 - 2013.7.10. 心理データ解析演習 M1 枡田恵 主成分分析とは 主成分分析は 多変量データに共通な成分を探って 一種の合成変数 ( 主成分 ) を作り出すもの * 主成分はデータを新しい視点でみるための新しい軸 主成分分析の目的 : 情報を縮約すること ( データを合成変数 ( 主成分 ) に総合化 ) 因子分析の目的 : 共通因子を見つけること ( データを潜在因子に分解
ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル
時系列分析 変量時系列モデルとその性質 担当 : 長倉大輔 ( ながくらだいすけ 時系列モデル 時系列モデルとは時系列データを生み出すメカニズムとなるものである これは実際には未知である 私たちにできるのは観測された時系列データからその背後にある時系列モデルを推測 推定するだけである 以下ではいくつかの代表的な時系列モデルを考察する 自己回帰モデル (Auoregressive Model もっとも頻繁に使われる時系列モデルは自己回帰モデル
相関係数と偏差ベクトル
相関係数と偏差ベクトル 経営統計演習の補足資料 07 年 月 9 日金沢学院大学経営情報学部藤本祥二 相関係数の復習 r = s xy s x s y = = n σ n i= σn i= n σ n i= n σ i= x i xҧ y i തy x i xҧ n σ n i= y i തy x i xҧ x i xҧ y i തy σn i= y i തy 式が長くなるので u, v の文字で偏差を表すことにする
製造ータの因果分析 | 野中 英和氏(TDK株式会社)
E3 水分 硬度 E4 D2 F2 F3 D3 製造データの因果分析 V999 F1 D1 E1 中間粘度 SEMとグラフィカルモデルを使った製造データの要因解析 完成粘度 TDK 株式会社 品質保証部 野中英和 1 製造データの特徴 製造工程でデータを取る主目的は 管理状態 であることを確認するため 2 製造データの特徴 安定した工程で採取される 製造データは動いていないことが多い 動いていないデータは安定した工程の証拠
因子分析
因子分析 心理データ解析演習 M1 枡田恵 2013.6.5. 1 因子分析とは 因子分析とは ある観測された変数 ( 質問項目への回答など ) が どのような潜在的な変数 ( 観測されない 仮定された変数 ) から影響を受けているかを探る手法 多変量解析の手法の一つ 複数の変数の関係性をもとにした構造を探る際によく用いられる 2 因子分析とは 探索的因子分析 - 多くの観測変数間に見られる複雑な相関関係が
Microsoft PowerPoint - 基礎・経済統計6.ppt
. 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別
資料
2 操作マニュアル vol.4 多変量解析 5th Edit. 本マニュアルは Cross Finder が随時更新されるため 記載内容と実際の画面が異なる場合があります 目次 8. 多変量解析... 2 8.0 分析メニュー... 3 8.1 コレスポンデンス分析... 4 8.2 ポートフォリオ分析... 7 8.3 BSA 分析... 11 8.4 PSM 分析... 15 8.5 因子分析...
切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (
統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない
スライド 1
データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える
EBNと疫学
推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定
Ecel 演習問題 Work Shee 解答 第 章 Ecel 演習問題 WorkShee 解答 問題 - 4 8 7 転置行列 4 8 7 TRANSPOSE( ) 問題 - X.6 4 4.8 8 4.9 6. 7 48 8. X 転置行列 4 8 7 4 6 48 TRANSPOSE( ).6 4.8.9. 8. 問題 -.6 4 4.8 8 y.9. 7 8. 転置行列 4 8 7 TRANSPOSE(
Microsoft Word - lec_student-chp3_1-representative
1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )
Microsoft PowerPoint ppt
情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています
Microsoft PowerPoint - H17-5時限(パターン認識).ppt
パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を
JUSE-StatWorks/V5 活用ガイドブック
4.6 薄膜金属材料の表面加工 ( 直積法 ) 直積法では, 内側に直交配列表または要因配置計画の M 個の実験, 外側に直交配列表または要因配置計画の N 個の実験をわりつけ, その組み合わせの M N のデータを解析します. 直積法を用いることにより, 内側計画の各列と全ての外側因子との交互作用を求めることができます. よって, 環境条件や使用条件のように制御が難しい ( 水準を指定できない )
第4回
Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値
Excelによる統計分析検定_知識編_小塚明_1_4章.indd
第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,
次に Excel のメニューから 挿入 タブをクリックし 表示されたメニュー内の グラフ にある 折れ 線グラフ のボタンをクリックする するとサブメニューが表示されるので 左上の 折れ線 を選択する 挿入 メニューの グラフ クリック後 シート上の折れ線が追加される ここで 2 本グラフ があるの
Excel によるグラフ作成 この回では Excel を用いたグラフ作成の演習を行う 新聞記事等で利用されているような一般的なグラ フを題材にし Excel に備わっているグラフ作成機能を知る 1. 課題の確認 いくつかのグラフの例を参考に Excel の機能を用いて再現する 利用するソフトウェア Microsoft Excel 2016 Excel のグラフ機能は バージョンによって大きく異 なる
Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]
R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ
Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt
重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?
回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)
回帰分析の用途 実験計画法の意義 グラフィカルモデリングの活用 早稲田大学創造理工学部 経営システム工学科 永田靖, The Institute of JUSE. All Rights Reserved. 内容. 回帰分析の結果の解釈の仕方. 回帰分析による要因効果の把握の困難さ. 実験計画法の意義 4. グラフィカルモデリング 参考文献 : 統計的品質管理 ( 永田靖, 朝倉書店,9) 入門実験計画法
コレスポンデンス分Ⅵコレスポンデンス分析とは コレスポンデンス分析は, 多変量解析の 数量化 Ⅲ 類 と同様の手法です 行の要素と列の要素を使って数量化するとするという点で, 数量化 Ⅲ 類と基本的に同じなのですが, 数量化理論の場合は集計前のオリジナルデータから処理していくのに対し, コレスポンデ
コレスポンデンス分析Ⅵ コレスポンデンス分析 ブランドイメージや商品評価を問う調査では, マトリクス設問 ( 例えば表頭に評価項目, 表側にブランド名 ) がよく利用されます その集計データを基に, ブランドと質問項目との相関関係をビジュアルに表現できる手法が コレスポンデンス分析 です Q あなたは, 次の4 種類の商品について, どのようなイメージをお持ちですか 下の中から, あてはまるも全ての
不偏推定量
不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)
Ecel で学ぶ 多変量データ処理入門 坂元保秀 まえがき 本テキストは, 種々の分野で収集された多変量データを Mcosof Ecel を用いて処理する方法を述べたものである. 特に, 収集した多変量データを処理するために Sofwae がなく断念した, また Sofwae を購入するまでに至らなかった等, 初期の目的を達成できなかったとの意見を聞いたことがあり Ecel の基本関数を用いて解析を試みた.
主成分分析 + 重回帰分析 a.2 変数群に対して, 以下のような手順を実行 ( 多変数群 ) では,2 変数群を組み合わせて実行 ) 説明変数群の主成分分析 2 基準変数群の主成分分析 3 説明変数群における 個の主成分得点に対して, 基準へ数群における主成分得点のすべてを用いて重回帰分析を反復
正準相関分析についての解説 0. 判別分析 (discriminant analysis) 多変量のデータを用い, 重みづけた説明変数 ( 独立変数 ) を合成して, 個々人の所属する集団を分ける基準変数 ( 従属変数 ) を予測 ( 判別 ) する多変量解析法を, 判別分析と総称する. 例 : ある患者に対する多種類の検査結果を総合して ( 説明変数 ), どのような病気かを診断する ( 基準変数
データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習
データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習 ロジスティクス回帰 基本的には重回帰分析のモデルと考え方は似ている = 1 1+ ( ) 目的変数 = 係数 説明変数 + 定数 この式をグラフ化すると y は 0 1 に収まる ( シグモイド関数 ) トレーニングデータから確率を最大となる地点をもとめ それぞれの係数を求める
Microsoft PowerPoint - 資料04 重回帰分析.ppt
04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit [email protected] http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline
初めてのプログラミング
Excel の使い方 2 ~ 数式の入力 グラフの作成 ~ 0. データ処理とグラフの作成 前回は エクセルを用いた表の作成方法について学びました 今回は エクセルを用いたデータ処理方法と グラフの作成方法について学ぶことにしましょう 1. 数式の入力 1 ここでは x, y の値を入力していきます まず 前回の講義を参考に 自動補間機能を用いて x の値を入力してみましょう 補間方法としては A2,
Probit , Mixed logit
Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,
第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均
第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差
Microsoft Word - SPSS2007s5.doc
第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では
PowerPoint プレゼンテーション
1 01 Visual C# 2010 を使ってみよう BMI 計算プログラム 1 Visual Studio 2010 の起動 1 2 画面左下 タスクバーの左端にある スタートボタン をクリック 表示されたメニューにある すべてのプログラム をクリック 2 1 3 4 メニューから Microsoft Visual Studio 2010 のフォルダを探して これをクリック フォルダが展開されて
やすだ社会学研究法 a( 2012 年度秋学期担当 : 保田 ) クラスター分析 ( 1): 考え方 クラスター分析の目的と魅力クラスター分析 ( cluster analysis) は いくつかの変数から構成される多数のケースを類似性の高いグループ ( クラスター ) にまとめる 分類 のための技
やすだ社会学研究法 a( 2012 年度秋学期担当 : 保田 ) クラスター分析 ( 1): 考え方 クラスター分析の目的と魅力クラスター分析 ( cluster analysis) は いくつかの変数から構成される多数のケースを類似性の高いグループ ( クラスター ) にまとめる 分類 のための技法である 人間は 多くの場合 最終的に何らかのグループ枠組みで物事を理解しようとする ( 例 : この人の性格は
. 角の二等分線と調和平均 平面上に点 を端点とする線分 と を重ならないようにとる, とし とする の二等分線が線分 と交わる点を とし 点 から に垂直に引いた直線が線分 と交わる点 とする 線分 の長さを求めてみよう 点 から に垂直な直線と および との交点をそれぞれ, Dとする つの直角三
角の二等分線で開くいろいろな平均 札幌旭丘高校中村文則 0. 数直線上に現れるいろいろな平均下図は 数 (, ) の調和平均 相乗平均 相加平均 二乗平均を数直線上に置いたものである, とし 直径 中心 である円を用いていろいろな平均の大小関係を表現するもっとも美しい配置方法であり その証明も容易である Q D E F < 相加平均 > (0), ( ), ( とすると 線分 ) の中点 の座標はである
untitled
1 211022 2 11150 211022384 3 1000 23% 77% 10% 10% 5% 20% 15% 40% 5% 3% 8% 16% 15% 42% 5% 6% 4 =1000 = 66 5 =1000 = 59 6 52%(42% 1000 7 56% 41% 40% 97% 3% 11%, 2% 3%, 41 7% 49% 30%, 18%, 40%, 83% =1000
コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx
コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 http://cobayasi.com/jm/6th/6th.pdf /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx 今日の学習要点 ( テキスト P152-167) IF 関数の使い方 IF 関数による条件判定 複合条件による判定 順位付け (RANK.EQ)
二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株
二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株式会社 NTT データ数理システム Copyright 2013 NTT DATA Mathematical
1.民営化
参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方
