Microsoft PowerPoint 統計教育.pptx

Similar documents
Microsoft PowerPoint と2011年度統計入門 [互換モード]

2 成蹊大学経済学部論集第 43 巻第 2 号 (2012 年 12 月 ) 験は1 変数の基本統計量, 期末試験はそれを応用した相関と単回帰分析に加えて分割表と範囲が広い と講義でアナウンスしているにもかかわらず, 意外と中間の成績が良かったので欠席しても大丈夫と考える学生が何らかの理由で増えこと

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft Word - mstattext03.docx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

ビジネス統計 統計基礎とエクセル分析 正誤表

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

Probit , Mixed logit

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - 補論3.2

Microsoft Word - mstattext02.docx

統計的データ解析

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな


memo

Medical3

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

講義「○○○○」

SHUICHI SHINMURA

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - SPSS2007s5.doc

MedicalStatisticsForAll.indd

情報システム評価学 ー整数計画法ー

スライド 1

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

狭山デポ様IBM移設予定機器 _ppt [Compatibility Mode]

Microsoft PowerPoint - Sugi20130

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

Medical3

Microsoft Word - 保健医療統計学112817完成版.docx

経済統計分析1 イントロダクション

1.民営化

日心TWS

 

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

PowerPoint プレゼンテーション

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

SAP11_03

Microsoft PowerPoint - ch04j

Microsoft Word - å“Ÿåłžå¸°173.docx

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

Microsoft Word - Time Series Basic - Modeling.doc

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

相関分析・偏相関分析

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

カイ二乗フィット検定、パラメータの誤差

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

情報工学概論

スライド 1

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

PowerPoint Presentation

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Microsoft Word - 計量研修テキスト_第5版).doc

13章 回帰分析

Microsoft PowerPoint - ch03j

正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 220

基礎統計

Microsoft Word - reg2.doc

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

因子分析

technews2012autumn

EBNと疫学

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

スライド 1

Microsoft PowerPoint - 10.pptx

Microsoft Word - Stattext13.doc

[1] の問題は四分位数の計算方法を知っているだけでは解けず, 四分位数や箱ひげ図の意味がわかり, また,2 回目とのデータの比較について箱ひげ図からわかることの判断といったことができるかどうかが問われていた しかも (2) と (3) はそれぞれ選択肢を 4 個と 2 個答えるが, それぞれ完答を

3章 度数分布とヒストグラム

Microsoft Word - 教育経済学:課題1.docx

ANOVA

040402.ユニットテスト

Microsoft Word - appendix_b

スライド 1

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - Econometrics pptx


Microsoft PowerPoint - データ解析発表2用パワポ

横浜市環境科学研究所

重回帰式 y= x x 2 重症度 5 TC TC 重症度

不偏推定量

データ解析

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

回帰分析 重回帰(1)

Transcription:

合否判定できない判別分析の総括 分散共分散行列による LDF と QDF の使命の終焉ー 成蹊大学経済学部新村秀一 1. はじめに 判別分析は,Fisher[1] が 2 群の分散比の最大化から LDF( 線形判別関数 ) を定式化したが, 正規分布の対数尤度から同じ LDF がスマートに再定義される. 統計ソフトに取り入れやすい 分散共分散行列から,LDF や QDF さらにマハラノビスの汎距離を用いた多群判別. 品質管理の MT 理論. ゲノム判別 線形分離可能なデータを認識できない. 合否判定できないことはすぐに確認できる. 判別規則の単純さに隠れて多くの問題が隠蔽 y i *f(x)>0 class1/class2 に判別, y i *f(x)<0 class1/class2 に誤判別 判別境界上のケースの扱いは未解決. MNM (Minmum Number of Misclassification) 基準による最適線形判別関数 (OLDF) で解消. 分散共分散による判別分析の問題 2 群が多次元正規分布し分散共分散行列が等しいと仮定すれば, 分散比最大化基準による LDF が, 容易に 2 群を表す正規分布 N(m 1,s 1 ) と N(m 2,s 2 ) の対数尤度で定式化. 2 群の分散共分散行列による判別手法 2 群の分散共分散行列が等しい場合, LDF:f(x)={x (m 1 +m 2 )/2} 1 (m 1 m 2 ) 2 群の分散共分散行列が等しくない場合,2 次判別関数 (QDF) f(x)=x ( 2 1 1 1 ) x/2+(m 1 1 1 m 2 2 1 )x+c マハラノビスの汎距離から, 多群判別や品質管理の MT 理論 D=SQRT ((x m) 1 (x m)) この式に重大な問題が見過ごされてきた! 試験の合否判定を, 得点を説明変数として QDF で判別すると, 合格群の全てが不合格群に誤判別される理由が解明できた 試験の合否判定を大問 4 問で行い合格最低点を 50 点 F=T1+T2+T3+T4 49.5 で,f>0 なら合格,f<0 なら不合格 発表の概要 2010 年から 2012 年まで 3 年間行っていた 統計入門 のと試験 (10 択 100 問の試験,4 個の大問に分類 ) の総合報告 統計家は, 大学の試験のデータを分析し,FD に貢献できる 合格得点の 3 水準 (10%,50%,90% 点 ) で合否判定 大問の合否判定を,OLDF, ロジスティック回帰,LDF, QDF,SVM で行う LDF と QDF は, 合否判定できない LDF の誤分類確率は [2.3,16.7],QDF は [0.8,10.8] QDF は, 小問の合否判定で合格群すべてが不合格群に誤判別される理由

2. 単純な判別規則と判別分析の問題点 (1) Fisher の仮説の問題 かつてはFisherの仮説を満たさないデータにLDFを適用してはいけないという研究者 多次元正規性の検定はできていない 現実のデータはこの仮説を満たすものは少ない 医学診断で群の平均は典型症例でない (2) 判別超平面上のケースの帰属 f(x i )=0 のケースをどちらに判別するかは未解決 (3) 標本誤分類確率と母誤分類確率の関係 Miyake & Shinmura[18] 参照 (4) 3 つの判別境界と誤分類数の問題 判別境界は 3 つの異なった決め方 基本は,2 群が正規分布 N(m 1,s 1 ) と N(m 2,s 2 ) と考えて対数尤度 (log(n(m 1,s 1 )/N(m 2,s 2 )) が 0 になる判別境界. しかし判別境界を動かすと, 得られた誤分類数より小さなものが簡単に得られることが多い. 事前確率とリスク概念で, 正規分布を修正. ケース数 (n 1,n 2 ) に比例させた事前確率で対数尤度を修正 :log(n 1 N(m 1,s 1 )/( n 2 N(m 2,s 2 ))). 医学診断で異常群を正常群に間違う危険性を勘案し, リスク (r 1,r 2 ) で修正 : (log(r 1 n 1 N(m 1,s 1 ) /(r 2 n 2 N(m 2,s 2 ))). 正規分布を事前確率で修正したものを基本とすべき (5)MNM の正当性 135 個の異なった判別モデルの 100 重交差検証法 LDF は 120 個, ロジスティック回帰は 102 個の平均誤分類確率が改定 IP OLDF より悪い [12]. (6) MNM=0 を認識できない問題点 線形分離可能という専門用語が統計理論にない LDFやQDFはMNM=0の空間を認識できない (7) 誤分類数と判別係数の 95% 信頼区間 判別係数は定数項が正と0と負の3つの異なった構造 MNMが最少な最適凸体の内点を判別係数とすれば, 判別分析の問題が解明 (8) 合否判定できない問題 3. 試験の合否判定 試験の合否判定は, 自明な線形分離可能な判別が可能 50 点以上を合格とする場合 :y=t1+t2+t3+t4 49.5で y>0であれば合格,y<0であれば不合格 しかし,LDFやQDFは合否判定できない 誰もがすぐに手に入るMNM=0の良質な研究データ 大学の統計研究者は, 積極的に試験データの統計分析を行うことで,FD 活動に貢献できる [13]. 統計入門で, 正規分布表が意外と新入生に難しい 大問で変数選択を行えば, 設問の難易度がある程度分かる

週 2010 年 (2012 年度 ) 2011 年 1 PowerPoint で概論同左 2 最頻値, 中央値, 平均値 同左 3 範囲, 四分位範囲, SD,CV 同左 4 学生データの解釈 同左 5 正規分布同左 6 自由度,SE,t 分布相関係数 7 試験試験 8 相関係数 9 回目 9 Excel で相関の計算 10 回目 10 単回帰分析 12 回目 11 単回帰分析試験 12 分割表と独立性の検定 13 分割表と独立性の検定 14 まとめ 3.1 授業の概要 統計の入門科目として, 基本統計量, 相関, 単回帰, 分割表 4 件のデータで統計量を説明, Excelで相関と単回帰分析の計算, JMPで実際の出力の解釈 2011 年は, 電力節減のため11 週 試験は10 択 100 問のマークセンス試験 試験実施後, 得点と統計分析した内容を学生にフィードバック 表 2 4 個の大問 大問試験試験 内容得点内容得点 T1 基礎統計量 29 統計量の筆算 26 T2 統計量の筆算 12 相関と回帰 30 T3 正規分布 19 分割表 21 T4 JMP の解釈 40 JMP の解釈 23 100 個の小問と4 個の大問で, 試験の質の評価を行う. 実際の合格最低点は10% 点であるが,50% 点と90% 点で継続分析 各水準ごとに変数選択法とMNM=0になる最小設問を調べることで, 設問の難易度が分かる 15 試験 3.2 2012 年の欠席者増大の影響の分析 (1)3 年間の成績評価 2 年間の経験を踏まえ, 成績の上昇を期待 試験以降欠席が増える 140 人中, 欠席者が40 人から60 人に増えつずける 例年は, 試験後に40 人に増え, 減っていく 得点分布が2 峰性に? 結論 2010 年より悪い 相関, 単回帰, 分割表より 2010 2011 2012 0% 31 25 21 10% 48 42 37 中 50% 66 61 63 間 90% 82 79 78 100% 93 88 88 平均 65.1 56.1 58.8 0% 22 26 20 10% 40 43 41 期 50% 60 60 58 末 90% 82 81 81 100% 91 99 95 平均 59.3 57.1 58.8 r 0.54 0.7 0.51 2010 年 : 正解と無回答 2010 年 : 正解と無回答 R2 0.29 0.49 0.26

評価 1( + =200 点 ) と評価 2( + + 宿題 =230 点 ) を 5 段階にした分割 2010 年度のグラフ との散布図未受験者と, 得点変動の激しい学生 2011 年の分割表 : 上位は 1 ランク落ち散布図 : 未受験以外外れ値なし (3) 分割表による評価の変動の分析 2011 年 : 対角線上が多い 2012 年 : 上位からの転落 2012 年度との得点分布 の最頻値 の最頻値

2012 年の成績上位 2012 年の成績下位群 4. 大問と小問による合否判定 10 択 100 問の小問を,4 個の大問にまとめる の計算は容易である. 正規分布が難しいことが分かる の計算は難しい 2010 年と 2011 年は分割表が時間不足で未消化 研究では,10% 点,50% 点,90% 点で合否判定 大問試験試験 4.1 大問の分析 3 水準の合否判定で, 大問の難易度と合否判定に必要 / 不要がある程度説明可 最適線形判別関数とロジスティック回帰が合否判定できる次元で,LDFとQDFは合否判定できない. 2012 年の10% 点のQDF 以外, LDFとQDFは合否判定できない. 10% 50% 90% 内容得点小問番号内容得点小問番号 2010 P MNM Logi LDF QD P MNM Logi LDF QD P MNM Logi LDF QD 4 0 0 9 2 4 0 0 3 6 3 0 0 20 10 T1 基礎統計量 29 1-8,21-41 計算 26 1-26 T2 計算 12 9-20 相関と回帰 30 27-56 T3 正規分布 19 42-60 分割表 21 57-77 T4 JMPの解釈 40 61-100 JMPの解釈 23 78-100 2011 2012 2010 2011 2012 3 0 0 9 10 4 0 0 3 3 3 0 0 13 5 2 0 0 1 1 4 0 0 7 5 4 0 0 10 3 4 0 0 5 2 4 0 0 4 5 4 0 0 4 13 4 0 0 16 4 4 0 0 4 5 4 0 0 5 12 4 0 0 9 3 4 0 0 3 3 4 0 0 4 1

の大問の分析 ( 上 :2010, 中 :2011, 下 :2012) 10% 点 :T3 の正規分布が難しい,2012 年は T4 の JMP の解釈だけで合否判定 50% 点 :2010 年と 2011 年は T2 の計算は不要, 2012 年は T3 の正規分布は不要 90% 点 :2010 年と 2011 年は T2 の計算と T1 の基礎統計量は不要 P Var MNM Logi LDF QDF Var MNM Logi LDF QDF Var MNM Logi LDF QDF 1 T4 6 9 11 11 T4 16 16 16 16 T3 10 27 24 24 2 T2 2 6 11 9 T3 9 10 12 12 T4 5 10 20 11 3 T1 1 3 8 5 T1 2 2 5 6 T1 0 0 20 10 4 T3 0 0 9 2 T2 0 0 3 6 T2 0 0 20 11 1 T2 9 17 15 15 T4 9 9 9 9 T3 6 7 14 14 2 T4 4 9 11 9 T1 4 4 5 7 T4 1 1 14 6 3 T1 0 0 9 10 T3 1 2 3 3 T1 0 0 13 5 4 T3 0 0 9 11 T2 0 0 3 3 T2 0 0 14 9 1 T 4 4 8 6 6 T 4 12 12 14 12 T 3 8 30 12 12 2 T 2 0 0 1 1 T 1 6 5 9 8 T 1 5 12 9 9 3 T 1 0 0 1 1 T 2 3 4 8 8 T 4 3 3 10 3 4 T 3 0 0 1 0 T 3 0 0 7 5 T 2 0 0 10 3 の大問の分析 10% 点 :2010 年は T3 の分割表,2011 年と 2012 年は相関と回帰が不要 50% 点 :T3 の分割表,T1 の計算,T4 の JMP が不要 90% 点 :T1 の計算が不要 p Var.MNM Logi LDF QDF Var.MNM Logi LDF QDF Var.MNM Logi LDF QDF 1 T1 10 27 13 13 T2 17 17 19 19 T3 10 19 10 14 2 T2 5 7 8 10 T4 12 13 13 15 T2 3 9 6 6 3 T4 4 8 6 6 T1 5 6 8 9 T4 2 4 4 4 4 T3 0 0 5 2 T3 0 0 4 5 T1 0 0 4 13 1 T1 8 28 22 22 T2 17 17 17 17 T4 6 22 6 6 2 T4 4 7 7 12 T3 11 12 16 12 T2 3 5 5 7 3 T3 2 5 15 8 T4 4 5 9 8 T3 1 1 5 3 4 T2 0 0 16 4 T1 0 0 4 5 T1 0 0 5 12 1 T1 6 13 8 10 T2 19 19 19 19 T2 7 20 8 7 2 T4 3 10 7 7 T3 9 10 15 15 T3 4 6 7 6 3 T3 2 7 9 6 T1 3 4 10 10 T4 2 6 3 4 4 T2 0 0 9 3 T4 0 0 3 3 T1 0 0 4 1 4.2 小問 100 問の分析 年度 P MNM Logi LDF QD P MNM Logi LDF QD P MNM Logi LDF QD 2010 6 0 0 2 1 12 0 0 2 4 13 0 1 4 13 96 0 0 0 109 96 0 0 0 61 96 0 0 0 13 4.3 変数選択変数選択法は, 線形分離可能なデータで問題がある. 10 点 :24 個中 19 個がより大きい次元を選ぶ 50% 点 : 24 個中 17 個がより大きい次元を選ぶ 90% 点 : 24 個中 12 個がより大きい次元を選ぶ 2011 12 0 0 2 107 15 0 0 3 6 9 0 0 6 9 10% 50% 90% 98 0 0 0 107 98 0 0 0 61 98 0 0 0 9 F Cp AIC BIC MNM F Cp AIC BIC MNM F Cp AIC BIC MNM 2012 6 0 0 7 114 19 0 0 0 3 15 0 0 0 12 100 0 0 0 114 100 0 0 0 67 100 0 0 0 12 2010 12 0 0 5 111 12 0 1 4 4 11 0 1 6 13 2010 2010 2011 2011 2012 2012 30 4 22 11 6 52 25 25 8 12 28 5 15 8 13 48 29 26 17 12 28 5 19 14 12 22 5 15 8 11 99 0 0 0 111 99 0 0 0 62 99 0 0 0 13 2011 8 0 0 4 4 13 0 0 6 7 8 0 0 2 12 97 0 0 0 110 97 0 0 0 62 97 0 0 0 12 2012 10 0 0 1 115 10 0 0 5 4 9 0 0 6 12 97 0 0 0 115 97 0 0 0 63 97 0 0 0 12 42 10 19 10 12 32 4 21 10 15 19 2 13 5 9 38 8 23 14 8 48 21 28 15 13 22 1 15 7 8 43 25 30 15 6 40 14 22 15 19 46 9 15 8 15 64 11 20 8 9 35 7 22 13 10 45 2 12 8 9

4.4 QDF が合格群を不合格と誤判別する現象 小問 100 問を主成分分析し, 第 1 主成分と第 2 主成分で, スコアプロットを描く. 90% 点,50% 点,10% 点で学生を第 1 群から第 4 群に分ける. なぜ第 4 群の成績の悪い学生の分散が大きいのか? なぜ,90% 点の合格群が 10% 点の不合格群に誤判別されるのか? 50% 点の合否判定 90% 点の合否判定 4.5 QDF が合格群の全てを誤判別する理由と判別理論の修正 LDF や QDF は, 計算式中に分散共分散行列の逆行列を含む QDF と正則化法 : 分散共分散行列の対角要素を修正することで, ダーティーな判別に対応 単に一定値をとる変数に N (0,10 6 ) を加えれば良い. 2 群の値が同じ 2 群が別の一定値 ( 判別に重要 ) 一方が同じで, 他方がばらつく ( 判別に重要 ) LDF QDF 平均の差 の検定 省く省く省く 省く省く省く 計算 合格群を不合格群に誤判別 計算 SPSS 省く省く省く p VAR MNM pldf pqdf 修正 VAR MNM pldf pqdf 1 x85 10 14 14 14 x92 12 12 12 2 x15 6 14 114 28 x42 8 8 12 3 x68 5 8 114 28 x21 5 5 12 4 x47 3 8 114 28 x54 4 8 12 5 x7 1 4 114 9 x65 1 3 12 6 x32 0 5 114 3 x100 1 3 12 7 x20 0 3 114 0 x83 1 3 12 14 x98 3 114 x1 1 1 12 15 x5 1 114 x62 0 1 12 16 x1 0 114 x3 1 12 18 x38 114 x60 0 12 19 x6 114 x96 12 20 x89 114 x22 12 21 x100 114 x40 12 2013 年のの 10% と 90% 一定値をとる設問に N(0,10 9 ) を加えるだけで解決 しかし, 分散共分散行列の ( 対角要素 ) の修正という研究スタイルを変えず データがばらつかない, ことを認めるべき 90% 点は, X92(t=16.0,12/34), X65(t=12.2,12/48), X83(t=7.85,12/72)

5. 終わりに 判別分析に関する多くの問題は, 最適線形判別関数で全て解決 [12]. 試験の合否判定データ 良質なMNM=0の研究データ 大問による合否判定で,MNM=0になる設問と不要な設問で, 試験の質や学生の理解度が分析. 統計入門のような入門科目の簡単な設問の場合, 100 問中 6 問ぐらいで合否判定可. 入試データの統計分析をなぜ行わないのか? 大学教育に, 統計家は積極的にかかわろう. 文献 [1]Fisher, R.A. (1936). The Use of Multiple Measurements in Taxonomic Problems, Annals of Eugenics, 7, 179 188. [2] Firth,D.(1936).Bias reduction of maximum likelihood estimates. Biometrika, 80,27 38. [3]Flury,B. & Rieduyl, H. (1988). Multi variate Statistics: A Practical Approach, Cambridge University Press, Cambridge. [4] Shinmura,S.(2000). A new algorithm of the linear discriminant function using integer programming, New Trends in Probability and Statistics, 5,133 142. [5] Shinmura,S. (2011). Beyond Fisher s Linear Discriminant Analysis New World of Discriminant Analysis,ISI2011 Proceedings,1 6. [6] 新村秀一, 三宅章彦 (1983). 重回帰分析と判別解析のモデル決定 (1) 19 変数をもつ CPD データの多重共線性の解消, 医療情報学,3/3,507 124. [7] 新村秀一 (1998). 数理計画法を用いた最適線形判別関数, 計算機統計学,11/2, 89 101. [8] 新村秀一 (2004).JMP 活用統計学とっておき勉強法. 講談社, 東京. [9] 新村秀一 (2007). JMP による統計レポート作成法. 丸善. [10] 新村秀一 (2007). 数理計画法による判別分析の 10 年, 計算機統計学,20(1/2) 53 94. [11] 新村秀一 (2007).Excel と LINGO で学ぶ数理計画法. 丸善. [12] 新村秀一 (2010). 最適線形判別関数. 日科技連出版社. [13] 新村秀一 (2011). 問題解決学としての統計入門, 第 7 回統計教育の方法論ワークショップ 問題解決力育成を目指した統計教育の方法論,1 10. [14] 新村秀一 (2011). 合否判定データにおける判別分析の問題点. 応用統計学,3,157 173 [15] 新村秀一 (2011). 数理計画法による問題解決法. 日科技連出版社. [16] 新村秀一 (2012).Fisher の判別分析を超えて.2012 年 SAS ユーザー会論文集,349 361. [17] 新村秀一 (1984). 医療データ解析, モデル主義, そして OR. オペレーションズ リサーチ,29 7,415 421. [18] Miyake,A. & Shinmura,S. (1976). Error rate of linear discriminant function, F.T. de Dombal & F.Gremy, editors 435 445, North Holland Publishing Cmpany. [19] 田口玄一 (1999). タグチメソッドわが発想法. 経済界. 東京. [20]Vapnik,V.(1995).The Nature of Statistical Learning Theor.Springer Verlag, 1995. [21] 新村秀一, ユンイエブン (2007).OLDF と SVM の比較研究 (4)- 種々のデータによる SVM との比較, 成蹊大学経済学部論集,37 2,89-119. [22] 新村秀一 鈴木隆一郎 中西克己 (1983). 各種判別手法を用いた医療データ解析の標準化 マンモグラフィによる乳癌の診断. 医療情報学,3 2,38 50.