JAPLA研究会資料 2018/6/16

Similar documents
Microsoft PowerPoint ppt

JAPLA研究会資料 2010/9/ Excel_

Microsoft Word - lec_student-chp3_1-representative

【指導のポイント】

散布度

現代日本論演習/比較現代日本論研究演習I「統計分析の基礎」

untitled

第4回

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

健診の手引き_0707変.indd

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること

win版8日目

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

(Nov/2009) 2 / = (,,, ) /8

2014-9

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - データ解析基礎2.ppt

年生 章資料の活用 ( 基本問題練習 ) 入試問題を解くための準備問題です 1 に適当なことばを入れなさい 資料のとる値のうち, 最大のものから最小のものをひいた差を ア という 度数分布表において, 資料を整理するための区間を階級といい, その幅を 3 右の表は, 生徒 人のある日の睡眠時間を,

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63>

三科目合計の算出関数を用いて各教科の平均点と最高点を求めることにする この2つの計算は [ ホーム ] タブのコマンドにも用意されているが 今回は関数として作成する まず 表に 三科目合計 平均 と 最高点 の項目を用意する 項目を入力する際 適宜罫線などを設定し 分かりやすい表作成を心がけること

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

untitled

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

Microsoft PowerPoint - 基礎・経済統計6.ppt

1. 期待収益率 ( 期待リターン ) 収益率 ( リターン ) には次の二つがあります 実際の価格データから計算した 事後的な収益率 将来発生しうると予想する 事前的な収益率 これまでみてきた債券の利回りを求める計算などは 事後的な収益率 の計算でした 事後的な収益率は一つですが 事前に予想できる

PowerPoint プレゼンテーション

2017年度 京都大・文系数学

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

3章 度数分布とヒストグラム

統計的データ解析

不偏推定量

Medical3

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - apstattext04.docx

情報工学概論

ネットワーク工学演習 解答編 典型的な IP アドレス問題と解答を示す 解き方をよく覚えるように N 科 ある PC がある ネットワークの設定をみると IP アドレスが であり サブネットマスクは である 下記について解答せよ [1]

正誤表(FPT1004)

<4D F736F F D A778F4B8E7793B188C A77816A899C967B2E646F63>

経営統計学

Microsoft Word - Stattext11.doc

平成 28 年度山梨県学力把握調査 結果分析資料の見方 調査結果概況 正答数分布グラフ 分布の形状から児童生徒の解答状況が分かります 各学校の集計支援ツールでは, 形状だけでなく, 県のデータとの比較もできます 設問別正答率 無解答率グラフ 設問ごとの, 正答率や無解答率が分かります 正答率の低い設

PowerPoint プレゼンテーション

ANOVA

線形代数とは

Microsoft Word - t30_西_修正__ doc

3章 度数分布とヒストグラム

stat-excel-12.tex ( ) 2 -countif Excel E4:E10 E4:E10 OK 4. E4:E10 E4:E /1

stat-base [互換モード]

EBNと疫学

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

untitled

Q1. A. Q2. A A IQ35 IQ

モジュール1のまとめ

解析力学B - 第11回: 正準変換

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

Microsoft Word - Stattext07.doc

79 2 [4] X X m X, X m X X < X m X m X X > X m X m


東邦大学理学部情報科学科 2014 年度 卒業研究論文 コラッツ予想の変形について 提出日 2015 年 1 月 30 日 ( 金 ) 指導教員白柳潔 提出者 山中陽子

stat-base_ppt [互換モード]

4 月 東京都立蔵前工業高等学校平成 30 年度教科 ( 工業 ) 科目 ( プログラミング技術 ) 年間授業計画 教科 :( 工業 ) 科目 :( プログラミング技術 ) 単位数 : 2 単位 対象学年組 :( 第 3 学年電気科 ) 教科担当者 :( 高橋寛 三枝明夫 ) 使用教科書 :( プロ

Microsoft Word - mstattext02.docx

,

iR-ADV C2230/C2220 製品カタログ

データ解析

Microsoft PowerPoint - 13基礎演習C_ITプランナー_2StableMatching.pptx

地理情報システム論 外部データとのやりとり レイヤのエクスポートによるシェープファイルの作成金沢区を題材とした操作練習では, すでにマップ上に表示されているレイヤを複製することで, 同一のシェープファイルを, 一方は階級区分図に用い, 他方はチャート表示に用いてオーバーレイ表現

, ,

JAPLA研究会資料 2011/1/29

C#の基本2 ~プログラムの制御構造~

関数の定義域を制限する 関数のコマンドを入力バーに打つことにより 関数の定義域を制限することが出来ます Function[ < 関数 >, <x の開始値 >, <x の終了値 > ] 例えば f(x) = x 2 2x + 1 ( 1 < x < 4) のグラフを描くには Function[ x^

胎児計測と胎児発育曲線について : 妊娠中の超音波検査には大きく分けて 5 種類の検査があります 1. 妊娠初期の超音波検査 : 妊娠初期に ( 異所性妊娠や流産ではない ) 正常な妊娠であることを診断し 分娩予定日を決定するための検査です 2. 胎児計測 : 妊娠中期から後期に胎児の発育が正常であ

家庭における教育

SD SD SD

<8F6F97CD31205B C D>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

代表値

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

Microsoft Word - no13.docx

Microsoft Word - no103.docx

2. 幅優先探索のアルゴリズムの考え方ふつう考えるように順次経路をたどっていくということから 発想を転換する それにはまず 区間経路を列挙することから始める AB, AC, BC, CB, BD, DE, CE, EC, DE, ED, DF, EG そして経路探索とは このような区間を記したカード

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - mp11-02.pptx

3-2 学びの機会 グループワークやプレゼンテーション ディスカッションを取り入れた授業が 8 年間で大きく増加 この8 年間で グループワークなどの協同作業をする授業 ( よく+ある程度あった ) と回答した比率は18.1ポイント プレゼンテーションの機会を取り入れた授業 ( 同 ) は 16.0

今日の話のメインターゲット R を ( 入れてみたが ) 使い方が分からない人 そもそも使ったことが無い人 R の存在を知らなかった人 2

_KyoukaNaiyou_No.4

Boost.Preprocessor でプログラミングしましょう DigitalGhost

データ科学2.pptx

相関係数と偏差ベクトル

Microsoft Word - histgram.doc

DVD DVD

PowerPoint プレゼンテーション

スライド 1

情報システム評価学 ー整数計画法ー

JAPLA研究会資料 2007/4/28

<8F6F97CD32205B C D>

Transcription:

JAPLA 研究会資料 2018/6/16 J で電卓並みの統計ツールを - その 2 - 生まのデータからグラフ表示 さらに偏差値の活用 - 西川利男 統計学を教科書に沿って学ぶというより J をツールとして電卓並みに使って 手軽に統計学をやってみようということで始めている [1] [1] 西川利男 J で電卓並みの統計ツールを- 統計学はなぜ分かり難いのか- JAPLA 研究会資料 2017/12/9 先月の JAPLA の例会では 山本洋一氏より z 値 ( 偏差値 と χ 2 値との数値的関連性指摘の発表があった これに触発されて 今回 私自身もあらためて 偏差値というテーマを見直してみた 1. 生データから 度数分布表 ヒストグラムを作る高度の統計手法を用いる以前に 得られた生まのデータから度数分布表 そしてヒストグラムを作ることがまず必要になる これは 統計適用の第一段階で 計算というよりデータの整理にすぎないが これが思ったより面倒である J はこのような計算以前のこまかい処理が 気軽に行える Excel を使えば いろいろな統計処理計算から きれいな図やグラフが得られるが 大仰な Excel がなくてはお手上げということは あまりにバカげている これに関連して かなり古いが 高橋秀俊先生が 閉じたシステム と 開いたシステム という語で いろいろ書かれている そのなかで 大きすぎる硬いシステムの危険性を警告されている [2] [2] 高橋秀俊 数理の散策 日本評論社 (1974, p.110-121 アメリカ人の大部分は システムのいろいろあるオプションから選択してやることに慣れすぎて 一部の人を除いて自分で創造することを忘れてしまっている そして これがグローバルスタンダード つまり世界中でどこでも行われていると思っている これは いまや日本人にもあてはまりつつある このような考え方 生き方が文明化 近代化として 世界中どこにでも蔓延してきている J でのプログラミングは 冷静に人間性を取り戻すことになる と私は思う - 1 -

岩井 鈴木の統計学の本 [3] p.30 に 課題としてつぎのような ある学年 80 人の IQ 得点のデータがあげられている この値を例として 以後進めていこう [3] 岩井勇児 鈴木真雄 教師のための統計法入門 福村出版 (1989. NB. 度数値 - 粗得点 NB. 岩井 鈴木 統計法入門 p.53 Q. 2-4 DA =: 100 117 92 88 128 101 94 107 107 68 DA =: DA, 116 135 91 103 58 92 105 113 89 94 DA =: DA, 84 97 104 124 94 107 112 90 97 106 DA =: DA, 95 126 109 105 64 119 99 115 95 112 DA =: DA, 102 75 106 81 77 82 110 90 117 109 DA =: DA, 110 133 126 85 87 109 93 100 86 89 DA =: DA, 96 113 82 76 114 111 91 97 107 100 DA =: DA, 90 72 145 132 101 98 102 101 85 114 DB =: : 8 10$DA DB 100 116 84 95 102 110 96 90 117 135 97 126 75 133 113 72 92 91 104 109 106 126 82 145 88 103 124 105 81 85 76 132 128 58 94 64 77 87 114 101 101 92 107 119 82 109 111 98 94 105 112 99 110 93 91 102 107 113 90 115 90 100 97 101 107 89 97 95 117 86 107 85 68 94 106 112 109 89 100 114 まず 階級にわけて 度数分布表をつくる 階級に区切るには データの最大値と最小値を見つけて その間をおよそ 10 段階ぐらいに区切ればよい J では 最大値と最小値はつぎのようにして 求められる max =: ({.@\:{] min =: ({.@/:{] 上の定義は つぎのとおりである 最大値 (max は大から小の順のアドレス (\: を得て その先頭 ({. の値を使う 同様にして 最小値 (min は小から大の順のアドレス (/: で行えばよい - 2 -

計算すると つぎのようになる max DA 145 min DA 58 したがって 145-58 = 87 で 10 段階に区切れば 9 の幅になるが 区切りのよさを考えて 階級の幅を 10 とする つまり 140-149, 130-139,... 50-59 とする さらにこれはそれぞれの中点値 144.5, 134.5,... 54.5 としたほうがよい ある値が どの階級の間隔の間に入るかどうかは 階級の上下で引き算をして 正負の値を調べればよい J の次のような動詞を作って調べた Kyukan =: 50 + 10 * i. 10 test =: 3 : 0 : q =. x. p =. 10 + q P =. p (*@> y. Q =. q (*@> y. (1 = +/"(1 P,. Q # q Kyukan 50 60 70 80 90 100 110 120 130 140 Kyukan test 117 110 Kyukan test 92 90 さらに 度数分布を調べる動詞 tclass を作った tclass =: 3 : 0 4.5 +, > Kyukan test"(1 0 L:0 < y. 上の定義の中で test"(1 0 となっているのは 左引数はランク 1(=ベクトル 右引数はランク 0(=スカラー つまり それぞれの個々の値に対して 実行するためのものである Kyukan test 117, 92 110 90-3 -

つぎのようにして 調べる まず 中点値は Chuuten =:. 4.5 + Kyukan Chuuten 144.5 134.5 124.5 114.5 104.5 94.5 84.5 74.5 64.5 54.5 最初からいくつかの値に対して tclass によりどこに属すかを表形式で調べる Chuuten =/ tclass 100 117 92 88 128 101 94 107 107 68 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 横方向に合計した値はその頻度数を表す +/"(1 Chuuten =/ tclass 100 117 92 88 128 101 94 107 107 68 0 0 1 1 4 2 1 0 1 0 この値を 中点値と対比して表す Chuuten,. +/"(1 Chuuten =/ tclass 100 117 92 88 128 101 94 107 107 68 144.5 0 134.5 0 124.5 1 114.5 1 104.5 4 94.5 2 84.5 1 74.5 0 64.5 1 54.5 0-4 -

全部のデータを用いて 最終的な度数頻度表を作る Freq =: +/"(1 Chuuten =/ tclass DA Table_Freq =: Chuuten,. Freq Table_Freq 144.5 1 134.5 3 124.5 4 114.5 14 104.5 21 94.5 19 84.5 11 74.5 4 64.5 2 54.5 1 この度数頻度 Freq を用いれば ヒストグラムは 前回 [1] 示したように J の plot ルーチンにより 簡単に次のように表示される load 'plot' 'bar' plot. Freq - 5 -

2. 偏差値 = 実効得点 実質得点を求める次に 学校の成績などで使われるいわゆる偏差値について 多少述べたい これは 平均値 標準偏差などのように グループの全体のようすを表す言葉ではない 偏差値に関連する用語として 次の z 値 Z 値が定義されている X mean z std X mean Z 10 * 50 std この Z 値が 一般に偏差値といわれているものである 岩井 鈴木の統計学の本 [3] では Z 得点と名づけられている つまり 学校の試験などの各人の得点は そのままでは 受けた試験の難しさや生徒の出来の良さを反映していない ところが この Z 得点の値は 平均値 標準偏差を考慮した得点といえる さらにこの Z 得点の値は 100 点満点で 標準偏差を 50 としたときの実質の得点だとしてよい 私は偏差値なる用語の代わりに 各人の実効得点 実質得点という語を使ったら良いと思う たとえば実効得点 50 点ならば受験者の真ん中 70 点ならば良い方でその位置もすぐわかる このような意味から もっと活用して良いと思う z 得点と Z 得点を求める J のプログラムは 次のようになる NB. calc. z and Z scores ====================================== NB. 岩井 鈴木 統計法入門 p.53 NB. (mean, stdev hensa raw score => z(z_score, Z(hensa_chi hensa =: 3 : 0 : 'M S' =. x. z =. (y. - M % S Z =. 50 + 10 * ((y. - M % S z,. Z 平均値 標準偏差値を左引数として 生まの得点それぞれの値 ( 右引数 に対する z 得点と Z 得点 ( 偏差値 は 次のように求められる (100.6, 16.44 hensa 144.5 134.5 124.5 2.67032 76.7032 2.06204 70.6204 1.45377 64.5377-6 -

プログラム リスティング mean_std =: 3 : 0 ME =. (+/ > */ L:0 y. % (+/ > {: L:0 y. SD =. %: (+/ > (*/ L:0 (*: L:0 ME -~ L:0 ({. L:0 y. (,L:0 ({: L:0 y. % (+/ > {: L:0 y. ME, SD NB. stat_hensachi.ijs NB. 岩井 鈴木 統計法入門 p.30 Q. 2-4, NB. [7] 偏差値 p. 52-54 Kyukan =: 50 + 10 * i. 10 test =: 3 : 0 : q =. x. p =. 10 + q P =. p (*@> y. Q =. q (*@> y. (1 = +/"(1 P,. Q # q NB. calc. 度数分布表 NB. 岩井 鈴木 統計法入門 p.30 Q.2-4 から表 2-4 NB. tclass 100 117 92 88 128 101 94 107 107 68 NB. 104.5 114.5 94.5 84.5 124.5 104.5 94.5 104.5 104.5 64.5 tclass =: 3 : 0 4.5 +, > Kyukan test"(1 0 L:0 < y. NB. (. 4.5 + Kyukan,. +/"(1 (. 4.5 + Kyukan =/ tclass 100 117 92 88 128 101 94 107 107 68 NB. 144.5 0 NB. 134.5 0 NB. 124.5 1 NB. 114.5 1-7 -

NB. 104.5 4 NB. 94.5 2 NB. 84.5 1 NB. 74.5 0 NB. 64.5 1 NB. 54.5 0 NB. 度数値 - 粗得点 NB. 岩井 鈴木 統計法入門 p.53 Q. 2-4 DA =: 100 117 92 88 128 101 94 107 107 68 DA =: DA, 116 135 91 103 58 92 105 113 89 94 DA =: DA, 84 97 104 124 94 107 112 90 97 106 DA =: DA, 95 126 109 105 64 119 99 115 95 112 DA =: DA, 102 75 106 81 77 82 110 90 117 109 DA =: DA, 110 133 126 85 87 109 93 100 86 89 DA =: DA, 96 113 82 76 114 111 91 97 107 100 DA =: DA, 90 72 145 132 101 98 102 101 85 114 DB =: : 8 10$DA NB. (. 4.5 + Kyukan,. +/"(1 (. 4.5 + Kyukan =/ tclass DA NB. 144.5 1 NB. 134.5 3 NB. 124.5 4 NB. 114.5 14 NB. 104.5 21 NB. 94.5 19 NB. 84.5 11 NB. 74.5 4 NB. 64.5 2 NB. 54.5 1 Kyukan =: 50 + 10 * i. 10 Chuuten =:. 4.5 + Kyukan Freq =: +/"(1 Chuuten = / tclass DA NB. calc. Hensachi - 8 -

NB. 岩井 鈴木 統計法入門 p.53 NB. (mean, stdev hensa raw score => z(z_score, Z(hensa_chi NB. (100.6, 16.44 hensa 144.5 => 2.67032 76.7032 NB. (100.6, 16.44 hensa 144.5 134.5 124.5 NB. 2.67032 76.7032 NB. 2.06204 70.6204 NB. 1.45377 64.5377 hensa =: 3 : 0 : 'M S' =. x. z =. (y. - M % S Z =. 50 + 10 * ((y. - M % S z,. Z - 9 -