PowerPoint プレゼンテーション

Size: px
Start display at page:

Download "PowerPoint プレゼンテーション"

Transcription

1 統計処理の基本 1. データとブラウジング 2. 平均の差の検定 3. 相関と回帰 4. その他の重要な知識

2 1. データとブラウジング

3 有効数字について 表現方法例えば,1200mg/L で,00 が有効数字でないのなら 1.2g/L と表現する ( 一般に, 有効数字 10 3n の指数形式が適切 ) 計算加減 乗除 結果を絶対値の大きい方の有効桁数に合わせる例 ) 最大有効桁位が小数点下第 1 位の場合 = ( 小数点第 2 位まで丸めて計算 ) ( 結果を小数点第 1 位に丸める ) 結果を有効桁の少ない方に合わせる例 ) 最小有効桁数が 2 桁の場合 = ( 有効桁数 s3 まで丸めて計算 ) ( 結果を有効桁数 2 に丸める )

4 数値と誤差 自然現象を測定した数値にはすべて誤差がある したがって すべて統計的に評価する必要がある 正規分布 ( 平均と分散で形が決まる ) モデルを使用 f x = 1 2πσ 2 e * 平均値 μはデータを全部足して例数で割ったもの x μ 2 2σ 2 * 分散 σ 2 は偏差平方和 ( データと平均値の差の二乗の総計,Σ(x i x) 2 = S xx ) を例数で割ったもの ( S xx ) n * 分散の平方根をとると単位がデータと同じになり データの分布を平均値からの距離 ( 標準偏差,σ ) で表現できる ( 平均 ± 標準偏差 ) < 標準偏差はその範囲に分布データの何 % が含まれるかを示す ±1σ は約 68% ±2σ は約 95%> * 平均値の分散はデータの分散を例数で割ったもの ( σ2 n ) * 平均値の分散の平方根をとると単位が同じになり 平均値の分布を平均値からの距離 ( 標準誤差,SE) で表現できる

5 正規分布では 分布の 95% を含む区間は σ の ±1.96 倍 しかし 実際の測定は標本に対して行われるので 誤差 ( 偏り ) のある標本平均値 xを用いて分散を計算することになる したがって 分散の推定値には 平均値の誤差分を加えなければならない σ 2 = S xx n + σ2 n = S xx n 1 ( 不偏分散 ) 分散の式が異なるので 正規分布ではなく 自由度 (n p p は誤差をもつパラメーターの数になる ) によって変化する t 分布となる ( 95% を含む区間が異なる ) 例えば 自由度 60 の時 約 ±2.00 倍となる (t 値 )

6 信頼区間 誤差を含めた数値の評価 数値の信頼区間を求める 測定法の性能指標 CV( 変動係数 :coefficient of variance) を使う CV = SD data 測定値 100 の CV が 5%(0.05) の場合 SD = CV data = = 5 2SD が 10 となるので約 95% の信頼区間 (data ± 2SD) は 90~110 となる 例えば 臨床検査でよく使う項目の CV は 最近では 1% 以下であるが 免疫学的測定法の低値域では CV 10% まで上がることがあるの要注意 測定値 100 が 4 重測定の平均値であれば 信頼区間は data ± 2SE となる ので 95~105 となる ( SE = SD n = 2.5)

7 データの集計 データの分類 * 一意コード (ID 連番など 重複がない) * 一次データ ( 未編集の生データ ) * 二次データ ( 変換や計算後の値 ) * 補足データ ( 単位やコメントなど ) 変数のタイプ * 質的変数 ( 名義尺度, 分類 ) * 量的変数 ( 連続量, 離散量, 順位数 ) 一次データでは, 元の精度を保持すること ( 四捨五入 測定感度以下を 0 にする などをしない ) 欠損値の情報では理由を区別する ( 測定せず 検出されず 測定範囲外 無効値など ) 統計処理前にはデータ浄化 ( エラーチェック, 表現 単位の統一, データの圧縮, など )

8 一意コード質的変数量的変数一次データ :TP, ALB, ZTT, CRP, WBC, St, Seg, Lym 二次データ :GLB, T.Neu, T.Lym 離散量 : 年齢

9 データのブラウジング : 分布を見る 正規分布 対数正規分布 正規分布を前提とした統計処理の場合 正規分布に適合可能な分布は前処理としてデータ変換を行う Box-Cox 変換 x = (xλ 1) λ 0 λ x = log x λ = 0 べき変換分布

10 データのブラウジング : 箱ヒゲ図で見る 4 分位偏差による表現 95% 点など % 点 50 中央値 25% 点 0 AST(U/L) 5% 点など

11 正規分布化 ( 対数変換 )

12 データの関連性のブラウジング : 相関散布図

13 2. 平均の差の検定

14 プロローグそもそも2 群の平均の差は明白 ( ある男女対抗の競技大会で, 平均点の高いチームの勝ちにする, というような場合 ) 知りたいのは, 普遍的な事実 - 母集団での差 ( この競技における平均点は男女どちらが高いのか, という一般的な問題を解く場合 ) 部分的な事実 を用いて 普遍的な事実 を知るためには, 確率論に基づく統計学を利用する この場合 部分的な事実 は 母集団から無作為に取り出した標本であるとの前提 ( 標本理論 ) が必要 さらに 標本は, 比較したいもの以外の因子がすべてランダム化されているかマッチングされていることが前提 ( 例えば 若い男性と高齢の女性との間で性差は論じられない ) ランダム化 < 保証がない > よりはマッチングのほうが現実的?

15 平均の差の検定 方法の原理 標本の平均値間には差があるが, 母集団でも差があるとは限らない ( 大小が逆かもしれない そもそも分からない ) ので 確率的に 差がない という可能性を否定することによって 逆に 観察されている差は一般化できると主張する 差がない可能性を完全に否定することはできないが 一定の基準 ( 危険率 ) を設定して それより小さい場合には, 差があるということを受け入れ それ以上では, 差がないという可能性は捨てないでおこう ( 有意差なし ) とします 危険率をどう決めるかは自由で 研究方法で明記すればいいが 多くの場合 5% 以下とすれば受け入れられるでしょう ( 内容次第ですが ) 注意すべきは 有意差なし が 差がない ということではない! ということ

16 平均の差の検定 具体的な方法 平均値の差がその誤差の 95% を含む区間よりも大きければ, 5% 未満の危険率で差があると判定 差の誤差は それぞれの平均値の分散を加算し (SE A 2 + SE B 2 ) その平方根をとって求める 有意差 = 平均値の差が誤差の 95% を含む区間 ( 誤差の 1.96 倍 ) よりも大 有意差が成立する不等式 μ A μ B > SE A 2 + SE B 標本を用いる場合は 誤差のある標本平均値 xを2つ用いているので 自由度 n 2の t 分布となる 有意差が成立する不等式 x A x B > SE A 2 + SE B 2 t

17 平均の差の検定 具体的な方法 ( つづき ) 実際の t 検定 対応なしで 母分散が等しい ( 分散比で判定 これは怪しい ) とき 不偏分散は S xxa +S xxb n A +n B 2 有意差の式は x A x B > 自由度は n A + n B 2 Sxx A +Sxx B Sxx A +Sxx B n A +n B 2 n + A +n B 2 n A n B t 対応なしで 母分散が等しくない ( 不明の ) とき (Welch 法 ) 式は x A x B > 自由度を近似 (SE A 2 +SE B 2 ) 2 (SE 2 A ) 2 n A 1 +(SE B 2 ) 2 n B 1 SE A 2 + SE B 2 t ( 有効自由度 ) 対応のある場合 式は x (A B) > 自由度は n 1 SE (A B) 2 t

18 平均の差の検定 - 解釈 S 分散 xx は例数が増えてもあまり変わらないが, 平均値の分散は分散を n さらにnで割っているため 例数を増やしていけばどんどん減っていく つまり 例数を増やせば p 値もどんどん小さくなっていく 差がないという可能性もどんどん減っていく Sxx n n 逆に例数が少なすぎても ( 偶然に ) 有意差は出やすくなる 有意差が得られただけでは 単に 差がある とは言えても 意味のある差がある とまでは言えていない したがって 意味のある差がある ことを言いたいのであれば * どの程度の差を 意味あるもの と考えるのか * そのためにはどれだけのサンプル数が適当なのか ということを予め考えておくことが必要

19 平均の差の検定 有意かつ意味のある差 どの程度の差を意味あるもの ( 医学的な有意性 ) とするのかを決める 効果量 d = 意味ある平均の差 / 標準偏差の平均を設定し α = 0.05 ( 第一種過誤確率 ) β = 0.2 ( 第二種過誤確率 )< 検出力 1 β = 0.8 >の時 適当なサンプル数は, n 1 = (1 + n 1 ) ( α 2 のときのz 値 + βのときのz 値 ) 2 n 2 d 2 (n 2 n 1, 片側検定では α 2 α にする ) たとえばコレステロ ル20mg/dLの差を意味あるものとし, 標準偏差が30mg/dLと 50mg/dLの集団を同数用いる場合,d = 20 = ,n 1 = 1 n 2 ここで,α = 0.05 の場合の例数は, n = (1 + 1) ( ) 2 / = / 0.25 = 62.7 したがって63 人ずつがよいということになる この場合 有意差がなければ差がない ( 同等 ) と判断してよい 検出力の設定は研究の目的によって変わるが 0.8( 効果重視 = 通常はこれ ), 0.5( 中 ), 0.2( 低 = 僅かな差でも重視 )

20 群分けによる変動 補足 : 分散分析 データ全体を複数の群に分けた時に 群分けによる変動が それ以外の誤差による変動よりも大きいかどうかを検定する方法 方法 : 分散比の検定 (F 検定 ) 分母は 誤差の分散 ( 群ごとに平均偏差平方和を求めてすべて加え 全データ数 - 群の数 = 自由度で割ったもの ) 分子は 群分けの分散 ( 各群の平均値を用いて偏差平方和を求め 群の数 -1= 自由度で割ったもの ) 平均値に差がなければ分散は等しくなる

21 3. 相関と回帰

22 複数の数値をセットでもつものをベクトルというベクトルは固有の方向を持つベクトル間の方向の関係を相関性という 正相関 ( 同方向 ) 逆相関 ( 逆方向 ) 無相関 ( 直交 ) 通常は相関する成分と無相関の成分に分けられる相関する成分が多いほどベクトルどうしの関連性は強い

23 相関 まずひとつの数値だけを含む数 ( ふつうの数 ) どうしで考えると かけ合わせたものが + になれば同方向 - になれば逆方向 0 になれば直交それぞれ 正相関 負相関 無相関 に対応する 複数の数値の集まりではベクトルどうしのかけ合せで 結果の意味は同じなので ベクトル間の掛け算 ( 内積 ) で相関性を評価できる x = [x 1, x 2, x 3,, x n ] y = [y 1, y 2, y 3,, y n ] x y = x 1 y 1 + x 2 y 2 + x 3 y 3 + +x n y n = x y cos θ ベクトルの方向が同じとき内積は+となる 正相関 ( 全く同じときは cosθ = 1) ベクトルの方向が逆のとき内積は-となる 負相関 ( 完全に逆向きは cosθ = 1 ) ベクトルが直交していると内積は0となる 無相関 (cosθ = 0 ) 内積を絶対値の積で標準化したもの ( ベクトル間の余弦 ) x y x y = cos θ は要素が偏差値の場合に相関係数を表す x = [(x 1 x), (x 2 x), (x 3 x),, (x n x)] y = [(y 1 y), (y 2 y), (y 3 y),, (y n y)]

24 相関分析について - 方法と検定 母集団のモデルを正規分布とする 標本の分布も正規性が必要 標本相関係数は r = S xy S xx S yy = Σ(x i x)(y i y) Σ(x i x) 2 Σ(y i y) 2 <r = xとyの共分散 > xの標準偏差 yの標準偏差 分母と分子で n が消えています 相関係数検定方法の例 : 無相関 0 の信頼限界より外に r があるかどうかを調べる 有意差となる不等式 r > (1 r2 ) n 2 t 標本平均値が x と y に計 2 つあるので 自由度は n 2 となる

25 相関分析について - 回帰式 y = ax + b (a = S xy, b = y a x) S xx 一次線形回帰式とは,x に対応する y が,x の変化に対して直線的に変化するというモデルで, 説明変数 x と応答変数 y ( 因果関係 ) が区別されていなければならない 年齢と体重の回帰式をつくる場合, 年齢を応答変数にすることはできないのは自明 一方, 学力試験で国語と数学の成績の関係をみるような場合は, 相関関係はあっても どちらが説明変数でどちらが応答変数ということは言えない 応答変数を変動させる成分の中で説明変数が寄与する割合は, 決定係数 = r 2 で表現される (r=0.5 なら 0.25 が寄与率で x は y の変動の 25% に寄与していることとなる )

26 回帰式 注意点 1 回帰式を一般化する場合の注意 * 回帰式に代入されて得た値 y の信頼区間は平均値前後で最小となり, 平均値をはずれるほど広がっていく y ± t (1 + 1 n + (x i S xx x) 2 ) Ve ( 信頼区間 95% では t は自由度 n-1,α=0.05 の時の値,Ve: 残差の不偏分散 ) * 回帰式の作成に用いたデータ域をはずれた部分にまで回帰式が有効であるとは限らない ( 定義域内でのみ使用すべき ) * 回帰式の作成に用いたデータに対する過剰適合が生じている 回帰式で逆推定する場合の注意例えば, 濃度別の吸光度を測定した回帰式 ( 検量線 ) では, 吸光度 yから濃度 xを求める ( 逆推定 ) 作業が予定される * x = y i b として求めるのは,r = 1.0の時以外は正しくない a * 正確にはy の信頼区間についての下式をxについて解いてxの区間推定を行う y i ax b t (1 + 1 n + (x i S xx x) 2 ) Ve

27 体重 ( kg) 散布図と回帰直線 95% 信頼区間 信頼区間は周辺で広がる 身長 ( cm) 誤差は y 軸方向のみ (x と y に互換性はない ) 切片は最大化される ( 過剰適合 )

28 回帰式 多変量解析への発展 2 つ以上の説明変数がある場合 応答変数のベクトルは, 互いに独立な ( 軸上にある ) ベクトルの一次結合で表現できる 重回帰式 y = a 1 x 1 + a 2 x 2 + a 3 x 3 + a 4 ただし x 1 x 2 = 0 x 2 x 3 = 0 x 1 x 3 = 0 例えば 赤血球数, フィブリノゲン,γ-globulin の変動が互いに独立とすると 血沈 = -0.2 赤血球数 フィブリノゲン + 20 γ-globulin+ 40 赤血球 フィブリノゲン 血沈 γ-globulin

29 多変量解析のいろいろ supervised 学習系 重回帰分析 複数の説明変数の組み合わせによって応答変数を説明 < 応答変数は量的変数 > 判別分析複数の説明変数を組み合わせて判別 分類のための式を作成する < 応答変数はカテゴリーなどの質的変数 > unsupervised 探索系 主成分分析 既知の変数を用いて ( 隠された ) 未知の応答変数を求める 因子分析既知の変数に対して未知の説明変数 ( 因子 ) による回帰を求める 因子分析 ( 斜交解パターン行列 ) 因子 1 因子 2 因子 3 Albumin Globulin ZTT CRP Neutrophil Lymphocyte クラスター分析複数の変数を関連性の強さ ( 距離など ) によってカテゴリーに分類する < データセットに分類結果は未知で与えられていない >

30 回帰式 関数線形回帰 変数 関数 線形基底関数モデル y i = i=0 ω i φ i (x) φ i (x): 基底関数 ( 多項式 ガウシアン 三角関数 Wavelet など ) 多項基底の場合 φ i x = x i y i = ω 0 + ω 1 x + ω 2 x 2 + 係数の設定法 : 最小二乗法 最尤推定法 過剰適合の防止 : 正則化項 ( ペナルティ項 ) の追加 Lasso 回帰 など

31 一般化線形モデル (GLM) 正規分布以外の分布も扱える線形回帰モデル ( ロジスティック回帰 ポアソン回帰など ) 多重ロジスティック回帰線形回帰を確率 (0~1 の値域 ) で表現する p = e β 0+β 1 x 1 +β 2 x 2 + +β n x n 多項ロジスティック回帰応答変数が多群 (3 値以上 ) の場合 量的変数 質的変数 交差変数 (x 1 x 2 など ) が混在できる! 一般化線形混合モデルサンプルごとに異なる値をとるランダム効果の関数 γ を加えたモデル β 0 + β 1 x 1 + β 2 x 2 + +β n x n + γ 1 + γ 2 +

32 4. その他の知識

33 1 正規分布モデルが利用できない時 データが少なくて分布が不明データが離散的で分布を当てはめ難い などの場合 ノンパラメトリック法を用いる データの数値をそのまま使用せず 順位をつけて 順位数を用いた擬似的な正規分布により検定する方法 比率の差の χ2 検定 t 検定の代わりに Wilcoxson の順位和検定 U 検定分散分析 (ANOVA) の代わりに Kruskal-Wallis 順位和検定 Pearson 相関係数の代わりに Spearman または Kendall の順位相関係数 パラメーター ( 平均 分散 ) で処理できるものをパラメトリック法として区別する ブートストラップ法とジャックナイフ法について 標本から再サンプリングし 分布のパラメーターを推定する方法ブートストラップ法は重複を許した同じケース数の復元サンプリングを繰り返すジャックナイフ法はケースを除きながらサンプリングを繰り返す

34 2 モデルの最適化 ( 最尤推定法と情報量基準 ) 尤度 : 観測されたデータの確率モデルへの適合度各観測データの確率モデルにおける確率の積で計算 最尤推定 : 尤度を最大にするようなモデル ( 確率分布 ) とそのパラメーターを求めること尤度関数 L θ = f x i θ を最大にする θ を求めること ( データ x i は定数扱い ) 実際の計算では 両辺の自然対数をとって ln L θ = ln f(x i θ) 最尤推定は 対数尤度関数を最大 ( 0) にする θ を求めることと等価解析的には対数尤度関数を偏微分した式を 0 とおいて θ を求めるモデルが正規分布の場合 (θ は 2 つ ) 最尤推定値は観測データの平均と分散になる数値計算的には Newton-Raphson 法 EM アルゴリズム MCMC 法など参考 ) ベイズ推定は事前確率を尤度で補正して事後確率を求める 最適モデルの選択 : 赤池の情報量基準 AIC = 2 (ln L p) ln L は最大対数尤度 p は自由パラメーターの数 ( 平均対数尤度の近似値 尤度とパラメーター数のトレードオフで最適なモデルを評価 ) AIC が小さい値を示すほうのモデルを選ぶ応用例重回帰式の変数選択 統計モデルの比較 など

35 3 ベイズ推論による臨床診断 Bayesの公式の確率 pをオッズ o = p 1 p にして式を書きかえると 例 1: 胸痛患者が心筋梗塞である確率 事前確率 0.1( 胸痛患者における心筋梗塞の確率 ) の時 Odds 0.11 < 事前確率の情報がなければ主観的確率でもよい> 所見 LR+ LR- 男性 あり 才以上 50 才 0.8 刺すような痛み なし 1.3 胸壁の圧痛 なし 1.3 ニトログリセン効果 なし 1.1 発汗 なし 0.7 頸動脈の怒張 なし 0.9 第 III 音聴取 なし 0.9 ECG:ST 上昇 なし 0.6 ECG:ST 低下 あり 4.5 ECG: 非特異的 ST 変化 なし 1.5 ECG:T 波の逆転 あり 2.2 < 各 LR 値はMcGee, Evidence-Based Physical Diagnosisによる> 事前 Odds(=0.11) LR(=9.77) = ( 事後オッズ ) 事後確率は Odds/(1+Odds) = となる 例 2: 意識障害が脳病変によるものかそれ以外 ( 代謝性など ) か事前確率 0.5 とし 血圧が 120 以下の場合 LR- は 0.2 なので 事後確率は 0.17 で脳病変は否定的

36 4 傾向スコア ランダムな割り当てができない状況で 関心ある変数の差を検討する場合 ( 観察研究 ) に複数の共変量 ( 交絡因子 ) を 1 変数に集約し この変数を用いて マッチング 層化 重みづけを行う Ex. ある薬の投与群と非投与群において 差を検討する場合 割り当て変数 z( 投与群 =1と非投与群 =0) 年齢 性別 体重 などの複数の共変量 xiでzを説明するモデルを作成し 例ごとの傾向スコアを得る ロジスティック回帰がよく用いられる マッチング 2 つの群で傾向スコアの等しいまたは近いペアで差を求め その平均を検定する ( 傾向スコアの差の合計を最小化するように設定する 例数の少ない方は重複使用する ) 層化傾向スコアを複数の層 (5 など ) に分類し そのクラス間で平均の差を検定する 重みづけ傾向スコアの逆数で補正する

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発 6.. ロジスティック回帰分析 6. ロジスティック回帰分析の原理 ロジスティック回帰分析は判別分析を前向きデータ用にした手法 () ロジスティックモデル 疾患が発症するかどうかをリスクファクターから予想したいまたは疾患のリスクファクターを検討したい 判別分析は後ろ向きデータ用だから前向きデータ用にする必要がある ロジスティック回帰分析を適用ロジスティック回帰分析 ( ロジット回帰分析 ) は 判別分析をロジスティック曲線によって前向き研究から得られたデータ用にした手法

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - Statistics[B] 講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 kkarato@eco.u-toyama.ac.jp

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

様々なミクロ計量モデル†

様々なミクロ計量モデル† 担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

8 A B B B B B B B B B 175

8 A B B B B B B B B B 175 4.. 共分散分析 4.1 共分散分析の原理 共分散分析は共変数の影響を取り除いて平均値を比較する手法 (1) 共分散分析 あるデータを群間比較したい そのデータに影響を与える他のデータが存在する 他のデータの影響を取り除いて元のデータを比較したい 共分散分析を適用 共分散分析 (ANCOVA:analysis of covariance アンコバ ) は分散分析に回帰分析の原理を応 用し 他のデータの影響を考慮して目的のデータを総合的に群間比較する手法

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

相関係数と偏差ベクトル

相関係数と偏差ベクトル 相関係数と偏差ベクトル 経営統計演習の補足資料 07 年 月 9 日金沢学院大学経営情報学部藤本祥二 相関係数の復習 r = s xy s x s y = = n σ n i= σn i= n σ n i= n σ i= x i xҧ y i തy x i xҧ n σ n i= y i തy x i xҧ x i xҧ y i തy σn i= y i തy 式が長くなるので u, v の文字で偏差を表すことにする

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

0415

0415 今回の授業の狙い 基本的な統計量を求め 活用できること 章統計量と確率分布のと確率分布の活用 part 統計解析で用いる代表的な確率分布の特徴を 把握すること 統計解析の全体像 統計解析での注意点 ()( サンプリング サンプル 測定 母集団 何らかの意味で同質性が期待できるものの集団 e 日本人男性同じ条件で作った製品 母集団 推定 アクション 事実に基づく判断 データからモノをいう データ解析

More information

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8> 第 8 回 t 分布と t 検定 生物統計学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

ベイズ統計入門

ベイズ統計入門 ベイズ統計入門 条件付確率 事象 F が起こったことが既知であるという条件の下で E が起こる確率を条件付確率 (codtoal probablt) という P ( E F ) P ( E F ) P( F ) 定義式を変形すると 確率の乗法公式となる ( E F ) P( F ) P( E F ) P( E) P( F E) P 事象の独立 ある事象の生起する確率が 他のある事象が生起するかどうかによって変化しないとき

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft Word - Time Series Basic - Modeling.doc 時系列解析入門 モデリング. 確率分布と統計的モデル が確率変数 (radom varable のとき すべての実数 R に対して となる確 率 Prob( が定められる これを の関数とみなして G( Prob ( とあらわすとき G( を確率変数 の分布関数 (probablt dstrbuto ucto と呼 ぶ 時系列解析で用いられる確率変数は通常連続型と呼ばれるもので その分布関数は (

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

相関分析・偏相関分析

相関分析・偏相関分析 相関分析 偏相関分析 教育学研究科修士課程 1 回生 田中友香理 MENU 相関とは 相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数 偏相関係数 SPSSによる偏相関係数 順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す 曲線回帰分析を行う 相関とは

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

モジュール1のまとめ

モジュール1のまとめ 数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差

More information

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る 確率分布 - 確率と計算 6 回に 回の割合で の目が出るさいころがある. このさいころを 6 回投げたとき 度も の目が出ない確率を求めよ. 5 6 /6 6 =565/46656=.48 (5/6) 6 =.48 ある市の気象観測所での記録では 毎年雨の降る日と降らない日の割合は概ね :9 で一定している. 前日に発表される予報の精度は 8% で 残りの % は実際とは逆の天気を予報している.

More information

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,. 23(2011) (1 C104) 5 11 (2 C206) 5 12 http://www.math.is.tohoku.ac.jp/~obata,.,,,.. 1. 2. 3. 4. 5. 6. 7.,,. 1., 2007 ( ). 2. P. G. Hoel, 1995. 3... 1... 2.,,. ii 3.,. 4. F. (),.. 5.. 6.. 7.,,. 8.,. 1. (75%

More information

重回帰式 y= x x 2 重症度 5 TC TC 重症度

重回帰式 y= x x 2 重症度 5 TC TC 重症度 3. 重回帰分析 3.1 重回帰分析の原理 重回帰分析は説明変数が複数になった回帰分析 (1) 重回帰モデル ある結果項目に影響を与えている原因項目が複数ありしかも原因項目間に相関関係がある 複数の原因項目間の相関関係を考慮して結果項目との間の因果関係の内容を検討したい 重回帰分析を適用重回帰分析は目的変数が 1 つで 説明変数が複数でお互いに相関がある時の回帰分析 目的変数には誤差変動があり 説明変数には誤差変動がないことを前提にしている

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 17 回 講義 母平均の区間推定 Part- 016 年 6 14 ( )3 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u toyama.ac.jp website: http://www3.u toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

EBNと疫学

EBNと疫学 ノンパラメトリック検定 94 質的変数と質的変数の関連性を調べる - クロス表 行周辺度数 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 列周辺度数 95 クロス表 - 行パーセント 各行のセルの度数を行周辺度数で割って 100 をかけたもの 行周辺度数 肺がん合計発生発生しない 10%(100

More information

構造方程式モデリング Structural Equation Modeling (SEM)

構造方程式モデリング Structural Equation Modeling (SEM) 時間でだいたいわかる 構造方程式モデリング Structural Equaton Modlng (SEM) 構造方程式モデリングとは何か 構造方程式モデリング (Structural Equaton Modlng, SEM) とは : 別名 共分散構造分析 (coaranc structural analyss) 構成概念やの性質を調べるために集めた多くのを同時に分析するための統計的方法 本来 構造方程式モデリングは主に以下の3つを含みます

More information

統計学の基礎から学ぶ実験計画法ー1

統計学の基礎から学ぶ実験計画法ー1 第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

memo

memo 数理情報工学特論第一 機械学習とデータマイニング 4 章 : 教師なし学習 3 かしまひさし 鹿島久嗣 ( 数理 6 研 ) kashima@mist.i.~ DEPARTMENT OF MATHEMATICAL INFORMATICS 1 グラフィカルモデルについて学びます グラフィカルモデル グラフィカルラッソ グラフィカルラッソの推定アルゴリズム 2 グラフィカルモデル 3 教師なし学習の主要タスクは

More information

Chapter 1 Epidemiological Terminology

Chapter 1 Epidemiological Terminology Appendix Real examples of statistical analysis 検定 偶然を超えた差なら有意差という P

More information

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch04j Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

Microsoft Word doc

Microsoft Word doc . 正規線形モデルのベイズ推定翠川 大竹距離減衰式 (PGA(Midorikawa, S., and Ohtake, Y. (, Attenuation relationships of peak ground acceleration and velocity considering attenuation characteristics for shallow and deeper earthquakes,

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

Microsoft Word - mstattext02.docx

Microsoft Word - mstattext02.docx 章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で

More information

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63> 第 回相関分析 9 年 月 日 A.つの変数間の関係を調べる. 散布図を書く例 水稲の収量に関連のある生育指標を知りたい. 例えば草丈と収量には関連があるだろうか? 例 トマトの糖度は施肥量によってどのように変化するかを知りたい. 例えば, 窒素施肥量を増加させると糖度はどうなるか? 散布図の書き方 )x 軸 ( 横軸 ) には原因となる変量を, y 軸 ( 縦軸 ) には結果となる変量をとる. サツマイモの収量

More information

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt 主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで

More information

PowerPoint Presentation

PowerPoint Presentation 付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像

More information

スライド 1

スライド 1 Monthly Research 静的情報に基づいたマルウェア判定指標の検討 Fourteenforty Research Institute, Inc. 株式会社 FFRI http://www.ffri.jp Ver2.00.01 Agenda 背景と目的 実験概要 実験結果 評価及び考察 まとめ 2 背景と目的 マルウェアの急増に伴い 従来のパターンマッチングによる検知が困難になっている そのため

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

数値計算法

数値計算法 数値計算法 011/5/5 林田清 ( 大阪大学大学院理学研究科 ) レポート課題 1( 締め切りは 5/5) 平均値と標準偏差を求めるプログラム 入力 : データの数 データ データは以下の 10 個 ( 例えばある月の最高気温 ( )10 日分 ) 34.3,5.0,3.,34.6,.9,7.7,30.6,5.8,3.0,31.3 出力 :( 標本 ) 平均値 標準偏差 ソースプログラムと出力結果をメイルの本文にして

More information

Microsoft Word - reg.doc

Microsoft Word - reg.doc 回帰分析 単回帰 麻生良文. 回帰分析の前提 次のようなモデルを考える 単回帰モデル : mple regreo moel : 被説明変数 eple vrble 従属変数 epeet vrble regre : 説明変数 epltor vrble 独立変数 epeet vrble regreor : 誤差項 error term 撹乱項 trbe term emple Kee 型消費関数 C YD

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

Microsoft PowerPoint - 医学統計のつぼ.ppt

Microsoft PowerPoint - 医学統計のつぼ.ppt 日本補綴学会第 114 回学術大会 研究教育研修 Ⅰ 2005.10.1. 医学統計のつぼ 国立保健医療科学院技術評価部 横山徹爾 研究計画 データの整理 検定とは? 数量データの差の検定 質的データの差の検定 検定と区間推定 関連の分析 22 つの数量データの関連 研究計画時に行うこと 目的 仮説を明確に 最終的なまとめの図表を頭に描いておく 統計解析手法も決めておく とはいえ 統計学の基本が分かっていないと

More information

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 10.pptx m u. 固有値とその応用 8/7/( 水 ). 固有値とその応用 固有値と固有ベクトル 行列による写像から固有ベクトルへ m m 行列 によって線形写像 f : R R が表せることを見てきた ここでは 次元平面の行列による写像を調べる とし 写像 f : を考える R R まず 単位ベクトルの像 u y y f : R R u u, u この事から 線形写像の性質を用いると 次の格子上の点全ての写像先が求まる

More information

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,, (1 C205) 4 8 27(2015) http://www.math.is.tohoku.ac.jp/~obata,.,,,..,,. 1. 2. 3. 4. 5. 6. 7.... 1., 2014... 2. P. G., 1995.,. 3.,. 4.. 5., 1996... 1., 2007,. ii 2. F. ( ),.. 3... 4.,,. 5. G., L., D. ( )

More information

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式 統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団 統計学 Ⅱ(16 11-1 章 11 章母集団パラメータの推定 1. 信頼区間 (1 点推定と区間推定 ( 区間推定のシミュレーション (3 母平均 μの信頼区間 (4 母比率 pの信頼区間 (5 母比率 pのより厳密な信頼区間. 点推定量の特性 (1 標本平均 X の持つ望ましい性質 ( 不偏性 (3 推定量の分散と有効性 (4 平均 乗誤差 MEと最小分散性 (5 一致性 (6 チェビシェフの不等式

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

スライド 1

スライド 1 データ解析特論第 5 回 ( 全 15 回 ) 2012 年 10 月 30 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 をもっとやります 2 第 2 回 3 データマイニングの分野ではマクロ ( 巨視的 ) な視点で全体を捉える能力が求められる 1. コンピュータは数値の集合として全体を把握していますので 意味ある情報として全体を見ることが不得意 2. 逆に人間には もともと空間的に全体像を捉える能力が得意

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 絶対値の意味を理解し適切な処理することができる 例題 1-3 の絶対値をはずせ 展開公式 ( a + b ) ( a - b ) = a 2 - b 2 を利用して根号を含む分数の分母を有理化することができる 例題 5 5 + 2 の分母を有理化せよ 実数の整数部分と小数部分の表し方を理解している

More information

_KyoukaNaiyou_No.4

_KyoukaNaiyou_No.4 理科教科内容指導論 I : 物理分野 物理現象の定量的把握第 4 回 ( 実験 ) データの眺め ~ 統計学の基礎続き 統計のはなし 基礎 応 娯楽 (Best selected business books) 村平 科技連出版社 1836 円 前回の復習と今回以降の 標 東京 学 善 郎 Web サイトより データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

Excelにおける回帰分析(最小二乗法)の手順と出力

Excelにおける回帰分析(最小二乗法)の手順と出力 Microsoft Excel Excel 1 1 x y x y y = a + bx a b a x 1 3 x 0 1 30 31 y b log x α x α x β 4 version.01 008 3 30 Website:http://keijisaito.info, E-mail:master@keijisaito.info 1 Excel Excel.1 Excel Excel

More information

Microsoft PowerPoint - Inoue-statistics [互換モード]

Microsoft PowerPoint - Inoue-statistics [互換モード] 誤差論 神戸大学大学院農学研究科 井上一哉 (Kazuya INOUE) 誤差論 2011 年度前期火曜クラス 1 講義内容 誤差と有効数字 (Slide No.2~8 Text p.76~78) 誤差の分布と標準偏差 (Slide No.9~18 Text p.78~80) 最確値とその誤差 (Slide No.19~25 Text p.80~81) 誤差の伝播 (Slide No.26~32 Text

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information