DVIOUT-mem

Size: px
Start display at page:

Download "DVIOUT-mem"

Transcription

1 統計学講義メモ (1): 記述統計 高木真吾, 北海道大学 目次 1 データの全体像を見る 全体像を把握する : ヒストグラム 分布状態を比較する : ローレンツ曲線 データを要約する 8.1 データを代表する尺度 : 代表値 データの散らばりを示す尺度 データの基準化と応用例 ヒストグラムからの要約 二つの変数の間の関係を探る 共分散 相関係数 順位相関係数 データの全体像を見る データ : 何らかの概念に対応する量的 質的表現 記述統計学 : データを正しく効率的に読む方法論 ( データの要約 整理 ) 1.1 全体像を把握する : ヒストグラム 度数分布表 ヒストグラム, 階級数 階級幅 階級値の決定 階級幅の異なるヒストグラムの描写 オープンエンドとなっている上端 下端の処理ローレンツ曲線 ジニ係数 同一概念に基づく二つのデータの分布状態の比較 データの分布状態 / 集中の程度 1

2 データセット ( 標本の大きさ ): X 1,X,X 3,...,X 1. 度数分布表の作成 (a) 階級数と階級幅 ( 観測値のとりうる値を複数のクラスに分類する ) の決定方法 1. 目算で作成方法. 自動で決定 : スタージェス (Sturjes) の公式 ( 標本数に応じて階級数 k を自動的に決める ) 1 k =1+log (b) A. 度数のカウント B. 相対度数の計算 A. 各階級に属する観測値の個数を数える B. 標本の大きさが異なるケースでも比較可能なように標本の大きさで割る ( 全体で1になる ) (c) 階級値の決定方法 1. 各階級の上限と下限の中間値方法. 階級内のデータの標本平均値. ヒストグラムの作成 度数分布表をグラフ化する 階級幅が異なるときには注意が必要 グラフの高さは, 相対度数と階級幅から決まる. 注意点 (1): 各階級の相対度数はその階級が全体に対してどの程度貢献しているかを示している. 各階級のヒストグラムの棒の面積も相対度数に比例する形で描写されなければならない. したがって階級幅が他の部分の異なるときは棒の高さを調整してヒストグラムを描写しなければならない. 注意点 (): オープンエンドとなっている右端と左端の階級の扱い 左端について, 金額などのときは0を下限にすることが多い 階級内の平均値が分かっているとき, それを利用する ( 以下の例を参照 ) 適当に定める 例 1:50 人の点数分布 階級数を 5, 階級幅を 0 点 例 :30 人の年俸分布 階級は表のように定め, 度数分布表を作成した. 1 ほかにも多くの方法が知られている. 例えば, 標本標準偏差 s を用いて,k =3.49 1/3 と決める方法や k () 1/3 なる最小の k を階級数とする方法もある.Sturjes の公式は, 階級数 k で各階級に含まれる標本数が二項係数で近似できるような分布であるとき, 標本数と階級数の間に k 1 X ³ k 1 = = k 1 i i=0 ここから両辺の対数をとることで log = k 1 となり公式を得る.

3 オープンエンドの処理方法としては, 表 の例では, 下限は 0 と分かっているのでその情報を用いる 階級の中央の値が階級値になるように処理する, つまり次の関係を満たす x を求める x = 1680 x = 7560 例 3:50 人の成績分布スタージェスの公式から 1+log つまり階級数は6とすることが示唆されており, 階級幅を6 点刻みで設定した ( 上端はオープンエンド ). 階級値は 35 と分かっているので上の例と同じように定めればよい. 1. 分布状態を比較する : ローレンツ曲線ローレンツ曲線は, 各観測点が全体に対してどの程度貢献するかを求めることでそのデータの分布状態 ( 集中状態 ) を描写する. データ :W 1,W,W 3,...,W これらは小さい方から並べられているものとする :W 1 W W 3 W ローレンツ曲線は次のような手順で作成する. 1. 観測点について, 全体が 個あり, 各個体が占めているシェアは S i =1/ である. これを観測点シェアと呼ぶことにする.. データの数値についてみると, 全体の大きさは W = P W i であり, 各観測点のシェアは V i = W i /W である. これをデータ値シェアと呼ぶことにする. 3. 最後にそれぞれのシェアの累積和を定義する. ix X i = S j,y i = ix j=1 j=1 V j i =1,,..., これらをそれぞれ観測点シェア累積和, およびデータ値シェア累積和と呼ぶことにする. 以上ふたつの累積和 {(X i,y i )} を X Y グラフにしたものがローレンツ曲線である. 表 4, 5, 6 の資産分布を例にこの曲線の意味を考える. ローレンツ曲線の考え方としては 均等にデータが分布しているとき, 観測点シェア累積和 と データ値シェア累積和 と等しく増加していくと考えられる. 不均等に分布しているとき, 最初は小さい貢献 ( シェア ) しかしない観測点が並んでいるので, 観測点シェア累積和 にくらべ データ値シェア累積和 は緩やかにしか増加しない. 逆に最後の方には貢献の大きい ( シェアが大きい ) 観測点が残っているので後者の方が急激に増加すると考えられる. 以上の結果より, ローレンツ曲線は分布状況が完全に均等なとき 45 度線になる ( どの階層の人も等しい資産総額に対する貢献しか持たないことを示している ). ローレンツ曲線をグラフ化すると, 3

4 表 1: 階級値は, 階級上限 下限の中間値 階級 階級値 度数 相対度数 累積度数 累積相対度数 ただし 0 0 は 0 より大きく 0 以下と読むことにする. 表 : 階級値は, 階級内平均値 階級 階級値 度数 相対度数 累積度数 累積相対度数 1000 万円以下 (0 1000) 万円以下 ( ) 万円以下 ( ) 万円以下 ( ) 万円以下 ( ) 万円から上 (5000 x) 表 3: 上端の階級値は階級内平均値 階級 階級値 度数 相対度数 累積度数 累積相対度数 x

5 表 4: 平等な資産分布 総額 資産額 , 500 資産シェア 0% 0% 0% 0% 0% 100% 人口シェア ( 累積 ) 0% 40% 60% 80% 100% 資産シェア ( 累積 ) 0% 40% 60% 80% 100% 表 5: 不平等な資産分布 1 資産額 , 00, 000 資産シェア 10% 10% 10% 10% 60% 100% 人口シェア ( 累積 ) 0% 40% 60% 80% 100% 資産シェア ( 累積 ) 表 6: 不平等な資産分布 資産額 , 700 資産シェア 1% 18% 18% 4% 9% 100% 人口シェア ( 累積 ) 0% 40% 60% 80% 100% 資産シェア ( 累積 ) 均等に保有している場合には 45 度線となり, 一人に富が集中している場合には曲線が外に広がっている ことが分かる. ローレンツ曲線のひとつの問題点として, 曲線が交差してしまうとき分布状態の比較ができない. 例として, 世界銀行の World Developmet Idicators には, 表 1. のようなデータが掲載されている. この表を用いて国別ローレンツ曲線を描くと図 1 のようになる. 表 7: 所得階層別人口シェアと各階層が全体に占める所得シェア 人口シェア 10% 10% 0% 0% 40% 40% 60% 60% 80% 80% 90% 90% 100% Idia Japa Chia U.S この例ではインドのローレンツ曲線と中国 アメリカのそれが交差しているので不平等の程度が判定できない. その場合の判定方法のひとつとしてジニ係数と呼ばれるひとつの尺度がある. この尺度はどの程度ローレンツ曲線が 45 度線から乖離しているかを計測する. 具体的には 45 度線とローレンツ曲線で囲む面積 ( の 倍 ) として定義される. この定義から明らかなように, ジニ係数の性質として 完全に平等 =ローレンツ曲線が 45 度線 = 面積が0=ジニ係数が0 5

6 図 1: 国別ローレンツ曲線 不平等度大 =ローレンツ曲線が 45 度線から乖離 = 面積が大 =ジニ係数が0より大 完全に不平等 =ローレンツ曲線が 90 度線 ( 軸に一致 )= 面積が1=ジニ係数が1 つまり, ジニ係数は0から1の間の値を取り,1に近いほど不平等の程度が大きい状態を指し示している. ジニ係数を求める一般的な公式を次の表のような形でデータが与えられている場合について考える. これらはローレンツ曲線を描く上で必要なものである. 目的とする部分の面積は,45 度線で囲まれる三角形から 表 8: 所得階層別人口シェアと各階層が全体に占める所得シェア 観測点シェア S 1 S S データ値シェア V 1 V V データ値シェア累積和 Y 1 Y Y ローレンツ曲線の外側の台形の総和を差し引いたものを 倍したものである. ローレンツ曲線の下部分にできる台形の面積はそれぞれ (Y k 1 + Y k ) S k と与えられるので, ジニ係数は ( 1 G = X (Y k 1 + Y k ) と与えられる. S k ) =1 X (Y k 1 + Y k ) S k, Y 0 =0. (1) 個別データが与えられている ( あるいは観測点シェアが等しい間隔もほぼ同様の方法で計算できる ) 場合には計算上便利な別の計算公式が存在している. 元データを小さい順に W 1 W と並べ, V k = W P k W = W k i W, 1 W = X W i 完全に不平等という意味合いは十分たくさんの人がいて一人だけがすべての富を所有している状態を指している. 6

7 として各観測値のシェアを定義する. 目的とする部分の面積は,45 度線で囲まれる三角形からローレンツ曲線の外側の台形の総和を差し引いたものを 倍したものである. 台形部分の面積の総和は X {( k)+( k +1)} V k である 3 のでジニ係数は以下のように表現できる. ( ) 1 G = X {( k)+( k +1)} V k = +1 = +1 W X k +1 他にも同値な表現は多く知られている 4 W k = W 表 4 について, 式 (1) を用いてジニ係数を計算すると X X { k +1} V k () k W k +1 G = 1 {(0 + 0.) 0.+(0.+0.4) 0.+( ) 0.+( ) 0.+( ) 0.} = 1 ( ) = 0 同様に計算すると表 5 表 6 についてそれぞれ約 0.400,0.165 となる ( 各自で確認してください ).(3) 式を用いて, 表 6 についてジニ係数を計算してみる. 小さい方から順に 00, 300, 300, 400, 500 となっており, これらの平均は 340 なので G = 5+1 µ = となり, 上の結果と一致している ( 他の結果についても確認してください ). 表 1. についても式 (1) から計算することができる. 例えばインド (Idia ) について, G = 1 ( ) 0.10 ( ) 0.10 ( ) 0.0 ( ) 0.0 ( ) 0.0 ( ) 0.10 ( ) 0.10 = その他の国についても同様に Japa: 0.398,Chia: ,U.S.: となる. 先ほどの図でインドのローレンツ曲線と中国 アメリカの曲線が交差していたが, ジニ係数で見る限り, インドのそれの方が小さい値をとっていることがわかる. (3) 3 シェアが均等に 1/ ずつ増加していくという性質を用いている. 4 (3) 式と同値な表現として, G = W Cov(W k,k/) が計算機で利用しやすいものとして知られている. ただし,Cov は二次元データ {W k,k/} に関して標本共分散を計算したものである. また G = 1 W X j=1 という表現も知られている. X W i W j 7

8 データを要約する データの要約 データセットの代表値 各種の平均 ( 算術平均, 幾何平均, 調和平均 ), 分位点 ( パーセント点 ), 最頻値 ( モード ) 散らばりの尺度 ( 分散 レンジ ) データセットの散らばりの尺度 分散 ( 標準偏差 ), レンジ ( 四分位レンジ ).1 データを代表する尺度 : 代表値大きさ のデータセット {X 1,X,X 3,,X 1,X } が与えられている. このデータセットを 代表的な値 で要約するとき, どのような尺度が考えられるであろうか. ひとつの考え方として, データセットの代表 = 中心部分に関する情報を取り出すと考える. データセットの 中心 としては以下のようなものが考えられる. 標本平均 ( 算術平均 ) 標本平均 ( 算術平均 ) は最もよく知られた中心を示す尺度であり, 非常に多くの理論的利点 5 を持ち, 以下のような状況では中心を示すのに適していることが多い. 比較的均質で極端な値をとる観測点が存在していない 異なる層が混じっていない 逆にこれらが満たされないときは中心の尺度として適切ではないことが多い. X = 1 X X i (4) 幾何平均比率に意味のある数値で, 連続した時点間での伸び率 ( 成長率 ) のデータなどに利用 6. v uut X G = p Y X 1 X X 3 X 1 X = X i (5) 調和平均逆数に意味のあるデータに利用. 時速 仕事量などに利用. Ã! 1 1 X 1 X H = X i (6) 5 詳しくは標本理論のところで学ぶ. 6 相加 相乗平均の関係より v 1 X uy X i t X i つまり算術平均は幾何平均を上回るか等しくなる. 8

9 中央値 ( メディアン :media) 全体を小さい方の値から並べ, ちょうど 50% のところにくる観測点の値 7 最頻値 ( モード :mode) 最も高い頻度で観測される値 9 例 1.8 人の年間所得がそれぞれ 10, 30, 50, 60, 90, 30, 340, 360 万円, 平均所得は? x = = 8.5 例.8 人の年間所得がそれぞれ 10, 30, 50, 90, 30, 340, 360, 1580 万円, 平均所得は? x = = 例 3.8 人の年間所得がそれぞれ 10, 30, 50, 30, 360, 190, 1340, 1580 万円, 平均所得は? x = = 例 4. 人口について年率増加率が 1990 年から % 3% 4% 5% 1% であるとき, 平均年率物価上昇率は? x G = 5p (1.01) (1.0) (1.03) (1.04) (1.05) 例 5. ある地点から目的地まで行き 60km/h, 帰りが 40km/h で運転すると, 行き帰りの平均時速は? x H = ½ µ ¾ 1 40 例 や例 3のように少数の異常な値が存在するときなどは, 平均はデータセットの代表値としてあまり適切ではない. そこで 中央値 を中心の尺度と考えたとき, 定義式から, 少数の異常な値は全体的な傾向として中央値に影響を与えることは少ないことが予想される. 先ほどの例 は, 例 1のデータをひとつだけ置き換えただけであるが, 平均が大きく変化するのに対して ( ), 中央値の変化は比較的小さい ( ).. データの散らばりを示す尺度データが対称に分布しているとき, 中心を示す尺度 ( 平均, 中央値, モードなど ) が比較的近い値を示す傾向がある. しかし三つのデータセット ( 平均 = 中央値 = 最頻値 =5) {0, 3, 3, 5, 5, 5, 5, 7, 7, 10} {0, 1,, 3, 5, 5, 7, 8, 9, 10} 7 まずデータセットを小さい順に並べ替え Y (1) Y () Y (3) Y ( 1) Y (), この中心の値をとる 8. つまり が奇数のとき M = Y ((+1)/) が偶数のとき M = Y (/) + Y (/+1) とすることが多い. 9 典型的な観測値という意味で, 最頻値 ( モード :mode): 観測値の中で最も頻度が高い値を利用することがある. 容易に想像できるようにこの尺度は比較的大きなデータセットでない限りあまり意味を持たない. 9

10 {3, 4, 4, 5, 5, 5, 5, 6, 6, 7} は明らかに異なる分布状態を示している. 違いを見るためにデータの 散らばり に注目する. データの散らばりを示す尺度としては, 分散 範囲 ( レンジ ),4 分位レンジなどが知られている. どの程度散らばっているかを確認するには, 各観測点に関して平均点 = 中心 ( 重心 ) からの偏差に注目する. 観測値 Y i の偏差 :Y i Ȳ この偏差の累積がどの程度の大きさになるかが散らばりの尺度になりそうであるが, 偏差の総和は0になる 10 のであまり参考にならない. しかしながら 乗偏差 : Y i Ȳ 絶対偏差 : Y i Ȳ について総和をとることが尺度になり得るが, ここでは平均との理論的関連性や数学的扱いやすさの観点から 乗偏差に焦点を当てる. 分散各観測点の 乗偏差の平均値 : 平均的にどの程度中心から離れているかを測る尺度 11. 定義式 1 : S = 1 X (Y i Ȳ ) (7) 標準偏差分散の平方根 S = S ( 注意点 ) 作成方法からも明らかであるが, 分散 ( 標準偏差 ) はある種の平均であるから, 平均が意味を持たない場合には同様に意味を持たないし, 少数の極端な値に非常に敏感に反応してしまう欠点を持つ. 上の例で分散の値を計算するとそれぞれ 6.6,10.8,1. となる 13. より直接的なデータの散らばりの尺度として 範囲 ( レンジ :rage): データに含まれている最大値と最小値の差 4 分位範囲 (4 分位レンジ ) とは, 5% 点と 75% 点の間のレンジ 10 各自で確認してください. 11 偏差の 乗をとっていることによって, 絶対偏差が 1 よりも小さいときにはより小さく,1 より大きいときにはより大きく乖離の程度を評価している. つまり近い部分と遠い部分について 1 を基準にして, メリハリをつけ, より強調した形に変換している. 1 この定義式は で除しているが 1 で割ると定義することもある. これは後に学ぶ推測統計での考え方からすると自然な調整であるが, ここでは 乗偏差の平均値という見方を強調するため で除しておく. 13 直接公式通りに計算することもできるが S = 1 X (Y i Ȳ ) = 1 X Yi Ȳ つまり [ 二乗の平均 ]-[ 平均の二乗 ] としても計算可能. 10

11 が用いられることがある. 中央値と同様に4 分位範囲 (4 分位レンジ ) は少数の異常値が含まれていても大きく変動することがない ( 異常値に対して頑健 / ロバストである ). したがって 頑健な標準偏差 として 標準偏差 = 4 分位範囲 1.35 を用いることもある データの基準化と応用例 データセットの 中心 と 散らばり を統一することで複数のデータセットを比較することができる複数のデータセットを比較する手段として, ローレンツ曲線やジニ係数による比較について先述したが, データセットの特性値である平均や分散を用いて, 同一の 中心 と 散らばり 持つようにデータセットを変換するという方法も考えられる. 命題.1 ( データの基準化 ). データセット Y 1,Y,,Y の標本平均, 標本分散を Ȳ,S Y ( 標準偏差 S Y ) とする. 数値 μ,σ を用いて X i = μ + σ Yi Ȳ S Y, i =1,,..., とすると, 変換されたデータセット X 1,X,,X の標本平均 X, 標本分散 S X は以下の通り. X = μ, S X = σ 証明は容易なので省略する 15. 例としては, 二回行った学力考査で問題の難易度が異なるため, 受験者の学力の分布状態自体はそれほど変化していないはずなのに点数の分布状況が大きく異なることがありうる. そのとき素点を用いるのではなく, 中心位置と散らばりの程度で調整した基準得点を用いることがある. つまりデータが Y 1,Y,,Y となっているとき, 上記の μ =50,σ =10としたものが偏差値と呼ばれるものである. このような操作の含意は, 対象となっている集団の点数化できる学力がほぼ正規分布 16 といわれる分布に近いとき, 偏差値 0から80の間でほとんどすべての人をカバーする. また 14 この関係は標準正規分布に関する議論から導いたものである. 15 以下のように確認できる. X = 1 X X i = μ + 1 X σ Yi Ȳ S Y Ã! = μ X σ Y i 1 X 1 Ȳ = μ + σ S Y S Y Ȳ Ȳ = μ また X = μ の結果を用いると, SX = 1 X (X i X) = 1 X Ã! = σ 1 X SY (Y i Ȳ ) 16 これについては後述. µ σ Yi Ȳ S Y = σ SY SY = σ μ 11

12 偏差値 65 以上 (35 以下 ) は, ほぼ 7% 偏差値 55 から 65(35 から 45)(35 以下 ) は, ほぼ 4% 偏差値 45 から 55 は, ほぼ 38% となることも計算できる. これらの数値は偶然の結果ではなく, 相対評価の成績と関連している. 通常 5 段階評価での相対評価を行うときには成績 1(5):7%, 成績 (4):4%, 成績 3:38% という割合になるよう設定されることが多い. ここでの議論は点数化できる学力が正規分布に近いことを前提にしているので, 実際に検査を実施したときその分布が極端に正規分布から離れているとき, 偏差値が100を超えたり負の値になることも原理的には起こりうる. ウェクスラーにより考案された知能指数 ( 偏差値知能指数 :DIQ) も基準化の応用例である. 同年代の人たちにある種の検査を実施し, その結果から平均 (Ȳ ) 分散 (SY ) を得たとき, 各個人のスコアを DIQ = Yi Ȳ S Y つまり偏差値とは異なり, 中心が 100, 散らばりの程度が 15 となるように調整されている. これによって 79 から 130 の間に約 95% の人が含まれる ( ただし知能指数にはさまざまな定義がある )..3 ヒストグラムからの要約 あるデータセット {X i } から作成した度数分布表が次のような形で与えられているものとする. この 表 9: 度数分布表 階級 階級値 度数 17 相対度数 A 1 a 1 1 r 1 A a r A 3 a 3 3 r A K 1 a K 1 K 1 r K 1 A K a K K r K = P K k 1.0 = P K r k とき平均 分散などはこの度数分布表から ( 近似的に ) 計算することができる. 平均は X = 1 X X i ˆX = 1 X a k k = X a k r k ただし, 代表値が階級内の平均値となっているときには二つの目近似的に等しいというところが厳密に等しくなる ( X = ˆX). 同様に考えて分散については SX = 1 X (a k ˆX) X k = (a k ˆX) r k 1

13 これは必ずしも元のデータから計算したものと等しくはならない. また中央値や最頻値についても同様に考えることができる. 3 二つの変数の間の関係を探る 3.1 共分散 相関係数 変数間の関係を示す尺度 二つの変数の散らばりの傾向とその大きさの程度を示す尺度 : 共分散 二つの変数の散らばりの傾向を示す尺度 : 量的データ : 相関係数 偏相関係数 質的データ : 順位相関係数 二つの変数を含むデータセット ( 二次元データ ) が与えられているものとする. {X 1,X,X 3,,X 1,X } {Y 1,Y,Y 3,,Y 1,Y } 二つの変数に関するデータの散らばり (X Y 平面に描いた散布図上での点の散らばり方 ) の大きさと関係の方向性を示す尺度として, 共分散を定義することができる. S XY = 1 X (X i X)(Y i Ȳ )= 1 X X i Y i XȲ (8) 共分散は, その符合と大きさで評価される.X を基準にして考えると, 共分散が正の値 :X と Y が右肩上がりの関係を持つ 共分散が負の値 :X と Y が右肩下がりの関係を持つまた大きさについては分散と同様に散らばりの程度を示している. この大きさを基準化し, 二つの変数の関係だけに注目した尺度として相関係数がある. 相関係数は二つの変数の関連の強さを示し, 特に正の値を持つとき, 二つの変数が右肩上がりの直線に沿って散布している関係にあり, 負の値を持つとき, 二つの変数が右肩下がりの直線に沿って散布している状態にあることを示す尺度となっている. その定義式は R = S XY p S X S Y (9) である. 相関係数は常に-1と1の間の値を取り,0に近い状態は無関係に分布していることを示す. 例として図のような金価格と日経平均株価の時系列データ (001 年 9 月 1 日から 11 月 14 日までの観測値 50) を考える. 有事の金 というように, 世界経済全体に影響を持つであろう 9 月 11 日のニューヨークでの大規模な事件の後, 株価の下落と金価格の急上昇が観測された. これら二つの系列について相関係数を求めたところ, 0.94 という値になり, あまり大きくはないものの負の相関関係が観測される. 13

14 図 : 金価格と日経平均株価の関係 表 10: 二つのデータセットにおける各観測点の順位 データセット A R A 1 R A R A 1 R A データセット B R B 1 R B R B 1 R B 3. 順位相関係数 順序付けられた質的データ間の関係について調べるために順位相関係数を考える ケンドールの順位相関係数 : r K = G H (G H) p p = ( 1)/ ( 1)/ ( 1) スピアマンの順位相関係数 : r S =1 6 X 3 (Ri A Ri B ) ただし,G は二つのデータセットの順位方向が一致している場合の回数 1 X X G = G i, G i = 1{Ri B >Rj B } j=i+1 であり,H は二つのデータセットの順位方向が逆転している場合の回数 1 X X H = H i, H i = 1{Ri B <Rj B } j=i+1 注 1)G i + H i = i, P 1 (G i + H i )=( 1)/ 注 ) 順位の方向が完全に一致しているとき, P 1 G i = ( 1)/, P 1 H i =0 注 3) 順位の方向が完全に逆転しているとき, P 1 G i =0, P 1 H i = ( 1)/ 注 4) 同順位があるとき, その処理方法はいくつか知られているが, その場合は G も H も0とするのが最も簡単な処理方法である ( その場合相関係数の最大 最小値が1や-1にはならない欠点はある ) 14

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 度数分布とヒストグラム データとは 複雑な確率ゲームから生まれたと考えてよい データ分析の第一歩として データの持つ基本的特性を把握することが重要である 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える データが母集団からのランダムサンプルならば 母集団についての推測を行う 度数分布とヒストグラムの作成

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 ) データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65

More information

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2 春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 3 章度数分布とヒストグラム データの中の分析 ( 記述統計 ) であれ データの外への推論 ( 推測統計 ) であれ まず データの持つ基本的特性を把握することが重要である 1 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する 3 章 グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える 4 5 6 章 データが母集団からのランダムサンプルならば 母集団についての推測を行う

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 3 よく使う記述統計量 事務連絡 Webclass を使ってみようと思います. 登録できる人はしておいてください. 宿題を webclass 経由で回収 返却する予定です. じつはすでにデータをアップロードしています. MS-Word, Excel が使えますか? VBA とかできなくてもいいです. 宿題をこれらで出していただけると, 採点しやすいです. 互換機能 ( 校閲機能含む

More information

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C> 統計の種類 統計学 データの種類データのグラフ化中心を表す特性値 記述統計母集団 ( 調査対象の集団 ) をすべて調査でき その調査結果に基づき データをまとめる統計 推測統計母集団 ( 調査対象の集団 ) をすべて調査できないが 一部のデータから母集団の状況を推測する統計 外れ値 データの中には 他の観測値に比べて著しく離れた値が含まれている場合があります ( 入力ミスではなく ) このような値のことを外れ値といいます

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - -

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - - 統計学 Ⅰ(8) 章度数分布とローレンツ曲線. 度数分布表 教科書 8- ページ. 度数分布表 () データの表し方 () 度数分布表 () 度数, 相対度数, 累積度数. ヒストグラム () ヒストグラム () 階級の決め方 () ヒストグラムにおける階級幅の調整 () クロス集計. ローレンツ曲線とジニ係数 () 所得格差の問題 () ローレンツ曲線 () ジニ係数 () データの表し方 例 :

More information

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード] データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

統計学入門 練習問題解答集

統計学入門 練習問題解答集 統計学入門練習問題解答集 この解答集は 995 年度ゼミ生椎野英樹 ( 回生 ) 奥井亮(3 回生 ) 北川宣治(3 回生 ) による学習の成果の一部です. ワープロ入力はもちろん井戸温子さんのおかげです. 利用される方々のご意見を待ちます.(996 年 3 月 6 日 ) 趙君が 7 章 8 章の解答を書き上げました.(996 年 7 月 ) 線型回帰に関する性質の追加. (996 年 8 月 )

More information

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx 統計の分析と利用. データとその扱い -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばり データの尺度 -. 二次元のデータ 堀田敬介 散布図 クロス集計二次元データの関係 : 相関係数 相関比 連関係数 0/9/30, Fri.~ -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット, =9, =-3, =4, =5, =3, 67 = 箱ひげ図,, 3,

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

Microsoft PowerPoint - 12統計の分析と利用_1-1.pptx

Microsoft PowerPoint - 12統計の分析と利用_1-1.pptx 統計の分析と利用 /9/ 統計の分析と利用. データとその扱い PartⅠ -. 一次元のデータ -. 一次元のデータ ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばりデータの尺度 -. 二次元のデータ 変数の関係 : 散布図, 共分散 相関係数 変数の関係 : クロス集計, クラメルの連関係数 変数の関係 : 点グラフ, 相関比 堀田敬介, 9, -,,,, /9/, Fr.~ = ヒストグラム

More information

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

Microsoft PowerPoint - 10統計の分析と利用_1.pptx 統計の分析と利用 00/9/4 統計の分析と利用. データとその扱い 堀田敬介 -.. 一次元のデータ度数分布 ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばりデータの尺度 -.. 二次元のデータ散布図 クロス集計二次元データの関係 : 相関係数 相関比 連関係数 00/9/4, Fri.~ -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット 箱ひげ図 (,,, ) 個 L,, 3, 4,

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

基礎統計

基礎統計 基礎統計 第 2 回講義資料 講義資料 テキスト 入門統計解析 倉田博史 星野崇宏, 新世社,2009. (2500 円 + 税 ) スライド資料 http://lecture.ecc.u-tokyo.ac.jp/~candoma/ 基礎統計 ( 16) にてスライド資料 (PDF ファイル ) 学内の PC 端末からアクセスするには 情報教育棟にある PC 端末で Safari を起動すると 講義用

More information

Microsoft Word - Stattext07.doc

Microsoft Word - Stattext07.doc 7 章正規分布 正規分布 (ormal dstrbuto) は 偶発的なデータのゆらぎによって生じる統計学で最も基本的な確率分布です この章では正規分布についてその性質を詳しく見て行きましょう 7. 一般の正規分布正規分布は 平均と分散の つの量によって完全に特徴付けられています 平均 μ 分散 の正規分布は N ( μ, ) 分布とも書かれます ここに N は ormal の頭文字を 表わしています

More information

散布度

散布度 散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (

More information

代表値

代表値 代表値 統計基礎の補足資料 2019 年 6 月 13 日金沢学院大学経営情報学部藤本祥二 量的データの分析 (P.78~119) 分布全体の様子を知るのが目的 (P.99のまとめ) 1. 単峰性,2. ピークの位置と散らばり具合, 3. 左右対称性,4. 外れ値の存在 度数分布, ヒストグラムを描き形状を見る (P.78~P.91) 数値で分布を要約する (P.99~P.117) 基本統計量 :

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

stat-base_ppt [互換モード]

stat-base_ppt [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 髙木廣文東邦大学看護学部国際広域保健分野 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは? アンケート調査で学生のアルバイト実施を調べる

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 絶対値の意味を理解し適切な処理することができる 例題 1-3 の絶対値をはずせ 展開公式 ( a + b ) ( a - b ) = a 2 - b 2 を利用して根号を含む分数の分母を有理化することができる 例題 5 5 + 2 の分母を有理化せよ 実数の整数部分と小数部分の表し方を理解している

More information

stat-base [互換モード]

stat-base [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 高木廣文東邦大学看護学部国際保健看護学研究室 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは?

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次 夏期講習高 センター数学 ⅠA テキスト第 講 第 講 三角比 データの分析 ABC は AB=,BC=,AC= を満たす ⑴ cos B= アイ である 辺 BC 上に点 D を取り, ABD の外接円の半径を R とするとき, AD R = ウであり, 点 D を点 B から点 C まで移動させるとき,R の最小値はエである ただし, 点 D は点 B とは異なる点とする ⑵ ABD の外接円の中心が辺

More information

_KyoukaNaiyou_No.4

_KyoukaNaiyou_No.4 理科教科内容指導論 I : 物理分野 物理現象の定量的把握第 4 回 ( 実験 ) データの眺め ~ 統計学の基礎続き 統計のはなし 基礎 応 娯楽 (Best selected business books) 村平 科技連出版社 1836 円 前回の復習と今回以降の 標 東京 学 善 郎 Web サイトより データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て . 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,0 年に 回の渇水を対象として計画が立てられる. このように, 水利構造物の設計や, 治水や利水の計画などでは, 年に 回起こるような降雨事象 ( 最大降雨強度, 最大連続干天日数など

More information

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を テレビ学習メモ 第 40 回 第 5 章データの分析 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータのを 1 つの数値で表す 2共分散と 3実際のデータからを求める ポイント 1 2 種類のデータのを 1 つの数値で表す 2 種類のデータの散らばりは散布図で見ることができました

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

モジュール1のまとめ

モジュール1のまとめ 数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差

More information

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 10.pptx m u. 固有値とその応用 8/7/( 水 ). 固有値とその応用 固有値と固有ベクトル 行列による写像から固有ベクトルへ m m 行列 によって線形写像 f : R R が表せることを見てきた ここでは 次元平面の行列による写像を調べる とし 写像 f : を考える R R まず 単位ベクトルの像 u y y f : R R u u, u この事から 線形写像の性質を用いると 次の格子上の点全ての写像先が求まる

More information

学習指導要領

学習指導要領 (1 ) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 自然数 整数 有理数 無理数の包含関係など 実 数の構成を理解する ( 例 ) 次の空欄に適当な言葉をいれて, 数の集合を表しなさい 実数の絶対値が実数と対応する点と原点との距離で あることを理解する ( 例 ) 次の値を求めよ (1) () 6 置き換えなどを利用して 三項の無理数の乗法の計

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

(Microsoft PowerPoint - \214o\215\317\223\235\214va-8.ppt [\214\335\212\267\203\202\201[\203h])

(Microsoft PowerPoint - \214o\215\317\223\235\214va-8.ppt [\214\335\212\267\203\202\201[\203h]) 経済統計 a: 第七回 担当教員黒田敏史 今週の内容 テキスト 6 章 データの身近な分析方法 代表値とその他の記述統計 変化率と構成比 弾力性と寄与度 今週の内容 テキスト 6 章 データの身近な分析方法 代表値とその他の記述統計 変化率と構成比 弾力性と寄与度 代表値 集団から得られたデータを一つの値で表現する値 平均 中央値 分散等 記述統計とも呼ばれる どの数値で代表値を作成するかは分析目的に依存

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

画像類似度測定の初歩的な手法の検証

画像類似度測定の初歩的な手法の検証 画像類似度測定の初歩的な手法の検証 島根大学総合理工学部数理 情報システム学科 計算機科学講座田中研究室 S539 森瀧昌志 1 目次 第 1 章序論第 章画像間類似度測定の初歩的な手法について.1 A. 画素値の平均を用いる手法.. 画素値のヒストグラムを用いる手法.3 C. 相関係数を用いる手法.4 D. 解像度を合わせる手法.5 E. 振れ幅のヒストグラムを用いる手法.6 F. 周波数ごとの振れ幅を比較する手法第

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領 数と式 (1) 式の計算二次の乗法公式及び因数分解の公式の理解を深め 式を多面的にみたり目的に応じて式を適切に変形したりすること 東京都立町田高等学校学力スタンダード 整式の加法 減法 乗法展開の公式を利用できる 式を1 つの文字におき換えることによって, 式の計算を簡略化することができる 式の形の特徴に着目して変形し, 展開の公式が適用できるようにすることができる 因数分解因数分解の公式を利用できる

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

Microsoft Word - apstattext01b.docx

Microsoft Word - apstattext01b.docx 1. 量的データの集計 1..1 分布とヒストグラム量的なデータの集計では まずデータの分布を見ることが大切です どの範囲にどれだけの数のデータがあるのかを示すのが度数分布表です 度数分布表の階級がデータを分類する範囲で 度数がどれだけのデータがその範囲に入っているかを表します 相対度数は その度数の全体から見た割合です また それに加えて累積度数と累積相対度数を加える場合もあります 累積度数はその階級以前の度数の合計

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

テレビ講座追加資料1105

テレビ講座追加資料1105 数学類題にチャレンジ 資料の活用 資料の活用語句のまとめ 階級 資料を整理したときの つ つの区間のこと 階級の幅 区間の幅のこと 各階級の最大値と最小値の差 度数 各階級にはいる資料の個数 ( 人数 ) のこと 度数分布表 資料をいくつかの階級に分け 階級ごとに度数を示して分布の様子をわかりやすくした表のこと 階級値 度数分布表で 各階級の真ん中の値のこと ヒストグラム 度数分布多角形 ( 度数折れ線

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 時系列分析 変量時系列モデルとその性質 担当 : 長倉大輔 ( ながくらだいすけ 時系列モデル 時系列モデルとは時系列データを生み出すメカニズムとなるものである これは実際には未知である 私たちにできるのは観測された時系列データからその背後にある時系列モデルを推測 推定するだけである 以下ではいくつかの代表的な時系列モデルを考察する 自己回帰モデル (Auoregressive Model もっとも頻繁に使われる時系列モデルは自己回帰モデル

More information

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅 周期時系列の統計解析 3 移動平均とフーリエ変換 io 07 年 月 8 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ノイズ の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分のがどのように変化するのか等について検討する. また, 気温の実測値に移動平均を適用した結果についてフーリエ変換も併用して考察する. 単純移動平均の計算式移動平均には,

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 千早高校学力スタンダード 自然数 整数 有理数 無理数の用語の意味を理解す る ( 例 ) 次の数の中から自然数 整数 有理 数 無理数に分類せよ 3 3,, 0.7, 3,,-, 4 (1) 自然数 () 整数 (3) 有理数 (4) 無理数 自然数 整数 有理数 無理数の包含関係など

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 春学期統計学 I 記述統計と推測統計 担当 : 長倉大輔 ( ながくらだいすけ ) 1 本日の予定 本日はまず記述統計と推測統計の違い 推測統計学の基本的な構造について説明します 2 記述統計と推測統計 統計学とは? 与えられたデータの背後にある 特性 法則 を 検証 発見 分析 するための手法の開発 その応用などに関わる学問の事です 3 記述統計と推測統計 データの種類 データの種類はおおまかに

More information

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

学力スタンダード(様式1)

学力スタンダード(様式1) (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 稔ヶ丘高校学力スタンダード 有理数 無理数の定義や実数の分類について理解し ている 絶対値の意味と記号表示を理解している 実数と直線上の点が一対一対応であることを理解 し 実数を数直線上に示すことができる 例 実数 (1) -.5 () π (3) 数直線上の点はどれか答えよ

More information

Microsoft PowerPoint 確率レジュメA

Microsoft PowerPoint 確率レジュメA 確率統計レジュメ集 ( 前半 ) 202.04.0 版 立命館大学 電子情報デザイン学科 この講義の目標 進め方 この講義は指定教科書の内容をしっかりと理解することを目的とする. 配布するレジュメは その理解を助けるための資料である. 必ず 教科書に書かれた基礎的な内容をひとつひとつ理解するように努めること. レジュメの空欄の箇所は 教科書からそのヒントを見つけることができる. 予習時に教科書を読み

More information

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 自然数 整数 有理数 無理数の包含関係など 実数 の構成を理解する ( 例 ) 次の空欄に適当な言葉をいれて, 数の集合を表しなさい ア イ 無理数 整数 ウ 無理数の加法及び減法 乗法公式などを利用した計 算ができる また 分母だけが二項である無理数の 分母の有理化ができる ( 例 1)

More information

. 角の二等分線と調和平均 平面上に点 を端点とする線分 と を重ならないようにとる, とし とする の二等分線が線分 と交わる点を とし 点 から に垂直に引いた直線が線分 と交わる点 とする 線分 の長さを求めてみよう 点 から に垂直な直線と および との交点をそれぞれ, Dとする つの直角三

. 角の二等分線と調和平均 平面上に点 を端点とする線分 と を重ならないようにとる, とし とする の二等分線が線分 と交わる点を とし 点 から に垂直に引いた直線が線分 と交わる点 とする 線分 の長さを求めてみよう 点 から に垂直な直線と および との交点をそれぞれ, Dとする つの直角三 角の二等分線で開くいろいろな平均 札幌旭丘高校中村文則 0. 数直線上に現れるいろいろな平均下図は 数 (, ) の調和平均 相乗平均 相加平均 二乗平均を数直線上に置いたものである, とし 直径 中心 である円を用いていろいろな平均の大小関係を表現するもっとも美しい配置方法であり その証明も容易である Q D E F < 相加平均 > (0), ( ), ( とすると 線分 ) の中点 の座標はである

More information

Microsoft Word - NumericalComputation.docx

Microsoft Word - NumericalComputation.docx 数値計算入門 武尾英哉. 離散数学と数値計算 数学的解法の中には理論計算では求められないものもある. 例えば, 定積分は, まずは積分 ( 被積分関数の原始関数をみつけること できなければ値を得ることはできない. また, ある関数の所定の値における微分値を得るには, まずその関数の微分ができなければならない. さらに代数方程式の解を得るためには, 解析的に代数方程式を解く必要がある. ところが, これらは必ずしも解析的に導けるとは限らない.

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

Microsoft Word - スーパーナビ 第6回 数学.docx

Microsoft Word - スーパーナビ 第6回 数学.docx 1 ⑴ 与式 =- 5 35 +14 35 =9 35 1 ⑵ 与式 =9-(-5)=9+5=14 1 ⑶ 与式 = 4(a-b)-3(5a-3b) = 8a-4b-15a+9b = -7a+5b 1 1 1 1 ⑷ 与式 =(²+ 1+1²)-{²+(-3+)+(-3) } 1 ⑷ 与式 =(²++1)-(²--6)=²++1-²++6=3+7 1 ⑸ 与式 = - ² + 16 = - +16

More information

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc (1) 数と式 学習指導要領 都立町田高校 学力スタンダード ア 数と集合 ( ア ) 実数 根号を含む式の計算 数を実数まで拡張する意義を理解し 簡単な 循環小数を表す記号を用いて, 分数を循環小数で表 無理数の四則計算をすること すことができる 今まで学習してきた数の体系について整理し, 考察 しようとする 絶対値の意味と記号表示を理解している 根号を含む式の加法, 減法, 乗法の計算ができる

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

<4D F736F F D F90948A F835A E815B8E8E8CB189F090E05F8E6C8D5A>

<4D F736F F D F90948A F835A E815B8E8E8CB189F090E05F8E6C8D5A> 06 年度大学入試センター試験解説 数学 Ⅱ B 第 問 () 8 より, 5 5 5 6 6 8 ア, イ また, 底の変換公式を用いると, log 7 log log 9 9 log 7 log ウエ, オ (), のグラフは, それぞれ = 89 = 右図のようになり, この つのグラフは 軸に関して対称 ここで, 0, のとき, と log カ のグラフが直線 に関して対称 であることから,

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

memo

memo 数理情報工学特論第一 機械学習とデータマイニング 4 章 : 教師なし学習 3 かしまひさし 鹿島久嗣 ( 数理 6 研 ) kashima@mist.i.~ DEPARTMENT OF MATHEMATICAL INFORMATICS 1 グラフィカルモデルについて学びます グラフィカルモデル グラフィカルラッソ グラフィカルラッソの推定アルゴリズム 2 グラフィカルモデル 3 教師なし学習の主要タスクは

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 第 1 章第 節実数 東高校学力スタンダード 4 実数 (P.3~7) 自然数 整数 有理数 無理数 実数のそれぞれの集 合について 四則演算の可能性について判断できる ( 例 ) 下の表において, それぞれの数の範囲で四則計算を考えるとき, 計算がその範囲で常にできる場合には

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

スライド 1

スライド 1 計測工学第 12 回以降 測定値の誤差と精度編 2014 年 7 月 2 日 ( 水 )~7 月 16 日 ( 水 ) 知能情報工学科 横田孝義 1 授業計画 4/9 4/16 4/23 5/7 5/14 5/21 5/28 6/4 6/11 6/18 6/25 7/2 7/9 7/16 7/23 2 誤差とその取扱い 3 誤差 = 測定値 真の値 相対誤差 = 誤差 / 真の値 4 誤差 (error)

More information

測量士補 重要事項「標準偏差」

測量士補 重要事項「標準偏差」 標準偏差 < 試験合格へのポイント > 士補試験における標準偏差に関する問題は 平成元年が最後の出題となっており それ以来 0 年間に渡って出題された形跡がない このため 受験対策本の中には標準偏差に関して 触れることすら無くなっている物もあるのが現状である しかし平成 0 年度試験において 再び出題が確認されたため ここに解説し過去に出題された問題について触れてみる 標準偏差に関する問題は 基本的にはその公式に当てはめて解けば良いため

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information

Microsoft PowerPoint - Econometrics

Microsoft PowerPoint - Econometrics 計量経済学講義 第 0 回回帰分析 Part 07 年 月 日 ( 水 ) 限 ( 金曜授業実施日 ) 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 4 号室 mal: kkarato@co.-toama.ac.jp wbst: http://www.-toama.ac.jp/kkarato/ 講義の目的 ロジスティック関数の推定方法について学びます 多重回帰分析について学びます kwords:

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

測量試補 重要事項

測量試補 重要事項 重量平均による標高の最確値 < 試験合格へのポイント > 標高の最確値を重量平均によって求める問題である 士補試験では 定番 問題であり 水準測量の計算問題としては この形式か 往復観測の較差と許容範囲 の どちらか または両方がほぼ毎年出題されている 定番の計算問題であるがその難易度は低く 基本的な解き方をマスターしてしまえば 容易に解くことができる ( : 最重要事項 : 重要事項 : 知っておくと良い

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード] R で統計解析入門 (4) 散布図と回帰直線と相関係数 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. の場所に移動し, データを読み込む 4. データ DEP から薬剤

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

線積分.indd

線積分.indd 線積分 線積分 ( n, n, n ) (ξ n, η n, ζ n ) ( n-, n-, n- ) (ξ k, η k, ζ k ) ( k, k, k ) ( k-, k-, k- ) 物体に力 を作用させて位置ベクトル A の点 A から位置ベクトル の点 まで曲線 に沿って物体を移動させたときの仕事 W は 次式で計算された A, A, W : d 6 d+ d+ d@,,, d+ d+

More information

<4D F736F F D208CF68BA48C6F8DCF8A C30342C CFA90B68C6F8DCF8A7782CC8AEE967B92E8979D32288F4390B394C529332E646F63>

<4D F736F F D208CF68BA48C6F8DCF8A C30342C CFA90B68C6F8DCF8A7782CC8AEE967B92E8979D32288F4390B394C529332E646F63> 2. 厚生経済学の ( 第 ) 基本定理 2 203 年 4 月 7 日 ( 水曜 3 限 )/8 本章では 純粋交換経済において厚生経済学の ( 第 ) 基本定理 が成立することを示す なお より一般的な生産技術のケースについては 4.5 補論 2 で議論する 2. 予算集合と最適消費点 ( 完全 ) 競争市場で達成される資源配分がパレート効率的であることを示すための準備として 個人の最適化行動を検討する

More information

学習指導要領

学習指導要領 (1) 数と式 ア整式 ( ア ) 式の展開と因数分解二次の乗法公式及び因数分解の公式の理解を深め 式を多面的にみたり目的に応じて式を適切に変形したりすること (ax b)(cx d) acx (ad bc)x bd などの基本的な公式を活用して 二次式の展開や因数分解ができる また 式の置き換えや一文字に着目するなどして 展開 因数分解ができる ( 例 ) 次の問に答えよ (1) (3x a)(4x

More information

DVIOUT

DVIOUT 第 章 離散フーリエ変換 離散フーリエ変換 これまで 私たちは連続関数に対するフーリエ変換およびフーリエ積分 ( 逆フーリエ変換 ) について学んできました この節では フーリエ変換を離散化した離散フーリエ変換について学びましょう 自然現象 ( 音声 ) などを観測して得られる波 ( 信号値 ; 観測値 ) は 通常 電気信号による連続的な波として観測機器から出力されます しかしながら コンピュータはこの様な連続的な波を直接扱うことができないため

More information

基礎統計

基礎統計 基礎統計 第 4 回講義資料 本日の講義内容 第 3 章 : 次元データの整理 散布図 [ グラフ ] 共分散と相関係数 [ 数値 ] 回帰分析 [ 数値とグラフ ] 偏相関係数 [ 数値 ] 第 3 章 次元のデータ 第 3 章 : 次元のデータ ( 目的 ) 変数間の関係を探る 相関と回帰 ( 相関 ) 変数を区別せず対等にみる ( 相関関係 ) 身長と体重, 教科目の成績 ( 回帰 ) 一方が他方に影響を与える

More information

【指導のポイント】

【指導のポイント】 教材 -B-() の解答資料の活用 分析 さいひんち 度数 最頻値 の解決のために さいひんち最頻値の相対度数の求め方 説明文 相対度数は ( 相対度数 )=( 最頻値の階級の度数 ) ( ( ア ) ) で求めることができる 最頻値の階級の度数は ( イ ), ( ア ) は, ( ウ ) であるから求める ( イ ) 相対度数は, =.9 となる ( ウ ) ( ア ) 度数の合計 ( イ )

More information

untitled

untitled KLT はエネルギを集約する カルーネンレーベ変換 (KLT) で 情報を集約する 要点 分散 7. 9. 8.3 3.7 4.5 4.0 KLT 前 集約 分散 0.3 0.4 4.5 7.4 3.4 00.7 KLT 後 分散 = エネルギ密度 エネルギ と表現 最大を 55, 最小を 0 に正規化して表示した 情報圧縮に応用できないか? エネルギ集約 データ圧縮 分散 ( 平均 ) KLT 前

More information

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - Econometrics pptx 計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: kkarato@eco.u-toyama.ac.p webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます

More information