Microsoft Word - Excel統計・2014サンプル.docx

まえがきこの度は Excel でできる統計データ分析講座をご受講いただきまことにありがとうございます人間万事塞翁が馬ということわざがあります世の中で起きることは良いことも悪いこともなかなか予測できないものですしかし将来を予測する場合でも過去の傾向や現状を基にすれば手がかりが有るかもしれません人間の経験からくる勘に基づく判断は無視できませんただここで重要なのは過去の傾向や現状を客観的に探ることも必要ですそして数値による裏づけを基に将来の予測をしたり次なるアクションをとったりすることができれば経験や勘だけによる判断からより確証ある裏づけに基づく判断に変わりますこの講座は Excel を使ってビジネスデータを活用し意思決定に活かすことがテーマですあくまで Excel はツールです東京から大阪へ出張に行くことを例に挙げれば移動手段が新幹線飛行機夜行バスなど様々ありそれぞれ所要時間や料金などにおいてメリットやデメリットがある中で何時にどの交通手段で移動をするのかを決めますこれと同じく Excel はただの手段であり Excel の操作を覚える段階で苦労を強いられることは望んでいません自己責任や危機管理という言葉を耳にする機会が増えて久しくなりました会社の経営で考えれば経営者や所属長の勘や経験だけを頼りに予測や判断をした時うまくいっている時は良いのですがその人の欠勤ばかりでなく異動や退職をした場合残された人は従来と同じように判断ができるでしょうかまたその勘を頼りにした判断の方法を的確に後任者や部下へ継承することができるのでしょうかまた従業員の退職による従業員固有のノウハウの流出は会社としては避けたいものです情報共有しやすいツールである Excel を使って誰が作業をしても同じような解釈ができるようすべての人がスキルを持てば従業員全体が高いレベルで知識の均整化が図られます会社の経営資源という面でも大変意義があると言えますこのことを意識しながら講座の内容を習得して下さいそして演習問題にもチャレンジして下さいもし不明な点があればどしどしご質問をお寄せ下さい最後になりましたが本書執筆は家族など大切な人をはじめ多くの方の協力が有り完成しました共著者の鈴木義郎君をはじめ協力なさった皆さんに厚く御礼を申し上げますまたこれまでに公開セミナー企業研修や通信講座共著書等を通じて寄せられたご質問も執筆のヒントになっています本当にありがとうございました 2014 年 6 月監修著者 : 米谷学

データの抽出に役立つ機能ここから E x cel の演習に入りますデータを扱うときのポイントの1 つであるデータの抽出に役立つ機能能フィルタ機能や V L OOKUP 関数を理解しましょう特に VLOOO KUP 関数は利用価値の高い関数ですこの章のねらい Excel の演演習を通じてフィルタ機能能を理解しましょう Excel の演演習を通じて VLOOKUP 関数を理解しましょうデータの抽出に役立つフィルタ機能 Excel による主なデータの抽出方法を考えてみますここでは次の2つを採り上げます 1 フィルタ機能特定の値や条件のデータのみを抽出 ( 表示 ) させる 2 VLOOKUP 関数特定の値に紐付けされた情報を呼び出すまずはフィルタ機能から説明しますフィルタ機能とは指定する条件に該当するデータのみをシートに表示させる機能ですこのとき表示されなかった情報は削除されるのではなくただ非表示になるだけですなおこの非表示になったデータは無視され表示されたデータのみを他のワークシートなどにコピー / 貼り付け( ペースト ) させることが可能です次の表は 136 名の顧客の居住地職業性別年齢過去のキャンペーン実施時に来店したかどうかをまとめたものです( 抜粋 ) 第 Ⅰ講演習用データ.xlsx ファイル 01_ フィルタ 1 シート Copyright 2014 Man abu Yoneya All rights reserved. 著者販売者者に無断で転載複写転売はご遠慮下さい

この表から Excel のフィルタ機能で居住地は京都年齢は 30 歳以下のみを抽出すると次のようになりますそれではこのようにデータを抽出する操作に入ります本来フィルタ機能は表の範囲のうちいずれかの任意のセルを 1 か所指定していれば良く表の範囲外を指定すると次のようにエラーメッセージが表示されフィルタ機能を実行できません今回 B 列はナンバリングの列なので本来処理の対象にする必要はありませんが操作の便宜上表の範囲のうち任意のセルを選択した状態で操作を始めます ( 但しこのとき表の周囲にはスペースを含め選択した範囲のデータとは無関係な文字等は入力されていないこと ) しょうじゅんなお特に顧客 ID が初期状態で昇順 ( 少ない値から多い値の順 ) で並んでいる場合は良いのですがそれ以外のルールに基づいてナンバリングされている場合などは Excel で並べ替え操作をした後でも元の状態に復元できるよう別途ナンバリング列を設けることをお勧めしますなおここでは京都在住の 30 歳以下のデータのみを抽出する操作を行います 1 データタブの並べ替えとフィルターグループからフィルターボタンをクリックしますフィルタのマークが範囲選択された各列に表示されました

複数の項目の情報を基に予測をする ( 重回帰分析 ) 分析の背景仮説次の表はある小売チェーン店 20 社の総売場面積店舗数と合計売上高を示した表です 20 社のデータで見られる売上高は総売場面積と店舗数に応じて増減するだろうという仮説の下 No. 1~ 20 のデータを基に総売場面積と店舗数により新たな 21 社目の売上高を予測する式を求めますまた売上高により影響を及ぼしている要因 ( 総売場面積か店舗数 ) はどれかを併せて分析しますここでは予測をしたいまたは注目している項目に対して複数の数値項目の関連を基に分析を行いますこのように複数の数値項目を一度に分析し関連や傾向を探ることを多変量解析と呼び回帰分析は多変量解析の中で代表的な分析手法の1つですそして総売場面積や店舗数の数値を基に売上高を予測し要因分析を行うことが回帰分析の目的ですまず予測式を求めるためめに回帰分析を実行します入力 X 範囲にあたる列が2つ以上有る場合散布図で予測式を求めることができません Excel の分析ツール回帰分析を利用します回帰分析の実行第 Ⅱ講演習用データ.xlsx ファイル 5.3.2 回帰分析シート要領は最高気温とアイスクリームの売上個数の事例と同じですが X 範囲と Y 範囲の指定を間違えないようにしましょう入力 X 範囲 (X) には総売場面積と店舗数のデータ列である C2 セルから D222 セルをマウスでドラッグして範囲選択をします設定が済んだら OK をクリックします Copyright 2014 Man abu Yoneya All rights reserved. 著者販売者者に無断で転載複写転売はご遠慮下さい

回帰分析を実行した結果は次のようになりました予測式を求める上記の回帰分析実行結果より予測式を作ります注目する点は切片と回帰係数の部分です売上高 = 2,149 + 48.283 総売場面積 + 15.203 店舗数要因分析をする第 Ⅱ講演習用データ.xls ファイル 5.3.4影響度シートさて回帰分析の実行結果から総売場面積と店舗数のうちどちらの項目がどの程度総売上高に影響を及ぼしているかを探ることができますそれには影響度を求めます Copyright 2014 Man abu Yoneya All rights reserved. 著者販売者者に無断で転載複写転売はご遠慮下さい

影響度 : には t 値の絶対値の大きい順に影響を及ぼしていると判断します切片の t 値はこの分析には無関係なので無視します統計学的には偏回帰係数という指標を使って影響度を求めますが Excel ではサポートしていませんまた t 値を使う方が精度が良いとされていますのでここでは偏回帰係数の説明は省略します絶対値とは正の値 (0 より大きい値 ) の場合はそのままの値負の値 (0 より小さい値 ) の場合はマイナスの記号を取り払った時の値を表します Excel では ABS 関数が絶対値を求める関数ですそれでは説明変数の中で t 値を比較してみましょう大小の比較をグラフで表すには棒グラフで表します数式 0-1 回帰分析実行結果から t 値を抜粋図 0-1 影響度影響度 18 16 14 12 10 8 6 4 2 0 総売場面積店舗数総売場面積の方がより売上高に影響を及ぼしていることがわかります t 値と P 値の統計学上の原則目的変数への影響度は t 値の絶対値の大きさで判断することを説明しました t 値は回帰係数 ( 隣の ) 標準誤差で求めていますまた P 値 (Excel では P- 値と表記 ) とは回帰係数が 0 であるつまり説明変数の回帰係数には意味が無いという仮説 ( 帰無仮説 ) を基に 0 を中心とした t 分布上の両側確率を求めたものです t 値を基に Excel の関数を使って T.DIST.2T 関数 (Excel2007 までの場合は TDIST 関数 ) で P 値を求めることもできます付録無相関の検定を参照 ) 先人の慣例により有意水準は 5% とすることが多くこのとき P 値が 0.05 未満だとその説明変数の回帰係数は有意であると判断することが多いです実際の重回帰分析においてしかし説明変数が 2 つ以上の回帰分析では説明変数を組み合わせることにより目的変数を説明するということに意味がありまた説明変数の組み合わせ方によって t 値や P 値は変化しますつまり個々の説明変数が有意かどうかよりも説明変数がどのような組み合わせならば回帰式として最適かを考えることを優先しなくてはなりません

有意水準を 5% としたとき P 値が 0.05 以上となった説明変数のことを有意ではないと表しますがその有意ではない説明変数が回帰式に無くても良いということではありません