クエリエディターを活用した公開データのデータ整形

Similar documents
サイボウズ Office 10「個人フォルダ」

年齢別人数計算ツールマニュアル

作成するアプリ 本書は 楽々 Web データベースで 一覧アプリ を作成する方法を説明します 以下のような Excel ファイルの一覧表を題材に 楽々 Web データベースに Excel ファイルを読み込ん でアプリを作成し 使用するまで を説明します 課題管理表.xlsx タイトル詳細 内容対応優

前回の内容 山形大学 OIRE の HP で公開している Power BI レポート 出身高校の所在地県別入学者数 ( 学校基本調査 ) の 2 ページ目と 6 ページ目を作成し Web を通じて共有することができる そのために必要なステップ 1. 公開データを入手 2. データ変

PowerPoint プレゼンテーション

サイボウズ Office 10「リンク集」

住所録を整理しましょう

サイボウズ Office 8 リンク集マニュアル

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

サイボウズ Office「リンク集」

PowerPoint プレゼンテーション

CONTENTS マニュアルの表記... S01-02_01 1.DataNature Smart 全体概要図... S01-02_11 2. 基本操作... S01-02_ ジョブの作成... S01-02_21 加工条件設定... S01-02_21 Step1: 処理対象データの指

WebCADD.com ご利用ガイド

第1部参考資料

2 / 25 複数ソフトの組み合わせ テキストファイルを Excel で開く テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 14 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Office ボタ

<4D F736F F D F8E FEE95F1836C F8EE88F878F F88979D8BC68ED2976C A2E646F63>

目 次 1. はじめに ソフトの起動と終了 環境設定 発助 SMS ファイルの操作 電話番号設定 運用条件 回線情報 SMS 送信の開始と停止 ファイル出力... 16

Windows8.1基礎 ファイル管理

第 12 講データ管理 1 2 / 14 ページ 12-1 データベースソフトの概要 データベースとは集められた様々なデータをテーマや目的に沿って分類 整理したものです データベースソフトでは データベースを作成し その管理を行います 何種類ものファイルや帳簿で管理していたデータをコンピュータ上で互

Microsoft PowerPoint - T4OOマニュアル_admin管理者_ pptx

スーパー英語アカデミック版Ver.2

DataWare-NETご利用ガイド

管理機能編目次 目次 1 管理機能 1) 物件データ登録依頼 2 2) 物件情報検索 8 3) ユーザー情報照会 10 4)WEB 依頼検索 15 管理機能編 1

クイックマニュアル(利用者編)

スライド 1

購買ポータルサイトyOASIS簡易説明書 a

目 次 1. ログイン システムの操作 データ検索 検索 CSV 出力 台帳表示 位置確認 詳細表示 データ編集

編集する ファイルを開く マイクロデータの設定を行うファイルまたはファイルを開きます 開かれたファイルは編集画面に表示されて ブラウザ表示した時のプレビューも同時に表示されます HTML ファイルの選択 編集する ファイルを開くためにメインメニューから ファイル 開く を選びます ファイル選択ダイア

アクセス履歴の確認 アクセス履歴の確認 名刺データへのアクセス履歴を 日単位で確認または月単位でファイル出力できます 日単位の履歴を確認する 名刺データへの過去 1 ヵ月のアクセス履歴を 日単位で確認できます 1 名刺管理画面を表示し 名刺管理 アクセス履歴 の順にクリックします 名刺管理画面の表示

目次 1. サイトの概要 2. このサイトで行なうこと 3. ログインするには 4. 情報発信会員 管理画面の説明 5. 掲載情報を決める 6. マイページを作成する 6-1 マイページのトップ画面について 7. コンテンツを作成する 7-1 掲載場所を決める 7-2 ページを作成する プロフィール

<4D F736F F D E322E33816A91E58BB3554E F B582BD8DCC935F936F985E837D836A B2E646F6378>

管理者メニュー 目次 目次 承認... 2 管理メニューを見る 会員一覧 グループ一覧 一括置換 引用管理 ( 名刺 ) パターン管理 ( 名刺 ) インフォメーション管理

【手引き】完了時の手続について

1. ログイン 1-1 管理画面へのログイン 施設の作成 編集 削除や承認 公開には その操作権限を持つアカウントでログイン します アカウントについての詳細は 管理者にお問い合わせください (1) [ ユーザー ID またはメールアドレス ] と [ パスワード ] を入力後 [ ログイン ] を

また Excel 読み込みウィザードで Excel ファイルを読み込むと 指定した設定が JSL(JMP のスクリプト言語 ) に自動保存できるた め この JSL を実行することにより 簡単に Excel データの再読み込みを行うことができます 次の 2 章では これらの読み込みオプションのいくつ

. 起動 目次 P.. ログイン 画面 P.. メニュー 画面 P.. POS 開示 _ 指定店舗 アイテム別 期間合計 画面 ( レポート A) P. 5. POS 開示 _ 店舗別 指定アイテム 期間合計 画面 ( レポート B) ----

目次 1. ログイン P2 2. 送受信管理 P メールの新規送信 P 未送信 ( 保存 ) メールの編集 削除 P 送信済みメールの状況確認 P6 3. メンバー ( 送信先 ) 管理 P メンバーの新規登録 編集 P メンバーの削除 P

棚POWER 操作テキスト 「棚割分析編-売上データ登録~棚割モデルとの紐付け-」

購買ポータルサイトyOASIS(サプライヤ用) b

スライド 0

目次 1.CALS システム利用から完了までの流れ 2 2. 納品データの登録 書類の提出 決裁 納品物を作る 5 3. 納品情報の入力 案件基本情報 書類納品情報 写真 図面等の納品情報 電子納品媒体作成 一括

アクセス履歴の確認 アクセス履歴の確認 名刺データへのアクセス履歴を 日単位で確認または月単位でファイル出力できます 日単位の履歴を確認する 名刺データへの過去 1 ヵ月のアクセス履歴を 日単位で確認できます 1 名刺管理画面を表示し 名刺管理 アクセス履歴 の順にクリックします 名刺管理画面の表示

Microsoft Word A08

すだちくんメール法人(所属設定職員管理)_docx

償却奉行 i8/ i シリーズ 汎用データ受入の手順書 汎用データの作成方法を知りたい 汎用データのフォーマットがわからない 汎用データ受入をしたら受入エラーが発生した について資産データの受入を例に説明します 本手順書では OBC 受入形式 ( ) の汎用データの受入を 受入フォーマットに従って

N-system 操作マニュアル

Amazon 広告レポート君ソフト Ver.1904 Copyright PBSupport. All rights reserved.

yukarik

スマクラ版バージョン 2 記録システム操作マニュアル マスタ管理 1 株式会社富士データシステム

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

Amazonポイントプログラム (設定編)

メール利用マニュアル (Web ブラウザ編 ) 1

システム設計書

給管鳥 : 請求入金額管理ツール Ver4 のインストール方法 1. 給管鳥請求入金額管理ツール Ver4 セットアップウィザードへようこそ の画面が表示されたら 次へ (N) をクリックします 2. インストールフォルダーの選択 画面が表示されます 特に変更の必要がなければ 次へ (N) をクリッ

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

1. 信頼済みサイトの設定 (1/3) この設定をしないとレイアウト ( 公報 ) ダウンロードなどの一部の機能が使えませんので 必ず設定してください 1 Internet Explorer を起動し [ ツール ]-[ インターネットオプション (O)] を選択します 2 [ セキュリティ ] の

改訂履歴 日付バージョン記載ページ改訂内容 V2.1 - 初版を発行しました V3.1 P5 ドキュメントラベルが新規追加された事を追記 P7 P8 新しくなったラベルのツリー表示説明を追記 新しくなったラベルの作成 削除操作を追記 P9 ラベルのグループ

CASEC

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

団体専用ページログイン認証について ログインする 1 メールアドレス パスワードを登録し ログインする ボタンを押してお進みください メールアドレスは 団体受験利用申請時に登録されたメールアドレスとなります その際 協会より発行されたパスワードをご利用ください 団体 ID パスワードをお忘れの方 2

本文中の記号の意味 本文中で使用している記号の意味について以下に示します システムの操作上または処理の手続き上において 特に注意していただきたい事項を記載しています 記載内容を必ずお読みください システムの操作上または処理の手続き上において 参考にしていただきたい事項を記載しています 必要に応じてお

POWER EGG2.0 Ver2.8 スタートアップガイド ~Webデータベース 応用編~

2 / 16 ページ 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっている

1 差し込み印刷について 1-1. 差し込み印刷の例 1 レターへ差し込み印刷 データファイル メイン文書 福岡純一郎様 熊本京子様 小泉浩二様 太郎 聖子 沙樹ちゃんの応援を宜しくお願いいたします 2 お誕生カードへ差し込み印刷 メイン文書 たろうちゃん データファイル せいこちゃん さきちゃん

PowerPoint プレゼンテーション

Microsoft Word MSExcel2010

目次 DjVu Viewer インストールガイド 信頼済みサイトへの登録 ポップアップブロックの解除 GSPc_Web 用インストーラのダウンロード方法 GSPc_Web 用インストーラのインストール... 8 GSPc_WEB 操作説

サイボウズ Office 10「個人フォルダ」

POWER EGG V2.01 ユーザーズマニュアル 汎用申請編

サイボウズ Office 8 アドレス帳マニュアル

ふれんずらくらく流通図面マニュアル

■デザイン

スライド 1

写真の閲覧方法 1. 閲覧する納品データの種類の選択 ( 写真 ) P3 写真の閲覧写真の閲覧写真の閲覧 2. 写真を一覧から選択 表示 3. 写真をサムネイル一覧から選択 表示 4. 写真をアルバム形式で表示 P5~ P7~ P9~ 5. 写真の便利な表示方法 拡大 / 縮小 回転 明るさ補正 6

LINE WORKS セットアップガイド目次 管理者画面へのログイン... 2 ドメイン所有権の確認... 3 操作手順... 3 組織の登録 / 編集 / 削除... 7 組織を個別に追加 ( マニュアル操作による登録 )... 7 組織を一括追加 (XLS ファイルによる一括登録 )... 9

3 カーソルの下に 点 という文字が現われます 地図を拡大して点データを作成したい地点にカーソルを動かしクリックします 4 属性情報の確認 変更 ダイアログが表示されます 必要事項を入力し OK をクリックします 全ての項目を入力する必要はありません 必要な項目のみ入力して下さい いろいろな記号が用

目次 専用アプリケーションをインストールする 1 アカウントを設定する 5 Windows クライアントから利用できる機能の紹介 7 1ファイル フォルダのアップロードとダウンロード 8 2ファイル更新履歴の管理 10 3 操作履歴の確認 12 4アクセスチケットの生成 ( フォルダ / ファイルの

Transcription:

クエリエディターを活用した 公開データのデータ整形 山形大学学術研究院 (ICT IR 担当 ) 鈴木達哉 suzukit@jm.kj.yamagata-u.ac.jp February 26, 2018 データマネジメント に関する勉強会 ( 於 : 東京工業大学キャンパスイノベーションセンター (CIC)509 号室 )

本日の内容 1. 目標の確認 2. クエリエディターについての説明 起動方法 画面の見方等 3. 簡単なデータで データ整形 を学ぶ 4. 実際のデータを使用して データ整形 を行う 元となるデータのダウンロード 確認 クエリエディターへの読み込み データの整形 エクセルファイルへの読み込み 5. クエリエディターのさらなる活用 2

1. 目標の確認 Power BI を活用した公開データの可視化 に関する勉強会 ( 2017 年 11 月 20 日開催 ) で作成した 出身高校の所在地別国公私立大学入学者数 レポートで使用するデータを容易に作成できるようになることを目標とし 結果 Excel もしくは Power BI 等の BI ツールで使いやすいロング型データを作成することができる 使用するデータ : 文部科学省 HP 公開統計情報 学校基本調査 内 出身高校の所在地県別入学者数 ( 学校基本調査 ) データ 3

2. クエリエディターについての説明 4

クエリエディターとは Power BI Excel に付属の クエリ を作成するための エディター 操作内容を ステップ として記録して それをまとめて クエリ を作成する これによって 変更の履歴が記録される また その履歴をステップごとに変更したり 削除したりすることができる 元となるデータをクエリエディターで読み込んで整形し それをエクセルに読み込ませて使用することで データ整形 が可能である クエリエディター 元データ データ整形 データベース等で 使いやすい形 5

クエリエディターの主な機能 データの型の変更 10 進数 整数 パーセンテージ 日付 テキスト等 行 列の変更 ( 追加 削除 ) 列の分割区切り記号 文字数による分割 値の置換 列のピボット解除 ( ワイド型をロング型に変換 ) ステップ クエリの記録手順を記録するため 戻ることができる Power Query 式言語による式の作成 6

クエリエディターを使用した データ整形 の流れ 1. Excelの データ タブの データの取得と変換 取得と変 換 から元となるデータの読み込み 2. クエリエディターを使用して データ整形 3. 整形後のデータをエクセルファイルに読み込み クエリエディター 元データ データ整形 データベース等で 使いやすい形 7

起動方法 Excel のバージョンによるメニューの違いのため 表示は違うが 機能は同一です Office 365 の場合 Excel 2016 の場合 8

画面の見方 タブ リボン部分 プレビューウィンドウ ( ステップの結果をプレビューできる ) クエリウィンドウ ( ファイルに記録されたクエリの選択ができる ) クエリの設定ウィンドウ ( ステップが記録される ) 9

3. 簡単なデータで データ整形 を学ぶ 10

1. クエリエディターでデータを読み込む 元となるデータ ( 計 国立 私立のシートがある ) サンプル 16 出身高校の所在地県別入学者数.xlsx Power BI やデータベースで使用するために タイトル 合計 注意書き 見やすくするためのワープロ的なパーツは不要なので 整形する必要がある 11

1. クエリエディターでデータを読み込む 作成したいデータ 出身高校の所在地がある都道府県から 何処の都道府県に進学したのか わかるレポートを作成するために 以下のデータがまとまったテーブルを作成する 公開データから取得学校基本調査 出身高校の所在地県別入学者数大学 大学院 自作する等県別の地方区分 附番済み都道府県一覧など 今回は作成しない 年度 大学の所在地 出身高校の所在地 大学の所在地方 出身高校の所在地方 国公私立 入学者数 2016 北海道 北海道 北海道地方 北海道地方 国立 3138 2016 北海道 北海道 北海道地方 北海道地方 公立 825 2016 北海道 北海道 北海道地方 北海道地方 私立 9381 2016 北海道 青森県 北海道地方 東北地方 国立 138 2016 北海道 青森県 北海道地方 東北地方 公立 48 2016 北海道 青森県 北海道地方 東北地方 私立 171 2016 北海道 岩手県 北海道地方 東北地方 国立 146 12

1. クエリエディターでデータを読み込む Excel を起動 空白のブック 13

1. クエリエディターでデータを読み込む Excel を起動 1 データ タブ 2 データの取得と変換 の中の データの取得 14

1. クエリエディターでデータを読み込む データの取得 - ファイルから - ブックから で エクセルファイルを指定する ブックから は エクセルファイル指定を意味する 取得できるデータは多種多様 エクセルファイルのほかにも CSV,XML,JSON, SQL Server,Access,WEB, ODBC,Azure,Facebook などが選択可能 15

1. クエリエディターでデータを読み込む 事前配布済 サンプル 16 出身高校の所在地県別入学者数.xlsx を選択 選択し インポート サンプル 16 出身高校の所在地県別入学者数.xlsx 16

1. クエリエディターでデータを読み込む 複数のアイテムの選択 にチェックをいれ ナビゲーターウィンドウ内の 16(8-1) 16(8-3) 16(8-5) を選択し 編集 ボタンを押す このエリアには シート 名前の付いた範囲等が表示される 範囲を自分で設定可能 エクセルファイルの時点で わかりやすいように名前を付け その後の処理を簡易化可能 簡易的なプレビュー 17

1. クエリエディターでデータを読み込む クエリエディターが起動し データのプレビューができる この画面で ステップを記録していく プレビューウィンドウ ( ステップの結果をプレビューできる ) クエリの設定ウィンドウ ( ステップが記録される ) クエリウィンドウ ( ファイルに記録されたクエリの選択ができる ) 18

2. データの整形 不要な行の削除上から 3 行目まで不要なため削除する ホームタブ - 行の削除 - 上位の行の削除 上から何行分削除するか指定する 今回は 3 行なので 3 と入力する 行の削除の種類 上位だけでなく 下位 代替行 空白行などの指定ができるので 柔軟な編集が可能 19

2. データの整形 ヘッダー行の設定 この行をヘッダー行として活用したい ホーム - 変換 - 1 行目をヘッダーとして使用 で 先頭行を列見出しに変換することができる ヘッダー行に変換された 20

2. データの整形 さらに不要な行の削除 1 この 2 行を削除する 2 データの入っていない行を削除する ( 行の保持 を使用する ) 21

2. データの整形 不要な列の削除 列の削除 で使用していない列を除去 列の削除には 2 つのパターンがある 列の削除 = 選択した列を削除する 他の列の削除 = 選択した列を残す 22

2. データの整形 ヘッダーの名前の変更 ヘッダー名を右クリック - 名前の変更 から 大学の所在地 に変更する 少しづつ整ってきました 23

2. データの整形 ワイド型 から ロング型 へ変換列を指定して 変換 タブの 任意の列 の中にある 列のピボット解除 変換したい列を指定することで その列のみ 変換される 24

2. データの整形 ヘッダー名の変更 データ型の変更をする データ型を テキスト に変更 出身高校の所在地 に名前の変更 入学者数 に名前の変更 25

2. データの整形 値に含まれるスペースの除去 都道府県名に 半角スペース 全角スペース が入っていたため 除去したい それぞれの列で 全角スペース 半角スペース が入っているため 分析しやすくするために 統一しておいたほうが良い 26

2. データの整形 スペースの除去の方法 ホーム - 変換 内の 値の置換 で スペース を置き換える 変換 タブ - 任意の列 内にも 同様に 置換 がある スペースの違いに注意 スペース を 無 に置換 大学の所在地 : 全角スペース 出身校の所在地 : 半角スペース スペースの除去の方法 1. 単純な置換 2. 新しい列を作成し置換後のものを入れる 3.Power Query 構文を使用する Text.Remove( 青 森, ) Text.Replace( 青 森,, ) 参考 :Power Query M function Reference https://msdn.microsoft.com/library/1ed840b1-7e20-4419-ad2f-d82054c9b2ab 27

2. データの整形 カスタム列の追加 このデータは 合計 なので 新しい列名として 国公私立 追加して その式を = 計 とつける ( 国立 私立 と区別して データに入っていない 公立 を作るための準備 ) 28

2. データの整形 整形列の順序 データ型を整える 大学の所在地 出身高校の所在地 国公私立 入学者数 国公私立を前にドラッグアンドドロップ 入学者数のデータ型を テキスト にする 29

2. データの整形 クエリ名をわかりやすいものに変更する 平成 29 年度 _ 計 に変更する 30

2. データの整形 他のクエリ名もわかりやすいものに変更する 31

2. データの整形 他のシートも同様に整形する 平成 29 年度 _ 国立 : 国公私立 は 国立 平成 29 年度 _ 私立 : 国公私立 は 私立 32

2. データの整形 今回は 計 国立 私立 のデータから 公立 も出す必要があるため さらに修正が必要となる 公立 = 計 - 国立 - 私立 として計算する 計 国立 私立 の 3 つのクエリをマージして つなげる その後 公立 を計算し 再び 列のピボット解除 で ロング型に変換する 33

2. データの整形 クエリのマージ 一度に2つしかマージできないため 2 回処理が必要 1 計 に 国立 をマージ2さらに 私立 をマージ 1 計 に 国立 をマージ 値が テーブル となる テーブルは 中に複数の値を持つ クリックし 展開したい値を選択する 今回は 国公私立 と 入学者数 を選択する わかりやすくするため 元の列名をプレフィックスとして使用する にチェックをいれ OK とする 34

2. データの整形 2 さらに 私立 をマージ 確認の為使用した 3 つの列は削除 計 に名前変更 国立 に名前変更 私立 に名前変更 35

2. データの整形 公立 のカスタム列を追加する 式 =[ 計 ]-[ 国立 ]-[ 私立 ] 36

2. データの整形 計 の列を削除 列のピボット解除 でロング型に変換する 計 の列を削除 型を 10 進数にして 解除する範囲に 国立 私立 公立 を指定すること 37

2. データの整形 属性 : 国公私立 値 : 入学者数 に名前を変更する 38

3. データの読み込み データの整形が完了したので ホーム - 閉じて読み込む で データをエクセルファイルに流し込む エクセルに新規シートが作成され 整形されたデータが挿入される 39

3. データの読み込み ワイド型からロング型への変換完了修正完了後のデータがエクセルファイルに読み込まれた あとは このデータを Power BI やその他データベースに取り込むことができる データベース等で 使いやすい形 40

3. データの読み込み データの確認をする中で 修正したい点が出てきた場合 クエリエディターに戻って 再度編集ができる 例えば 都道府県名に 半角スペース 全角スペース が入っていたため 除去したい クエリ タブの 編集 からクエリエディターに戻り再度編集が可能 41

3. データの読み込み 複数のファイルの結合 ホーム タブの クエリの追加 を使用する 同じカラム名であれば下部に追加される 必要年度分のクエリを作成し すべて結合することで 複数年のデータ作成が可能 必要年度を追加して 一気に結合が可能 複数のファイルの結合 クエリのマージ JOIN Table.NestedJoin クエリの追加 UNION Table.Combine 42

4. 実際のデータで データ整形 を行う 43

1. 公開データの入手方法 作成するデータ過去 10 年間の 出身高校の所在地がある都道府県から 何処の都道府県に進学したのか わかるレポートを作成するために 以下のデータがまとまったテーブルを作成する 公開データから取得学校基本調査 出身高校の所在地県別入学者数大学 大学院 自作する等県別の地方区分 附番済み都道府県一覧など ( すでに作成済みのものを VLOOKUP 関数等で結合する ) 年度 大学の所在地 出身高校の所在地 大学の所在地方 出身高校の所在地方 国公私立 入学者数 2016 北海道 北海道 北海道地方 北海道地方 国立 3138 2016 北海道 北海道 北海道地方 北海道地方 公立 825 2016 北海道 北海道 北海道地方 北海道地方 私立 9381 2016 北海道 青森県 北海道地方 東北地方 国立 138 2016 北海道 青森県 北海道地方 東北地方 公立 48 2016 北海道 青森県 北海道地方 東北地方 私立 171 2016 北海道 岩手県 北海道地方 東北地方 国立 146 44

1. 公開データの入手方法 文科省の 年次統計 統計表一覧 から e-stat のホームページへ 45

1. 公開データを入手方法 文科省の学校基本調査データを入手する e-statから入手する方法は複数ある 1. ファイルから探す でエクセルファイルをダウンロード 2. データベースから探す でDB 機能でダウンロード 3. API 機能 でAPI 登録してダウンロード 今回は ファイルから探す を使用する 46

1. 公開データの入手方法 検索条件を入力 出身高校の所在地県別入学者数大学 大学院 で一覧取得可能 または 一括ダウンロード 調査年月 でソートして 必要なエクセルファイルをダウンロードする 今回は 時間の都合上 2 年分 ( 平成 28 年度 ~29 年度 ) で作業を行います 47

1. 公開データの入手方法 シートの内容について 2 つのシートを合わせて 1 つの内容になる そのため 結合する必要がある また 公立がないため それを別途作成する必要がある シート名 表の名称 内容について 16(8-1) 16 出身高校の所在地県別入学者数 ( 8-1 ) 1 計 16(8-2) 16 出身高校の所在地県別入学者数 ( 8-2 ) 1 計 ( つづき ) 結合 16(8-3) 16 出身高校の所在地県別入学者数 ( 8-3 ) 2 国立 16(8-4) 16 出身高校の所在地県別入学者数 ( 8-4 ) 2 国立 ( つづき ) 結合 組み合わせる 16(8-5) 16 出身高校の所在地県別入学者数 ( 8-5 ) 3 私立 16(8-6) 16 出身高校の所在地県別入学者数 ( 8-6 ) 3 私立 ( つづき ) 結合 16(8-7) 16 出身高校の所在地県別入学者数 ( 8-7 ) 4 計のうち男 18(8-8) 16 出身高校の所在地県別入学者数 ( 8-8 ) 4 計のうち男 ( つづき ) ここでは取り扱わない 48

2. データ整形 シートの内容について 2 つのシートを合わせて 1 つの内容になる そのため 結合する必要がある また 公立がないため それを別途作成する必要がある ステップ 手順 1 H28 H29のエクセルファイルをダウンロード 2 H28をクエリエディターで読み込む 3 計 国立 公立をそれぞれ1つにまとめる 4 公立の入学者数を作成する 5 ロング型に変換を行いH28 (2016 年度 ) とする 6 H29をクエリエディターで読み込む 7 計 国立 公立をそれぞれ1つにまとめる 8 公立の入学者数を作成する 9 ロング型に変換を行いH29 (2017 年度 ) とする 10 出来上がった2つのクエリを クエリの追加 で1つにする 11 閉じて読み込む でエクセルファイルに流し込む 49

2. データ整形 グループ化同じ意味合いのクエリをグループ化することで 見やすくすることが可能 グループ化することで 見やすくできる 50

3. エクセルに読み込む 最終的には 都道府県と所在地方 のテーブルも組み合わせることで 希望したデータが完成する 51

3. エクセルに読み込む 今回のようにクエリエディターを活用することで 元データの データ 整形 業務が非常に楽になり Power BI のレポート作成をスムーズに行 うことができます どんどん活用して下さい クエリエディター 元データ データ整形 データベース等で 使いやすい形 52

5. クエリエディターのさらなる活用 53

1. 公開データの入手方法 文科省の学校基本調査データを入手する e-statから 1. ファイルから探す でエクセルファイルをダウンロード 2. データベースから探す でDB 機能でダウンロード 3. API 機能 でAPI 登録してダウンロード ウェブ上で データ整形をある程度行う クエリエディター WEB から 情報を取得する機能を使う 54

2. データベースから探す で DB 機能でダウンロード 検索条件 出身高校の所在地県別入学者数大学 大学院 で一覧取得可能 DB から e-stat の 統計表表示 機能で加工する 平成 29 年度のデータは まだ DB 化されていない 55

2. データベースから探す で DB 機能でダウンロード レイアウト変更後 CSV ファイルをダウンロード 最後にクエリエディターで少しの加工のみで 希望の形式の作成が可能 56

2. データベースから探す で DB 機能でダウンロード 検索条件 出身高校の所在地県別入学者数大学 大学院 で一覧取得可能 API でクエリエディターに読ませても良い 要 appid 57

3. API 機能 で API 登録してダウンロード API を使用する方法もあります (s-stat の API 使用 ) API 機能を使う マイページを登録することで API 使用可能 58

3. API 機能 で API 登録してダウンロード 統計情報の取得 パラメータ表示 で 生成された API パラメータをブラウザ上に表示し それをクエリエディターで読み込ませて 各年度の統計表 ID 一覧を取得する 59

3. API 機能 で API 登録してダウンロード 統計データの取得 ちょっと面倒ですが この統計表 ID を使って データを取得する CSV でダウンロードしても良いし API パラメータを使って クエリエディターで読んでも良い 60

3. API 機能 で API 登録してダウンロード ロング型のデータを入手可能 但し 修正が必要 列名や並びが若干違う 平成 23 年度は 3 年分が一度に入っている等 すべて統一されていないため 修正が必要である 61