斎藤参郎 データサイエンス A 2018 年度水曜日 2 限目 (10:40-12:10) 0. イントロダクション 講義の進め方 担当昨年度より 講義の方針 1) 自宅でも学習できる 2) 様々なデータ分析手法を自分でインストールし 実験できる 環境の紹

Similar documents
Jupyter Notebook を活用したプログラムライブラリ構築の検討 吹谷芳博 1, 藤澤正樹 1 ( 1 あすか製薬株式会社 ) Examination of the program library construction using Jupyter Notebook ASKA Pharm

XMP structure: 1

仮想化基礎演習テキスト Ⅰ 第 1.0 版 演習で学ぶ仮想化基礎 ( クライアント仮想化編 ) 九州ラーニングネット株式会社 特定非営利活動法人パソコン整備士協会

C3 データ可視化とツール

目次 はじめに 4 概要 4 背景 4 対象 5 スケジュール 5 目標点 6 使用機材 6 第 1 章 C# 言語 7 C# 言語の歴史 7 基本構文 8 C 言語との違い 9 Java 言語との違い 10.Netフレームワーク 10 開発資料 10 第 2 章 Mono 11 Monoの歴史 1

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

ウェブデザイン技能検定 1 級実技 平成 28 年度 第 4 回 ウェブデザイン技能検定 1 級 実技試験概要 試験にあたっての注意事項 試験者は本試験の留意事項 注意事項に留意して作業を行うこと ペーパー実技試験は 課題 1 から 5 までの 5 課題を 60 分間で行うこと 作業実技試験は 課題

目次 1. 本書の役割 Windows Agent サポート OS とエディション サポート言語 Agent 稼働前提条件 Azure SDK リリース済み Windows Agent のサポート

Rの基本操作

PowerPoint プレゼンテーション

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

プログラムのゴールと特徴 プログラムのゴールデータ分析職 ( データサイエンティストでなくとも ) に求められる高度な統計学や機械学習の理論とスキルを体系立てて理解し ビジネス課題に適用できる人材の育成を目指します 具体的には以下のことができるようになることを目指します 高度なデータ分析技術を用いて

データ解析分野 () 履修モデル 公開日 : 平成 0 月 日 アナリスト コンサルタント系 ( コンサルティング 証券 銀行マーケティング分析金融データ分析データサイエンティスト税理士 会計士ビッグデータ解析 データアナリストとして経営企画 戦略の立案 評価をする 学 専門 & ( 選択および選択

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Maple 12 Windows版シングルユーザ/ネットワークライセンス

TopSE並行システム はじめに

_Kobayashi

Windowsユーザでも 手軽に作れるiPhoneアプリ

PowerPoint プレゼンテーション

1 Microsoft Windows Server 2012 Windows Server Windows Azure Hyper-V Windows Server 2012 Datacenter/Standard Hyper-V Windows Server Windo

情報処理 Ⅰ 前期 2 単位 年 コンピューター リテラシー 担当教員 飯田千代 ( いいだちよ ) 齋藤真弓 ( さいとうまゆみ ) 宮田雅智 ( みやたまさのり ) 授業の到達目標及びテーマ コンピューターは通信技術の進歩によって 私達の生活に大きな影響を与えている 本講座は 講義と

Server and Cloud Platform template

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

sg_lenovo_os.xlsx

1-1- 基 OSS 概要に関する知識 ソフトウェアの新たな開発手法となりソフトウェア業界で大きな影響力を持つようになったオープンソースについて学習する 本カリキュラム Ⅰ. 概要では オープンソースの登場から現在に至る発展の経緯や代表的なソフトウェアの特徴を理解する 講義の後半では実際にソフトウェ

technews 2016 autumn

本校で身につけた能力 技術 技能 複雑な作業や応用的な作業にも対応できる 基本作業が身についている 未回答 やや複雑な作業にも対応できる 身につけることができなかった タイピング Windows の操作 Office アプリケーション (Word Excel) の操作 PowerPoint の操作開

WHITE PAPER RNN

講座内容 第 1 回オープンソースの理念 ( 講義 90 分 ) オープンソースという言葉の定義と概念を理解する あわせてオープンソースの基本的なライセンスを理 解する (1) オープンソースの登場と理念 1. オープンソースの定義 2. ネットスケープ社製品のソースコード公開 3. Open So

大域照明計算手法開発のためのレンダリングフレームワーク Lightmetrica: 拡張 検証に特化した研究開発のためレンダラ 図 1: Lightmetrica を用いてレンダリングした画像例 シーンは拡散反射面 光沢面を含み 複数の面光 源を用いて ピンホールカメラを用いてレンダリングを行った

5-3- 基統合開発環境に関する知識 1 独立行政法人情報処理推進機構

PowerPoint プレゼンテーション

目次 1. はじめに Kaspersky Security Center 10 に関する注意事項 インストール前 動作環境 Kaspersky Security Center 9.x から Kaspersky Securit

科目名情報処理応用担当教員濵田秀二常勤 非常勤実務経験有 対象学年 2 年対象学科環境情報システム学科コース情報プロフェッショナルコース履修時間 60 学修内容 情報処理技術者試験の IT パスポート試験 および 基本情報技術試験 の合格を目指し 過去問題の演習を行う 到達目標 情報処理技術者試験の

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

XMP structure: 1

Microsoft PowerPoint - no1_19.pptx

学術情報基盤オープンフォーラム 2019 クラウド活用最新事例 クラウドと Jupyter Notebook を使ったプログラミング教育 2019 年 5 月 29 日 室蘭工業大学桑田喜隆

分野 コース名 基礎的 IT セミナーコース一覧 内容 I T 理解 I T スキル活用 I T 倫理 新技術動向 業務の I T 化 ネットワーク 表計算 ベデーースタ プンレ / ゼ文ン書テ作ー成ショ ホームページ 情報発信コンンプスライア 情報テセィキュリ 1 第 4 次産業革命のインパクト新

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

How-to-Use-Mac.pages

PowerPoint プレゼンテーション

WebFOCUS検証

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

目次 研究目的 背景システム開発について実験および評価結論

[Unifinity]運用マニュアル

Microsoft Word - 26 【標準P】演習TN ArcGIS.doc

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

データ分析のまとめ方

Maple 18 スタンドアロン版インストール手順

金沢八景キャンパス (Foresight21 館 ) オープン利用アプリケーション一覧 ソフトウェア名 Microsoft Office ProPlus (Word,Excel,PowerPoint,Access) 施設名 F-103 インターネットラウンジ A (64bit) F-903 B (3

DataBase17-10.pptx

,…I…y…„†[…e…B…fi…O…V…X…e…•‡Ì…J†[…l…‰fi®“ì‡Ì›Â”‰›»pdfauthor

2011年11月10日 クラウドサービスのためのSINET 学認説明会 九州地区説明会 九州大学キャンパス クラウドシステムの導入 伊東栄典 情報基盤研究開発センター 1

,480 9,720 12,960 19,440 3,240 3, ,440 9,660 12,880 19,320 3,220 3, ,390 9,580 12,780 19,170 3,195 3, ,350 9,520


日心TWS

WEBサービス超入門 mask.key

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx


moodle24guidebook

untitled

目次 初めに... 3 実習用 PC... 3 USB ケーブル... 4 Visual Studio 2015 のインストール... 4.NET Micro Framework SDK のインストール... 6 Azure SDK のインストール... 9 補足 NET Micro F

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

楽2ライブラリ Smart

<4D F736F F F696E74202D20838A B E AC888D D836A B81698A7790B691CE899E

Flash Player ローカル設定マネージャー

2. 生田仮想デスクトップ PC の接続方法 生田仮想デスクトップ PC に接続する方法は 次の 2 通りです 1. HTML アクセス Internet Explorer や Safari などのブラウザを用います PC に特別なソフトウェアをインストールす る必要が無いので 管理者権限をもってい

ゲームプログラミング講習 第0章 導入

Microsoft Azure Microsoft Corporation Global Blackbelt Sales Japan OSS TSP Rio Fujita

VMware Horizon

B 20 Web

WS_EOS_user_Web


2. 生田仮想デスクトップ PC の接続方法 生田仮想デスクトップ PC に接続する方法は 次の 2 通りです 1. HTML アクセス Internet Explorer や Safari などのブラウザを用います PC に特別なソフトウェアをインストールす る必要が無いので 管理者権限をもってい

事前準備マニュアル

Microsoft PowerPoint - データ解析演習 0520 廣橋

Hortonworks Kitase

Microsoft Word - index.html

.NET テクノロジー概説 /WindowsAzure 入門 コード P-2 0:00~7:00 ( 休憩 時間含む ) 前提条件 Windows の操作経験 ( エクスプローラの操作 ファイルの操作 ) があること 最低開講人数 0 名.NET テクノロジー概説 /WindowsAzure 入門

統合運用管理ソフトウェア FUJITSU Software Systemwalker 総合カタログ

Part 1 IT CPU IT IT 1998 Windows NT Server 4.0, Terminal Server Edition 1 Windows Based Terminal WBT Windows CE 1 100Mbps 1Gbps LAN OS 1 PC 1 OS 2

PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部


1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します 一般に OSS は営利企業ではない特定のグループが開発するソフトウェアで ソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが 大規模な

( ) ( ) ( ) 2

12680 情報科学Ⅲ 情報メディア演習 情報機器の操作 [a] 担 当 者 加藤 周一 授 業 形 態 講義 コンピュータはハードウェアとソフトウェアがあって初めて我々に役に 立つ機器となる ハードウェアの原理 ソフトウェアのアルゴリズムに ついて述べる アルゴリズムについては実際に

ブート ~OS が起動されるまで~

Microsoft Azure Azure Microsoft Web Azure Microsoft Azure Azure IT Web (IoT) OS Docker Linux JavaScript Python.NET PHP Java Node.js Ruby ios Android W

Python によるジオプロセシング スクリプト入門

セミナー標準カリキュラム4.0

IPSJ SIG Technical Report Vol.2018-SE-200 No /12/ Proposal of test description support environment for request acquisition in web appli

SURVEY123 FOR ARCGIS スタートアップガイド 2017 年度空間情報科学野外実験

ファーマコメトリクス研究に 要求されるスキル及び そのための教育 (Sun) 第 1 回ファーマコメトリクス研究会 株式会社ベルシステム 24 医薬関連サービス事業本部生物統計局薬物動態解析グループ笠井英史

Rを使うための準備

SEO対策サービスパッケージ

Python によるジオプロセシング スクリプト入門

サーバに関するヘドニック回帰式(再推計結果)

Transcription:

斎藤参郎 saito@fukuoka-u.ac.jp データサイエンス A 2018 年度水曜日 2 限目 (10:40-12:10) 0. イントロダクション 講義の進め方 担当昨年度より 講義の方針 1) 自宅でも学習できる 2) 様々なデータ分析手法を自分でインストールし 実験できる 環境の紹介 3) データ分析技法を自習していくことができる基礎能力 講義内容で考慮すべき点 4) 多くの手法が電卓のように使える時代 2 つの異なった能力 a) 少数の手法について 何故の質問にこたえられる理論的背景 b) 多くの手法を使いまわせる対応力 5) 自分で分析するときに何が必要か データサイエンティスト汎用スキル a) 様々なデータを加工して自分の分析に使えるようにする b) 計算方法に工夫を加える c) システム化して 実用化する 6) 研究分野に特化した技能 a) 特徴を抽出する b) 原因と結果 政策効果を測る c) 統計的方法の理論的背景を知る統計学 数学 計量経済学 d) 原因と結果を結び付けるモデルを考える ( パネル ) e) 予測モデルをつくる 政策の効果予測 f) ビッグデータ g) テキストデータ h) 画像データ i) 音声データ j) リアルタイムの推定予測 ( 時系列 パネル ) 7) データサイエンスの道具箱 a) 計算機環境 OS Windows Mac Linux モバイル Androids ios Virtual Machine

VirtualBox VMware HyperV Xen リモートデスクトップ TeamViewer Google Remote Desktop Windows Remote Desktop Parallels b) プログラミング言語 フリー Python Winbugs (Bayesian) Stan (Bayesian) R SASOnDemand 商用 SAS Proc IML MatLab Mathematica Stata 言語のタイプ 関数形言語 vs 手続き型関数形 Mathematica, Python 行列を変数として扱える言語 MatLab SAS IML Python Object-Oriented Programming オープンソース R Stata Proc IML MatLab ウェブ ( プログラミング ) 言語 PHP JAVA Python 開発環境 ( エディターなど ) SAS Studio Viya データマイニングなどのツールが用意されている Jupyter Notebook Spyder

Eclipse c) BI ツール Tableau Dr.SUM d) クラウドコンピューティング クラウドサービス AWS Google Cloud Computing Azure (MicroSoft) SAS Studio Viya SaaS IaaS 講義の内容 1) メインのソフト開発環境 SASOnDemand を選択 SAS Studio = Viya SAS University Edition VM(Virtual Machine) アプライアンスとして配布 VirtualBox VMware workstation player # VirtuaBox,VMware も Linux の Ubuntu を OS として配布 # Python Anaconda も Ubuntu にインストール可 自分のパソコンへ SAS University Edition VirtualBox VMware MatLab 大学で本年度より導入済み (5000 円学生版 ) 研究所のパソコンに teamviewer でアクセス SAS14.3 使用できるようにしたい 2) プログラミング言語 SAS IML(Interactive Matrix Language) #14.2 より オープンソース化された #14.2 より データタイプに 数値の matrix のみならず table と list が加えられた # 数値処理のほかに テキスト処理の実習も可能となった # 他の言語の理解へ拡張するのに効果的 # 必要に応じて今後使えると望ましいもの MatLab 大学で本年度より導入済み Mathematica FQBIC で利用可

Python FQBIC でアクセスできるようにしたい STATA FQBIC でアクセス可 ArcGIS FQBIC で可 ( リモート不可 ) Winbugs (Bayesian) Stan (Bayesian) # R 大学で利用可 ( リモート不可 ) R-commander 大学で利用可 ( リモート不可 ) 3) 講義の内容 SASOnDemand の利用 (2 回 ) (Takanami, Funao et al. 2016) 第 1,2 章 SASOnDemand の登録 SAS Studio の利用 SAS によるデータ処理 SAS プログラミングの概観 (3 回 ) SAS プログラミング入門 1,2,5 WEB SAS Studio によるデータ解析 (4 回 ) (Takanami, Funao et al. 2016) 第 3 章 SAS Studio によるグラフ (3 回 ) (Takanami, Funao et al. 2016) 第 4,5 章 SAS IML モジュール (2 回 ) SAS プログラミング入門 3,4 WEB まとめ (1 回 ) 4) 講義日程 1 4 月 11 日 ( 水 ) 2 4 月 18 日 ( 水 ) イントロ SAS OnDemand SAS Studio SAS によるデータ処理 3 4 月 25 日 ( 水 ) 4 5 月 2 日 ( 水 ) 休講 5 5 月 9 日 ( 水 ) 6 5 月 16 日 ( 水 ) SAS プログラミング入門 1,2,5 WEB Data Step Proc step Cards; Proc freq; If Then Do; End; など 7 5 月 23 日 ( 水 ) 8 5 月 30 日 ( 水 ) 9 6 月 6 日 ( 水 ) 中間実技テスト 10 6 月 13 日 ( 水 ) SAS Studio によるデータ解析 要約統計量

検定 2 群間の差の検定 (t- 検定 ) 正確検定 ノンパラメトリック検定 ヒストグラム 相関分析 線形回帰 2 値データ ロジスティック回帰 生存時間分析 11 6 月 20 日 ( 水 ) 12 6 月 27 日 ( 水 ) 13 6 月 30 日 ( 土 ) 補講 SAS Studio によるグラフ 棒グラフ 箱ひげ ヒストグラム 折れ線 散布図 バブルプロット 時系列 14 7 月 4 日 ( 水 ) 15 7 月 11 日 ( 水 ) SAS IML によるプログラミング SAS IML の最新の動き モジュールとは マトリックス ( 行列の操作 ) Huff モデルによる予測計算 Huff モデルの推定 16 7 月 18 日 ( 水 ) まとめ期末試験解説 教科書 Takanami, Y., N. Funao, 高浪洋平 and 舟尾暢男 (2016). SAS Studio によるやさしい統計データ分析, オーム社. Ohashi, W. and 大橋渉 (2010). 統計を知らない人のための SAS 入門. 東京, Japan, オーム社. SAS (2016). SAS/IML 14.2 User's guide, SAS Institute.