Amazon Redshift - 入門ガイド - PDF 無料ダウンロード

Amazon Redshift 入門ガイド

Amazon Redshift: 入門ガイド Copyright 2018 Amazon Web Services, Inc. and/or its affiliates. All rights reserved. Amazon's trademarks and trade dress may not be used in connection with any product or service that is not Amazon's, in any manner that is likely to cause confusion among customers, or in any manner that disparages or discredits Amazon. All other trademarks not owned by Amazon are the property of their respective owners, who may or may not be affiliated with, connected to, or sponsored by Amazon.

Table of Contents ご利用開始にあたって... 1 ステップ 1: 前提条件の設定... 1 AWS にサインアップする... 2 SQL クライアントのトライバーとツールのインストール... 2 ファイアウォールルールの決定... 3 ステップ 2: IAM ロールを作成する... 3 Amazon Redshift 用の IAM ロールを作成するには... 3 ステップ 3: クラスターを起動する... 4 Amazon Redshift クラスターを起動するには... 4 ステップ 4: クラスターへのアクセスの許可... 9 VPC セキュリティグループ (EC2-VPC Platform) を設定するには... 10 Amazon Redshift セキュリティグループを設定するには... 11 ステップ 5: クラスターに接続する... 11 接続文字列を取得するには... 12 SQL Workbench/J からクラスターに接続するには... 12 ステップ 6: サンプルデータをロードする... 14 ステップ 7: 他のリソースの検索と環境のリセット... 18 ここからどこへ進むべきですか?... 18 ドキュメント履歴... 22 iii

ステップ 1: 前提条件の設定 Amazon Redshift の使用開始ガイドへようこそ Amazon Redshift はクラウド内での完全マネージド型ペタバイトスケールのデータウェアハウスサービスです Amazon Redshift データウェアハウスはノードと呼ばれるコンピューティングリソースのコレクションでありこれらはクラスターと呼ばれるグループを構成します各クラスターは 1 つの Amazon Redshift エンジンを実行し 1 つ以上のデータベースを含みます Amazon Redshift を初めて使用する方には次のセクションを初めに読むことをおすすめします Amazon Redshift Management Overview このトピックでは Amazon Redshift の概要を説明しますサービスのハイライトと価格設定この製品詳細ページには Amazon Redshift の価値提案サービスのハイライト価格設定が掲載されています (本ガイド) 本ガイドでは Amazon Redshift を使用してサンプルクラスターを作成しサンプルデータを操作する方法を実践的に説明します Amazon Redshift で PoC (概念実証) ソリューションを構築する場合 Amazon Redshift の PoC (概念実証) の構築を読まれることを推奨します本ガイドは Amazon Redshift のサンプルクラスターを作成する手順を説明するために設計されたチュートリアルですこのサンプルクラスターは Amazon Redshift サービスを評価するのに使用できます本チュートリアルでは次の手順を実行しますステップ 1: 前提条件の設定 (p. 1) ステップ 2: IAM ロールを作成する (p. 3) ステップ 3: Amazon Redshift サンプルクラスターの起動 (p. 4) ステップ 4: クラスターへのアクセスの許可 (p. 9) ステップ 5: サンプルクラスターに接続する (p. 11) ステップ 6: Amazon S3 のサンプルデータをロードする (p. 14) ステップ 7: 他のリソースの検索と環境のリセット (p. 18) 本チュートリアルを完了した後はここからどこへ進むべきですか? (p. 18)で Amazon Redshift に関する詳細と次に行うステップを説明しています Important 作成するサンプルクラスターはライブ環境で実行されます本チュートリアルで設計されるサンプルクラスターの使用についてはサンプルクラスターを削除するまでのオンデマンドレートが 1 時間あたり 0.25 USD になります料金表の詳細については Amazon Redshift の料金表ページを参照してくださいご質問がある場合や問題が発生した場合はディスカッションフォーラムに投稿することで Amazon Redshift チームに問い合わせることができます本チュートリアルでは運用環境での使用を想定していないためオプションについては詳しく説明しません本チュートリアルの手順を完了したらその他のリソース (p. 18)セクションを参照してクラスターの計画展開保守やデータウェアハウスのデータの操作についてより詳細な情報を得ることができますステップ 1: 前提条件の設定 Amazon Redshift クラスターの設定を開始する前にこのセクションに記載する前提条件を満たしていることを確認してください AWS にサインアップする (p. 2) 1

AWS にサインアップする SQL クライアントのトライバーとツールのインストール (p. 2) ファイアウォールルールの決定 (p. 3) AWS にサインアップするまだ AWS アカウントをお持ちでない場合はサインアップしてアカウントを作成してくださいすでにアカウントをお持ちの場合はこの前提条件をスキップして既存のアカウントを使用します 1. https://aws.amazon.com/ を開き [Create an AWS Account] を選択します Note 過去に AWS マネジメントコンソールにサインインした場合はお使いのブラウザで使用できないことがありますその場合は [Sign in to a different account] を選択し次に [Create a new AWS account] を選択します 2. オンラインの手順に従いますサインアップ手順の一環として通話呼び出しを受け取り電話のキーパッドを用いて PIN を入力することが求められます SQL クライアントのトライバーとツールのインストール Amazon Redshift クラスターへの接続には Amazon Redshift JDBC または ODBC のドライバーを使用するほとんどの SQL クライアントツールを使用できます本チュートリアルでは SQL Workbench/J を使って接続する方法を説明しますこれは無料で使える DBMS に依存しないクロスプラットフォームの SQL クエリツールですこのチュートリアルを完了させるために SQL Workbench/J を使用する場合は次の手順に従って Amazon Redshift JDBC ドライバーおよび SQL Workbench/J をセットアップしてください SQL Workbench/J のインストールの詳細な手順については Amazon Redshift Cluster Management Guide の SQL Workbench/J クライアントのセットアップを参照してください Amazon EC2 インスタンスをクライアントコンピュータとして使う場合はそのインスタンスに SQL Workbench/J および必要なドライバーをインストールします Note サードパーティ製データベースツールでクラスターに使用したいものがあれば別途インストールする必要があります Amazon Redshift によりサードパーティ製のツールやライブラリが提供されたりインストールされることはありませんクライアントコンピュータに SQL Workbench/J をインストールするには 1. 2. 3. SQL Workbench/J のソフトウェアライセンスを確認します SQL Workbench/J ウェブサイトに移動し使用するオペレーティングシステムに適したパッケージをダウンロードします Installing and starting SQL Workbench/J ページにアクセスして SQL Workbench/J をインストールします Important 4. SQL Workbench/J に必要な Java ランタイムのバージョンを確認して必ずそのバージョンを使用してください違うバージョンでは SQL Workbench/J が動作しません JDBC 接続を設定するを参照して Amazon Redshift JDBC ドライバーをダウンロードし SQL Workbench/J をクラスターに接続できるようにします 2

ファイアウォールルールの決定 Amazon Redshift JDBC または ODBC ドライバの使用の詳細については Amazon Redshift での接続の設定を参照してくださいファイアウォールルールの決定本チュートリアルの一部として Amazon Redshift クラスターを起動するときのポートを指定しますまたこのポートを経由するクラスターへのアクセスを許可するためにインバウンド進入ルールをセキュリティグループに作成しますお使いのクライアントコンピュータがファイアウォールの内側にある場合は SQL クライアントツールからクラスターに接続してクエリを実行できるように使用可能な開いているポートを把握しておく必要がありますポートが分からない場合はネットワークファイアウォールルールを把握している担当者の協力を得てファイアウォールの開いているポートを判別する必要があります Amazon Redshift はデフォルトでポート 5439 を使用しますがお使いのファイアウォールでこのポートが開いていない場合は接続できません Amazon Redshift クラスターの作成後にポート番号を変更することができないため起動処理の際には必ずお使いの環境で機能する開いているポートを指定してくださいステップ 2: IAM ロールを作成する COPY コマンドを使用して Amazon S3 からデータをロードするなど他の AWS リソースのデータにアクセスする操作についてはクラスターはユーザーに代わってリソースおよびリソースのデータへのアクセス許可が必要ですクラスターにアタッチされている IAM ロールを通してまたは必要なアクセス権限を持つ IAM ユーザー用の AWS アクセスキーを提供することによって AWS Identity and Access Management を使用してこれらのアクセス許可を提供します機密データおよび AWS 認証情報を保護するために IAM ロールを作成しクラスターにアタッチすることをお勧めしますアクセス許可の提供の詳細については他の AWS のリソースにアクセスするためのアクセス権を参照してくださいこのステップでは Amazon Redshift が Amazon S3 バケットからデータをロードできるようにする新しい IAM ロールを作成します次のステップではクラスターにロールをアタッチします Amazon Redshift 用の IAM ロールを作成するには 1. 2. 3. AWS マネジメントコンソールにサインインし IAM コンソール https://console.aws.amazon.com/ iam/ を開きます左のナビゲーションペインで [Roles] を選択します [Create role] を選択します 4. 5. [AWS Service] グループの [Redshift.] を選択します [Select your use case] で [Redshift - Customizable] [Next: Permissions] の順に選択します 6. [Attach permissions policies] ページで [AmazonS3ReadOnlyAccess] [Next: Review] の順に選択します 7. [Role name] にロールの名前を入力しますこのチュートリアルでは myredshiftrole を入力します 8. 情報を確認してから [Create Role] を選択します 9. 作成したロールのロール名を選択します 10. clipboard に [Role ARN] をコピーしますこの値は作成したロール用の Amazon Resource Name (ARN) ですステップ 6: Amazon S3 のサンプルデータをロードする (p. 14) で COPY コマンドを使用してデータをロードする際にこの値を使用します新しいロールを作成したら次はクラスターにアタッチしますロールは新しいクラスターの起動時にアタッチするか既存のクラスターにアタッチできます次のステップでは新しいクラスターにロールをアタッチします 3

ステップ 3: クラスターを起動するステップ 3: Amazon Redshift サンプルクラスターの起動前提条件を満たしたら Amazon Redshift クラスターを起動することができます Important ここで起動するクラスターはライブとなります (サンドボックスで実行されるわけではありません) クラスターを削除するまでそのクラスターについて Amazon Redshift 標準使用料が発生しますここで説明したチュートリアルを 1 種類の設定だけで実行し完了した時点でクラスターを削除すれば課金される合計料金はごくわずかです Amazon Redshift クラスターを起動するには 1. AWS マネジメントコンソールにサインインし Amazon Redshift コンソール https:// console.aws.amazon.com/redshift/ を開きます Important IAM ユーザー認証情報を使う場合はそのユーザーにクラスター操作を実行するために必要な権限があるか確認してください詳細については Amazon Redshift Cluster Management Guide の IAM ユーザーへのアクセスの制御をご覧ください 2. メインメニューでクラスターを作成するリージョンを選択しますこのチュートリアルでは [米国西部 (オレゴン)] を選択します 3. Amazon Redshift ダッシュボードで [Launch Cluster] を選択します Amazon Redshift ダッシュボードは以下のような内容です 4. [Cluster Details] ページで次の値を入力してから [Continue] をクリックします 4

Amazon Redshift クラスターを起動するには [Cluster Identifier]: examplecluster と入力します [Database Name]: このボックスは空欄のままにします Amazon Redshift によりデフォルト名 dev でデータベースが作成されます [Database Port]: データベースへの接続を受け入れるポート番号を入力しますこのポート番号には本チュートリアルの前提条件のステップで決定した番号を使用しますクラスターの起動後にポートを変更することはできないので SQL クライアントツールからクラスターのデータベースに接続できるようにお使いのファイアウォールの開いているポート番号を確認しておきます [Master User Name]: masteruser と入力しますクラスターが使用可能になったらこのユーザー名とパスワードを使用してデータベースに接続します [Master User Password] と [Confirm Password]: マスターユーザーアカウントのパスワードを入力します 5. [Node Configuration] ページで次の値を選択してから [Continue] を選択します [Node Type]: dc2.large [Cluster Type]: Single Node 5

Amazon Redshift クラスターを起動するには 6. [Additional Configuration] ページではお使いの AWS アカウントによって異なるオプションが表示されますこのアカウントによりクラスターで使用するプラットフォームのタイプが決まります本チュートリアルでは話を単純にするため EC2-Classic と EC2-VPC のプラットフォームの違いを理解する必要はありませんチュートリアルの後でその他のリソース (p. 18)の情報を利用してAmazon Redshift Cluster Management Guideを参照しさらに詳しい情報を得ることができます EC2-VPC 選択したリージョンにデフォルトの VPC が存在する場合は EC2-VPC プラットフォームを使用してクラスターを起動します画面は次のようになります 6

Amazon Redshift クラスターを起動するには EC2-VPC プラットフォームでクラスターを起動する場合は次の値を使用します [Cluster Parameter Group]: デフォルトのパラメータグループを選択します Encrypt Database: None [Choose a VPC]: デフォルトの VPC (vpc-xxxxxxxx) [Cluster Subnet Group]: デフォルト [Publicly Accessible]: Yes [Choose a Public IP Address]: No Enhanced VPC Routing: No [Availability Zone]: No Preference [VPC Security Groups]: デフォルト (sg-xxxxxxxx) Create CloudWatch Alarm: No メンテナンストラック: Current (最新) EC2-Classic VPC が存在しない場合は EC2-Classic プラットフォームを使用してクラスターを起動します画面は次のようになります 7

Amazon Redshift クラスターを起動するには EC2-Classic プラットフォームでクラスターを起動する場合は次の値を使用します [Cluster Parameter Group]: デフォルトのパラメータグループを選択します Encrypt Database: None [Choose a VPC]: Not in VPC [Availability Zone]: No Preference [Cluster Security Groups]: デフォルト Create CloudWatch Alarm: No メンテナンストラック: Current (最新) 7. IAM ロールとクラスターを関連付けます [AvailableRoles] で [myredshiftrole] を選択し [Continue] を選択します 8. [Review] ページで選択した内容を確認してから [Launch Cluster] を選択します画面は次のようになります 8

ステップ 4: クラスターへのアクセスの許可 9. 確認ページが表示されクラスターの処理が完了するまで数分かかります [Close] を選択してクラスターのリストに戻ります 10. [Clusters] ページで先ほど起動したクラスターを選択し [Cluster Status] 情報を確認します本チュートリアルで後ほどデータベースに接続する前に [Cluster Status] が available に [Database Health] が healthy になっていることを確認しますステップ 4: クラスターへのアクセスの許可前のステップでは Amazon Redshift クラスターを起動しましたクラスターに接続する前にアクセスを許可するためのセキュリティグループを構成する必要があります 9

VPC セキュリティグループ (EC2VPC Platform) を設定するには EC2-VPC プラットフォームでクラスターを起動した場合は VPC セキュリティグループ (EC2-VPC Platform) を設定するには (p. 10)の手順に従います EC2-Classic プラットフォームでクラスターを起動した場合は Amazon Redshift セキュリティグループを設定するには (p. 11)の手順に従います Note これらの 2 種類のセキュリティグループのうち設定するのはどちらかでかまいませんクラスターを起動したプラットフォームに対応する手順に従います VPC セキュリティグループ (EC2-VPC Platform) を設定するには 1. Amazon Redshift コンソールのナビゲーションペインで [Clusters] を選択します 2. examplecluster を選択してこのクラスターを開き [Configuration] タブが表示された状態にします 3. [Cluster Properties] の下の [VPC Security Groups] でセキュリティグループを選択します 4. セキュリティグループが Amazon EC2 コンソールで開いたら [Inbound] タブを選択します 5. [Edit] を選択し次のように入力してから [Save] を選択します [Type]: Custom TCP Rule [Protocol]: TCP [Port Range]: クラスターの起動時に使用したのと同じポート番号を入力します Amazon Redshift のデフォルトのポートは 5439 ですがお使いのポートはこれと異なる場合があります [Source]: [Custom IP] を選択し 0.0.0.0/0 と入力します Important 0.0.0.0/0 と入力するとインターネット上のすべてのコンピュータからアクセス可能になるためデモ目的以外での使用は推奨しません実際の環境ではお使いのネットワーク設定に基づいてインバウンドルールを作成します 10

Amazon Redshift セキュリティグループを設定するには Amazon Redshift セキュリティグループを設定するには 1. Amazon Redshift コンソールのナビゲーションペインで [Clusters] を選択します 2. examplecluster を選択してこのクラスターを開き [Configuration] タブが表示された状態にします [Cluster Properties] の下の [Cluster Security Groups] で [default] を選択してデフォルトのセキュリティグループを開きます 3. 4. [Security Groups] タブのクラスターセキュリティグループリストでルールを管理するクラスターセキュリティグループを選択します 5. [Security Group Connections] タブで [Add Connection Type] を選択します 6. [Connection Type] ボックスで [CIDR/IP] を選択します [CIDR/IP to Authorize] に 0.0.0.0/0 と入力し [Authorize] を選択します Important 0.0.0.0/0 と入力するとインターネット上のすべてのコンピュータからアクセス可能になるためデモ目的以外での使用は推奨しません実際の環境ではお使いのネットワーク設定に基づいてインバウンドルールを作成しますステップ 5: サンプルクラスターに接続する次に SQL クライアントツールを使用してクラスターに接続しシンプルなクエリを実行して接続をテストします PostgreSQL と互換性があるほとんどの SQL クライアントツールを使用できます本チュート 11

接続文字列を取得するにはリアルでは前提条件のセクションでインストールした SQL Workbench/J クライアントを使用します次の手順に従ってこのセクションを実行します接続文字列を取得するには (p. 12) SQL Workbench/J からクラスターに接続するには (p. 12) このステップを終了した後はステップ 6: Amazon S3 のサンプルデータをロードする (p. 14) に進んで Amazon S3 からサンプルデータをロードするかここからどこへ進むべきですか? (p. 18) で Amazon Redshift に関する情報を参照して環境をリセットするかを選択できます接続文字列を取得するには 1. Amazon Redshift コンソールのナビゲーションペインで [Clusters] を選択します 2. examplecluster を選択してこのクラスターを開き [Configuration] タブが表示された状態にします 3. [Configuration] タブで [Cluster Database Properties] の下にあるクラスターの JDBC URL をコピーします Note クラスターのエンドポイントはクラスターが作成されて使用可能な状態になるまで使用できません SQL Workbench/J からクラスターに接続するにはこのステップではステップ 1: 前提条件の設定 (p. 1) で SQL Workbench/J をインストールしたことを前提としています 1. SQL Workbench/J を開きます 2. [File] を選択し [Connect window] を選択します 3. [Create a new connection profile] を選択します 4. [New profile] テキストボックスにプロファイルの名前を入力します 5. [Manage Drivers] を選択します [Manage Drivers] ダイアログが開きます 6. [Create a new entry] ボタンを選択します [Name] テキストボックスにドライバの名前を入力します 12

SQL Workbench/J からクラスターに接続するには [Library] ボックスの横にあるフォルダアイコンを選択し目的のドライバーの場所まで移動してそのドライバーを選択します次に [Open] を選択します [Please select one driver] ダイアログボックスが表示されたら [com.amazon.redshift.jdbc4.driver] または [com.amazon.redshift.jdbc41.driver] を選択し [OK] を選択します [Classname] ボックスは SQL Workbench/J によって自動入力されます [Sample URL] ボックスは空白のままにしておいて [OK] を選択します 7. [Driver] ボックスで追加したドライバーを選択します 8. [URL] で Amazon Redshift console から JDBC URL をコピーしここに貼り付けます 9. [Username] に masteruser と入力します 10. [Password] にマスターユーザーアカウントに関連付けられたパスワードを入力します 11. [Autocommit] ボックスをオンにします 12. 次に示す [Save profile list] アイコンを選択します 13

ステップ 6: サンプルデータをロードする 13. [OK] を選択しますステップ 6: Amazon S3 のサンプルデータをロードするこれでデータベース dev を作成しそれに接続できました次はこのデータベースにテーブルを作成しテーブルにデータをアップロードしてクエリを実行してみますすぐにロードして使えるサンプルデータを Amazon S3 バケットに用意しました Note 次に進む前に SQL Workbench/J クライアントをクラスターに接続しておいてくださいこのステップを完了したら Amazon Redshift に関するより多くの情報を検索したりここからどこへ進むべきですか? (p. 18) で環境をリセットすることができます 1. テーブルを作成する以下の create table ステートメントをコピーして実行し dev データベースにテーブルを作成しますシンタックスの詳細については Amazon Redshift Database Developer Guide の CREATE TABLE に進みます create table users( userid integer not null distkey sortkey, username char(8), firstname varchar(30), lastname varchar(30), city varchar(30), state char(2), email varchar(100), 14

ステップ 6: サンプルデータをロードする phone char(14), likesports boolean, liketheatre boolean, likeconcerts boolean, likejazz boolean, likeclassical boolean, likeopera boolean, likerock boolean, likevegas boolean, likebroadway boolean, likemusicals boolean); create table venue( venueid smallint not null distkey sortkey, venuename varchar(100), venuecity varchar(30), venuestate char(2), venueseats integer); create table category( catid smallint not null distkey sortkey, catgroup varchar(10), catname varchar(10), catdesc varchar(50)); create table date( dateid smallint not null distkey sortkey, caldate date not null, day character(3) not null, week smallint not null, month character(5) not null, qtr character(5) not null, year smallint not null, holiday boolean default('n')); create table event( eventid integer not null distkey, venueid smallint not null, catid smallint not null, dateid smallint not null sortkey, eventname varchar(200), starttime timestamp); create table listing( listid integer not null distkey, sellerid integer not null, eventid integer not null, dateid smallint not null sortkey, numtickets smallint not null, priceperticket decimal(8,2), totalprice decimal(8,2), listtime timestamp); create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp); 15

ステップ 6: サンプルデータをロードする 2. COPY コマンドを使用して Amazon S3 からサンプルデータをロードします Note Amazon S3 または DynamoDB から大容量のデータセットを Amazon Redshift にロードするために COPY コマンドを使用することをお勧めします COPY 構文の詳細については Amazon Redshift Database Developer Guide の COPY を参照してくださいこのチュートリアルのサンプルデータがあるのは Amazon Redshift が所有する Amazon S3 バケット内ですこのバケットの権限はすべての認証された AWS ユーザーにサンプルデータファイルへの読み込みアクセスを許可する設定になっていますサンプルデータをロードするにはユーザーに代わってクラスターが Amazon S3 にアクセスするための認証を提供する必要がありますロールベースの認証またはキーベースの認証を提供できますロールベースの認証を使用することをお勧めします両方のタイプの認証の詳細については Amazon Redshift Database Developer Guide の CREDENTIALS を参照してくださいこの手順では前の手順で作成しクラスターにアタッチした IAM ロールを参照して認証を提供します Note Amazon S3 への適切なアクセス許可がない場合 COPY コマンドを実行すると S3ServiceException: Access Denied というエラーメッセージが表示されます COPY コマンドには次の例のように IAM ロール ARN のプレースホルダーが含まれます copy users from 's3://awssampledbuswest2/tickit/allusers_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' region 'us-west-2'; IAM ロールを使用してアクセスを許可するには CREDENTIALS パラメータ文字列の <iam-rolearn> をステップステップ 2: IAM ロールを作成する (p. 3) で作成した IAM ロールのロール ARN と置き換えます COPY コマンドは次の例のようになります copy users from 's3://awssampledbuswest2/tickit/allusers_pipe.txt' credentials 'aws_iam_role=arn:aws:iam::123456789012:role/myredshiftrole' delimiter ' ' region 'us-west-2'; サンプルデータをロードするには次の COPY コマンドの <iam-role-arn> をロール ARN と置き換えます次に SQL クライアントツールでコマンドを実行します copy users from 's3://awssampledbuswest2/tickit/allusers_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' region 'us-west-2'; copy venue from 's3://awssampledbuswest2/tickit/venue_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' region 'us-west-2'; copy category from 's3://awssampledbuswest2/tickit/category_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' region 'us-west-2'; copy date from 's3://awssampledbuswest2/tickit/date2008_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' region 'us-west-2'; 16

ステップ 6: サンプルデータをロードする copy event from 's3://awssampledbuswest2/tickit/allevents_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' timeformat 'YYYY-MM-DD HH:MI:SS' region 'us-west-2'; copy listing from 's3://awssampledbuswest2/tickit/listings_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter ' ' region 'us-west-2'; copy sales from 's3://awssampledbuswest2/tickit/sales_tab.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '\t' timeformat 'MM/DD/YYYY HH:MI:SS' region 'us-west-2'; 3. 次にサンプルクエリを実行します詳細については Amazon Redshift 開発者ガイドの SELECT を参照してください -- Get definition for the sales table. SELECT * FROM pg_table_def WHERE tablename = 'sales'; -- Find total sales on a given calendar date. SELECT sum(qtysold) FROM sales, date WHERE sales.dateid = date.dateid AND caldate = '2008-01-05'; -- Find top 10 buyers by quantity. SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, users WHERE Q.buyerid = userid ORDER BY Q.total_quantity desc; -- Find events in the 99.9 percentile in terms of all time gross sales. SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1 ORDER BY total_price desc; 4. オプションとして Amazon Redshift コンソールから実行したクエリを確認できます [Queries] タブに指定期間内に実行されたクエリの一覧が表示されますデフォルトではコンソールは現在実行中のクエリを含め最近 24 時間以内に実行されたクエリを表示します AWS マネジメントコンソールにサインインし Amazon Redshift コンソール https:// console.aws.amazon.com/redshift/ を開きます右ペインのクラスターリストで examplecluster を選択します [Queries] タブを選択しますコンソールに実行したクエリの一覧が下の例のように表示されます 17

ステップ 7: 他のリソースの検索と環境のリセットクエリに関する詳細情報を表示するには Query 列でクエリ ID リンクを選択するかまたは拡大鏡のアイコンを選択します次の例は前のステップで実行したクエリの詳細を表示したものですステップ 7: 他のリソースの検索と環境のリセットこのチュートリアルを完了したらこのガイドで説明した概念について Amazon Redshift の他のリソースでさらに知識を深めることも環境を元の状態にリセットすることもできます他の Amazon Redshift ガイドのタスクを試す意向がある場合は実行しているサンプルクラスターを維持することもできますただしクラスターを実行している間は継続して課金されるので注意してください不要になったクラスターは課金を停止するためにアクセスを取り消して削除する必要がありますここからどこへ進むべきですか? その他のリソース次のリソースを使用してこのガイドで説明した概念についてさらに詳細な説明をご覧になることを推奨します Amazon Redshift Management Overview このトピックでは Amazon Redshift の概要を説明します 18

ここからどこへ進むべきですか? Amazon Redshift Cluster Management Guide: このガイドは本を基礎として構成されておりクラスターの作成管理および監視に関する概念とタスクの詳細情報を提供します Amazon Redshift Database Developer Guide: このガイドは本を基礎として構成されておりデータウェアハウスを構成するデータベースの構築クエリおよび保守に関する詳細情報をデータベース開発者向けに提供します環境のリセットこのチュートリアルを完了したら次の手順を実行して環境を以前の状態にリセットしますアクセスを許可したポートおよび CIDR/IP アドレスへのアクセスを取り消します EC2-VPC プラットフォームを使用してクラスターを起動した場合は VPC セキュリティグループからのアクセスを取り消すには (p. 19)の手順を実行します EC2-Classic プラットフォームを使用してクラスターを起動した場合はクラスターセキュリティグループからのアクセスを取り消すには (p. 20)の手順を実行しますサンプルクラスターを削除しますクラスターを削除するまでそのクラスターについて Amazon Redshift サービスの使用料が継続して発生しますサンプルクラスターを削除するには (p. 20) の手順を実行します VPC セキュリティグループからのアクセスを取り消すには 1. Amazon Redshift コンソールのナビゲーションペインで [Clusters] を選択します 2. examplecluster を選択してこのクラスターを開き [Configuration] タブが表示された状態にします 3. [Cluster Properties] の下の vpc セキュリティグループを選択します 4. デフォルトのセキュリティグループを選択した状態で [Inbound] タブを選択し [Edit] を選択します 5. ポートに対して作成したカスタム TCP/IP 進入ルールと CIDR/IP アドレス 0.0.0.0/0 を削除します All traffic ルールなどセキュリティグループに対してデフォルトで作成されたその他のルールは削除しないでください [Save] を選択します 19

ここからどこへ進むべきですか? クラスターセキュリティグループからのアクセスを取り消すには 1. Amazon Redshift コンソールのナビゲーションペインで [Clusters] を選択します 2. examplecluster を選択してこのクラスターを開き [Configuration] タブが表示された状態にします 3. [Cluster Properties] の下の [Cluster Security Groups] で [default] を選択してデフォルトのセキュリティグループを開きます 4. [Security Groups] タブのクラスターセキュリティグループリストでデフォルトクラスターセキュリティグループを選択します 5. [Security Group Connections] タブで CIDR/IP アドレス 0.0.0.0/0 に対して作成したカスタム CIDR/ IP 進入ルールを選択し [Revoke] を選択しますサンプルクラスターを削除するには 1. Amazon Redshift コンソールのナビゲーションペインで [Clusters] を選択します 2. examplecluster を選択してこのクラスターを開き [Configuration] タブが表示された状態にします 3. [Cluster] メニューで [Delete] を選択します 20

ここからどこへ進むべきですか? 4. [Delete Cluster] ウィンドウで [Create snapshot] に [No] を選択して [Delete] を選択します 5. クラスターの詳細ウィンドウで [Cluster Status] にクラスターが削除処理中であると表示されます 21

ドキュメント履歴次の表は最新版リリース以降に更新された重要な変更点をまとめたものですドキュメント最新更新日: 2015 年 28 月 7 日変更説明リリース日新機能 Amazon Redshift ダッシュボードからクラスターを起動するようにガイドを更新しました 2015 年 7 月 28 日新機能新しいノードタイプ名を使用するようにガイドを更新しました 2015 年 6 月 9 日ドキュメントの更新 VPC セキュリティグループの設定のスクリーンショットと手順を更新しました 2015 年 4 月 30 日ドキュメントの更新現在のコンソールに合致するようにスクリーンショットと手順を更新しました 2014 年 11 月 12 日ドキュメントの更新見つけやすくするために Amazon S3 からのデータのロードに関する説明を独立したセクションに移動し次のステップセクションを最終ステップに移動しました 2014 年 5 月 13 日ドキュメントの更新ようこそページを削除しそのコンテンツをメインの使用開始ページに組み込みました 2014 年 3 月 14 日ドキュメントの更新これはカスタマーフィードバックとサービスの更新情報を反映したの新しいリリースです 2014 年 3 月 14 日新規ガイドこれはの初版リリースです 2013 年 2 月 14 日 22