Redshift serverlessにS3からデータをロードします。 この操作もQuery Editor v2上から操作可能です。
s3://ee-assets-prod-us-east-1/modules/aba5d66e8cd44378ba70a0427830efd5/v1/flightdata1/
URI入力欄の下の「S3 file location」をクリックし、ドロップダウンメニューから「 us-east-1
」を選びます。
S3からロードするためのIAMロールを設定します。
ロードするCSVの区切り文字の設定をします
\t
と入力します。ロードするデータの圧縮方式の設定を行います。今回のデータはGZIP圧縮されています。
GZIP
を選択します。
最後にTarget table欄から「Select a schema」をクリックして「public」を、「Select a table」をクリックして先ほど自分で作成したテーブル名を選択します。
選択したテーブルが自分が作成したものであることを必ず確認してください。
GUI上で設定した値で自動的に以下の様なSQLが生成され実行されることでS3からデータがロードされます。
SAMPLE SQL
COPY dev.public."flightdata_ ykyoshi"
FROM '<S3_BUCKET>' GZIP
IAM_ROLE '<IAM_ARN>'
FORMAT AS CSV DELIMITER '\t' QUOTE '"'
REGION AS 'us-east-1'
SQL文のCOPYコマンドが自動生成・実行されてデータロードが始まりますので、しばらくお待ち下さい。ロードが終了すると、処理のサマリが表示されます。