このハンズオンでは、 Amazon Redshift Serverless と Amazon QuickSight を利用して可視化を行います。 現在、業務で分析するデータは非圧縮 5 GB を超え手元のラップトップで分析を行うのが厳しい状況になっています。 そこで、 Amazon S3 にデータを圧縮 ( 圧縮後のデータ量は約 650 MB ) して格納し Amazon Redshift Serverlessでデータを取り込み、Query Editor v2 を使ってクエリを実行しその場で簡単な可視化が出来るようにします。
また、 SQL を利用せずダッシュボードを確認するビジネスロールの方が利用できるように Amazon QuickSight をAmazon Redshift Serverless に接続し、より高度な可視化とダッシュボードの作成を行います。
ハンズオンでは、まず環境の準備を行い、 Query Editor v2 を使って S3 上のデータを分析します。その次に、QuickSight を使用して分析用のダッシュボードを作成します。
本ハンズオンは、東京リージョン(ap-northeast-1) での実施を前提としています。
このハンズオンでは米国交通統計局が公開している米国国内の発着データを利用しています。 使用データは 2010年から2014年の範囲で必要な部分を TSV ( タブ文字で区切られたテキストファイル ) 形式で保存したものを利用しています。