AWS Glueのコンソール画面 (https://console.aws.amazon.com/glue/) でクローラの作成を以下の手順で行います。
クローラ
を選択。クローラの追加
を選択します。次へ
を選択します。 (例: tcudata-twatanabe)Data stores
にチェック、Repeat crawls of S3 data storesはCrawl all folders
にチェックして次へ
を選択します。s3://connected-vehicle-data-{REGION}-{Administrator Name}-{AWS Account Number}/telemetry
を入力して次へ
を選択します。 (例: s3://connected-vehicle-data-ap-northeast-1-twatanabe-xxxxxxxxxxxx/telemetry
)次へ
を選択します。IAMロールの作成
をチェックして、AWSGlueServiceRole-{NAME}と入力して次へ
を選択。(例: AWSGlueServiceRole-twatanabe)オンデマンドで実行
を選択して、次へ
を選択。データベースの追加
を選択して、表示されたポップアップのデータベース名にcvradb-{NAME}
と入力して作成
を選択。(例: cvradb-twatanabe)S3データのグループ化動作(任意)
を選択してドリルダウン。S3 パスごとに単一のスキーマを作成する
にチェックを入れて次へ
を選択する。完了
を選択します。クローラ画面で作成した、tcudata-{NAME}のチェックボックスを選択してクローラの実行
を選択します。
左のメニューペインからテーブルを選択して、telemetry
というテーブルが作成されていることを確認します。
telemetryテーブルが表示されない場合は、画面の上部にあるテーブルのフィルタリングでtelemetryと入力してフィルタリングを行います。それでも表示されていない場合は、上記クローラの設定のデータストアの追加でインクルードパスに/telemetryを入力できていない可能性があるので、再度クローラの設定を行います。