Amazon Redshiftを活用したMDV社RWDデータ分析ハンズオン
Amazon Redshiftを活用したMDV社RWDデータ分析ハンズオン ワークショップへようこそ!
本ハンズオンでは、下記のようなユースケースの想定、概要にて実施します。
課題
- RWD(リアルワールドデータ)分析を行いたいがデータ量が膨大で自端末の環境ではスペック不足
- MDV様などから大量のデータを準備しても、それをホストするデータベース/DWHマシンが用意できない
- 大量データをUSB-HDDやBlu-rayメディアなどでやり取りするのは面倒、セキュリティのリスク
- オンラインでやり取りするにも受け渡しのネットワーク帯域が必要
- DWHなどの環境準備が出来ても、データインポートの為のスキル(DDL、型の一致)が必要
- DB/DWHのAdminの方とのリソース調整や準備に時間を要して本来の解析業務に時間がかかる
実現すること
- AWSのクラウドにて簡単、迅速に構築し、例えば新薬上市後の年代別患者数シェア推移の分析や、社製品の有効性分析などの手法を、MDV社の実データを用いてご体験いただく
本ハンズオンの概要
- AWSが用意するマネージドなDWHサービス Amazon Redshiftを利用することにより数十分で環境を用意
- 面倒なデータの受け渡しやインポート作業は、MDV様が提供いただくRedshift Snapshot(データの型定義、データインポート済みのDWH環境をそのままコピーしたもの)を利用することにより起動するだけでSQLクエリが可能
- 洞察を得るためのBIは、Amazon QuickSightを利用し、インストール等不要でブラウザのみで高速な解析が可能
取り扱うデータ
- MDV様にご協力いただき、過去のレセプト/DPCデータを用いて行います
- データのテーブル、レコード数は下の表を参照ください
構築するアーキテクチャ
- 下記の構成を順に作成していきます
それでは早速、始めてみましょう!
画面右中央の矢印をクリックして進めてください。