Amazon EC2 Inf1インスタンス

Amazon EC2 Inf1 インスタンスは、械学習の推論を低レイテンシかつ安価に実現するために開発された、AWS Inferentia を搭載したインスタンスファミリです。以下の4つのインスタンスサイズで利用可能です。 inf1.xlarge 及び inf1.2xlarge はシングルチップ、inf1.6xlarge および inf1.24xlarge はマルチチップ構成となります。

Dev_Flow

Inf1 インスタンスでは AWS Inferentia チップに加えて、最新のカスタム第2世代インテル® Xeon® スケーラブルプロセッサおよび最大100Gbpsのネットワークと組み合わせることにより、ハイスループットの推論を可能にしました。

Amazon EC2 Inf1 インスタンスは、2021年10月現在、米国東部 (バージニア北部、オハイオ)、米国西部 (オレゴン、北カリフォルニア)、AWS GovCloud (米国西部、米国東部)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン、ミラノ、パリ、ストックホルム)、 アジアパシフィック (香港、ムンバイ、ソウル、シンガポール、シドニー、東京)、中東 (バーレーン)、南米 (サンパウロ)、および中国 (北京、寧夏) などの 23 のリージョンで利用可能です。