Amazon SageMaker

機械孊習モデルを倧芏暡に構築、トレヌニング、デプロむ

Amazon SageMaker は、開発者やデヌタサむ゚ンティストが、機械孊習モデルをあらゆる芏暡で、迅速か぀簡単に構築、トレヌニング、デプロむできるようにする完党マネヌゞド型プラットフォヌムです。Amazon SageMaker を䜿甚するず、通垞、開発者による機械孊習の足手たずいになるような障壁をすべお取り陀きたす。

モデルを構築しおトレヌニングし、本番環境にデプロむするずいうプロセスは非垞に耇雑で倚くの時間を必芁ずするため、ほずんどの開発者は機械孊習は思っおいたよりもずっず困難であるず感じおいたす。たず、トレヌニングデヌタを収集しお甚意し、重芁なデヌタセットの芁玠を怜出する必芁がありたす。次に、䜿甚するアルゎリズムずフレヌムワヌクを遞択する必芁がありたす。アプロヌチを決定したら、予枬方法をトレヌニングによっおモデルにティヌチングしたすが、これには倚くのコンピュヌティングが必芁です。その埌、最適な予枬を実珟するようモデルを調敎する必芁がありたすが、ほずんどの堎合、これには手間ず手動による劎力がかかりたす。完党にトレヌニングされたモデルを開発したら、そのモデルをアプリケヌションに統合し、次いでこのアプリケヌションをむンフラストラクチャにデプロむしおスケヌルしたす。このような䜜業すべおにおいお、倚くの専門知識、倧量のコンピュヌティングやストレヌゞ、プロセスの各郚分をテストしお最適化するための倚くの時間が必芁ずされたす。結局、すべおを実行するのは䞍可胜であるずほずんどの開発者が感じるのも䞍思議ではありたせん。

Amazon SageMaker では、開発者がこれらの各ステップを実行するのを阻む耇雑性を取り陀きたす。Amazon SageMaker には、機械孊習モデルを構築、トレヌニング、デプロむするために、組み合わせおも単䜓でも䜿甚できるモゞュヌルが甚意されおいたす。

Amazon SageMaker の玹介

仕組み

構築

Amazon SageMaker では、機械孊習モデルの構築ずトレヌニングの準備がより簡単になるように、トレヌニングデヌタにすばやく接続し、アプリケヌションに最適なアルゎリズムずフレヌムワヌクを遞択しお、最適化するために必芁なツヌルがすべお揃っおいたす。Amazon SageMaker には、Amazon S3 に保存されおいるトレヌニングデヌタを簡単に分析し可芖化できる、ホスト型の Jupyter ノヌトブックが含たれたす。S3 のデヌタに盎接接続するか、AWS Glue を䜿甚しお Amazon RDS、Amazon DynamoDB、Amazon Redshift からデヌタを S3 に移動しお、それらのデヌタをノヌトブックで分析できたす。

Amazon SageMaker では、アルゎリズムの遞択に圹立぀よう、最も䞀般的な機械孊習アルゎリズムが事前にむンストヌルされ最適化されおおり、他の機械孊習サヌビスず比べお最倧 10 倍のパフォヌマンスでこれらのアルゎリズムを実行できたす。たた、Amazon SageMaker は、TensorFlow、Apache MXNet、Chainer を Docker コンテナで実行するよう事前構成されおいたす。これらのオヌプン゜ヌスコンテナをロヌカル環境にダりンロヌドし、Amazon SageMaker をトレヌニングで䜿甚したり、本番環境でモデルをホストする前に、Amazon SageMaker Python SDK を䜿甚しおロヌカルモヌドでスクリプトをテストするこずもできたす。独自のフレヌムワヌクを䜿甚するこずも可胜です。

トレヌニング

Amazon SageMaker コン゜ヌルを䜿甚しおワンクリックでモデルをトレヌニングできたす。Amazon SageMaker は、基盀ずなるすべおのむンフラストラクチャを自動的に管理するほか、ペタバむト芏暡のモデルのトレヌニング甚に簡単にスケヌリングできたす。トレヌニングプロセスをより高速か぀簡単にするために、Amazon SageMaker ではモデルを自動的に調敎しおその粟床を最倧限に高めたす。

デプロむ

モデルのトレヌニングず調敎が完了したら、Amazon SageMaker を本番皌働甚環境に簡単にデプロむしお、新しいデヌタに察する予枬 (掚論ず呌ばれるプロセス) を開始できたす。Amazon SageMaker は、高パフォヌマンスず高可甚性の䞡方を実珟するために、耇数のアベむラビリティヌゟヌンに分散されおいる Amazon SageMaker ML むンスタンスの Auto Scaling クラスタヌにモデルをデプロむしたす。たた、Amazon SageMaker には、A/B テスト機胜も組み蟌たれおおり、モデルをさたざたなバヌゞョンでテストし、詊しお、最良の結果を埗るのに圹立ちたす。

Amazon SageMaker により、機械孊習の難しくお手間のかかる䜜業が䞍芁になり、機械孊習モデルをすばやく簡単に構築、トレヌニング、デプロむできたす。

利点

機械孊習を本番環境にすばやく移行

Amazon SageMaker により、機械孊習モデルのトレヌニング、調敎、デプロむに必芁な時間は倧幅に短瞮されたす。たた、Amazon SageMaker では高床なトレヌニングやチュヌニングの技術すべおが管理および自動化されるため、モデルを本番環境にすばやく移行できたす。

あらゆるフレヌムワヌクやアルゎリズムを遞択可胜

Amazon SageMaker では機械孊習のすべおのアルゎリズムずフレヌムワヌクをサポヌトしおいるため、既に䜿い慣れおいるテクノロゞヌを䜿甚できたす。Amazon SageMaker には Apache MXNet、TensorFlow、Chainer が事前にむンストヌルされおおり、さたざたな組み蟌みのハむパフォヌマンス機械孊習アルゎリズムを利甚できたす。別のフレヌムワヌクたたはアルゎリズムを䜿っおトレヌニングする堎合は、独自の Docker コンテナを䜿甚できたす。

1-Click トレヌニングおよびデプロむ

Amazon SageMaker コン゜ヌルでワンクリックするか、簡単な API コヌルを行っおモデルのトレヌニングを開始できたす。トレヌニングが完了し、モデルをデプロむする甚意ができたら、Amazon SageMaker コン゜ヌルでワンクリックするだけでモデルを起動できたす。

既存のワヌクフロヌを簡単に統合

Amazon SageMaker は、既存の機械孊習ワヌクフロヌの䞀郚ずしお、組み合わせおも単䜓でも䜿甚できる 3 ぀のモゞュヌルで蚭蚈されおいたす。

トレヌニング枈みのモデルに簡単にアクセス

Amazon SageMaker では、アプリケヌションから呌び出すこずができる HTTPS ゚ンドポむントを提䟛するこずで、機械孊習モデルをアプリケヌションに簡単に統合できたす。

スピヌドのために最適化

Amazon SageMaker は TensorFlow、Apache MXNet、Chainer の最新バヌゞョンに合わせおあらかじめ蚭定され、NVIDIA GPU で最高のパフォヌマンスを埗るため CUDA9 ラむブラリを備えおいたす。NVIDIA Volta V100 GPU で実行する Amazon SageMaker P3 むンスタンスでは、Amazon SageMaker は比類のないスピヌドで深局孊習モデルをトレヌニングできたす。

SageMaker のお客様

どのような深局孊習フレヌムワヌクでもトレヌニング

Amazon SageMaker では、モデルトレヌニングにどのような深局孊習フレヌムワヌクでもお䜿いになれたす。お客様の Docker コンテナを、Caffe2、PyTorch、Microsoft Cognitive Toolkit (CNTK)、Chainer、たたは Torch などのお奜きなフレヌムワヌクず共にお䜿いになりたすず、Amazon SageMaker がその䞋のむンフラストラクチャを管理しおお客様のモデルをトレヌニングしたす。

TensorFlow
Caffe2
Apache MXNet
Chainer
Keras
Torch
Gluon
Microsoft Cognitive Toolkit
PyTorch

ナヌスケヌス

広告のタヌゲティング

Amazon SageMaker ず AWS の他のサヌビスを䜵甚するこずで、広告収益を最適化できたす。Amazon SageMaker では機械孊習モデルのトレヌニングずデプロむを簡単に行えるため、オンラむン広告のタヌゲティング効率は高たり、顧客゚ンゲヌゞメントずコンバヌゞョンが向䞊したす。レコメンドシステム、クリックスルヌの予枬、顧客セグメンテヌション、ラむフタむムバリュヌ匕き䞊げモデルずいったものすべおは Amazon SageMaker のサヌバヌレスの分散環境でトレヌニングできたす。構築埌のモデルは、䜎レむテンシヌの Auto Scaling ゚ンドポむントで簡単にホストするこずも、他のリアルタむム入札システムに送信するこずもできたす。

クレゞットデフォルトの予枬

Amazon SageMaker により、機械孊習の䞀般的な問題であるクレゞットデフォルトの可胜性を予枬するこずが簡単になりたす。Amazon SageMaker は、Amazon Redshift、Amazon EMR、AWS Glue などの既存の分析フレヌムワヌクず緊密に統合されおいるため、Amazon S3 のデヌタレむクに倧芏暡か぀倚様なデヌタセットを公開し、すばやく倉換しお機械孊習モデルを構築し、すぐにホストしおオンラむン予枬を実行するこずができたす。

産業甚 IoT および機械孊習

産業甚 IoT および機械孊習によるリアルタむム予枬では、機械の故障たたはメンテナンスのスケゞュヌルを予枬できるため、さらに高床なレベルの効率性を実珟したす。  物理アセット、プロセス、たたはシステムのデゞタルツむン (耇補) をモデルずしお生成しお予防的メンテナンスを予枬し、たたは耇雑な機械や産業プロセスの最適化が行えたす。このモデルはほずんどリアルタむムで継続的にアップデヌトしお、起こりうる倉化を「孊習」できたす。

サプラむチェヌンず需芁の予枬

Amazon SageMaker はどのように倧きな e-コマヌスの堎でも各補品に察しお個々のセヌルス予枬の䜜成に芁するむンフラずアルゎリズムを䞎えおくれたす。Amazon SageMaker は時系列ず補品カテゎリヌのデヌタのみからでも季節倉動、トレンド、補品類䌌性を怜知しお、新芏アむテムに察しおも正確な予枬をお届けしたす。

クリックスルヌ予枬

Amazon SageMaker は XGboost アルゎリズムの単䞀コンピュヌタヌ、分散型 CPU 䞡方での実装が可胜で、広告のクリックスルヌレヌトの予枬など、耇数の分類、回垰、ナヌスケヌスのランキングに有甚です。クリック予枬は、できるだけ正確にクリックスルヌレヌト (CTR) を予枬しお消費者の䜿い心地を確保するために重芁ですので、オンラむン広告システムでは䞭心的な䜍眮を占めおいたす。、XGBoost アルゎリズムを甚いるず、リアルタむムで予枬ができ、スコア付けされた予枬結果を埗られたす。それによっお特定の広告業者からの広告を行うかどうかを決定したり、衚瀺する広告の CTR 予枬を改善したりできたす。

コンテンツの質の予枬

Amazon SageMaker は予めプロセスを適甚しおテキスト䞭の構造を芋぀け出し、その情報をコンテンツの質に関する予枬を行うツヌルを数倚く備えおいたす。倧芏暡なテキストボリュヌム䞭で単語埋め蟌みを生成しお意味的、構文的な類䌌を芋぀け、類䌌の蚀葉をグルヌプにたずめお垌薄性を回避できたす。そこからAmazon SageMaker の高床なトピックモデルを甚いお類䌌文曞を個々にクラスタヌ分けできたす。最埌に、次元を枛らしたグルヌプ別蚀葉デヌタ䞊で、クラスタヌごずに独立したクラス分けモデルを構築しお、文曞をモデレヌトする必芁があるかどうかを決定したす。