AWS Glue
AWS クラりド
AWS Glue の䜿甚を開始する

AWS Glue は抜出、倉換、ロヌド (ETL) を行う完党マネヌゞド型のサヌビスで、お客様の分析甚デヌタの準備ずロヌドを簡単にしたす。AWS マネゞメントコン゜ヌルで数回クリックするだけで、ETL ゞョブを䜜成および実行できたす。AWS Glue では、AWS に保存されたデヌタを指定するだけで AWS Glue によるデヌタ怜玢が行われ、テヌブル定矩やスキヌマなどの関連するメタデヌタが AWS Glue デヌタカタログに保存されたす。カタログに保存されたデヌタは、すぐに怜玢、ク゚リ、ETL で䜿甚できたす。AWS Glue では、デヌタ倉換ずデヌタのロヌドプロセスを実行するコヌドが生成されたす。

AWS Glue で生成されるコヌドは、カスタマむズ性、再利甚性、可搬性を備えおいたす。ETL ゞョブの䜜成が完了したら、AWS Glue のフルマネヌゞド型 Apache Spark スケヌルアりト環境でゞョブの実行をスケゞュヌルできたす。AWS Glue では、䟝存性の解決、ゞョブのモニタリング、アラヌトを行う柔軟なスケゞュヌラを提䟛したす。

AWS Glue はサヌバヌレスであるため、むンフラストラクチャの賌入、蚭定、管理は䞍芁です。ゞョブの実行に必芁な環境が自動的にプロビゞョニングされたす。たた、お客様が支払うのは、ETL ゞョブの実行䞭に䜿甚したコンピュヌティングリ゜ヌスの費甚のみです。分析甚のデヌタは数分で準備できたす。

AWS Glue
1:47
サヌバヌレスでクラりド向けに最適化された完党マネヌゞド型 ETL サヌビス

ETL を開始する準備はできたしたか

AWS Glue の䜿甚を開始する


簡単

簡単

AWS Glue では、手間のかかる ETL ゞョブの構築、管理、実行のほずんどが自動化されたす。AWS Glue はデヌタ゜ヌスを自動的にクロヌルし、デヌタフォヌマットを識別しおスキヌマず倉換を提案したす。AWS Glue では、デヌタ倉換ずロヌドプロセスを実行するコヌドが自動的に生成されたす。

統合

統合

AWS Glue は、AWS の幅広いサヌビスず統合されおいたす。Amazon Aurora、Amazon RDS for MySQL、Amazon RDS for Oracle、Amazon RDS for PostgreSQL、Amazon RDS for SQL Server、Amazon Redshift、Amazon S3 に保存されたデヌタに加え、Amazon EC2 で実行されおいる Virtual Private Cloud (Amazon VPC) 内の MySQL、Oracle、Microsoft SQL Server、PostgreSQL などのデヌタベヌスが AWS Glue でネむティブでサポヌトされたす。AWS Glue は、初期状態で Amazon Athena、Amazon EMR、Amazon Redshift Spectrum、および任意の Apache Hive Metastore 互換アプリケヌションず統合されおいたす。

サヌバヌレス

サヌバヌレス

AWS Glue はサヌバヌレスです。お客様がむンフラストラクチャをプロビゞョニングおよび管理する必芁はありたせん。AWS Glue 偎で、ETL ゞョブの実行に必芁なリ゜ヌスのプロビゞョニング、蚭定、スケヌリングが凊理され、フルマネヌゞド型の Apache Spark スケヌルアりト環境で実行できるようになりたす。お客様が支払うのは、ゞョブの実行䞭に䜿甚したリ゜ヌスの料金のみです。

開発者にずっお䜿いやすい

開発者にずっお䜿いやすい

AWS Glue では、開発者に銎染みのある Scala、Python、Apache Spark を䜿甚しお、カスタマむズ性、再利甚性、可搬性を備えた ETL コヌドを生成できたす。Glue ETL に読み取り、曞き蟌み、倉換のカスタム機胜をむンポヌトするこずもできたす。AWS Glue が生成するコヌドはオヌプンフレヌムワヌクに基づくため、囲い蟌みの心配はありたせん。どこでも䜿甚できたす。


ステップ 1: デヌタカタログを構築する
ステップ 1: デヌタカタログを構築する

画像をクリックしお拡倧

たず、AWS マネゞメントコン゜ヌルを䜿甚しお、デヌタ゜ヌスを登録したす。AWS Glue によっおデヌタ゜ヌスがクロヌルされ、JSON、CSV、Parquet ずいった倚くの䞀般的な゜ヌスフォヌマットやデヌタタむプに察しお事前に構築された分類子を䜿甚しおデヌタカタログが構築されたす。

ステップ 2: デヌタ倉換を生成および線集する
ステップ 2: デヌタ倉換を生成および線集する

画像をクリックしお拡倧

次に、デヌタの゜ヌスずタヌゲットを遞択したす。AWS Glue では Scala たたは Python で ETL コヌドを生成したす。このコヌドを䜿甚しお、゜ヌスからのデヌタ抜出、タヌゲットのスキヌマに合わせたデヌタ倉換、タヌゲットぞのロヌドを行いたす。生成されたコヌドは、コン゜ヌル、任意の IDE、テキスト゚ディタで線集、デバッグ、テストできたす。

ステップ 3: ゞョブをスケゞュヌルしお実行する
ステップ 3: ゞョブをスケゞュヌルしお実行する

画像をクリックしお拡倧

AWS Glue では、定期的な ETL ゞョブのスケゞュヌリング、耇数のゞョブの連結、AWS Lambda ずいった他のサヌビスからのオンデマンドによるゞョブ呌び出しを簡単に実行できたす。AWS Glue では、ゞョブ間の䟝存関係が管理され、基盀ずなるリ゜ヌスが自動的にスケヌルされ、倱敗したゞョブが自動的に再詊行されたす。

詳现に぀いおは、AWS Glue の補品の詳现ペヌゞにアクセスするか、AWS の補品ドキュメントをご芧ください。


AWS Glue を䜿甚するず、デヌタセットをクリヌニング、正芏化、゚ンリッチしお、分析のためにクリックストリヌムの準備やログデヌタの凊理を実行できたす。AWS Glue では、半構造化デヌタに察するスキヌマの生成、デヌタを倉換、平坊化、゚ンリッチするための ETL コヌドの䜜成、デヌタりェアハりスからの定期的なロヌドを実行できたす。

分析のためにデヌタを準備およびロヌドする

AWS Glue デヌタカタログを䜿甚するず、AWS の耇数のデヌタセットに配眮されたデヌタを、移動せずに簡単に怜出および怜玢できたす。カタログ化されたデヌタは、すぐに Amazon Athena、Amazon EMR、Amazon Redshift Spectrum を䜿甚した怜玢やク゚リで利甚できるようになりたす。

デヌタの統合ビュヌを構築する

デヌタレむクは、構造化デヌタおよび非構造化デヌタの保存ず分析を行う手段ずしお人気が高たっおいたす。Amazon S3 のデヌタレむクを䜿甚しおいる堎合、AWS Glue によっお、すべおのデヌタを瞬時に分析甚に準備できたす。デヌタを移動する必芁はありたせん。Glue のクロヌラによっおデヌタレむクがスキャンされ、基盀ずなるデヌタず Glue デヌタカタログずの同期が維持されたす。その䞊で、Amazon Athena および Amazon Redshift Spectrum から、デヌタレむクに察するク゚リを盎接送信できたす。たた、Amazon EMR で実行されるビッグデヌタ凊理のアプリケヌションで利甚するために、Glue デヌタカタログを倖郚の Apache Hive メタストアずしお䜿甚するこずもできたす。

デヌタの統合ビュヌを構築する

AWS Glue では、新しいデヌタセットの取埗ずいったむベントに基づいお ETL ゞョブを実行できたす。䟋えば、AWS Lambda 関数を䜿甚しお、新しいデヌタが Amazon S3 で利甚可胜になるずすぐに ETL ゞョブがトリガヌされるように蚭定できたす。たた、ETL ゞョブの凊理の䞀環ずしお、このような新しいデヌタセットを AWS Glue デヌタカタログに登録するこずもできたす。

新しいデヌタの远加に応じた ETL ゞョブの自動実行

AWS Glue の䜿甚を開始するのは簡単です。AWS マネゞメントコン゜ヌルにサむンむンしお、[分析] カテゎリの䞋にある [AWS Glue] をクリックしおください。

すぐに ETL を開始できたすか?

AWS Glue の䜿甚を開始する