クラウドインテグレーション事業部の森です。
re:invent 2023 に現地参加しております。

Adam Selipsky の Keynote でも発表された Zero-ETL 統合 について、Amazon Redshift のセッションでも話があったためレポートを共有します。

これまでのアーキテクチャ

これまで大規模なトランザクション分析のリファレンスアーキテクチャではこちらの構成が必要でした。

このパイプラインは非常に難易度が高く、DMS のような CDC システムを使って変更を継続的にレプリケーションし、データを S3 に格納、それをロードし、分析に利用可能な状態のデータにするための変更など、非常に多くの処理が必要となります。

Zero-ETL 統合を利用したアーキテクチャ

今回、Keynote での発表のように Aurora MySQL との Zero-ETL 統合機能により以下の構成が可能となります。

これを実現できたのは Amazon が多くのレイヤーを管理しているためであり、ストレージ層でこのコラボレーションを実現しました。

この統合により、ETL パイプラインは不要となり、Amazon Aurora に書き込まれたデータを数秒で Redshift に複製し、分析を可能にします。また、Aurora MySQL 環境でのログレプリケーションなどのオーバーヘッドが不要となります。

  • Amazon Redshift 統合ターゲットの容易な作成
  • ストレージレイヤーでのデータのシーディングと継続的なレプリケーションの自動化
  • 複数の Aurora データベースクラスタからのデータの統合
  • 取り込みと並行して分析を実行
  • Amazon Redshift のシステムテーブルと CloudWatch から経過、遅延、パフォーマンスを監視

今回 Aurora MySQL との統合が GA されましたが、既に他の3つの DB についても着手しており、プレビューとなっています。

参考

Amazon Aurora と Amazon Redshift の Zero-ETL 統合のご紹介

Amazon Redshift との Amazon Aurora ゼロ ETL 統合の開始方法

AWS re:Invent 2023 re:Cap presented by iret 2023年12月7日 (木)「AWS re:Invent 2023」のポイントを解説する「AWS re:Invent 2023 re:Cap presented by iret」を開催します。

詳細はこちら:https://cloudpack.jp/lp/aws-reinvent-recap-2023/