はじめに
Global Solutions事業部の緒方です。
AWS re:Invent 2024に現地で参加しています。
今回は[BSI206 | Scale BI to all your users with Amazon Q in QuickSight]に参加しましたので内容を紹介します。
AWS re:Invent 2024とは
AWSが主催する年次カンファレンスで、主にクラウドコンピューティングに関する最新情報を発表し、エンジニアに限らず様々なロールの人や様々な業種の企業が集う大規模イベントです。2024年は12月2日から12月6日にかけて、アメリカ・ラスベガスで開催されます。
セッション
セッション概要
このセッションでは、QuickSight で Amazon Q を使用して、組織内のすべての人にビジネスインテリジェンス (BI) を提供する方法を学びます。さまざまなデータソースの接続、大規模なユーザーとグループの管理、運用上のベストプラクティスの実装について説明します。集中アクセス管理と制御されたデータ検出を可能にしながら、デプロイメントを保護する方法を学びます。QuickSight で Amazon Q の Generative BI 機能を使用するベストプラクティスを学び、ユーザーが自然言語でインサイトにアクセスできるようにします。
Peter Tyson, Software Engineer Manager, Capital One
Temesgen Meheret, Director, Software Engineering, Capital One
Sean Boon, Sr. Manager, Product Management, Amazon
Tracy Daugherty, GM, AWS
セッション内容
データ駆動の意思決定を妨げる要因の紹介がありました。そこではユーザーの75%が、データに関するスキルに自信がないそうです。データの整形などの準備に時間が多くかかっている問題があるそうです。
QuickSightの使用によるメリットですね。ROIが275%とは驚異的ですね。
QuickSight の「pixel perfect reporting」について紹介がありました。
「pixel perfect reporting」はダッシュボード形式で表示するのが困難な大規模なデータセット向けに設計されているようです。そのレポートには数千行のデータを含むことが可能です。
また、サーバーレスで自動でスケーリングされるため、オンデマンドで使用することができます。
QuickSightのAIを活用した際にできることの紹介がありました。
・自然言語(デモ動画では英語)を使用してデータについて質問することができ、それに基づいて視覚化する。
・自然言語で計算をインプットでき(このデータとこのデータのかけ算する)、数式を自動的に生成する
・視覚化をした後、「500行目以降をすべて赤で強調表示して」のように、自然言語を入力してビジュアルに手を加える
・ダッシュボードにエグゼクティブ サマリーを自動的に生成し、データに基づきトレンドなどを強調表示する
・データについて自然言語を使用して質問し、様々な視点を提供するためにマルチビジュアルなレスポンスを行う
QuickSightがAmazon Q Businessと統合され、データのストーリーを生成する際に会議のメモやプレゼンテーション(PPTX形式)などの非構造化データを使用できるようになったそうです。そのままデータとして使えると手間が相当減ってありがたいですね。
データ駆動型組織で大事なことは、チームスポーツと考えて全員がそれぞれの役割で優れた成果を上げること、と言っていました。各ロールでのタスクを十分にこなすことが大事で、データエンジニアだけ頑張ればいいなどという考えではないようです。
以下のロールが紹介されていました。
管理者:QuickSightでストレージ、ユーザー、AWSリソースの管理を担当する。
作成者:データセットの作成、分析、ダッシュボードの公開、およびインサイトの共有を行う。
使用者:ダッシュボードの操作、データに関する質問(AIへのインプット)、アラートの設定、およびレポートの受信を行う。
プロ管理者:自然言語を使用して視覚化と計算を行う。
プロ使用者:マルチビジュアルの質問やストーリーテリングなどの機能にアクセスする。
QuickSightにおける主なアセットについての紹介がありました。資産とかじゃなくて項目?を言ってそうでした。以下は紹介があったもの。
データソース:DB、アプリケーション、クラウドストレージなど、オンプレミスとクラウドの多種多様ななデータソースへの接続をサポート
データセット:データソースの上にあるQuickSightにおける論理的な構造
分析:ユーザーが QuickSightで作成したダッシュボード
テーマ:色、グラフなどの視覚的に変更をするための要素など外観をカスタマイズするもの
ダッシュボード:ユーザーが構築して共有できるデータを視覚的に表現したもの
QuickSightはオンプレミス、クラウド問わず様々なものと接続できると紹介がありました。
12月3日にGAになったS3の新機能にも言及されていました。
Apache Icebergを搭載しています。これにより、S3に保存されている表形式のデータと非構造化データのメタデータの両方に対して分析を実行できるようになり、S3に保存されている様々なデータを分析に活用でるようになりました。
QuickSightにS3 Icebergテーブルのサポートが追加されたことで、S3 に保存されている構造化データと非構造化データにダイレクトに接続して分析できるようになりました。
QuickSightのSPICEは、高速なインタラクティブ分析や中規模データに適しており、複雑な計算や視覚化にも対応していますが、Direct Queryは、大規模なデータやコンプライアンス上の理由でデータを移動せずに利用する場合に有効とのことで、ユースケースに応じて最適な方法を選択することが重大切と述べていました。規模の大きさの基準が気になりますね。どのくらいから大規模と呼ぶのか。
QuickSightのデータセキュリティは、行レベルおよび列レベルのセキュリティ(RLSとCLS)をデータセット内やソースシステムで設定します。
ユーザーID管理のためにIdentity Centerと統合しているので、個別の認証が不要になってセキュリティは維持しつつもユーザにとって便利に使用できますね。
Redshiftもデータソースで行レベルと列レベルのセキュリティ (RLS と CLS) ルールを直接定義し、Identity Centerと統合されているので、個別の認証が不要になります。
フォルダを使用してダッシュボードやデータセットを整理、共有ができます。各フォルダに閲覧者、投稿者、所有者のようなレベルで権限の設定が可能です。この権限はフォルダ内に継承されるので管理が楽だそうです。
「import visuals」は、他のダッシュボードや分析からビジュアルを検索して再利用できる機能で、インポート時にデータセットやフィルターも保持され、正確な表示が可能になるそうです。チーム内での共同編集とかがしやすくなりますね。
「Highcharts Visual」は、標準のQuickSightのチャートに加えて、ネットワークダイアグラムやサンバーストなどの高度なチャートを提供する機能で、JSONエディタというものを使用して柔軟にカスタマイズができるそうです。チャートの種類が増えることで見やすさの向上や、表示の幅が広がって便利ですね。
「prompted reports」は、閲覧者がフィルタやパラメータを設定してレポートをカスタマイズできる機能で、スケジュール配信も可能だそうです。閲覧者側でカスタマイズできるってのは少し斬新だなと思いました。使い方の幅が広がりますね。
「brand customization」、見た目を組織のブランド(イメージカラーとか?)に合わせて調整できる機能とのことです。会社で指定の色とかあったりしますよね、それの際に使用できますね。多様な見せ方をしようとする意気込みが伝わってきますね。
ここからはCapital Oneの事例紹介がありました。
2019年にQuickSightを導入、16000人以上のアクティブユーザーと月間120000件のレポート、2600のダッシュボードを運用しているそうです。
使いやすくなったことで利用率が400%増加し、効果があがっているそうです。以前までは使いにくさから使用が限られていたようです。確かに、操作や編集が手間なツールってちょっと憚られますよね。
さいごに
自然言語を使った指示ができ、指示に沿った精度の高いものが作られている印象を受けました。この機能があれば、インプットに慣れていない人でも使えると思うのでビジネスでの利用がさらに増えていきそうですね。