はじめに

Vertex AI Agent BuilderではRAGチャットのような簡易的なアプリを用意して動作を確認することができます。その際にデータストアを指定して設定することができるため、データストアを分けて各々の情報を参照することで、アプリ毎に部署やジャンルなどの用途を分けて使用するような使い方ができます。今回はデータストアの作成と同期の設定について確認したことを備忘録として記載しています。

データストアの作成

Agent Builderのページからデータストアのタブを選択し、データストアの作成ボタンから作成を開始します。続いてデータソースを選択します。(今回はCloud Storageを指定しました)


選択後、取り込むデータの情報などを選択していきますが注意点として「同期の頻度」という項目があります。


記載のとおり、データストア作成後は変更ができないため注意です。そのまま作成ボタンでデータストアが作成されます。


データストア一覧ページに作成したデータストアが表示されます。作成したデータストアを選択して、詳細を確認していきます。詳細画面では、同期の設定を1回限り(手動更新)にした場合と定期的(自動更新)にした場合に次の違いがあります。

1回限り(手動同期)の場合

  • データストア作成のタイミングで一度インポートが実施されますが「データをインポート」ボタンがあり、都度インポートするソースを選択することができます。Cloud Storageの場合はバケット内のフォルダまたはファイル単位で指定ができます。リアルタイムで同期することが可能なので、新しいファイルを追加したタイミングで実施するようなことができます。
  • デメリットとしては、参照データの更新頻度(新しいファイルの追加や既存ファイルの更新頻度)が高い場合は、毎回手動でやるため手間が掛かります。

定期的(自動同期)の場合

  • 自動同期が有効となり、データのインポートはデータストア作成時に指定したソースからのみインポートがされます。読み込み頻度を[1日、3日、5日]の中から設定(変更も可能)ができ、その頻度で自動でインポートされます。
  • デメリットとしては、自動ではあるが最短1日までの設定となり時刻までの指定ができないことです。決まった時刻に実行されるわけではなく毎回時刻が異なります。
  • 数日確認したところ、画像のようにインポートするタイミング(時刻)が毎回ズレていることが分かります。

まとめ

データストアの同期設定については、データの更新頻度、参照頻度を考慮して用途に応じて設定することが良さそうです。 自動更新はとても便利ですがもう少し頻度を詳細に設定できると使い勝手が良くなると思いました。