Google Cloud Next Tokyo ’23 day2 BigQuery 性能最適化のポイント後半

前回からだいぶ時間が経ってしまいましたが、Google Cloud Next Tokyo ’23 の Day2 にて行われたセッションD2-DA-03「データ分析を加速する BigQuery 性能最適化のポイント」に関するレポートと感想の後半です。

中間テーブルの利用

BigQueryでも当然中間テーブルは有効。
図のようにローデータをBigQuery のストレージコンポーネントを利用し、中間テーブルを作成することで高速化が見込めます。
そもそもJOINが多い場合も割り切って、高速化用の中間テーブルの作成はBIに向けての利用でも有効だと思います。

シリアル処理の削減

Spannerでも同じことがいえるのですが、スロットを意識することは重要です。
とはいえRDBからデータを持ってくるケースも多いと思うので、auto incrementを使ってるとそうもいかないのですが、改めてID振り分けをする際にuuidなどを利用するといった分散は良いかと。

パーティショニング

RDBでも大量のデータを扱う場合のパーティショニングは重要なので、これはBigQueryでも意識しておきたい部分。

マテリアライズドビュー

これは所謂キャッシュ化なのでBIの参照で更新頻度を割り切った用途で使うと有効だと思います。
Lookerだと似たようなタイル多くなったりするので。
あとは類似を減らし、使いまわしできるように管理ルールを取り決めたいところ。

SEARCH INDEX

BigQueryはローデータを突っ込むケースが多く、その中から文字列パターンでフィルタを作成し、一致条件。というのをLookerでもよくやります。
個人的にはSEARCH INDEXはよく使う高速化方法です。

テーブルの非正規化

配列を使う。という部分は個人的にちゃんと使えてないので、割り切って使っていきたいと思いました。

主キーと外部キーで結合を最適化

特に結合順序は気にしていないので、詰めるとここまでやる必要があるのかと。
DWH特有のデータ量の多さなら差が出てくるのかなと。

Metadata Cachingメタデータのキャッシュ保存

これはCloud Storage BigLake テーブルを作成して使っている場合に限るネタですね。
リアルタイム性を問われないケースが多いので、有効ですね。

まとめ

「なるべく少ないリソースで結果に辿りつける書き方を心がける」はRDBに対してのクエリ作成においても基本かつ最も重要なことなので
やはりそこに帰結するなと思いました。
AIによるクエリ生成など開発への敷居はどんどん下がりますが、職人的なチューニングはBigQueryにおいても普遍的なものですね。

この記事を書いた人

平野弘紀現場での経験を活かしつつ、主にGoogleCloudに関する記事を書いていきます。平野弘紀が書いた記事

Google Cloud Next Tokyo ’23 day2 BigQuery 性能最適化のポイント後半

中間テーブルの利用

シリアル処理の削減

パーティショニング

マテリアライズドビュー

SEARCH INDEX

テーブルの非正規化

主キーと外部キーで結合を最適化

Metadata Cachingメタデータのキャッシュ保存

まとめ

NotebookLM Enterprise で API 経由での操作が可能になりました！

毎朝30分かかってたタスク整理、3分になっちゃった話 - Claude Code × MCP × Obsidian による究極の自動化術 -

クラウド時代は CRUD ではなく CQRS で考えよう

【Oracle AI World 2025】Oracle AIを使用した各業界の取り組み（Keynote）

アイレット新卒シリーズ Vol.84 【開催レポート】6年ぶりの対面開催！未来を担う新たな仲間を歓迎した、2025年度アイレット内定式

Google Cloud Next Tokyo ’23 day2 BigQuery 性能最適化のポイント 後半

中間テーブルの利用

シリアル処理の削減

パーティショニング

マテリアライズドビュー

SEARCH INDEX

テーブルの非正規化

主キーと外部キーで結合を最適化

Metadata Cachingメタデータのキャッシュ保存

まとめ

関連記事Related Articles

Google Cloud Next Tokyo ’23 day2 BigQuery 性能最適化のポイント 前半

Google Cloud Next Tokyo ’23 セッションレポート「DMM における AWS から BigQuery へのデータ基盤移行」

BigQuery から PaLM API の日本語利用してGoogle の急上昇ワード要因の調査

Google Cloud Next Tokyo ’23 セッション 「D1-APP-05 SLO監視でサービス品質を一段上げる！Cloud Monitoring活用法について」

Google Cloud Next Tokyo ’23 セッションレポート「SLO 監視でサービス品質を 一段上げる!Google Cloud Monitoring 活用法」

Google Cloud Next Tokyo ’23 day2 BigQuery 性能最適化のポイント後半

Google Cloud Next Tokyo ’23 day2 BigQuery 性能最適化のポイント前半

Google Cloud Next Tokyo ’23 セッション「D1-APP-05 SLO監視でサービス品質を一段上げる！Cloud Monitoring活用法について」

Google Cloud Next Tokyo ’23 セッションレポート「SLO 監視でサービス品質を一段上げる!Google Cloud Monitoring 活用法」