はじめに

当該記事はラスベガスで行われている Google Cloud Next 2025 の Day1 の What’s new Cloud Storage に関する記事となります。

概要

主要なトピックスとしては AI、Data Lake に関する Storage サービス及び、Storage サービスに対する新機能の内容が中心に発表されておりました。今回 Storage サービスを中心とさせていただき、Backup については割愛させていただいております。

AI、Data Lake に関する主要トピックス

Rapid Storage

新しい Cloud Storage のバケットタイプとして公開されました。Rapid Storage は AI のワークロードでの活用を目的に設計されたもので、非常に高速なストレージサービスとなります。
当該サービスとしての推し機能としては、以下とされています。

  • IO サイズにかかわらず、1ミリ秒以下のランダム読み取りレイテンシ
  • 最大 6 テラバイト/秒のスループット
  • Google 内部で利用されているファイルシステムの Colossus の機能を API 経由で利用できる仕組みになっており、コンピュートに可能な限り近い SSD に構築されており、高速なスループットを実現します。

AI ワークロードのストレージの選択肢として以前から Cloud Storage がありましたが、こちらの機能は今までよりも更に性能面において期待ができるものと思いました。
こちらにもっと詳細な情報がブログで公開されており、詳細にご覧になりたい場合、こちらをご覧ください。
プライベートプレビューの内容と見受けられるので、ご利用になりたい方は、記載したブログからフォームでご連絡いただくか、ご担当の Google Cloud の方と連携が必要と記載されておりました。

Google Cloud Managed Lustre

私にとってはついにキタ!というマネージドサービスです。今まで Lustre を Google Cloud 上で構築するには、Marketplace から構築するか、自分でライセンスを持ち込み手組みで行う必要がありましたが、ついに Google Cloud の Managed サービスとして登場しました。
HPC を利用する上で多くの方が望んでいると思われる内容となり、最大で1テラバイト/秒のパフォーマンスが実証、ストレージサイズの拡張性など多くの面で、AI ワークロードに特化し、非常に有効なストレージサービスとなります。
こちらについては招待制で利用できる形となっているため、Google Cloud のご担当者様へお問い合わせください。
こちらに overview として、スペックの詳細や機能のハイライトをご確認いただけますので、詳細はこちらをご覧ください。

Storage Intelligence

Storage Intelligence が GA になりました。release notes はこちらを参照ください。
ストレージのオブジェクト情報を探索等が行えたり、未使用のリソースの共有、最適化にあたっての費用削減の推奨事項を提供することが可能となります。設定自体は 組織、プロジェクト、バケットなど様々なレイヤーが有効化可能です。

今回のデモではバケットの再配置が行われ、こちらもアクセス元の場所によって費用削減に繋がる機能であり、そういったオペレーションもある機能なため、今後も様々な機能拡張が楽しみな内容でした。
多くのデータを抱えておられるお客様においては特に強力な機能であり、有効化の方法としても、組織やプロジェクトなどの大きな単位で行えるため、有効化としては容易に行えそうですが、

Anywhere Cache

Cloud Storage を Data Lake として活用されている場合、活用することで、パフォーマンスを大幅に向上させる機能という発表でした。
こちらに当該機能の詳細が記載されております。
Compute Engine で同じゾーンにあるキャッシュされたデータを読み込む場合に高パフォーマンスを発揮し、有効化された場合のデータ読み込みと無効化した状態での読み込みでは明確な違いがでたと、述べられておりました。
キャッシュされたデータにのみ課金が発生し、リージョンをまたぐ場合の転送料金を削減でき、またコンピューティングの稼働時間も抑えられるとのことです。
データ分析においてレイテンシーへの影響は、当該処理のリソース稼働時間、費用において、何度も重ねることで大きく跳ね返る問題となるため、レイテンシーやデータ配置に起因する問題がある場合、試すことを検討しても良い機能だと感じました。

Filestore の tailored performance and capacity


Filestore の今回の機能としてはよりパフォーマンスなどのチューニングが細かく可能となり、こちらもデータ分析や AI ワークロードの選択肢に使われることもあるものであることからより AI ワークロードの活用で柔軟に対応できるようにしたものだと感じました。
もっと細かくパフォーマンスをチューニングしたい要望があり実装された機能とのことで、サイズは1テラバイトから100テラバイト、IOPS は 4,000 IOPS から 750,000 IOPS まで調整できるようになっております。
Filestore は GCE や GKE から容易に使えるストレージであるため、これらのパフォーマンスの調整により、より使うシーンが見えてくるアップデートだと思います。なお、GA やプレビューについては、言及されていないように思います。

まとめ

多くのデータ分析や AI ワークロードを意識したインフラの機能のアップデートが多いと感じました。これはデータ分析、AI ワークロードとしての活用を見据えたものであり、今後モデル開発などにおいて多く利用されるものだと思います。またデータ分析の内容においても、運用時の効率化を見据えたものであるとともに、最適化を意識した内容であることから、運用に組み込む、または費用面で意識したい内容だと感じました。これら踏まえて、AI、データ分析とインフラ周りの密接な関わりがあると感じられる内容でした。