はじめに

突然ですが皆さん、今のIT業界でホットなワードってなんだと思いますか?
僕は、オブザーバビリティAIだと思います!

まさにそんなホットなワードを組み合わせたようなワードAIOps(こじつけです…汗)

今回はですね、NewRelicでAIOps機能を利用した時の忘備録、かつ皆様に共有したいことを記載します!

(New Relic) AIOpsとは?

AIOpsは、
従来の手動での閾値設定などをAIの力で補完し、運用チームの負担を大幅に軽減するソリューションです。
異常検知、自動化、アラートノイズの削減を目的としています。

AI Monitoringと混同しやすいかもですが、
AI Monitoringは、
AIサービスのパフォーマンスや品質、コストを監視するためのソリューションです。

この記事を読んでいただいている皆様はすでにNewRelicでモニターを作成して、閾値を設定したことのある方が大半だと思います。
なので、今回は『AIOpsを利用してモニターを作成する流れ』からの『活用例』と『チューニングのポイント』の順で説明していきます。

AIOpsを利用してモニターを作成する流れ

基本的に普通にモニター作成する時の手順と相違ありませんが、NRQLを設定後、[ threshold type ] を  Anomaly にしなければいけません。

 

Static…静的な閾値
Anomaly…過去のデータに基づいて予測された動的な閾値

Staticを選択した時と比べ [ Threshold direction ] と [ Open incidents with a ]いう設定項目が増えます。

Threshold direction

Upper and lowerUpper onlyLower onlyが選択でき、値に対してどの方向へのびた場合に検知するかを設定できます。
グレーアウトしている箇所がAIが正常と判断してくれている箇所です。
これはUpper onlyを選択しているため、上側にしか異常検知ゾーンがありません。

Open incidents with a

標準偏差で閾値を設定する箇所です。
標準偏差というのはつまり、平均からのズレを表す数値です。
以下の画像でイメージしやすくなると思います。

Open incidents with a:10

Open incidents with a:100

つまり、閾値の値を小さくすればするほどアラートの検知数は多く、細微な変化もアラートとして検知してしまうということです。
不要なアラートを検知しないようにするためにも適切な値を見つけ出すことが重要です。

閾値チューニングの具体例とポイント

AIOpsの最大の長所のひとつは、閾値の自動調整機能です。
この機能により、これまで手動で設定・調整していた閾値が、リアルタイムでシステムの挙動に基づいて動的に変更されるようになります。
まずは、AIOpsを活用するケースを想定してみましょう。

具体例

地理別のアクセス異常検知
ケース:
・特定地域からのアクセス数が異常に増加
・通常時、全体のアクセスのうち日本からのトラフィックは80%を占めているが、特定の時間帯に突然アジア圏(例:中国、韓国)からのアクセスが急増。

対応:
・AIOpsが地域ごとの通常トラフィックパターンを学習し、異常を検知。
・Opsチームによって攻撃の可能性の調査を実施。

メリット:
・地域別の異常検知により、通常では見逃されがちな異常を迅速にキャッチ。
・必要に応じて該当地域のトラフィックを制限することで、システム全体の安定性を保つ。

ポイント

この例は、AIOpsの高度な分析能力と動的調整機能による具体的なメリットを示しています。
特に地理的な異常検知や、時間帯に応じた柔軟な閾値設定は、従来の手動設定にはない強みといえます。

しかしその反面初期の閾値の設定が、難しいという参入障壁の高さもあります。
そこは運用の中で必要に応じて値をチューニングしていく必要があると思われます。

結論

AIOpsは、運用効率の向上とアラート管理の改善に大きく貢献するツールです。(それは間違えない)
現在、弊社ではこの技術の導入を進めており、実際の効果を検証しています。
今後、この経験をもとに、顧客へのサービス内容に取り入れることで、システムの可用性と信頼性向上に役立てたいと考えています。
引き続き、最新技術を活用した運用サービスの強化に努めてまいります。

最後に

当社では New Relic を活用した「AWS 運用・保守サービス」、「New Relic One 導入支援サービス」、「New Relic One 請求代行サービス」を提供しております。

お客様のご要望に合わせた最適なサービスを提供し、監視運用に関する課題解決をサポートいたします。
詳細については、お問い合わせフォームよりお気軽にご連絡ください。