2022年11月24日に、エンジニア向けオンライン勉強会「雲勉」を開催しました。

今回のテーマは「実践!SLI / SLO with New Relic!」です。

Google が提唱している SRE について、クラウドインテグレーション事業部の大園隼人が解説しました。

この記事では発表内容の一部をご紹介します。
詳しく知りたい方は記事最後のリンクより YouTube にてアーカイブ動画をご覧ください!

Google SRE について

SRE は、信頼性の高い本番環境システムを実行するための一連のプラクティスです。日本語では「サイト信頼性エンジニアリング」と呼ばれています。

サービスの信頼性が著しく失われるとユーザーからの信用、関心も容易に失われてしまうことから、システムやサービスにおいて「信頼性」が最も重要であると言われています。

では、信頼性を100%にすれば良いかというとそうではなく、常に新機能を追加しているサービスにとって信頼性と機能追加(=変更)はトレードオフの関係にあります。

そこで問題となるのは、信頼性の線をどこで引くのかという点です。

SLI / SLO への理解

SLI / SLO を学ぶ上で知っておく必要があるのが、SLA(サービスレベル契約)です。SLA とは、サービスの信頼性に関する顧客との取り決めのことを指します。

SLA に抵触する前にサービスの信頼性に関する問題を検知するためのしきい値を SLO (サービスレベル目標)といいます。

そして、SLO を満たすために計測すべき指標/尺度を SLI(サービスレベル指標)といいます。

ここで、アイレットのサービスサイトを例に挙げて説明を行ないました。

例えば、サイトのトップページを表示するまでの時間が2秒以内である割合や、問い合わせを送信した際のリクエスト処理成功割合などを定めたものを SLI と呼びます。

つまり SLI は、サービスを利用するユーザーが体験する上で期待していることやユーザーが満足するであろうことを定義すれば良いということになります。

その上で、定義した SLI に対しての目標、ならびにしきい値を SLO として策定します。

SLO は、ギリギリ達成できればサービスの典型的なユーザーが満足するような目標値にするのが良いと言われています。

New Relic 導入

最後に、SLI / SLO を New Relic で導入する方法について実際にハンズオンを行ないながら解説しました。

詳しいやり方はぜひ動画でチェックしてください。

まとめ

SLI / SLO を策定することで、適度なサービスの品質を保ち、高いパフォーマンスを維持することができます。

詳しく知りたいという方はアイレットの YouTube にてアーカイブ動画をアップしていますので、ぜひご覧ください!
https://www.youtube.com/watch?v=lf2kGpOdF4M

次回の雲勉は12月8日、テーマは「AWS App Runner に Laravel をデプロイして LINEBot を作ってみよう」です!

ぜひご参加ください!