Amazon Elasticsearch Service でデータが保存されなくなった話 [cloudpack OSAKA blog]

ナスです。

またまた Elasticsearch の話です。今回は Amazon Elasticsearch Service にデータが保存されなくなった話です。Amazon 特有の話なのかそうでないのかわかりませんが、実際に起こったので書いておきます。

気がついたら何も保存されていなかった

初期構築を終えて数日運用した後に Elasticsearch Service の様子を見てみたら、Indices タブにあるべきインデックス名が全く出ていませんでした。クラスタ数は 1 で設定してあるので、ステータスは常に Yellow だったので、これが原因とは思えない。かといってストレージの空きはわりとある。って状況で、最初はなかなか原因がわかりませんでした。

Monitoring タブで見れるグラフがなんかおかしい

Elasticsearch Service のグラフを見ていると、なんか気になる形を発見。Write IOPS が 0 だ…

この状況を基にいろいろ調べたら、このドキュメントが出てきました。
AWS サービスエラー処理 – Amazon Elasticsearch Service

なんかメモリくさいな…　と思って、CloudWatch で Write IOPS と JVMMemoryPressure のメトリクスを見るとこうなってました。

JVMMemoryPressure が92,93% あたりを超えると Write IOPS が 0 になり、JVMMemoryPressure が下がると同時に Write IOPS も増えていました。

原因は？

ドキュメントには、　

t2 インスタンスでは、[JVMMemoryPressure] メトリクスが 92% を超えた場合、クラスターが赤の状態になるのを防ぐため、Amazon ES はすべての書き込みオペレーションをブロックすることによる保護メカニズムをトリガーします。

と書いてありますが、この環境ではデフォルトの m4.large を使っていますので、どうやら t2 だけに限らないっぽいです。もしかしたらデフォルトのインスタンスサイズ＆ t2 がこれに引っかかるという可能性もあります。（他のインスタンスタイプでは試せてないのでわかりません

どう対処したのか？

今回は、データが多すぎてメモリも多く使われたのだと仮定して、先日書いた↓の対応を行いました。

Lambda から elasticsearch service に何かする [cloudpack OSAKA blog] - sorta kinda...

ナスです。 elasticsearch service (ES) 2.3 の古くなったインデックスを削除することにしたんですが、完成までわりと苦労したので書きます。まずは ES への接続通常、ES へは curl で操作するんですが、この curl に AWS の認証情報をつけることができません。（...

sorta kinda...

nasrinjp1.hatenablog.com

不要なデータを消した直後から、JVMMemoryPressure も下がり、無事に Write IOPS もガンガン上がり始め、ようやくデータが保存されていきました。

他には、クラスタ数を増やす、インスタンスのサイズをあげる、等の選択肢もありますが、不要なデータがたまりすぎている状況なら素直に不要データを削除するのがいいと思います。後は、JVM 関連のパラメータ調整くらいですかね。

　
Elasticsearch Service はマネージドサービスですが、ちゃんと使い方や特性を理解した上で運用しないと痛い目にあうなと思いました。マネージドサービス＝何も気にしなくても運用できる、ではないことを再認識させられました。

元記事はこちら

「Amazon Elasticsearch Service でデータが保存されなくなった話 [cloudpack OSAKA blog]」

この記事を書いた人

iret.media 編集部ネットワークエンジニア、SAPコンサルタントを経て、cloudpackにJOIN。Webサイトや基幹システムのインフラ構築および運用を主に行い、シェルやPythonなどでスクリプトを組んで、インフラ運用の効率化を目指している。 iret.media 編集部が書いた記事

Amazon Elasticsearch Service でデータが保存されなくなった話 [cloudpack OSAKA blog]

気がついたら何も保存されていなかった

Monitoring タブで見れるグラフがなんかおかしい

原因は？

どう対処したのか？

元記事はこちら

[アップデート]複数VPCのインターネット通信を制御する機能「VPC Block Public Access (BPA)」がリリースされました！

『第3回 Well Architected Mini Bootcamp for iret（運用上の優秀性）in 名古屋』参加レポート

仕事で評価されるために最初にやるべきこと (新人編)

Arduinoを初めて使う時のセットアップと実例集

IT健保「鮨一新」食レポ

Amazon Elasticsearch Service でデータが保存されなくなった話 [cloudpack OSAKA blog]

気がついたら何も保存されていなかった

Monitoring タブで見れるグラフがなんかおかしい

原因は？

どう対処したのか？

元記事はこちら

関連記事Related Articles

CloudTrailのログをKibanaで確認する(CloudWatch → Lambda → Elasticsearch)

（ショロカレ 5 日目）2015 年のうちにやっておきたい Amazon Elasticsearch Service 入門（2）～スナップショットとレストア～

Elasticsearch 勉強会 in 福岡に参加したのでメモ #elasticsearchjp

stream2es で大量データをサクッと Amazon Elasticsearch Service に放り込む 〜 もう bulk API を操作しなくても良いかもしれない 〜

Curator を使って elasticsearch に何かする [cloudpack OSAKA blog]

stream2es で大量データをサクッと Amazon Elasticsearch Service に放り込む〜もう bulk API を操作しなくても良いかもしれない〜