Metrin(メットリン)

AWSのCloudWatchの値を取得できるMackerelのプラグインはいくつかあるのですが、
対象リソースが未対応のものが多く、また新しいサービスにはすぐに対応しない作りだっため困ってました。

そこで、汎用で利用できるプラグインがほしいなーとy13iにアピールしていましたら、
なんと作って頂けたので紹介になります!!

Metrinはy13iが作成した汎用CloudWatchプラグインです。
1つのプラグインでチェック機能とメトリックの取得の両方を兼ね備えています。

Zabbix/Sensu/Mackerel監視システムを選ばず、言語はGoで書かれているため、
OSはWindows/Linux/Mac/BSDどれでも使用できます。

また、MetrinはデフォルトでMackerelのカスタムメトリックのフォーマットに対応してくれています!

https://github.com/y13i/metrin

準備

対象のOS(Windows/Linux/Mac/BSD)のものをダウンロードして、お好きなディレクトリに配置します。
https://github.com/y13i/metrin/releases

また、AWSのインスタンスにCloudWatchが参照できるIAMRoleを付与しておいてます。

$ cd /usr/local/bin/
$ wget https://github.com/y13i/metrin/releases/download/v0.0.3/metrin-linux_amd64.zip
$ unzip metrin-linux_amd64.zip

コマンド

metrinはグローバルオプションと、サブコマンドの2つに分かれています。
グローバルオプションでは、対象のCloudWatchの値に関してのオプションを設定します。
サブコマンドでは、チェックなのかプリントなのかを決めることができます。

例えば、CloudWatchのCPUの使用率がある一定以上の値になったらアラートを上げる場合はcheckを利用。
Mackerel側にCPU使用率をカスタムメトリックとして送信したいのであればprintを利用します。

NAME:
   metrin - Very simple CloudWatch CLI for Zabbix/Nagios/Sensu/Mackerel/etc.

USAGE:
   metrin [global options] command [command options] [arguments...]

VERSION:
   0.0.3

COMMANDS:
     check    perform check and exit with status codes (0: OK, 1: WARNING, 2: CRITICAL, 3: UNKNOWN)
     print    Prints GetMetricStatistics response with given format template
     debug    Prints GetMetricStatistics params and response
     help, h  Shows a list of commands or help for one command

GLOBAL OPTIONS:
   --namespace value, -n value                          CloudWatch namespace. e.g. 'AWS/EC2'
   --metric-name value, -m value                        CloudWatch metric name. e.g. 'CPUUtilization'
   --start-time value, -S value                         start time as unix timestamp, relative from now if 0 or negative value given (default: -300)
   --end-time value, -E value                           end time as unix timestamp, relative from now if 0 or negative value given (default: 0)
   --period value, -p value                             CloudWatch metric statistic period. (default: 60)
   --unit value, -u value                               CloudWatch metric statistic unit. e.g. 'Percent'
   --statistic value, -s value                          CloudWatch metrics statistic. e.g. 'Average'
   --extended-statistic value, -e value                 CloudWatch extended metrics statistic. e.g. 'p99.5'
   --dimension DIM_KEY:DIM_VALUE, -d DIM_KEY:DIM_VALUE  CloudWatch dimension. DIM_KEY:DIM_VALUE e.g. 'InstanceId:i-12345678'
   --region value                                       AWS region. e.g. 'us-west-2'
   --profile value                                      AWS profile name. e.g. 'myprofile'
   --access-key-id value                                AWS access key id. e.g. 'AKIAIOSFODNN7EXAMPLE'
   --secret-access-key value                            AWS secret access key. e.g. 'wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY'
   --help, -h                                           show help
   --version, -v                                        print the version

Print

試しにインスタンスのCPU使用率を取得してみます。

$ metrin --namespace AWS/EC2 --metric-name CPUUtilization --statistic Average --dimension InstanceId:i-xxxxxxxxx --start-time -600 print --last-value-only
CloudWatch.InstanceId.i-xxxxxxxxx.CPUUtilization.Average    1.468   1482596160

問題なく表示できることが確認しできました。
後は確認できたコマンドをそのままMackerelのconfに入れれば終わりです。

[plugin.metrics.cloudwatch-i-xxxxxxxxx-cpu]
command = "/usr/local/bin/metrin--namespace AWS/EC2 --metric-name CPUUtilization --statistic Average --dimension InstanceId:i-xxxxxxxxx --start-time -600 print --last-value-only"

後はCloudWatchの好きな値を選ぶだけで、Mackerelのコンソール側で表示したりすることが可能です。

デフォルトのprint表示はMackerelに対応しているフォーマットになりますが、
--template オプションを利用すればお好みで変更が可能です。
ZabbixやSensuでも利用可能です。

Check

Printとグローバルオプションは同じで、checkの部分のみ変更すればチェックプラグインとして利用できます。
リターンコードはsensuと同様になりますので、Mackerelでも問題なく利用できます。

例えば、値が1以上であればアラートを上げる場合はこちら。

# metrin --namespace AWS/EC2 --metric-name CPUUtilization --statistic Average --dimension InstanceId:i-xxxxxxx --start-time -600 check --critical-gt 1
CloudWatch CRITICAL, got `1.628000` (Percent), greater than `1.000000`
Params: {
  Dimensions: [{
      Name: "InstanceId",
      Value: "i-xxxxxxxxxx"
    }],
  EndTime: 2016-12-24 xx:xx:xx +0000 UTC,
  MetricName: "CPUUtilization",
  Namespace: "AWS/EC2",
  Period: 60,
  StartTime: 2016-12-24 xx:xx:xx +0000 UTC,
  Statistics: ["Average"]
}

確認ができたら同様にMackerelのconfに記載すればよい。

[plugin.checks.cloudwatch-i-xxxxxxxxx-cpu]
command = "/usr/local/bin/metrin --namespace AWS/EC2 --metric-name CPUUtilization --statistic Average --dimension InstanceId:i-xxxxxxxxx --start-time -600 check --critical-gt 1"
notification_interval = 60
max_check_attempts = 1
check_interval = 1

これで監視設定も可能。

etc

使いまわせる汎用監視プラグインMetrinの紹介となりました。
一つ一つの値を取得しなければいけないですが、confの反映はchefなどを利用するのであまり気になりませんでした。

それでは皆さん、楽しいMackrelライフを!

\アッカリ~ン/
にプラグイン名が似てるなって思ったけど、俺だけだった模様。
12月24日に記事を上げると言ったが、JSTとは言っていない。(ごめんなさい

元記事はこちら

AWS CloudWatchの汎用監視プラグインMetrinの紹介(Mackerelも対応)