この記事はアイレット25卒社員によるAWSブログリレーのAmazon Rekognition編です。
2025 Japan AWS Top Engineers (Services)である、クラウドインテグレーション事業部の松田 啓佑さんに監修していただき執筆しております。

松田さんのiret.mediaの記事はこちら

この記事では、Amazon Rekognitionの概要から、メリット、料金体系、そしてユースケースまで、分かりやすく解説していきます。

Amazon Rekognitionの概要

Amazon Rekognitionは、Amazon Web Services (AWS) が提供する、ディープラーニングを活用したフルマネージドの画像・動画分析サービスです。
Amazon Rekognitionの公式ドキュメントはこちら

APIを呼び出すだけで、画像や動画に含まれる物体、人物、テキスト、シーンなどを自動で検出・分析できます。
APIは数多くあり、大きく5種類に分けられます。

①Amazon Rekognition Image
静止画像から顔、物体、テキストなどを検出・分析する機能。

②Amazon Rekognition Custom Labels
独自の画像認識モデルを構築し、自社製品のロゴなど特定の物体を識別する機能。

③Amazon Rekognition Stored Video
保存済みの動画ファイルから、人物の追跡や物体、テキストなどを非同期で検出・分析する機能。

④Amazon Rekognition Streaming Video
リアルタイムのビデオストリームを処理するためのプロセッサを作成・管理する機能。

⑤Amazon Rekognition Streaming (Face Liveness)
リアルタイムのビデオストリームを利用して、カメラの前の人物が本物の人間かを判定する機能。
→なりすまし防止などに活用できます。

続いてこちらは、マネジメントコンソールで試すことができるデモの画面となっております。
(マネジメントコンソールへのログインが必要です。)
AWSが用意したサンプルイメージだけでなく、自分がアップロードして試すことが可能です。

ラベル検出

検出された物体は四角く囲われ、右画面の結果の一覧に精度とともに表示されています。
かなり精度が高く、ラベルの種類も豊富なため細かい部分まで検出してくれます!

動画の分析

動画分析では、ラベルを検出した時間とともに通知欄に表示されました。
かなり素早く認識してくれます!

Amazon Rekognitionのメリット

①専門知識が不要
画像分析を行うには従来、機械学習を行う必要があり、数学や統計の知識が必要でした。Amazon Rekognitionを使えばそれらの知識が不要で簡単に利用できます。
もしAWS側で検出して欲しいラベルが用意されていなくても、カスタムラベルのトレーニングを誰でも簡単に行うことができます!

②高精度で多機能
Amazonが持つ膨大なデータでトレーニングされたモデルを利用するため、非常に高い精度での分析が可能です。物体検出から顔認証、保護具の検出など、幅広いニーズに対応する機能が揃っています。

③スケーラブルでフルマネージド
機械学習モデルやインフラをゼロから構築する必要がなく、すでにトレーニングされた画像分析APIをアプリケーションに組み込むことができます。

④他のAWSサービスとの強力な連携
Amazon S3やAWS Lambdaと組み合わせることで、スケーラブルで全自動のワークフローを簡単に構築できます。例えば、「S3に画像がアップロードされた瞬間にRekognitionが自動でタグ付けする」といった仕組みをサーバーレスで実現することが可能です。

利用料金

Amazon Rekognitionは、処理した画像や動画の量に応じた従量課金制です。
初期費用は不要で、使った分だけ支払います。

料金体系は機能ごとに異なりますが、主な例は以下の通りです。
※2025年10月時点の東京リージョンの料金例

機能 料金
画像分析 最初の100万枚まで0.0013USD/枚
動画分析 ラベル検出 0.1USD/分
顔メタデータの保存 0.000013USD/月当たりの顔メタデータ
カスタムラベル(トレーニング) 1.37USD/時間
カスタムラベル(推論) 4.00USD/時間

無料利用枠

AWSアカウント作成から12ヶ月間有効な無料利用枠も用意されています。
画像:グループ1とグループ2に分けられるそれぞれのAPIごとに、1 か月に 1,000 枚の画像分析が無料です。
グループ1は顔を検出した後に、データベースに登録して管理・検索をするためのAPI、グループ2は画像に何が写っているかを検出するためのAPIで、顔以外にも幅広く対応しています。)
顔メタデータの保存:1 か月あたり 1000 個の顔ベクトルオブジェクトと 1000 個のユーザーベクトルオブジェクトの保存が無料です。
動画:毎月 60 分間の動画分析が無料です。
カスタムラベル:毎月2時間のトレーニングと1時間の推論が無料です。

※料金は利用量が増えるほど単価が安くなる段階制になっています。
詳細な料金や使用例はAWS公式サイトでご確認ください。

ユースケース

Amazon Rekognitionでは、例えば以下のようなシーンで活用できます。

①ユーザーが投稿した画像や広告の画像を分析し、ポリシー違反を防止する
DetectModerationLabels」というAPIを用いることで、画像内の不適切なコンテンツを自動で検出できます。流れとしては以下のようになります。
1. 投稿画像をRekognitionに送信
2. DetectModerationLabelsが不適切な要素があるか判定
3. 検出結果に不適切な要素がある場合、自動でブロック

これにより、SNSやECサイトなどでの不適切なコンテンツを減らしたり、人手による審査などを手助けしてくれます。

オンライン試験での本人確認・不正行為防止
主に以下のAPIを用いることで、オンライン試験での公平性を確保することに繋げることができます。
1. 「CompareFaces」で受験者の顔をカメラで撮影し、事前に登録した写真と照合して本人認証を行うことができます。
2. 「DetectFaces」で定期的に撮影された映像から、顔の有無や視線、他の人が写っているかなどを検出することができます。
3. 「DetectLabels」でスマホや紙などの不正使用がないかを判定することもできます。

製造業・農業での目視検査の自動化
カスタムラベル」を用いることで、製品や作物に傷や欠け、異物などがないか検出することができるようになります。
これにより、これまで目視で確認することが多かった作業も、画像データをアップロードして独自のAIモデルをトレーニングすることで労力の削減に繋げることができます!

他サービスとの比較

Amazon Rekognitionは、Google CloudのVision AIMicrosoft AzureのAzure AI Visionなどが競合サービスとして挙げられます。それぞれに得意な機能や料金体系の違いがありますが、Amazon Rekognitionはやはり、他のAWSサービスとの連携のしやすさが大きな強みです。
AWSサービスをよく使われている方であれば、画像認識にはAmazon Rekognition一択だと思います。

また、同じAWSサービスの中にAmazon SageMaker AIもあります。
Amazon SageMaker AIは専門知識が必要になることがありますが、画像だけでなく、さまざまな分野で高度な機械学習を行うことができるサービスです。
Amazon Rekognitionだけでは対応しきれない高度なケース(姿勢推定や医療分野など)では、Amazon SageMaker AIを検討すると良いでしょう。

AWSサービスとの連携

AIとのバイブコーディングを通して、Amazon Rekognitionを用いたウェブアプリを作ってみました!
内容はアップロードした画像がAmazon S3に格納され、それをAWS Lambdaが分析して結果を表示するというものです。
AWS Lambda関数の中には、Amazon Rekognitionを呼び出して、画像から検知した顔や住所などの個人情報をマスキングする(モザイクをかける)コードを記述してあります。
ここでは、個人情報が誤ってSNSなどに拡散され、炎上することを防ぐために活用できるか検証してみます。

レベル1:履歴書

架空の履歴書を作成して分析してみました。
これは分かりやすくはっきり写っているので問題なく検出できています!
(ピンク色の破線は手動で隠した部分となります。)

レベル2:集合写真

大人数が写っているフリー写真で試してみましたがかなりの精度です。
画像左側の女性だけ認識できませんでしたが、奥に小さく写っていても認識しているのはすごいですね!

レベル3:生成AI の画像(情報てんこもり)

まずはこちらの画像をご覧ください。(車が横断歩道渡っているのは気にしないでください笑)

生成AIに作成してもらいましたが、大勢の人間、ナンバープレート、電話番号らしきものなど、都会らしい情報量となっている画像です。(生成AI特有の文字なので歪んだりしています)
Amazon Rekognitionで、どこまで検出できるでしょうか?

結果がこちら


なんと、通行人の非常に小さな顔まで検出してモザイクをかけることに成功しました!
画面が検出したラベルによって埋め尽くされてしまいました。

電柱の番号のように生成AIの歪んだ文字でも検出するほど精度が非常に高いことがわかります。
歪んでいると誤検知のリスクもありそう?ですが、人間が最終レビューを行う仕組みにすることで見逃してしまう可能性は減りそうです。

今回は簡単にモザイクをかけるシステムのため隠す必要のない部分も隠れることがありましたが、Lambda関数を調整したり、他のサービスと組み合わせることでより高度なシステムにすることができると感じました。

さいごに

ここまで読んでいただきありがとうございました!
以上がAmazon Rekognitionの紹介となります。
AWSのサービスと組み合わせることで簡単に高度な画像・動画分析ができることが強みだと感じました。またカスタムラベルを用いることで多岐に渡る分野で活かせることも大きな魅力です。
無料枠もあるので、ぜひ一度使ってみてください!