こんばんわ、cloudpack@dz_ こと大平かづみです。

Prologue – はじめに

cloudpack技術ブログでもちらほらみかける、 Amazon CloudSearch
この Amazon CloudSearch に関するアップデートが、11/19に発表されていました。

AWSブログ記事
CloudSearch Update – Price Reduction, Hebrew & Japanese Support, Partitioning, CloudTrail

さっそく見てみましょう。

※ 正式な情報につきましては、公式サイト、公式ブログをご参照くださいますようお願いいたします。

要約

「CloudSearchアップデート – 値下げ、ヘブライ語と日本語のサポート、Partitioning、CloudTrailとの連携」

価格 値下げ
言語サポートの追加
  • ヘブライ語や日本語のサポート追加
  • 計34ヶ国語をサポート
  • 日本語に関しては、分かち書き用のカスタム辞書をサポート
Control Over Domain Partitioning (今年リリースの既存機能)
  • search.m2.2xlarge を選択した際に、ドメインのパーティションを分割できる
  • この分割により、ドメインに対するドキュメントの量を減らすことでパフォーマンス向上を見込めるそう
  • AWSマネジメントコンソールCloudSearch API、または AWS コマンドラインインタフェース(CLI) からパーティショニングの制御が行える
  • search ドメインの新規作成時や、その後でも更新可能
  • 指定できる数は 1 ~ 10 (AWSコンソールから確認)
AWS CloudTrail でのサポート

ドメインのパーティショニングについて、AWSコンソールを見てみます

以下は、実際にAWSコンソールで Search Domain を作る際に、”search.m2.2xlarge“ を選択した画面のキャプチャです。
そうすると、Desired Partition Cout のプルダウンが有効になり、選択できるようになりました。選択できる値は、1 ~ 10 のようです。
Amazon CloudSearch でドメイン作成時、search.m2.2xlarge を選択すると、Desired Partition Count を設定できます

クイック翻訳

記事冒頭

As you may already know, CloudSearch is a a fully-managed service that makes it easy to setup, operate, and scale a search service for your website or application.

ご存知のように、CloudSearch はフルマネージドのサービスです。これを利用することで、あなたのウェブサイトやアプリケーションのための検索サービスのセットアップ、実行、スケールが容易にできます。

If you use CloudSearch, you will benefit from a price reduction, additional language support, and control over domain partitioning (we released these features earlier this year but I didn’t have a chance to blog about them at that time).

もし、CloucdSearch をご利用中であれば、値下げや言語サポートの追加、ドメインのパーティショニングのコントロール (実は今年の早い時期にこれをリリースしていたが、ブログでお知らせする機会がありませんでした。) の恩恵を受けられるでしょう。

You can also take advantage of the recently released support for AWS CloudTrail.

最近リリースした AWS CloudTrail のサポートに関するアドバンテージも受けることができます。

Price Reduction – 値下げ

We are reducing the hourly charge for CloudSearch by up to 50%, across all AWS Regions and search instance types.

CloudSearchに関して、1時間あたりの価格を、最大50%値下げいたします。これは、すべてのAWSリージョンで、CloudSearch用のインスタンスタイプすべてに適用されます。

This change is effective as of November 1, 2014 and will take effect with no action on your part. With this change, the overall cost to run CloudSearch compares very favorably to the cost of setting up, running, and scaling your own search infrastructure.

この価格は、2014/11/1 から適用されます。お客様側では特になんのアクションも必要ありません。
この価格により、CloudSearch を実行する際の全体的なコストが、あなたの検索のためのインフラ環境のセットアップや実行、スケールするためのコストと好意的に比較できる範囲になります。

Check out the CloudSearch Pricing page for more information.

詳細は「Amazon CloudSearch 料金表」をご参照ください。

Additional Language Support - 言語サポートの追加

Earlier this year we introduced language-specific text processing for Hebrew. With this addition, CloudSearch now supports a total of 34 languages.

今年前半に行ったヘブライ語のサポートも含め、CloudSearch は今や計34ヶ国語をサポートしています。

In mid-October we added support for custom tokenization dictionaries for Japanese.

10月中旬ごろには、日本語の分かち書き用のカスタム辞書を追加しました。

You can now control how CloudSearch tokenizes Japanese by adding a custom tokenization dictionary to the analysis scheme that you use for fields that contain Japanese-language text. To learn more, read about Customizing Japanese Tokenization in the CloudSearch Developer Guide.

解析のスキーマに分かち書きのカスタム辞書を追加したことにより、あなたは今、CloudSearch において、日本語を分解することを制御できるようになりました。

詳細は、CloudSearch開発者向けガイドの「Customizing Japanese Tokenization」をご参照ください。

Control Over Partitioning – パーティショニングのコントロール

If you are using the m2.2xlarge search instance type, you can now preconfigure the number of index partitions for your search domain.

もし、検索用のインスタンスタイプで m2.2xlarge を利用しているなら、あなたは今、あなたの検索ドメインの index パーティションの個数を事前に構成することができます。

Preconfiguring a domain will improve the performance of large uploads. You can also add partitions to boost query performance by reducing the number of documents per partition.

ドメインの事前構成で、大量のアップロードに対してパフォーマンスの改善が見込めます。
あなたはまた、パーティションに対するドキュメントの量を減らすために、クエリのパフォーマンスをブーストする目的でパーティションを追加することもできます。

CloudSearch will still scale the domain up and down based on the volume of data and traffic, but the number of partitions will never drop below your desired partition count.

CloudSearch は、今でも、データやトラフィックを元にドメインをスケールアップおよびスケールダウンします。しかし、パーティションの数はあなたが望んだパーティションの個数未満には、決してドロップしません。

You can exercise control over partitioning from the AWS Management Console, the CloudSearch APIs, or the AWS Command Line Interface (CLI).

あなたは、AWSマネジメントコンソールや、CloudSearch API、または AWS コマンドラインインタフェース(CLI) からパーティショニングの制御を行えます。

You can set it when you create a search domain:
And you can update it later:

これは、search ドメインを作る際にも設定できますし、後からでも更新することができます。

CloudTrail Support - CloudTrailのサポート

Last month we added AWS CloudTrail support to CloudSearch. You can now use CloudTrail to get a history of the calls that are made to the CloudSearch API. The calls are recorded and delivered to an Amazon S3 bucket. To learn more, read about Logging Amazon CloudSearch Configuration Service Calls Using AWS CloudTrail.

先月、私たちは AWS CloudTrail のサポートを、 AWS CloudSearch に追加しました。あなたは今、CloudSearch API に対して行われる呼び出しの履歴を得るためにCloudTrailを利用することができます。
この呼び出しは記録され、Amazon S3 バケットに配信されます。
詳細については、「Logging Amazon CloudSearch Configuration Service Calls Using AWS CloudTrail」をご参照ください。

Prologue – おわりに

CloudSearch って、入力ソースの形式で PDF/HTML/IMDB movies(demo)/Microsoft Office も選べるようで(?)、今度実際に試してみたいです!