Amazon S3を利用した「S3ホスティング」とAmazon CloudFrontを利用した「CDNホスティング」なら、
Amazon EC2を利用せずに、静的ファイル(HTML/CSS/JS/画像/動画/Flashなど)のみを対象としたホスティングを
行うことが可能です。
実際に各ホスティングを利用し、気付いた点をまとめてみました。
実験したサイトは、http://www.iret.co.jp/ で、以下のようにホスティングを変更してみました。
—–
一般的なDC
↓
CDNホスティング(運用期間:約6ヶ月)
↓
S3ホスティング(運用期間:約2ヶ月~)
—–
※運用期間の構成ファイルは同じで、企業サイトなのでほとんど更新はありませんでした。
まず一般的なDCにデータを置いていた際の状態についてですが、
各種検索エンジンで、http://www.iret.co.jp/ の全ページがインデックスされており、
「iret」「アイレット」「アイレット株式会社」などのキーワードで1位表示でした。
尚、Googleで、サイトリンクが表示されていました。
上記の状態からホスティングをCDNホスティングへ変更し、約6カ月間運用してみたところ、
「サイトリンクの消滅」という現象が起こりました。
※サイトリンクの詳細は、サイトリンク – ウェブマスターツールヘルプをご確認ください。
サイトリンクの出ているサイトで、サーバを変更してもドメインが同じなので、
基本的にサイトリンクが消滅するということはありません。
しかし、CDNホスティングの場合、サイトリンクが消滅してしまいました。
次にこの状態から、ホスティングをS3ホスティングに変更し、現時点で約2ヶ月間運用してみたところ、
DCで運用していた時と同様に、再度、サイトリンクが表示されました。
どうして、CDNホスティングの場合に、サイトリンクが消滅してしまうのか?
それとも、S3ホスティングとCDNホスティングで違いがあるのか?
といことで、レスポンスヘッダーを確認してみました。
○S3ホスティングで運用しているサイト
○CDNホスティングで運用しているサイト
※2011/05現在では、ANDROID IRETは、CDNホスティングしています。
上記を見てみると、CDNホスティングの場合には、「X-Cache: Hit from cloudfront」と記述されており、
CloudFrontから配信されていることが分かります。
また、「X-Cache」と表示されているので、キャッシュコンテンツと考えられると思います。
それでは、サイトリンクが出ている時(一般のDCおよびS3ホスティング時)の
インデックス数ですが、以下になります。
では、CDNホスティングの場合は、
結論としては、CDNホスティングを利用していた場合には、インデックス数が減少し、
Googleウェブマスターツール側でも、サイトリンクは表示されていないということでした。
Googleのアルゴリズムは公開されていないので憶測になりますが、
上記の内容からすると、CDNホスティングを利用し、HTMLファイルを置いている場合には、
キャッシュコンテンツと認識され、サイトとして見られない為に、インデックス数が減少したものと思います。
尚、CDNホスティングを継続していく場合、インデックスが無くなるもしくはTOPページのみになる可能性も
考えられるので、他の方法でのホスティングに切り替える必要があります。
ちなみに、上記でも記載しましたが、http://www.iret.co.jp/ は、S3ホスティングへ切り替えて、
約1カ月と少しの間運用したところ、サイトリンクおよびインデックス数が復活しました。
(※構成ファイルは、DCで運用していたものと同様)
元々サイトリンクが出ていたから早かったのでしょうか。
上記に書いた内容をまとめるとS3ホスティングとCDNホスティングの正しい利用方法は、
以下のようにするのが望ましいと思います。
—–
S3ホスティング: 静的サイトまるごと
CDNホスティング: CSSやJSといったファイルのみ
—–
CDNなので、一般的な使い方をしましょうということですね。
ですが、CDNホスティングは、低コストで世界対応が出来るホスティングなので、
短期間集中型の静的キャンペーンサイトなら、広告でアクセスを集めてもインデックスされる必要はないので、
利用は問題ないかなと思います。
正しい使い方をしないと、困ったことになりますね。