ブロガー視点から見るGoogleイメージクローラーに関するエトセトラ
2012年05月15日 公開

Googleイメージ検索に関する情報が公式で流れてたので、ブロガー視点からみてわりと重要な点だけまとめておこうかと。
一般的なWebサイトでもそうなんですけど、画像検索も馬鹿にならないんですよね。特に商品の画像とか。商品説明に力を入れているページが結構引っかかってくるので、あとはファイル名や、その辺のガイドラインをこれを読んで強化するだけでも、だいぶ変わってくるんじゃないかと思います。
Googleはどうやってそれをコーヒーと判断しているのか

Alt属性から見ているというのはわりと誰でも知っていることなので、そのあたりを気にする必要あるのかなぁとおもってよく読んでみると、意外といろんな情報を元に形成していたんだなぁと。
ちなみにこの上の画像は「 alt="coffee art の検索結果" 」とつけてます。
で、言われてみると検索結果には、coffeeと検索したらズラズラとcoffeeが出てくるわけですが、今の上の画像のように、記事の内容としては大してコーヒーについて書いているわけでもない画像というのも無数にあるわけです。そういうのを検索結果からはじいているわけですよね。
Googleがインデックスに登録する時に見ているデータ
とりあえず以下のような情報を参照しているとのことです。
- 画像が見つかったページのテキストを見て、画像に関する情報を取得
- ページのタイトルや本文
- 画像のファイル名
- リンク先を示すアンカーテキストから取得
- Alt属性に書かれているテキストから取得
- コンピューター ビジョンを用いて画像情報を取得
- ページ上にキャプションテキストが存在するときは 画像のサイトマップ に含まれているキャプションの情報を用いる
特に「ファイル名」とかになると・・・。私のファイル名は常に日付なので、どちらかと言えば画像検索されにくいブログだったのかと気がついたわけです。あとは、面倒ですが、画像のサイトマップを作ると、ある程度画像検索からの訪問者も増えるんじゃないかと言えます。
実際に以下のようにGoogleは推奨しています。
- 画像のファイル名が画像の内容に関連した名前になっている
- 画像の alt 属性が、人間が読んで分かるような画像説明になっている
- 加えて、HTML ページのテキスト コンテンツと画像近辺のテキストを、画像に関連した内容にしておくことも有効です。
最後にQ&Aの中から、気になる奴を1点だけご紹介。
要するにオリジナルの画像サイトよりも、パクった方のサイトが検索上位になっているという問題に対する回答。Q: 元々の画像が、それ以外のソースのものよりランキングが下位になっている場合がときどきありますが、それはなぜですか?
A: Google は画像の内容を判定する際に、ページのテキスト コンテンツを使用していることを覚えておいてください。例えば、オリジナル ソースが、テキストがほとんど存在しない画像ギャラリーのようなページである場合、テキストをより多く含むページが上位の検索結果として選ばれることがあります。ある特定の検索キーワードに対する検索結果があまりにもおかしいと思われる場合は、検索結果の下に表示されているフィードバック用リンクで報告するか、ウェブマスター ヘルプフォーラム にて事例を報告してください。
例えオリジナルでも画像だけのページより、テキストを多く含んだパクリページのほうが、検索上位に選びますよーという内容ですね。なかなか興味深い。
画像検索でもだいぶかわる
ブロガーってかなりの数の画像を使う人も多くいると思いますけど、このあたりを少し見なおしてみるのもいいかもしれないですよね。
Google ウェブマスター向け公式ブログ: 画像検索についての A to Z
ようはユーザーがその画像を探しているということは、何らかの情報を探している状態なので、そういうユーザーにも的確な記事を案内出来れば、それは素晴らしいことだと思います。Webサイトを作るときなんかは、特に気をつけて作成していけば、それなりに効果は出ますので、お試しあれ。
それでは、また。
スポンサーサイト