2010年10月22日金曜日

Googleで再インデックスに挑戦したら、キャッシュとの関係に疑問が。

スポンサーリンク

2010.9.30の時点で、このブログのページには、Googleにインデックスされていないページがありました。

丁度良いので、そのページをインデックスさせる事が出来るかどうか実験してみました。

が...。
結果としてキャッシュとインデックスの関係に疑問が湧きました。

googleのクローラー

状況


GoogleのWeb Master Toolで調べると、10ページ程がインデックスされていません。

その中の半分くらいは、投稿と同時にtwitterでツイートしています。
タイトルで検索すると、ツイッター関連サービス(twib)のページが検索結果に表示される事はあります。
botでブログ記事を収集しているサイトにリンクされているページもあります。

しかし直接タイトルを入れてもブログのページはヒットしませんし、URLを入力しても該当無しです。

仮説


内部のSEOを重視した上で、インデックスされる為に有効な仮説を考えてみました。
基本的にクローラーを呼ぶ為の方法です。

  • トップページから該当ページへのリンク(クローラーを呼び込む)
  • コンテンツの加筆(以前クロールされた時との変化)
  • タイトルのみの変更(以前クロールされた時との変化)
  • リンクの付与(クローラーを呼ぶ為のきっかけ)

実験内容


indexされていないページのうち、3ページを選んでいくつか方法を試しました。
ページの選択については、内容的に検索に引っかかりやすそうなページを選びました。

試した方法は以下の通り。

基本的には1番から順に行いました。
2番以降は前の作業に次の作業をプラスしています。

  1. トップページに該当のページにリンクを貼る
  2. コンテンツに手を加える/タイトルに手を加える/何もしない
  3. twitterでつぶやく
  4. はてなブックマークを付ける
  5. 何もしない

結果:その1


結論から言えば、3ページともインデックスされました。

最初に分かったのは、トップページからのリンクだけでは効果がなかったこと。
さすがに道が出来ただけではインデックスされません。

最も早かったページ

もっとも早かったのは、コンテンツに手を加えてTwitterでつぶやいたページです。
つぶやいてから2日程で、検索出来るようになりました。

次に早かったページ

次に早かったのは、コンテンツもタイトルも変えずにTwitterでつぶやき、その後はてなブックマークを付けたページでした。
具体的には、はてなブックマークを付けてから7日程で検索できました。

最後まで残ったページ

最後まで残ったのは、タイトルのみを変えてTwitterでつぶやき、その後はてなブックマークを付けた上で、そのまま放置したページです。

前のページから遅れる事5日程で、検索できました。

結果:その2


この3ページが検索結果に表示された際にキャッシュを見て驚きました。
いずれも9月上旬から中旬にかけての日付でした。

9月30日の時点では検索でURLやタイトルを入れても出てこなかったけれども、キャッシュはちゃんと存在していたという訳です。

今回はインデックスさせたというよりは、表示を再開させた程度の話かもしれません。
内容を変えたページでも、キャッシュは置き換わりませんでしたので。

結論


以上の結果から、Twitterやはてなブックマークがインデックスには有効です。
...とは根拠が無さ過ぎてとても言えません。

しかし、今回いくつか手を加えた事でインデックスが増えたことは事実です。

更新されないキャッシュ

最初のページがインデックスされてから2週間ほど経ちましたが、キャッシュの内容も日付も変わりません。

いままで下記のように理解していました。

  1. ページがクロールされる
  2. キャッシュを作成
  3. キャッシュを元にインデックスを作成

実際は違うのでしょうか?

確認したキャッシュと検索に使われているキャッシュが違うのかと考えて、念のため下記の条件で検索をしました。

  • 「タイトル」と「以前からある単語」
  • 「タイトル」と「新しく追加した単語」

検索した結果、「タイトル」と「新しく追加した単語」では検索されませんでした。
明らかにキャッシュされている内容通りの検索結果です。

やはり、検索はキャッシュを元に作られたインデックスに対して行われているように思えます。

結び


真っ当な実験環境と手順だったとは考えていませんが、無意味でもなかったと考えています。

反面、一般的にあり得る状況で実験できたかもしれないとは思っています。
実際にアレやこれやを段階的に試したら、検索できるようになった訳ですし。

しかし結果的にインデックスさせる目的を果たしたとはいえ、疑問点は消えません。
キャッシュとインデックスの関係は分からなくなってしまいました...。

詳しい方から見ると、当然の結果なのでしょうか?

スポンサーリンク

0 件のコメント :

コメントを投稿