goo ブログ検索のクローラは2種類あるらしい

Web & Internet Comments (0) | Trackbacks (0)

ここ2日間くらい goo ブログ検索に関して Apache のログとにらめっこしています。そして、わかったことは goo ブログ検索のクローラは2種類あるらしいこと。具体的には「gooblog/2.0」と「gooblogsearch/2.0」。

goo ブログ検索の2つのクローラ

  • gooblog/2.0:更新 ping を送るとやってくるクローラ。サイトトップにアクセスしたあと、index.rdf を見に行く
  • gooblogsearch/2.0:実際にインデックスしているクローラ。こいつが来た時点で最終更新日時が最新の記事の時刻に更新される

>>『goo ブログ検索のクローラは2種類あるらしい』の続きを読む

【考察】goo ブログ検索にインデックスされた日時が9時間遅れている件

WordPress Comments (0) | Trackbacks (1)

【祝!】WordPress を Yahoo! ブログ検索させる方法 その8【gooブログ検索インデックス!】」の記事にて、goo ブログ検索にインデックスされて喜んでいたのですが、挙動がおかしな点が2つほどある。

1) 反映されるまで半日から1日かかる
2) 記事の日時が9時間分過去の時刻になってる(今日気がつきました)

もしかしたら、「記事が反映されるまで半日かかる」のは、2) のせいかもしれない、と。

そして、2) の「記事の日時が9時間分過去の時刻になってる」については、GMT(UTC)を表示していると考えると合点がいく。わたしが「【祝!】WordPress を Yahoo! ブログ検索させる方法 その8【gooブログ検索インデックス!】」の手順でGMTを日本標準時に直したのは、RSS 1.0 の出力ファイルである feed-rdf.php だけだ。もしかして、goo は他のフィードを読んでいるのかもしれない。

下記サイトのコメント欄を参照にして確かめてみた。
→Kuwata’s Blog くわぶろ:WordPressの投稿記事をYahoo!ブログ検索にインデックスさせる方法:コメント欄
>>『【考察】goo ブログ検索にインデックスされた日時が9時間遅れている件』の続きを読む

【ついに成功】Yahoo! ブログ検索にインデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その9〜

WordPress Comments (0) | Trackbacks (0)

なんとか、Yahoo! ブログ検索にこの blog がインデックスされるようになりました!

昨日「【【祝!】goo ブログ検索インデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その8〜」を書いたあと、くわ。さんよりコメントをいただき、Yahoo! ブログ検索にインデックスされる方法を教えていただきました。
→Kuwata’s Blog くわぶろ:それでもYahoo!ブログ検索にインデックスされない・・・という方へ

pingの打ち方が肝のようです。

簡単にまとめてしまうと以下のように ping を打て、ということです。

http://api.my.yahoo.co.jp/rss/ping?u=(あなたのサイトの最新記事のURL)

詳しい諸注意などは くわ。さんの Kuwata’s Blog くわぶろ をお読みになってください。本当に感謝です。ありがとうございます。
またこれ以前に下準備しなくてはならないことは、下記記事にまとめてありますのでご覧ください。
【祝!】WordPress を Yahoo! ブログ検索させる方法 その8【gooブログ検索インデックス!】
>>『【ついに成功】Yahoo! ブログ検索にインデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その9〜』の続きを読む

【祝!】goo ブログ検索インデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その8〜

WordPress Comments (4) | Trackbacks (8)

WordPress を Yahoo! ブログ検索にインデックスさせる戦線、定期報告です。
昨日は残念ながら、Yahoo! ブログ検索のクローラ Y!J-BSC/1.0 は1度も来てくれませんでした。なので、昨日手を加えた点についての検証はできず。

しかし、そんなあさこんに朗報が! なんと goo ブログ検索にインデックスされたのです! やった! 今朝(2009年5月19日午前8時58分)現在、12記事がインデックスされました!
Apache ログを調べてみると、gooブログ検索のクローラ gooblog/2.0 が午後12時前と午前12時前の2回アクセスしにきてくれてました。その時点までの記事がインデックスされてます。うれしい。

ここで goo ブログ検索インデックスへ試行錯誤をまとめてみようと思います。
>>『【祝!】goo ブログ検索インデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その8〜』の続きを読む

【経過】Feed をリダイレクトしてみたが 〜WordPress を Yahoo! ブログ検索させる方法 その6〜

Web & Internet, WordPress Comments (0) | Trackbacks (0)

相変わらず、Yahoo! ブログ検索にはインデックスされてないこの blog。

昨日加えた、gooへの変更がうまくいっているか Apache のログを見てみました。なんで1日1回の報告になるかというと、わたしが借りているレンタルサーバーが1日1回しか Apache ログを吐き出してくれないからです。

さてまず、Yahoo! ブログ検索のクローラ Y!J-BSC/1.0 ですが、昨日は来てくれたようです! でも来た時間が23時過ぎで、クロールしていった記事が、5月12日の20時57分の記事。これですね→「【検証】WordPress を Yahoo! ブログ検索させる方法」。来るの遅すぎ。まあ、こうやって地道にクロールしていってくれたら、いつかはインデックスされる日が来ると信じることにします。
>>『【経過】Feed をリダイレクトしてみたが 〜WordPress を Yahoo! ブログ検索させる方法 その6〜』の続きを読む

【考察】PING 送信方法でクローラの訪問に違いがあるのか 〜WordPress を Yahoo! ブログ検索させる方法 その5〜

WordPress Comments (0) | Trackbacks (0)

Yahoo! ブログ検索に表示されない件、その後変化なしです。

この2日間のまとめ。一昨日(2009年5月14日)は Y!J-BSC/1.0 から1回アクセスがありました。昼過ぎに、その日の夜中に更新した記事に対してでした。昨日は Y!J-BSC/1.0 のクロールはなし。残念。
これには心当たりがあります。一昨日は、ping を送信するのに、WordPress デフォルトの機能を使い、昨日は、Smart Update Pinger を使ったことです。

その代わりといっては何ですが、goo のブログ検索のクローラ gooblog/2.0 からのアクセスがありました。でも、トップページだけ見て帰ってる。トップページに何か問題があるのでは? と思い、Yahoo! ブログ検索に表示されてるページと見比べて、ちょっと小細工をしてみました。
前:<html xmlns="http://www.w3.org/1999/xhtml">
後:<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja">
日本語のページとわかるように xml:lang="ja" lang="ja" を付け加えました。吉と出るか、凶と出るか。

WP Theme & Icons by N.Design Studio
Entries RSS Comments RSS ログイン