goo ブログ検索のクローラは2種類あるらしい

SEO Comments (0) | Trackbacks (0)

ここ2日間くらい goo ブログ検索に関して Apache のログとにらめっこしています。そして、わかったことは goo ブログ検索のクローラは2種類あるらしいこと。具体的には「gooblog/2.0」と「gooblogsearch/2.0」。

goo ブログ検索の2つのクローラ

  • gooblog/2.0:更新 ping を送るとやってくるクローラ。サイトトップにアクセスしたあと、index.rdf を見に行く
  • gooblogsearch/2.0:実際にインデックスしているクローラ。こいつが来た時点で最終更新日時が最新の記事の時刻に更新される

>>『goo ブログ検索のクローラは2種類あるらしい』の続きを読む

【WordPress】RSS (rdf) が配信されない件【解決】

WordPress Comments (0) | Trackbacks (0)

このページの RSS (index.rdf) が読み込めないとご連絡をいただきました。(教えていただき、ありがとうございます!)一応自分の RSS は購読していて、動作の確認をとっていたので、びっくりしてしまいました。最近、アクセス数が伸びてきたので、とうとう転送容量オーバーしてしまったのかと思って慌ててしまったのですが、RSS リーダーではなく Firefox から rdf にアクセスすると、白紙ページ。rss、feed は正常に動いているので、rdf の何かがおかしいということがわかりました。Feed や RSS 関係は Yahoo! ブログ検索や goo ブログ検索にインデックスさせるため、リダイレクトしたり配信時刻を日本標準時に変えたりといろいろといじっていたので、原因を切り分けるのが大変でした。

結論からいうと、原因はPowerBookG4 を SSD 化するとこれくらい速くなるの投稿記事部分に Flash ビデオ (FLV) を表示するために JavaScript をベタ書きしていたことでした。Feed を全文配信していると、RDF では JavaScript だと解釈されないためにエラーになって白紙で表示されていたようです。

対策としては記事部分にベタ書きしてある JavaScript のコードを HTML のコメントアウトすることで解決しました。具体的には、下記の太字の部分を追加。
>>『【WordPress】RSS (rdf) が配信されない件【解決】』の続きを読む

WordPress RSS 関係いろいろ

WordPress運用 Comments (0) | Trackbacks (0)

なぜかこの「トイレのうず」の Feed、Mac の NetNewsWire で見ると文字化けする。2.8.4 にアップデートする前はちゃんと動いていたのに。なぞー。いろいろ試してみたけれど、どうしてかわからない。

それで、いろいろ見直してみていたら、なんと、feed/rdf の時刻の表示の仕方がおかしくなってる。

<dc:date>2009-09-14¥JST12:32:01+09:00</dc:date>

おかしい、ってことで、feed-rdf.php を見直して見るも、おかしなところはなし。でも「JST」っていうのは日本標準時ってことだから、「¥T」がエスケープされてないよう。PHP で「T」はタイムゾーンを出力するらしい。たぶん原因は UTF-8 にて「¥」がバックスラッシュで保存されてないためだぁ。

【PHP】Mac でバックスラッシュがエンマークになってしまう件【U.ico” de】

Yahoo! ブログ検索、goo ブログ検索ともに、RSS の時刻がちゃんとしてないがために「WordPress を 2.8.4 にアップデート」を最後にインデックスされてない。ちゃんと直したらまたインデックスされるかしら。

でも、RSS 2.0 の文字化けは相変わらず直らないなぁ。

【解決】goo ブログ検索にインデックスされた日時が9時間遅れている件【RSS2 の時刻修正】

WordPress運用 Comments (2) | Trackbacks (1)

goo ブログへのインデックス時刻が9時間遅れで GMT になってしまっていたのの修正に成功したのでご報告いたします。

goo ブログは index.rdf へ決め打ちでクロールしにきますが、実際にインデックスするのは、goo に登録されている RSS のようです。どの RSS ファイルが登録されているのかは、「【考察】goo ブログ検索にインデックスされた日時が9時間遅れている件」にて方法をご紹介していますのでご覧ください。

どの RSS が登録されているかわかったら、その URL を開きバージョンを確認してください。おおかた RSS 2.0 を現す feed のアドレスが登録されているのではないかと思います。

このサイトの場合は「/feed」でしたので、RSS 2.0 の時刻の出力を下記サイトを参考に変更しました。
RSS 2.0 Notes:pubDate要素
>>『【解決】goo ブログ検索にインデックスされた日時が9時間遅れている件【RSS2 の時刻修正】』の続きを読む

【考察】goo ブログ検索にインデックスされた日時が9時間遅れている件

WordPress運用 Comments (0) | Trackbacks (0)

【祝!】WordPress を Yahoo! ブログ検索させる方法 その8【gooブログ検索インデックス!】」の記事にて、goo ブログ検索にインデックスされて喜んでいたのですが、挙動がおかしな点が2つほどある。

1) 反映されるまで半日から1日かかる
2) 記事の日時が9時間分過去の時刻になってる(今日気がつきました)

もしかしたら、「記事が反映されるまで半日かかる」のは、2) のせいかもしれない、と。

そして、2) の「記事の日時が9時間分過去の時刻になってる」については、GMT(UTC)を表示していると考えると合点がいく。わたしが「【祝!】WordPress を Yahoo! ブログ検索させる方法 その8【gooブログ検索インデックス!】」の手順でGMTを日本標準時に直したのは、RSS 1.0 の出力ファイルである feed-rdf.php だけだ。もしかして、goo は他のフィードを読んでいるのかもしれない。

下記サイトのコメント欄を参照にして確かめてみた。
→Kuwata’s Blog くわぶろ:WordPressの投稿記事をYahoo!ブログ検索にインデックスさせる方法:コメント欄
>>『【考察】goo ブログ検索にインデックスされた日時が9時間遅れている件』の続きを読む

【祝!】goo ブログ検索インデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その8〜

WordPress運用 Comments (4) | Trackbacks (4)

WordPress を Yahoo! ブログ検索にインデックスさせる戦線、定期報告です。
昨日は残念ながら、Yahoo! ブログ検索のクローラ Y!J-BSC/1.0 は1度も来てくれませんでした。なので、昨日手を加えた点についての検証はできず。

しかし、そんなあさこんに朗報が! なんと goo ブログ検索にインデックスされたのです! やった! 今朝(2009年5月19日午前8時58分)現在、12記事がインデックスされました!
Apache ログを調べてみると、gooブログ検索のクローラ gooblog/2.0 が午後12時前と午前12時前の2回アクセスしにきてくれてました。その時点までの記事がインデックスされてます。うれしい。

ここで goo ブログ検索インデックスへ試行錯誤をまとめてみようと思います。
>>『【祝!】goo ブログ検索インデックス! 〜WordPress を Yahoo! ブログ検索させる方法 その8〜』の続きを読む

【調査】Yahoo! ブログ検索にインデックスされている WordPress 共通点は何か?【その3】

SEO, WordPress運用 Comments (0) | Trackbacks (0)

WordPress でサイト構築されていて、Yahoo! ブログ検索にインデックスされているページの共通点らしきものがなんとなく見えてきました。

それは、WordPress ME 時代からサイト運営されているところ。WordPress ME のままのサイトはもちろんのこと、本家 WordPress へアップデートしたサイトもほぼ何の改造しなくても、Y!J-BSC/1.0 クローラがやってきてるようです。

じゃあ、本家 WordPress から始めた人はどうしたらいいのよ、と思いつつ、MT のサイトと比べながら、RDFの中身を書き換えてみたり、WordPress、っていう文字をサイトのいろんなところから消してみたりといじってみました。成功したら、また記事にします。

というとこで本日は疲れたので、眠りにつきます。

あ、あとテーマのフォントの大きさを少し変えました。本当は大改造したいんだけれど。

【考察】なぜ WordPress は Yahoo! ブログ検索にインデックスされないか?【その2】

SEO, WordPress運用 Comments (0) | Trackbacks (0)

昨日下記のサイトを参考に WordPress に手を加えた。
→Kuwata’s Blog くわぶろ:WordPressの投稿記事をYahoo!ブログ検索にインデックスさせる方法

しかし Yahoo! ブログ検索にインデックスされない(涙。

今日はなぜインデックスされなかったのかの考察する。
>>『【考察】なぜ WordPress は Yahoo! ブログ検索にインデックスされないか?【その2】』の続きを読む

【挑戦】WordPress を Yahoo! ブログ検索にインデックスさせよう

WordPress運用 Comments (0) | Trackbacks (0)

WordPress に移行後、めっきり Yahoo! からの検索が減った。以前、LOVELOGというプロバイダ付属のblogサービスを使用していたときは、Google:Yahoo! は 6:4 くらいの割合で検索されていたように記憶しています。しかし、WordPress に移行して以来、その数は減り続け、今では 15:1 くらいの割合まで減少しています。これは明らかに WordPress が Yahoo! に嫌われているのでしょう。

あともっと痛いのは、Yahoo! ブログ検索にも引っかからなくなったことです。ホットな話題を書いたとき、LOVELOG 時代はぽーんとアクセス数が跳ね上がったものですが、今はそんなことはなし。Google ブログ検索から地味に来ていただいているだけです。

まあ、独自ドメインを取り、6か月が経過したので、以前よりはアクセス数は全体的には増えてはいるんですが、失った分も多い。
>>『【挑戦】WordPress を Yahoo! ブログ検索にインデックスさせよう』の続きを読む

ドリコムRSSが重すぎるのの応急処置

Webサービス Comments (0) | Trackbacks (0)

お気に入りのサイトの新着情報を表示してくれるドリコムRSS、非常に便利なんだけれど、夜になると重い。ページが表示されるまで5秒以上待たされるなんてざら。これじゃあ、せっかく見に来てくれた人も逃げちゃいますよね。ということで、対策を講じました。

対策は簡単。HTMLのページを別につくって、ドリコムRSSのコードを貼り付け。それらの背景、文字色をblogのそれと合わせる。iframe内に表示しておしまい。
これで、ドリコムRSSが重い時間でも、インラインフレーム内がレンダリングされないだけで、ページは普通に読めます。でも、読み込みのバーは表示されているけれどね。苦肉の策です。

この方法をダンナに話したところ、まるでエ□サイトのようだな、といわれました。そうなのか?

WP Theme & Icons by N.Design Studio
Entries RSS Comments RSS ログイン