百度弾き(Baiduspider)

スポンサーリンク
エントリー内リンクはアフィリエイト広告を含みます。
エントリー内リンクはアフィリエイト広告を含みます。

 いい加減勘弁してくれ。サーバーの負荷軽減と戦いつつ、対策してはすり抜けてくるスパムと追いかけっこ状態だが、随分とCORESERVER.JP移転当初から比べるとかなり負荷は激減させることに成功した。しかしねぇ・・・百度さんコリャ厳しいaccessですよ。cgiにばっかりアクセスしているのは何故ですか?

 百度とは中国の検索エンジンで、日本でも運営されているのですが、ここのサイト収集ロボット君が激しいアクセスを繰り返しています。以前もSERVERに過負荷をかけるということで問題になり百度も対策したという話ですが、最近また激しい気がしています。以前のように毎秒アクセスではないけれど、cgiへのアクセスが困る。Yahoo!やGoogleのロボットが収集しないアドレスにまでアクセスしかけてくるので困りものです。SereneBachを利用していますが、なぜadmin.cgi(管理画面)やcnt.cgi(カウンター)にまで・・・最近一番多いのは携帯電話用の表示を司っているmb.cgiへの異常なアクセスが見受けられます。1日で一番アクセスされているFileがmb.cgiでしたから・・・。

 一応検索エンジンでスパムじゃないですから弾くのには若干抵抗もあり、対策するという話でしたから放置していましたけど、無理ですね。正直百度検索で検索し来る人は居ません。70%がGoogleから、25%がYahoo!から、残りがその他のMSN等の検索エンジンやリンクたどったりRSSからだったりと言う感じで百度からは見たこと無いです。試しに百度でうちのサイト検索したら何でこのアドレスまで拾って居るんだよ!と思われるような管理用アドレスやら携帯用やら出るわ出るわ・・・。

 そんなわけでロボットに巡回されても「百害あって一利なし」と判断し完全に弾くことにしました。しばらく.htaccessで全面的に弾いておきます。時間がたって落ち着いたらcgiFileへのaccessを禁止するような.htaccessに書き換えようかなとは思いますけどね。

コメント

タイトルとURLをコピーしました