« あなどれないヘチマさん(゚-゚;) | メイン | ハンズに行ってきた〜♪ »

2005年12月05日

タヌキとロボットのイタチごっこ(^^;

アクセスログをぼーっと眺めるのが好きです。(更に、そのログを無意味に収集する(^^; 特に読み返すわけでもないのに収集する。 どうも収集癖があるようだ。)

可能であれば全ページのアクセスログを取得し、かつどのカテゴリが一番人気があるのかを知りたいタヌキは、かなり古いアクセスログのスクリプトを愛用しています。(タヌキが愛用しているスクリプトは2000年問題以前に基礎が出来たスクリプトが多いので、もう転がっていないのばかり(^^; ) SSIを使って生ログを適当に収集してくれている愛い奴なんですが(゚-゚;) ここにしばしば怒涛の勢いでロボット(ロボット検索の意)の襲撃があります。

ロボットはすぐわかるのよ〜。 すっごい勢い(秒単位)でページをザザザと読んでるリモートがあったら、ほぼロボットと確信してもいいぐらい(゚-゚;) アクセスログでチェックしたときにロボットに侵食されていると、ぷくーっと膨れながら生ログをダウンして、キレイにお掃除するほどの念の入れようです(^^; >部屋の掃除はしないわけだが・・・。

なんで、自分でロボットと認識される文字列を発見したらログに記録されないように、小細工をしています(゚-゚;) >今までのエントリでも何回か書いた。

がっ!

最近のロボットは独自色を持たせたいのか、ブラウザ情報が妙に特殊で「crawl」って入れてるだけじゃ蹴れないのよね〜。 巡回ロボットなんだから「crawl」でいいじゃん!(゚-゚;) などと思ったりしつつ、ぺちぺちと手動で入れまくりです(笑) >複数登録できるようにしてあるらしい。 ちなみにこれ調べていくと、ロボットのルールを守っていないんじゃないか? と思われるようなロボットを発見することもあったり(・・; >登録されなければいいわけなんだが、巡回はしてるのねー(゚-゚;) と・・・。

今回は更にキレイに整頓して、徹底してみたんだけれど、果たしてこれでどれだけ持つことやら・・・(・・; >ちなみに今回激しく大暴れしていたロボットは、ヤフーとグーでした・・・。 グーのロボットのブラウザ情報は特になんとかならんのか(・・; (ドコモの携帯ブラウザ情報になってた(^^; ホントだったら課金で死ぬだろう(笑) 定額はじまったんかなー(゚-゚;) と、一瞬思ってしまった(苦笑))

# 携帯ユーザーはモバイルばーじょんの方が読みやすいですぞっ(゚-゚;)

投稿者 tanucha : 2005年12月05日 20:30

トラックバック

このエントリーのトラックバックURL:
http://mainte.yukiakari.org/0tanu0512-link.cgi/876

コメント

コメントしてください




保存しますか?



(C)Copyright 2004-2006 Tanucha All rights reserved.
↑ 諸注意を読む。