最近要做个搜索引擎蜘蛛爬行的记录,当然要用代码来记录,不然会很麻烦的。庆幸的是php就有已经内置好的函数。$_SERVER['HTTP_USER_AGENT']变量就可以判断。如果该变量中含googlebot则为谷歌蜘蛛,含baidu则为百度蜘蛛,含yahoo则为雅虎蜘蛛。下面是一个获取蜘蛛的简单函数:
function get_naps_bot() {
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if(strpos($useragent, 'googlebot') !== false){
return 'Googlebot';
}
if(strpos($useragent, 'msnbot') !== false){
return 'MSNbot';
}
if(strpos($useragent, 'slurp') !== false){
return 'Yahoobot';
}
if(strpos($useragent, 'baiduspider') !== false){
return 'Baiduspider';
}
if(strpos($useragent, 'sohu-search') !== false){
return 'Sohubot';
}
if(strpos($useragent, 'lycos') !== false){
return 'Lycos';
}
if(strpos($useragent, 'robozilla') !== false){
return 'Robozilla';
}
if(strpos($useragent,"msie 67.0")!==false){//我测试用的(我的浏览器是ie6.0)
return 'MSIE 7.0';
}
return false;
}
在头部或者底部或者公共页面里调用这个函数,然后可以建立一个表,把蜘蛛的名字和爬行时间一并插入其中,这样在后台就可以一目了然的看到蜘蛛爬行的时间和次数了。。大家研究一下吧~~