Baiduspider - 百度蜘蛛

作者:沈继康
日期:2013/5/27 10:42:08

Baiduspider - 百度蜘蛛:

百度是如何收录到那么多网页的呢?这个百度用以抓取互联网上数以亿计的网页的程序,就叫做Baiduspider - 百度蜘蛛。

它是一个程序,夜以继日得在互联网上找寻新的URL,接着抓取URL上的内容,返回到百度的网页暂存数据库。

百度用来抓取网页内容的程序,叫做Baiduspider,抓取其他内容的蜘蛛,则是新的名字:

产品名称                 对应user-agent

网页搜索                Baiduspider
无线搜索                Baiduspider-mobile
图片搜索                Baiduspider-image
视频搜索                Baiduspider-video
新闻搜索                Baiduspider-news
百度搜藏                Baiduspider-favo
百度联盟                Baiduspider-cpro

分享