搜索引擎的分类

作者:孟丽君
日期:2010/5/28 19:57:16

搜索引擎的分类

定义:活的网站网页资料,能够建立数据库并提供查询的系统,都可以叫做搜索引擎。但是,按照工作原理的不同,可以把它们分为俩个基本类别:

1计算机自动搜索型

计算机自动搜索型的数据是依靠一个叫“网络机器人(spider)”或叫“网络蜘蛛(crawlers)”的软件,24小时不停的通过网络上的网页链接自动获取大量网页信息内容,并按已定的规则分析整理形成的。但是,因为计算机自动搜索型是依靠软件进行搜索,所以数据库的容量非常庞大,,他的查询结果往往不够准确。

2人工分类目录型

人工分类目录型则是通过人工的方式搜集整理网站资料形成数据库的,虽然也有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。比如雅虎以及国内的搜狐,新浪,网易等都属于人工分类目录型。另外,在网上的一些导航站点,也可以归属于为原始的人工分类目录型,比如“网易之家” (http://www.hao.360.com/).用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。人工分类目录型依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。为了取长补短,现在的很多搜索引擎都同时提供这俩项。此外,目前人工目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。

其他类型

1集成搜索引擎

集成搜索是运用了一定的网页技术,把多个搜索引擎的搜索功能整合在一个搜索页面,并对各个搜索引擎的功能进行分类,方便用户在多个搜索引擎的搜索结果中进行比较和选择。部分集成搜索甚至没有对用户的搜索请求做出任何记录。所以,集成搜索更像一个在线的、集合了多个搜索引擎入口的软件,而不是搜索引擎。
国内有很多集成搜索的网站,如优客搜索(www.yok.com)。如HotBot

2元搜索引擎


元搜索引擎在接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。元搜索引擎并不直接抓取网页,而是抓取多个搜索引擎的索引数据库,并根据自己的算法对抓取结果重新筛选排序。虽然说元搜索引擎综合了多个搜索引擎的结果,但由于是建立在其他搜索引擎基础之上,自身的排序算法也难以得到认可,所以一直没有特别的影响力。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。比较知名的元搜索引擎有 Dogpile(www.dogpile.com)、Vivisimo(www.vivisimo.com)、 比比猫(www.bbmao.com)等。

3、门户搜索引擎

门户搜索引擎如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
4、免费链接列表(Free For All Links,简称FFA)

免费链接列表这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。

分享