搜索引擎概述(二)

作者:孟雅婷
日期:2013/10/18 15:24:35

(二)分类目录

分类目录并不采集网站内容,而是通过工人或半自动的方式收集整理网站资料形成数据库。编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。所有这些收录的站点同样被存放在三个“索引数据库”中。用户在查询信息时,可以选择按照关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟全文探索引擎一样,也是根据信息关联程度排列网站。需要注意的是,分类目录的关键词查询只能在网站的名称、网址、简介等内容中进行,它的查询结果也只是被收录网站首页的URL地址,而不是具体的页面。

分类目录就像一个电话号码簿一样,按照各个网站的性质,把其网址分门别类排在一起,大类下面套着小类,用户界面基本上都是分级结构,首页提供了最基本的几个大类的人口,一直到各个网站的详细地址,一般还会提供各个网站的内容简介。目录中网站的排名一般是按照标题字母的先后顺序或者收录的时间顺序决定的。

全文搜索引擎和分类目录在使用上各有优缺点。全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确,包括不相关的内容、重复的内容等,由于搜索引擎优化的技术,许多质量不高的信息充斥搜索结果页面;分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。为了取长补短,现在很多的搜索引擎,都同时提供这两类查询,例如Google的目录、百度收购了网址之家、雅虎的易搜(或称雅虎全能搜)。

分享