首页>>学生风采>>华北科技学院怀万里>>观点>>搜索引擎的基本原理

搜索引擎的基本原理

作者:怀万里
日期:2011/6/14 13:29:07

(1)纯技术型的全文检索搜索引擎,如google、AltaVista、Inktomi

(2)经过人工审核编辑的分类目录,如yahoo、SOHU搜索引擎等

(3)多元搜索引擎

(1)纯技术全文检索搜索引擎的基本原理

其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。

  目前google收录的网页数量已经超过80亿个,这样,当用户检索时才可以在很短的时间内反馈大量的结果。

(2)分类目录型搜索引擎的工作原理这种“搜索引擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。

分类目录的好处是,用户可以根据目录有针对性地逐级查询自己需要的信息,而不是像技术性搜索引擎一样同时反馈大量的信息,而这些信息之间的关联性并不一定符合用户的期望。

(3)多元搜索引擎的工作原理

当用户提交搜索申请时,通过对多个独立搜索引擎的整合和调用,然后按照多元搜索引擎自己设定的规则将搜索结果进行取舍和排序并反馈给用户。

 优点:在于可以同时获得多个源搜索引擎(即被多元搜索引擎用来获取搜索结果的搜索引擎)的结果,但由于多元搜索引擎在信息来源和技术方面都存在一定的限制,因此搜索结果实际上并不理想 

分享