首页>>学生风采>>中山大学新华学院徐丽>>观点>>搜索引擎的工作原理

搜索引擎的工作原理

作者:徐丽
日期:2013/4/10 20:47:33

搜索引擎的工作原理大概分为以下三点: 一、搜集信息。搜索引擎的信息搜集原则上都是自动的,搜索引擎利用被人们称为网络蜘蛛爬虫的自动搜索机器人程序来连接上每一个网页上的超链接。机器人程序根据网页链到其中的超链接,从少数几个网页开始,连到数据库上所有到其他网页的链接,不断抓取更多的网页。理论上,若网页上有相当数量的超链接,机器人即可以爬到绝大部分的网页 二、整理信息。搜索引擎整理信息的过程称为“创建索引”,搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样一来,搜索引擎才不用在每次保存前重新检索它所保存过的信息,而即可以迅速找到所要用到的资料。 三、接受查询。用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎时时刻刻都在接收来自用户的、几乎是同时发出的查询请求,此时它就要按照按照每个用户的要求开始检查自己所有的索引,在非常短的时间内寻找出用户需要的资料,并及时返回给每一个用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这样通过点击进入链接,用户就能到达含有自己想要的资料的网页。这些网页中是否含有用户所需要的内容就要靠用户自己进行判断了。

分享