首页>>学生风采>>许昌学院贲静>>观点>>搜索引擎的概念和发展现状

搜索引擎的概念和发展现状

作者:贲静
日期:2010/5/17 22:53:12

搜索引擎(Seareh Engine)是一种用于帮助Internet用户查询信息的搜索工具,它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。

随着网络与通信技术的迅速发展,Web 信息爆炸性的增长,互联网已经成为一个巨大的海量信息空间。如何快速、准确、方便的从如此庞大的信息库中获取自己需要的信息,是互联网用户面临的一个重要问题。搜索引擎就是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术。它是一种Web上的应用软件系统,以一定的策略在Web上发现和收集信息,对信息进行组织和处理,为用户提供Web信息查询服务。

近年来,随着WWW技术的广泛应用,传统的通用搜索引擎正面临巨大的挑战。挑战之一是Web信息资源呈指数级增长,搜索引擎无法使所有网络页面索引化;挑战之二是Web信息资源动态变化,搜索引擎无法保证对信息的及时更新;挑战之三是传统的搜索引擎提供的信息检索服务,不能满足人们日益增长的对个性化服务的需要。面对这些挑战,各类适应特定人群需要的“专业搜索引擎”(Topic-Specific Search Engine)应运而生,并引起研究者的重视。以何种策略访问Web,以提高搜索效率,成为近年来专业搜索引擎研究的主要问题之一。因此, 建立面向特定专业领域的专题性搜索引擎已经成为搜索引擎新的发展趋势。

搜索引擎是为满足人们对网络信息的搜索需求而新兴的一种网络工具,它利用网络自动搜索功能,对各种信息资源分门别类地进行标引、建库,并对信息进行理解、提取、组织和处理,从而起到信息导航的作用,帮助人们从不同形式的数字化信息中进行搜索。搜索引擎起源于传统的信息全文检索理论。狭义上的搜索引擎仅指基于因特网的搜索引擎;广义上的搜索引擎除此之外还包括基于目录的信息检索服务。搜索引擎的研究极具综合性和挑战性,它涉及到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的关键理论和技术,其核心问题是数据库的规模、索引数据库的质量和标引质量[7]。

分享