首页>>学生风采>>广州华南商贸职业学院魏国雄>>观点>>谈谈搜索引擎是怎么处理网页索引的

谈谈搜索引擎是怎么处理网页索引的

作者:魏国雄
日期:2012/10/29 21:48:33

     大家都觉得很奇怪,搜索引擎是怎么处理网页索引的呢?接下来帮大家解析下搜索引擎。
 
一.提取关键词
      我们都知道这道互联网上的网页都是由于html文档构成的,而许多的html文档的内容都比较随意参杂这很多与内容无关的信息如广告、样板文字、导航等等信息,由于这些和内容无关的信息会影响用户等搜索展现,搜索引擎就需要提取其具有代表性特征————关键词搜索引擎提取关键词的过程当中会用一个切词软件,对网页中的内容的进行分词,通常在一篇的文章当中会有多个的这个关键词重复的出现如在、的、了之类的关键词,为了能够提高其工作的效率,搜索引擎就会将这些“停用词”给去掉,这样一般对于一般文章当中有效词语大于为200多个左右。
 
二.消除重复网页
      这些是根据用户的喜爱程度来进行构建,当然也可以参考同行业比较权威的站点来进行模仿,那样我们的网站自然而然的可以构建很好的布局咯。
 
三、稳定快速的服务器、空间。
      相信真正懂得做优化的站长都知道一个稳定快速的服务器对网站长久发展的重要性。如果我们的服务器不够稳定、或者经常的进不去,那么当我们网站排名网站 碰到蜘蛛来取食的情况下,当蜘蛛碰到这样打不开的情况,那么自然而然不会给你网站一个好的印象,如果在长久的这样的话,轻者不收录网站内容、快照迟缓,重 者拔毛K站(特别是新站)。所以说如果想要自己的网站有一个好的发展、好的排名,千万不要在服务器或者空间上面扣扣索索,否则你会后悔的。
 

分享