首页>>学生风采>>南华工商学院彭健>>观点>>搜索引擎怎样来识别网站已更新?

搜索引擎怎样来识别网站已更新?

作者:彭健
日期:2012/5/21 14:27:10

很多朋友都想弄明白这个问题,当然不排除很多朋友都已经知道了。这里我再唠叨几句。主要是介绍给新人看的。

  我们每次打开一个新的网页的时候,HTTP头部文件返回的都是200的HTTP状态代码。然后就将这个网页的代码存储到我们本地的电脑里面,这个时候会记录一个A时间,当我们按下F5刷新下页面的时候,浏览器会发送一个叫 If-Modified-Since的报头,如果服务器端的这个页面在A时间到刷新结束的时候还是没有更新的话,那么他会返回一个叫304的HTTP状态代码。表示该页面没有更新,浏览器只需要读取缓存即可。

  而搜索引擎也是靠这个机理来工作的,我们本地的缓存就可以理解为搜索引擎的网页快照,搜索引擎每次通过网页快照来对比我们网站发送的HTTP状态代码,如果是200那就表示网页上有新的内容了,如果是304,搜索引擎就直接走掉了。继续去F5其他的页面,这样快速的发送if-modified-since报头,快速的查看返回的HTTP状态代码,就可以识别互联网上那些页面更新了,那些页面没有更新。

  呵呵,简单吧?不要把搜索引擎想的太复杂,也不要不去了解那些基础的东西。老姜的建议是,大家尽量的要去研究那些容易的且大多数SEO都忽略的东西,只有这样自己才能在行业里面独树一帜!

分享