第一种情况比较好解释,这种情况往往出现在采集站,由于采集来的内容相似性比较高,百度收录后会对比比较后扔掉一些质量较差的网站页面,也就是权重较低的网站页面。除此之外服务器原因还有同服务网站被k也会出现这样的问题。
第二种情况是今天要说的重点,站长朋友在用站长工具查询自己网站的时候会经常发现网站的百度收录数量减少,但是网站每天都会收录新的页面为什么反而会减少呢,下边来详细讲解这个情况的原因。
既然说到百度收录页面变化我们就先说说百度收录页面的原理,百度收录共有4步:爬行和抓取——索引——搜索词处理——排序,经过这四步后在我们搜索的时候搜索引擎将这些展现在我们面前。我们能够控制的是爬行和抓取,做外链不但可以增加网站权重而且可以增加百度蜘蛛爬行次数,次数越多自然抓取的几率也就更高。之后是百度根据抓取的页面里关键词出现的位置、字体、颜色、加粗、斜体等相关信息做相应记录,然后是进行分词处理,最后是排序,对搜索词处理后,搜索引擎程序便开始工作,从索引数据库教程中找出所有包含搜索词的网页,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返回到“搜索”页面。
百度收录页面也就是抓取网站的页面,百度会根据自己的一套策略来分辨这个页面对用户是否有用,并且对其评分,每爬取一次会做一次评分,当分数达到要求了百度就会收录,其中评分受网站权重的影响比较大,这也就是网站权重高的网站页面比较容易收录,就像a5站长网,你发文章之后几分钟就会被百度收录,这就是网站赋予新页面的权重让其快速收录。如果一个站权重不是很高,当页面链接出现在首页的时候,传递给页面的权重比较多,百度评分满足收录要求对其收录了,由于网站不断更新,等页面离开网站首页后权重降低,评分无法满足百度收录要求,这样收录页面就会从百度消失,由于网站权重是不断提升的,页面的权重也会得到提升,最后满足收录评分要求被重新收录,这就是网站的百度收录数量会出现s型波动变化的原因。