当然要让搜索引擎收录的前提会有很多,比如你网站权重、内容的质量等等。特别是我们做一个新站,对于搜索引擎能收录我们的内容那是相当开心的一件事,对于新站的收录问题我在新站让百度快速收录前提一文里有提到过。这里我就不展开去细说。
今天可以说是继这篇文章之后,我不知道大家有没有发现一个问题。我们的快照更新的比较及时的站,但他的收录不一定跟的上,或者说是有些栏目页根据就不会收录。其实说的白一点,蛛蛛都没有去爬过(这些数据大家可以通过分析网站日志可以看出蛛蛛爬取的页面路径),那么对于这样的情况我们应该如何处理,这个是我今天要与大家分享的。
对于部分栏目不收录的问题。我就拿商城的产品页面来说,特别是对于一些相对来说内容重复率的产品来说,比如服装这个行业。可能不像我们做企业站,产品很少就那么几个。要做到精益求精也不是什么特别难的事,要是同样的情况出现几乎每日都要更新产品图片的商城来说,那么是不是我们无法做到大家说的,尽可能的把产品描述写的清楚细致一点。要是真的那样做的话,我们的工作量就太大了,这个也是我先前在操作一个童装批发站遇到一个大问题。
我们发现,对于以上说到的产品页他的一个非常大的特点就是产品介绍少,产品页与产品页之间的重复率高,再加上蛛蛛目前是无法读取图片信息的。那么假如蛛蛛访问这个页面,他看到的是不是只有那么不上100的高重复率的页面,如果你是搜索引擎你会收录这样的页面吗?对于这样的页面,我们的着手点就是在尽可能的减少页面的重复率。一般来说我们可以在相应的产品页面下面增加一个对产品的评论这个功能。当然我们不可能做到每一款产品都会有用户来评价,那么你得自己亲自来评价。比如去淘宝等一些相关性高的地方找一些内容来做一个补充就可以了。第二个操作模式,我们来随机调用网站论坛或者说新闻资讯,这个也是非常不错的手法。
那么我的站不是商城而且上面说的这种情况不在内,我应该如何去操作?其实这个原理也是非常简单的。在文章的开头我们有提到看网站日志之说,对于这个问题我们也是从哪里面着手。大家现在就可以看下你网站的日志哪些页面的访问频率是较高的,哪些页面的访问频率是比较低的。大家例出来,访问频率比较高的那是不是我们可以说明这个页面对于蛛蛛来说是比较受它欢迎的。