一般情况下,我们在搜索结果页面看到的都是省去默认首页的,主流建站程序语言有asp/php/jsp/.net,其默认首页一般是index.html/index.htm/index.php/index.asp/default.asp/default.aspx等。推荐阅读:做网站哪种编程语言好。比如WordPress默认首页应该是这样调用的,当有人输入http://www.××.org/来到笔者的SEO博客,DNS解析系统会帮助浏览器找到网站服务器,然后网站服务器调用了硬盘上的一个默认的文件:index.php。
之前site:www.××.org,是没有该默认首页的,在五种网页自动跳转方法与示例中的第四个示例把该默认首页亮出来了,没想到第二天百度就把这个默认首页放出。现在笔者已经index.php改成index.html,并且在robots.txt屏蔽index.php,过段时间再看看百度是否会删除该页面。
这次经历福建SEO明白一个道理,如果你不想让某种形式的链接出现在搜索引擎结果页面SERP,那么就应该避免在任何情况下对其提及。这个道理其实在SEO优化如何降低页面相似度有提到,SEO从业者应该思考如何把目标内容更有效的展示在搜索引擎结果页面。
不过屏蔽之后发现,搜搜跟搜狗好像变得更加不爱收录页面了。几个月前笔者的SEO博客robots.txt实际上刚开始时候有添加一条记录是Disallow: /index.php,后面福建SEO通过日志文件分析发现,蜘蛛是通过抓取index.php/*.html这样格式进行收录的。搜搜和搜狗蜘蛛好像抓取后并不放出,后来笔者把SEO博客的tag标签屏蔽后,搜搜就更不懂得怎么抓取了,当时就把robot.txt的这条记录删除了,后面搜狗好像正常了一些。现在又添加了这条记录后,搜狗好像收录又不正常了,这个情况福建SEO继续观察一段时间。
既然知道301重定向的好处,那么如果能让http://www.××.com/index.php转向http://www.××com/,这听起来是不是挺棒的?!
后面SEO技术细细思考下,事情好像没那么简单。我们想想是不是这么个流程?1、服务器接到http://www.××.com/index.php请求,然后看到应该301转向到http://www.××.com/,于是当调入http://www.××.com/时候,又要获取默认文件(index.php),就又调用http://www.××.com/index.php,然后服务器又看到需要转向http://www.××.com/,这岂不是无限循环了?
关于默认首页index/default做301重定向的思考,希望SEO能够提供简单明了的思路,福建SEO期待你们的分享!