对网友来说,没有比Google将自己呕心沥血建好的网站拒之门外更让人郁闷的事了。的确,就目前Google所处的地位来说,将自己的网站登录Google搜索引擎成了站主们心中的头等大事。可有时就是天不随人愿,花好大代价建成的网站,谁见了都被迷得五迷三道,而让对面的Google看过来,它却不理不睬,搞得站主们心里直犯嘀咕:我到底哪儿得罪Google了?
其实在对待收录网站的问题上,Google还是相当宽容的,而且从扫描技术上说它也是最全面的,不过万一你的网站得不到Google的赏识,不仿从以下几个方面找找原因(请首先确认Google的确没收录你的网站):
■ 网站设计是否搜索引擎友好
1、纯Java网站
如果你的网站是用纯Java设计的,那么就要小心了,因为Google曾在一些场合明确表示过不会收录用纯Java技术制作的网站。
2、Flash网站
如果你的网站大量使用Flash,例如首页为一个Flash动画,并且链接内嵌在Flash中,对这种网站Google是不太感冒的,而且一些搜索引擎(Google、Fast/AllTheWeb等)虽然已能解读图象中的内嵌文字和链接,但并未正式使用在对内部网页的检索上。
3、纯图象首页
目前许多网站(尤其是企业网站)将首页设计成仅包含图象的形象页面(splash page),加上网站内容太少,因此常常造成无法成功登录Google。听听Google对此是怎么说的:“We want to point users to content pages,not to doorways or splash screens”。
4、网页框架(frameset)
Google可以检索使用网页框架结构的网站,但由于搜索引擎工作方式与一般的网页浏览器不同,因此会造成返回的结果与用户的需求不符,这是搜索引擎所极力要避免的,所以Google在收录网页框架结构的网站时还是有所保留的。如果你非用框架结构不可,可以将相关内容放在标签中。
5、动态网页
Google是较早支持动态网页检索的搜索引擎之一,但有一定限度,Google的解释是:“because our web crawler can easily overwhelm and crash sites serving dynamic content we limit the amount of dynamic pages we index”。
不过据我们观察,Google现在对动态网页的支持很好。但如果动态网页存在回路(loop),很容易将spider套住让它无法脱身,所以当你找不到其他无法登录Google的原因时,可以试着将动态网页改成静态html文件。
6、网站内部链接