网站管理员指南
遵循以下指南将有助于 Google 查找、检索您的网站并对其进行排名,这是确保在 Google 搜索结果中列出您的网址的最佳途径。即使您选择不采纳这些建议,我们也强烈建议
您密切关注“质量指南“,该指南对可导致网站从 Google 索引中彻底删除的一些违禁行为做了简要说明。一旦网站删除之后,Google.com 或 Google 所有合作伙伴网站的搜索结果中都不会再显示该网站。
网站设计与内容指南:
网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。
为用户提供一个网站地图,并列出指向网站重要位置的链接。如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页。
网站应具有实用性且信息丰富,网页文字应清晰、准确地表述要传达的内容。
要考虑到用户会使用哪些关键词来查找您的网页,确保网站上包含了这些文字。
尽量使用文字而不是图像来显示重要的名称、内容或链接。因为 Google Crawler 无法识别图像中所包含的文字。
确保 TITLE 和 ALT 标记文字简单明了并与网页内容相关。
检查链接是否损坏,HTML 格式是否正确。
如果采用动态网页(即网址中包含“?“字符),请注意并非每一个搜索引擎 Spider 收录动态网页都能像收录静态网页一样容易。缩短参数的长度并减少参数数目将有助于收录动态网页。
将每一网页上的链接数量限制在合理的范围内(少于 100)。
技术指南:
由于大部分搜索引擎 Spider 查看网站的方式与文本浏览器一样,所以可使用诸如 Lynx 的文本浏览器来检查您的网站。如果因采用了 Javascript、Cookie、Session ID’s、frames (框架)、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在收录您的网站时可能会遇到麻烦。
允许搜索漫游器 (search bots) 收录您的网站,同时不采用 Session ID 或其它参数来追踪它的浏览路径。这些跟踪技术对了解个别用户的行为很有用,但由于漫游器的访问模式完全不同,采用这些技术则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同但实际却指向同一个网页的网址。
确保您的网络服务器支持 If-Modified-Since HTTP 标题。通过该功能 Google 可以知道自上次收录以来您的网站内容是否有变化,这样可以节省您的带宽和开销。
使用网络服务器上的 robots.txt 文件。该文件会告诉 Crawler 可以收取哪些目录。请确保该文件内容的更新,以免 Googlebot Crawler 的收录意外中断。有关来访漫游器和如何控制它们的常见问题解答,请访问 www.robotstxt.org/wc/faq.html。