1.设计和内容指南:
网站要有清晰的层次结构和文本链接。每个网页应当至少能从一个静态文本链接到达。
为您的用户提供一个网站地图(site map),其中有指向重要内容的链接,如果网站地图内的链接数量超过100,你应当将其分为几个页面。
创建一个有用的、信息丰富的网站,网页应当清晰、准确地描述你的内容。
设想用户可能会用哪些词语来查找你的网页,并且确保你的站点含有这些词语。
重要的名称、内容或链接应当用文本而不是图片显示。Google搜索机器人不认识图片中的文字。
确保使用描述性的 TITLE 和 ALT 标签,而且要准确。
检查坏链接,使用正确的HTML标记。
如果你使用动态页面(即URL中包含"?"字符),要知道不是每个搜索爬虫都能像搜索静态页面一样搜索动态页面,最好保持参数或数字简短。
将页面内的链接数量限制在合理的范围内(小于100)。
2.技术指南:
使用纯文本浏览器比如 Lynx 来检视你的网站,因为大多数网络爬虫看待网站的方式和Lynx一样。如果你使用了许多花俏的功能如Javascript, Cookies, Session ID,框架,DHTML或Flash,而在纯文本的浏览器中却看不到你的网站,那么搜索爬虫也无可奈何。
允许搜索机器人在没有会话ID或参数的情况下能够游历你的站点。这些技术对跟踪某个用户的行为可能有用,但机器人的访问模式却截然不同。使用这些技术将会导致站点索引的不完整,因为机器人也许无法消除哪些似乎不同但是却指向同一个页面的URL。
确保您的Web服务器支持If-Modified-Since HTTP报头,这个特性可以告诉Google自从上次游历以来哪些内容发生了变化。支持该功能可以节省你的带宽和反应时间。
充分使用服务器的robots.txt文件。这个文件告诉网络爬虫,哪些目录可以或者不能被遍历。确保它的及时性,以免无意中阻止Google爬虫的行动。关于网络爬虫以及如何控制它们访问您的网站的常见问题和解答,请参阅
http://www.robotstxt.org/wc/faq.html。
如果你的公司购买了内容管理系统,请确保这个系统能够输出内容,使得搜索引擎可以游历你的站点。
当你的网站准备好以后:
你的网站放到网上以后,将其提交给Google:
http://www.google.com/addurl.html.