编者按:透过位于山景城的一家搜索引擎公司的一份专利申请书,可以中让我们对这个搜索引擎的PageRank技术内幕多一些了解。
域名注册时限
作为一个合法的网站拥有者来说,无不希望自己的域名注册至少已有一年的历史。这是由于,对于Google的PageRank算法来说,如果网站注册时间不超过一年,那么Google可能不会给该域名分配应得的PR值,而是要低一些。
那些网站作弊的家伙总是企图将域名注册时间降至最低,也就是一年,但据Google的专利申请文件显示,这其实是一种非常糟糕的做法。在Google专利申请文件的第40项声明中就详细指出:
在域名相关信息中至少应包含:域名相关的域名有效期信息、域名服务器信息、域名服务器记录信息三者之一。
Google希望能够在网络搜索世界中,坐稳“金标准”这个至高无上的位置。Google不懈努力寻求如何从搜索结果中清除那些纯属欺骗网络用户的站点的解决之道,Google这样的做法只会进一步提高它在人们心目的声望。
链接建立时间及链接内容的合理合法性
该专利申请书还透露了Google对链接的态度。那些在短短时间内就积累了大量外部链接的网页或网站,在Google则可能会认为这个站点有利用不正当手段来愚弄搜索引擎排名算法之嫌。
该专利申请书中的许多声明内容都指向了花费较多时间建立链接的行为、这些链接的新鲜性、以及这些链接的内容。这三者都是在Google的排名算法中需要考虑到的因素。
所有这些声明都显示出网站应花费更多的时间来发展链接,而且应确保这些链接均有其合理合法的信息来源。
内容的时新性
Google的这份专利申请书还透露出Google对网站内容的“新鲜性”的要求。Google看起来似乎对那些更新频率高,但又不是过于频繁的网站尤为垂青。这样的网站在搜索引擎结果中往往更容易得到较为显著的位置。专利申请书中这样写道:
有若干因素可影响到搜索引擎所生成的搜索结果的质量。例如,一些不良网站会利用作弊技术进行人工干预排名。同时,由于内容“陈旧”的文档(例如有相当一段时间未更新网站内容,造成网站数据内容陈旧)有可能会比内容时常更新的“时新”文档(例如经常更新,因而包含更新的数据)排名高,在某些具体的上下文中,比包含“时新数据”的网站排名更高的“陈旧”文档会降低搜索结果的质量。