Google成立于1997年,几年间迅速发展成为目前规模最大的搜索引擎,并向Yahoo、AOL等其他目录索引和搜索引擎提供后台网页查询服务。目前Google每天处理的搜索请求已达2亿次!而且这一数字还在不断增长。Google数据库存有30亿个Web文件。属于全文(Full Text)搜索引擎。
Google提供常规及高级搜索功能。在高级搜索中,用户可限制某一搜索必须包含或排除特定的关键词或短语。该引擎允许用户定制搜索结果页面所含信息条目数量,可从10到100条任选。提供网站内部查询和横向相关查询。Google还提供特别主题搜索,如:Apple Macintosh, BSD Unix, Linux和大学院校搜索等。
Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择,包括英语、主要欧洲国家语言(含13种东欧语言)、日语、中文简繁体、朝语等。同时还可以在多达40多个国别专属引擎中进行选择。
搜索规则:以关键词搜索时,返回结果中包含全部及部分关键词;短语搜索时默认以精确匹配方式进行;不支持单词多形态(
Word Stemming)和断词(Word Truncation)查询;字母无大小写之分,默认全部为小写。
搜索结果显示网页标题,链接(URL)及网页字节数,匹配的关键词以粗体显示。其他特色功能包括“网页快照”(Snap Shot),即直接从数据库缓存(Cache)中调出该页面的存档文件,而不实际连接到网页所在的网站(图象等多媒体元素仍需从目标网站下载),方便用户在预览网页内容后决定是否访问该网站,或者在网页被删除或暂时无法连接时,方便用户查看原网页的内容(注:国内用户目前暂时无法使用Google的网页快照)。
Google借用Dmoz的目录索引提供分类目录查询,但默认网站排列顺序并非按照字母顺序,而是根据网站PageRank?的分值高低排列。
Google的“蜘蛛”程序名为“Googlebot”,属于非常活跃的网站扫描工具。Google一般每隔28天派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站。登录Google的周期一般为3个星期(从提交网站到被索引)。