按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:
1. 目录式搜索引擎。早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。信息大多面向网站,
提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。这类搜索引擎的代表是:YAHOO, Open Directory,国内最具代表性的是搜狐分类目录。
这是互联网早期的搜索引擎形式,现在仍然占有重要地位。雅虎就是从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,
2. 机器搜索引擎。由大规模机器运运行的程序按照某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,可能有很多无关信息,用户必须从结果中进行筛选。这类搜索引擎的代表是:AltaVista, Excite, Infoseek, Inktomi, FAST, Lycos,,AlltheWeb, Ask Jeeves, Google;国内最具代表性的是:百度,天网,OpenFind。
目录式搜索引擎的缺点,随着网络信息的增长变得日益明显。对网上信息搜索的需求使得从事机器搜索的研究机构和提供搜索服务的公司在1995年以后变得异常繁荣。
3. 元搜索引擎. 这类搜索引擎没有自己的数据,它将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。这类搜索引擎的代表是WebCrawler,在实际中应用的效果并不理想。