sql 全文索引入门与实例

作者:袖梨 2022-06-29
全文索引为在字符串数据中进行复杂的词搜索提供有效支持。全文索引存储关于重要词和这些词在特定列中的位置的信息。全文查询利用这些信息,可快速搜索包含具体某个词或一组词的行。 
    全文索引包含在全文目录中。每个数据库教程可以包含一个或多个全文目录。一个目录不能属于多个数据库,而每个目录可以包含一个或多个表的全文索引。一个表只能有一个全文索引,因此每个有全文索引的表只属于一个全文目录。
    全文目录和索引不存储在它们所属的数据库中。目录和索引由 Microsoft 搜索服务分开管理。
    全文索引必须在基表上定义,而不能在视图、系统表或临时表上定义。
    
    依据上面的描述,可以做这样一个比喻。大家大概都见过档案柜,档案柜是将各种档案按照分类登记在档案索引卡上,这个档案柜中的就象建立的全文索引,通过这些档案索引卡可以迅速定位你要查找的卷宗所在的位置。如果不建立这些索引卡,如果卷宗数量不多还好,一旦档案数量很多的时候显然很难找到期望的卷宗,这就类似使用LIKE的情形。
    
    全文索引和普通索引的区别: 
普通SQL 索引  全文索引 
存储时受定义它们所在的数据库的控制 存储在文件系统中,但通过数据库管理
每个表允许有若干个普通索引 每个表只允许有一个全文索引
当对作为其基础的数据进行插入、更新或删除时,它们会自动更新 将数据添加到全文索引称为填充,全文索引可通过调度或特定请求来请求,也可以在添加新数据时自动发生
不分组 在同一个数据库内分组为一个或多个全文目录
使用SQL Server企业管理器、向导或Transact-SQL语句创建和除去 使用SQL Server企业管理器、向导或存储过程创建、管理和除去

2、怎么用 
    例子:参见使用SQL Server2000的全文索引服务  
    上面这篇文章已经说的比较清楚了,这里只是把典型的几种SQL列出: 
    (详细描述可以在SQL Server2000联机从书中查询contains)
    返回包含字符串 "sea" 或 "bread" 的所有分类描述。
    Use Northwind
    Select * from categories
    where contains( description, ' "sea*" or "bread*" ')
    (详细描述可以在SQL Server2000联机从书中查询freetext) 
    搜索产品描述中含有与 bread、candy、dry 和 meat 相关的词语的所有产品类别,如 breads、candies、dried 和 meats 等。
    USE Northwind
    GO
    SELECT CategoryName
    FROM Categories
    WHERE FREETEXT (Description, 'sweetest candy bread and dry meat' )
    GO
3、建议 
    a、仔细考虑维护全文索引的方式
    [摘录自SQL Server2000联机从书]
    维护全文索引有三种方式:
完全重建 
重新扫描所有行。彻底重建全文索引。既可以立即执行完全重建,也可以通过 SQL Server 代理按调度进行。
基于时间戳的增量重建 
重新扫描那些从上一次完全重建或增量重建以来曾更改过的行。这样做需要在表上有一 timestamp 列。不更新时间戳的更改(如 WRITETEXT 和 UPDATETEXT)是检测不到的。可以立即执行增量重建,也可以按调度进行。
更改跟踪 
维护一份对索引数据的全部更改的列表。用 WRITETEXT 和 UPDATETEXT 进行的更改是检测不到的。可以用这些更改立即更新全文索引,也可以按调度进行,或者使用后台更新索引选项在更改一发生时便更新。
         所使用的方法取决于许多因素,如 CPU 和可用的内存、数据更改的数量和速度、可用磁盘空间的大小,以及当前全文索引的重要性等。以下建议可作为选择维护方式时的参考。
当 CPU 和内存不成问题,最新索引的值很高,且即时传播可以跟得上更改的速度时,使用带后台更新索引选项的更改跟踪。

当 CPU 和内存可以在调度时间使用,用于存储更改的磁盘空间足够大,且调度时间之间的变化并没有大到使传播所需的时间比完全重建更长时,使用带调度传播的更改跟踪。

如果大部分记录的更改或添加是立即发生的,应该使用完全重建。如果大部分记录是在扩展的时间段更改的,考虑使用带调度或后台更新索引的更改跟踪。

如果每一次更改的文档数目很多(并不是所占的百分比很高),可以使用增量重建。如果大量记录的更改是在扩展时间段发生的,考虑使用带调度或后台更新索引的更改跟踪。  
SQL SERVER数据库全文索引的示例,以pubs数据库为例。
首先,介绍利用系统存储过程创建全文索引的具体步骤:
1) 启动数据库的全文处理功能 (sp_fulltext_database)
2) 建立全文目录 (sp_fulltext_catalog)
3) 在全文目录中注册需要全文索引的表 (sp_fulltext_table)
4) 指出表中需要全文索引的列名 (sp_fulltext_column)
5) 为表创建全文索引 (sp_fulltext_table)
6) 填充全文目录 (sp_fulltext_catalog)
---------********示例********-------------
以对pubs数据库的title和notes列建立全文索引,之后使用索引查询title列或notes列中包含有datebase 或computer字符串的图书名称:
在这之前,需要安装Microsoft Search服务,启动SQL server全文搜索服务
user pubs --打开数据库
go
--检查数据库pubs是否支持全文索引,如果不支持
--则使用sp_fulltext_database 打开该功能
if(select databaseproperty('pubs','isfulltextenabled'))=0
execute sp_fulltext_database 'enable'
--建立全文目录FT_PUBS
execute sp_fulltext_catalog 'FT_pubs','create'
--为title表建立全文索引数据元
execute sp_fulltext_table 'title','create','FT_pubs','UPKCL_titleidind'
--设置全文索引列名
execute sp_fulltext_column 'title','title','add'
execute sp_fulltext_column 'title','notes','add'
--建立全文索引
--activate,是激活表的全文检索能力,也就是在全文目录中注册该表
execute sp_fulltext_table 'title','activate'
--填充全文索引目录
execute sp_fulltext_catalog 'FT_pubs','start_full'
go
--检查全文目录填充情况
While fulltextcatalogproperty('FT_pubs','populateStatus')<>0
begin
--如果全文目录正处于填充状态,则等待30秒后再检测一次
waitfor delay '0:0:30'
end
--全文目录填充完成后,即可使用全文目录检索
select title
form
where CONTAINS(title,'database')
or CONTAINS(title,'computer')
or CONTAINS(notes,'database')
or CONTAINS(notes,'database')
 
'--------------以下介绍一下全文操作类的系统存储过程
过程名称:sp_fulltext_service
执行权限:serveradmin或系统管理员
作 用:设置全文搜索属性
过程名称:sp_fulltext_catalog
执行权限:db_owner及更高角色成员
作 用:创建和删除一个全文目录,启动或停止一个全文目录的索引操作
过程名称:sp_fulltext_database
执行权限:db_owner角色成员
作 用:初始化全文索引或删除数据库中所有全文目录
过程名称:sp_fulltext_table
执行权限:db_ddladnmin或db_owner角色成员
作 用:将一个表标识为全文索引表或非全文索引表
过程名称:sp_fulltext_column
执行权限:db_ddladnmin角色成员
作 用:指出一个全文索引表中的那些列假如或退出全文索引

相关文章

精彩推荐