FREETEXT (Transact-SQL)
在 WHERE 子句中使用的一个谓词,用于搜索含有基于字符的数据类型的列,以查找含义与搜索条件中的单词相同但不完全匹配的值。如果使用 FREETEXT,则全文查询引擎将在内部对 freetext_string 执行以下操作,并为每个字词分配权重,再查找匹配项。
基于单词边界(单词界限)将字符串分隔成单独的单词。
生成单词的词形变化形式(词干处理)。
基于同义词库中的匹配项标识字词的扩展或替换的列表。
语法
FREETEXT ( { column_name | (column_list) | * }
, 'freetext_string' [ , LANGUAGE language_term ] )
参数
column_name
FROM 子句中指定表的一个或多个全文索引列的名称。这些列可为 char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 或 varbinary(max) 类型。column_list
指示可以指定多个列(以逗号分隔)。column_list 必须用括号括起来。除非指定 language_term,否则 column_list 中所有列的语言必须相同。*
指定所有注册全文搜索的列均应用于搜索给定的 freetext_string。如果 FROM 子句中有多个表,那么 * 必须由表名限定。除非指定 language_term,否则表的所有列的语言都必须相同。freetext_string
要在 column_name 中搜索的文本。可以输入任何文本,包括单词、短语或句子。只要在全文索引中找到任何术语或术语格式,就会生成匹配项。与 AND 作为关键字的 CONTAINS 和 CONTAINSTABLE 搜索条件不同,当在 freetext_string 中使用单词“and”时,会将它视为干扰词或非索引字,因此会丢弃它。
不允许使用 WEIGHT、FORMSOF、通配符、NEAR 和其他语法。系统将通过同义词库对 freetext_string 字符串进行断字处理、词干分析,然后执行同义词库查询。
freetext_string 为 nvarchar。将另一个字符数据类型用作输入时,将发生隐式转换。在下面的示例中,@SearchWord 变量(被定义为 varchar(30))导致 FREETEXT 谓词中发生隐式转换。
USE AdventureWorks2008R2; GO DECLARE @SearchWord varchar(30) SET @SearchWord ='performance' SELECT Description FROM Production.ProductDescription WHERE FREETEXT(Description, @SearchWord);
由于“参数截取”跨转换无效,因此请使用 nvarchar 以获得更好性能。在该示例中,请将 @SearchWord 声明为 nvarchar(30)。
USE AdventureWorks2008R2; GO DECLARE @SearchWord nvarchar(30) SET @SearchWord = N'performance' SELECT Description FROM Production.ProductDescription WHERE FREETEXT(Description, @SearchWord);
对于生成非最佳计划的情况,还可以使用 OPTIMIZE FOR 查询提示。
LANGUAGE language_term
特定的语言,查询时,其资源将用于断字、词干分析、同义词库查询以及非索引字删除。此参数是可选的,可以将其指定为与语言区域设置标识符 (LCID) 对应的字符串、整数或十六进制值。如果指定了 language_term,则它表示的语言将应用于搜索条件的所有元素。如果未指定值,则使用该列的全文语言。如果将不同语言的文档一起作为二进制大型对象 (BLOB) 存储在单个列中,则指定文档的区域设置标识符 (LCID) 将决定对其内容编制索引时使用哪种语言。在对这种列进行查询时,指定 LANGUAGElanguage_term 可增大找到有效匹配项的可能性。
如果指定为字符串,language_term 将对应于 sys.syslanguages (Transact-SQL) 兼容性视图中的 alias 列值。字符串必须用单引号引起来,如 'language_term'。如果指定为整数,则 language_term 就是标识该语言的实际 LCID。如果指定为十六进制值,则 language_term 将以 0x 开头,后面跟有 LCID 的十六进制值。十六进制值不能超过八位(包括前导零在内)。
如果该值是双字节字符集 (DBCS) 格式,则 Microsoft SQL Server 会将其转换为 Unicode 格式。
如果指定的语言无效,或者没有安装对应于该语言的资源,Microsoft SQL Server 将返回错误。若要使用非特定语言资源,请将 language_term 指定为 0x0。
注释
全文谓词和函数作用于 FROM 谓词所示的单个表。若要对多个表进行搜索,请在 FROM 子句中使用联接表,以搜索由两个或更多个表的乘积构成的结果集。
使用 FREETEXT 的全文查询没有使用 CONTAINS 的全文查询精度高。SQL Server 全文搜索引擎识别重要的字词和短语。保留关键字或通配符字符都不具有特殊含义,而它们指定在 CONTAINS 谓词的 <contains_search_condition> 参数中时则通常具有含义。
如果兼容级别小于 70,则不会将 FREETEXT 视为关键字。有关详细信息,请参阅 sp_dbcmptlevel (Transact-SQL)。
当数据库兼容级别设置为 100 时,不允许在 OUTPUT 子句中使用全文谓词。
LIKE 与全文搜索的比较
与全文搜索不同,LIKE Transact-SQL 谓词仅对字符模式有效。另外,不能使用 LIKE 谓词来查询格式化的二进制数据。此外,对大量非结构化的文本数据执行 LIKE 查询要比对相同数据执行同样的全文查询慢得多。对数百万行文本数据进行的 LIKE 查询可能需要几分钟的时间才能返回结果;而对于同样的数据,全文查询只需要几秒甚至更少的时间,具体取决于返回的行数。
示例
A. 使用 FREETEXT 搜索包含指定字符值的单词
以下示例搜索包含与“vital”、“safety”、“components”相关的单词的所有文档。
USE AdventureWorks2008R2;
GO
SELECT Title
FROM Production.Document
WHERE FREETEXT (Document, 'vital safety components' );
GO
B. 通过变量使用 FREETEXT
下面的示例使用了变量来取代具体的搜索项。
USE AdventureWorks2008R2;
GO
DECLARE @SearchWord nvarchar(30);
SET @SearchWord = N'high-performance';
SELECT Description
FROM Production.ProductDescription
WHERE FREETEXT(Description, @SearchWord);
GO
请参阅