Alterações de comportamento em pesquisa de texto completo
Este tópico descreve alterações de comportamento em pesquisa de texto completo. Essas alterações afetam a maneira como os recursos funcionam ou interagem no SQL Server 2012 em comparação com as versões anteriores do SQL Server.
Alterações de comportamento na pesquisa de texto completo do SQL Server 2012
O SQL Server 2012 instala uma nova versão dos separadores de palavras e lematizadores para inglês dos EUA (LCID 1033) e inglês do Reino Unido (LCID 2057). Porém, você poderá alternar para a versão anterior desses componentes se desejar reter o comportamento anterior. Para obter mais informações, consulte Alterar o separador de palavras usado para inglês dos EUA e inglês do Reino Unido.
Novos separadores de palavras e lematizadores instalados
O SQL Server 2012 atualiza todos os separadores de palavras e lematizadores usados por Pesquisas de texto completo e semântico. Para obter consistência entre o conteúdo de índices e os resultados das consultas, nós recomendamos que você repopule os índices de texto completo existentes.
Há novos separadores de palavras para inglês. Se você tiver que manter o comportamento anterior, consulte Alterar o separador de palavras usado para inglês dos EUA e inglês do Reino Unido.
Separadores de palavras de terceiros para dinamarquês, polonês e turco que foram incluídos com versões anteriores do SQL Server foram substituídos por componentes do Microsoft. Os novos componentes estão habilitados por padrão.
Há novos separadores de palavras para tcheco e grego. As versões anteriores de Pesquisa de Texto Completo do SQL Server não incluíam suporte para estes dois idiomas.
Alterações de comportamento de novos separadores de palavras e lematizadores
Os novos componentes podem retornar resultados diferentes dos componentes mais antigos quando você popula e consulta índices de texto completo. As tabelas a seguir demonstram algumas das diferenças que podem ser esperadas em resultados em inglês.
Se você tiver que reter o comportamento anterior dos separadores de palavras e lematizadores, consulte os tópicos seguintes:
Alterar o separador de palavras usado para inglês dos EUA e inglês do Reino Unido
Reverter os separadores de palavras usados por pesquisa à versão anterior
Em alguns casos, os novos componentes retornam mais resultados:
Termo |
Resultados com separador de palavras e lematizador anterior |
Resultados com novo separador de palavras e lematizador |
---|---|---|
cat-dog |
cat dog |
cat cat-dog dog |
cat@dog.com |
cat com dog |
cat cat@dog.com com dog |
12/11/2011 (onde o termo é uma data) |
12/11/2011 dd20111211 |
11 12 12/11/2011 2011 dd20111211 |
Em alguns casos, os novos componentes retornam resultados semelhantes:
Termo |
Resultados com separador de palavras e lematizador anterior |
Resultados com novo separador de palavras e lematizador |
---|---|---|
100$ |
100$ nn100$ |
100$ nn100usd |
022 |
022 nn022 |
022 nn22 |
10:49AM (onde o termo é uma hora) |
10:49am tt1049 |
10:49am tt24104900 |
Em alguns casos, os novos componentes retornam menos resultados ou resultados que podem ser inesperados pelos aplicativos:
Termo |
Resultados com separador de palavras e lematizador anterior |
Resultados com novo separador de palavras e lematizador |
---|---|---|
jěˊÿqℭžl (onde os termos não são caracteres válidos em inglês) |
‘jěˊÿqℭžl’ |
je yq zl |
table's |
table’s table |
table’s |
cat- |
cat cat- |
cat |
v-z(onde v e z são palavras de ruído) |
(nenhum resultado) |
v-z |
$100 000 USD |
$100 000 nn000 nn100$ usd |
$100 000 usd nn100000usd |
beautiful U.S land |
beautiful land u.s us |
beautiful land |
Mt. Kent and Mt Challenger |
challenger kent mt mt. |
mt kent challenger |
Alterações de comportamento na pesquisa de texto completo do SQL Server 2008
No SQL Server 2008 e em versões posteriores, o Mecanismo de Texto Completo é integrado como um serviço de banco de dados ao banco de dados relacional, como parte da infraestrutura de consulta de servidor e do mecanismo de armazenamento. A nova arquitetura de pesquisa de texto completo atinge as seguintes metas:
Armazenamento e gerenciamento integrados — Agora a pesquisa de texto completo está diretamente integrada aos recursos de armazenamento e gerenciamento inerentes ao SQL Server, e o serviço MSFTESQL não existe mais.
Os índices de texto completo são armazenados nos grupos de arquivos de banco de dados, e não no sistema de arquivos. As operações administrativas executadas em um banco de dados, como a criação de um backup, afetam automaticamente seus índices de texto completo.
Agora um catálogo de texto completo é um objeto virtual que não pertence a nenhum grupo de arquivos; trata-se de um conceito lógico que faz referência a um grupo de índices de texto completo. Por esse motivo, muitos recursos de gerenciamento de catálogo ficaram obsoletos e isso gerou alterações recentes em alguns recursos. Para obter mais informações, consulte Recursos do Mecanismo de Banco de Dados preteridos no SQL Server 2012 e Alterações recentes na pesquisa de texto completo.
Observação As instruções DDL Transact-SQL do SQL Server 2005 que especificam catálogos de texto completo funcionam corretamente.
Processamento de consultas integrado — O processador de consultas de pesquisa de texto completo faz parte do Mecanismo de Banco de Dados e está totalmente integrado ao Processador de Consultas do SQL Server. Isso significa que o otimizador de consulta reconhece predicados de consulta de texto completo e os executa automaticamente com o máximo de eficácia possível.
Administração e solução de problemas aprimoradas — A pesquisa de texto completo integrada oferece ferramentas que ajudam você a analisar estruturas de pesquisa, como o índice de texto completo, a saída de um determinado separador de palavras, a configuração de palavras irrelevantes (stopwords), entre outras.
As palavras irrelevantes e as listas de palavras irrelevantes (stoplists) substituíram as palavras de ruído o os arquivos de palavras de ruído. Uma lista de palavras irrelevantes é um objeto de banco de dados que facilita as tarefas de capacidade de gerenciamento relacionadas a palavras irrelevantes e melhora a integridade entre diferentes ambientes e instâncias de servidor. Para obter mais informações, consulte Configurar e gerenciar palavras irrelevantes e listas de palavras irrelevantes (stoplists) para pesquisa de texto completo.
O SQL Server 2008 e versões posteriores inclui novos separadores de palavras para muitos dos idiomas existentes no SQL Server 2005. Somente os separadores de palavras para inglês, coreano, tailandês e chinês (todas as formas) permanecem os mesmos. Nos demais idiomas, se um catálogo de texto completo foi importado durante a atualização de um banco de dados do SQL Server 2005 para o SQL Server 2008 ou um versão posterior, é possível que agora um ou mais idiomas usados pelos índices de texto completo do catálogo de texto completo estejam associados a novos separadores de palavras, cujo comportamento pode ser ligeiramente diferente daquele apresentado pelos separadores de palavras importados. Para obter mais informações sobre como garantir consistência entre consultas e o conteúdo de índices de texto completo, consulte Atualizar pesquisa de texto completo do SQL Server 2005.
Um novo serviço Iniciador FDHOST (MSSQLFDLauncher) foi adicionado. Para obter mais informações, consulte Iniciar a pesquisa de texto completo.
A indexação de texto completo funciona com uma coluna FILESTREAM da mesma maneira que com uma coluna varbinary(max). A tabela FILESTREAM deve ter uma coluna que contenha a extensão do nome do arquivo para cada BLOB FILESTREAM. Para obter mais informações, consulte Consulta com pesquisa de texto completo, Configurar e gerenciar filtros para pesquisa e sys.fulltext_document_types (Transact-SQL).
O mecanismo de texto completo indexa o conteúdo dos BLOBs FILESTREAM. Arquivos de indexação, como imagens, podem não ser úteis. Quando um BLOB FILESTREAM é atualizado, ele é reindexado.
Consulte também
Conceitos
Pesquisa de texto completo (SQL Server)
Atualizar pesquisa de texto completo do SQL Server 2005
Iniciar a pesquisa de texto completo
Outros recursos
Compatibilidade com versões anteriores da pesquisa de texto completo