Compartir a través de


Cambios de comportamiento en la búsqueda de texto completo

En este tema se describen los cambios de comportamiento en la búsqueda de texto completo. Los cambios de comportamiento afectan a cómo funcionan o interactúan las características en SQL Server 2014 en comparación con las versiones anteriores de SQL Server.

Cambios de comportamiento en la búsqueda de Full-Text en SQL Server 2014

La información se proporcionará posteriormente.

Cambios de comportamiento en la búsqueda de Full-Text en SQL Server 2012

SQL Server 2012 instala una nueva versión de los separadores de palabras y lematizadores para inglés de EE. UU. (LCID 1033) e inglés del Reino Unido (LCID 2057). Aunque puede cambiar a la versión anterior de estos componentes si desea conservar el comportamiento anterior. Para obtener más información, vea Cambiar el separador de palabras usado para el inglés de Estados Unidos y el del Reino Unido.

Nuevos separadores de palabras y lematizadores instalados

SQL Server 2012 actualiza todos los separadores de palabras y lematizadores usados por Full-Text búsqueda y búsqueda semántica. Para que haya coherencia entre el contenido de los índices y los resultados de las consultas, se recomienda que vuelva a rellenar los índices de texto completo existentes.

  1. Existen nuevos separadores de palabras para inglés. Si tiene que conservar el comportamiento anterior, vea Change the Word Breaker Used for US English and UK English.

  2. Los separadores de palabras de terceros para danés, polaco y turco que se incluyeron con versiones anteriores de SQL Server se han reemplazado por los componentes de Microsoft. Los componentes nuevos están habilitados de forma predeterminada.

  3. Existen nuevos separadores de palabras para checo y griego. Las versiones anteriores de SQL Server Full-Text Search no incluyeban compatibilidad con estos dos idiomas.

Cambios de comportamiento de los nuevos separadores de palabras y lematizadores

Es posible que los componentes nuevos devuelvan resultados diferentes a los componentes anteriores cuando se rellenan y consultan índices de texto completo. Las tablas siguientes muestran algunas de las diferencias que se pueden esperar en los resultados en inglés.

Si tiene que conservar el comportamiento anterior de los separadores de palabras y lematizadores, vea los siguientes temas:

En algunos casos, los componentes nuevos devuelven más resultados:

Término Resultados con los separadores de palabras y el lematizador anteriores Resultados con los separadores de palabras y lematizadores
gato-perro cat

perro
cat

gato-perro

perro
cat@dog.com cat

com

perro
cat

cat@dog.com

com

perro
12/11/2011

(donde el término es una fecha)
12/11/2011

dd20111211
11

12

12/11/2011

2011

dd20111211

En algunos casos, los componentes nuevos devuelven resultados similares :

Término Resultados con los separadores de palabras y el lematizador anteriores Resultados con los separadores de palabras y lematizadores
100$ 100$

nn100$
100$

nn100usd
022 022

nn022
022

nn22
10:49AM

(donde el término es una hora)
10:49AM

tt1049
10:49AM

tt24104900

En algunos casos, los componentes nuevos devuelven menos resultados o bien, las aplicaciones no esperan los resultados:

Término Resultados con los separadores de palabras y el lematizador anteriores Resultados con los separadores de palabras y lematizadores
jěˊøqCžl

(donde los términos no son caracteres válidos en español)
'jěˊľqCžl' je yq zl
table's table's

mesa
table's
gato- cat

gato-
cat
v-z*(donde v y z son palabras irrelevantes)* (sin resultados) v-z
$100 000 USD $100

000

nn000

nn100$

usd
$100 000 USD

nn100000usd
bonita tierra americana bonita

tierra

norteamericana

americana
bonita

tierra
Mt. Kent and Mt Challenger challenger

kent

mt

Mt.
mt

kent

challenger

Cambios de comportamiento en la búsqueda de Full-Text en SQL Server 2008

En SQL Server 2008 y versiones posteriores, el motor de Full-Text se integra como un servicio de base de datos en la base de datos relacional como parte de la infraestructura del motor de almacenamiento y la consulta del servidor. La nueva arquitectura de búsqueda de texto completo logra los objetivos siguientes:

  • El almacenamiento integrado y la administración: la búsqueda de texto completo ahora está integrada directamente con las características inherentes de almacenamiento y administración de SQL Server, y el servicio MSFTESQL ya no existe.

    • Los índices de texto completo se almacenan en grupos de archivos de base de datos en lugar de hacerlo en el sistema de archivos. Las operaciones administrativas que se llevan a cabo en una base de datos, como la creación de una copia de seguridad, afectan a los índices de texto completo de forma automática.

    • Un catálogo de texto completo es ahora un objeto virtual que no pertenece a ningún grupo de archivos; es un concepto lógico que hace referencia a un grupo de índices de texto completo. Por tanto, muchas de las características de administración de catálogos se han quedado desusadas, lo que ha provocado cambios de última hora en algunas características. Para obtener más información, vea Características en desuso del motor de base de datos en SQL Server 2014 y Cambios importantes en Full-Text Búsqueda.

      Nota

      SQL Server instrucciones DDL de Transact-SQL 2005 que especifican catálogos de texto completo funcionan correctamente.

  • Procesamiento de consultas integrado: el nuevo procesador de consultas de búsqueda de texto completo forma parte del motor de base de datos y está totalmente integrado con el procesador de consultas de SQL Server. Esto significa que, el optimizador de consultas reconoce los predicados de consulta de texto completo y los ejecuta automáticamente de la forma más eficaz posible.

  • La administración mejorada y la solución de problemas: la búsqueda de texto completo integrada proporciona herramientas para ayudarle a analizar estructuras de búsqueda como el índice de texto completo, la salida de un separador de palabras determinado, la configuración de palabras irrelevantes, etc.

  • Las listas de palabras irrelevantes han reemplazado a los archivos de palabras irrelevantes. Una lista de palabras irrelevantes es un objeto de base de datos que facilita las tareas de administración de las palabras irrelevantes y mejora la integridad entre instancias de servidor y entornos diferentes. Para obtener más información, vea Configurar y administrar palabras irrelevantes y listas de palabras irrelevantes para la búsqueda de texto completo.

  • SQL Server 2008 y versiones posteriores incluyen nuevos separadores de palabras para muchos de los idiomas que existen en SQL Server 2005. Los únicos separadores de palabras que siguen siendo iguales son los de inglés, coreano, tailandés y chino (tradicional y simplificado). En el caso de otros idiomas, si se importó un catálogo de texto completo cuando se actualizó una base de datos de SQL Server 2005 a SQL Server 2008 o una versión posterior, uno o varios idiomas usados por los índices de texto completo en el catálogo de texto completo podrían asociarse ahora con nuevos separadores de palabras que podrían comportarse de forma ligeramente diferente de los separadores de palabras importados. Para obtener más información sobre cómo garantizar la coherencia entre las consultas y el contenido del índice de texto completo, vea Actualizar Full-Text búsqueda.

  • Se ha agregado un nuevo servicio del iniciador del FDHOST (MSSQLFDLauncher). Para obtener más información, consulte Introducción a Full-Text Search.

  • La indexación de texto completo funciona con una columna FILESTREAM de la misma manera que con una varbinary(max) columna. La tabla FILESTREAM debe tener una columna con la extensión de nombre de archivo para cada BLOB FILESTREAM. Para obtener más información, vea Consulta con Full-Text Búsqueda, Configurar y administrar filtros para la búsqueda y sys.fulltext_document_types (Transact-SQL).

    El motor de texto completo indiza el contenido de los BLOB FILESTREAM. Indizar archivos como las imágenes podría no ser útil. Cuando se actualiza un BLOB FILESTREAM, vuelve a indizarse.

Consulte también

Búsqueda de texto completo
Compatibilidad con versiones anteriores de búsqueda de texto completo
Actualizar la búsqueda de texto completo
Introducción a la búsqueda de texto completo