Cambios de comportamiento en la búsqueda de texto completo
En este tema se describen los cambios de comportamiento en la búsqueda de texto completo. Los cambios de comportamiento afectan a cómo funcionan o interactúan las características en SQL Server 2014 en comparación con las versiones anteriores de SQL Server.
Cambios de comportamiento en la búsqueda de Full-Text en SQL Server 2014
La información se proporcionará posteriormente.
Cambios de comportamiento en la búsqueda de Full-Text en SQL Server 2012
SQL Server 2012 instala una nueva versión de los separadores de palabras y lematizadores para inglés de EE. UU. (LCID 1033) e inglés del Reino Unido (LCID 2057). Aunque puede cambiar a la versión anterior de estos componentes si desea conservar el comportamiento anterior. Para obtener más información, vea Cambiar el separador de palabras usado para el inglés de Estados Unidos y el del Reino Unido.
Nuevos separadores de palabras y lematizadores instalados
SQL Server 2012 actualiza todos los separadores de palabras y lematizadores usados por Full-Text búsqueda y búsqueda semántica. Para que haya coherencia entre el contenido de los índices y los resultados de las consultas, se recomienda que vuelva a rellenar los índices de texto completo existentes.
Existen nuevos separadores de palabras para inglés. Si tiene que conservar el comportamiento anterior, vea Change the Word Breaker Used for US English and UK English.
Los separadores de palabras de terceros para danés, polaco y turco que se incluyeron con versiones anteriores de SQL Server se han reemplazado por los componentes de Microsoft. Los componentes nuevos están habilitados de forma predeterminada.
Existen nuevos separadores de palabras para checo y griego. Las versiones anteriores de SQL Server Full-Text Search no incluyeban compatibilidad con estos dos idiomas.
Cambios de comportamiento de los nuevos separadores de palabras y lematizadores
Es posible que los componentes nuevos devuelvan resultados diferentes a los componentes anteriores cuando se rellenan y consultan índices de texto completo. Las tablas siguientes muestran algunas de las diferencias que se pueden esperar en los resultados en inglés.
Si tiene que conservar el comportamiento anterior de los separadores de palabras y lematizadores, vea los siguientes temas:
Cambiar el separador de palabras usado para el inglés de Estados Unidos y el del Reino Unido
Revertir los separadores de palabras usados por las búsquedas a la versión anterior
En algunos casos, los componentes nuevos devuelven más resultados:
Término | Resultados con los separadores de palabras y el lematizador anteriores | Resultados con los separadores de palabras y lematizadores |
---|---|---|
gato-perro | cat perro |
cat gato-perro perro |
cat@dog.com | cat com perro |
cat cat@dog.com com perro |
12/11/2011 (donde el término es una fecha) |
12/11/2011 dd20111211 |
11 12 12/11/2011 2011 dd20111211 |
En algunos casos, los componentes nuevos devuelven resultados similares :
Término | Resultados con los separadores de palabras y el lematizador anteriores | Resultados con los separadores de palabras y lematizadores |
---|---|---|
100$ | 100$ nn100$ |
100$ nn100usd |
022 | 022 nn022 |
022 nn22 |
10:49AM (donde el término es una hora) |
10:49AM tt1049 |
10:49AM tt24104900 |
En algunos casos, los componentes nuevos devuelven menos resultados o bien, las aplicaciones no esperan los resultados:
Término | Resultados con los separadores de palabras y el lematizador anteriores | Resultados con los separadores de palabras y lematizadores |
---|---|---|
jěˊøqCžl (donde los términos no son caracteres válidos en español) |
'jěˊľqCžl' | je yq zl |
table's | table's mesa |
table's |
gato- | cat gato- |
cat |
v-z*(donde v y z son palabras irrelevantes)* | (sin resultados) | v-z |
$100 000 USD | $100 000 nn000 nn100$ usd |
$100 000 USD nn100000usd |
bonita tierra americana | bonita tierra norteamericana americana |
bonita tierra |
Mt. Kent and Mt Challenger | challenger kent mt Mt. |
mt kent challenger |
Cambios de comportamiento en la búsqueda de Full-Text en SQL Server 2008
En SQL Server 2008 y versiones posteriores, el motor de Full-Text se integra como un servicio de base de datos en la base de datos relacional como parte de la infraestructura del motor de almacenamiento y la consulta del servidor. La nueva arquitectura de búsqueda de texto completo logra los objetivos siguientes:
El almacenamiento integrado y la administración: la búsqueda de texto completo ahora está integrada directamente con las características inherentes de almacenamiento y administración de SQL Server, y el servicio MSFTESQL ya no existe.
Los índices de texto completo se almacenan en grupos de archivos de base de datos en lugar de hacerlo en el sistema de archivos. Las operaciones administrativas que se llevan a cabo en una base de datos, como la creación de una copia de seguridad, afectan a los índices de texto completo de forma automática.
Un catálogo de texto completo es ahora un objeto virtual que no pertenece a ningún grupo de archivos; es un concepto lógico que hace referencia a un grupo de índices de texto completo. Por tanto, muchas de las características de administración de catálogos se han quedado desusadas, lo que ha provocado cambios de última hora en algunas características. Para obtener más información, vea Características en desuso del motor de base de datos en SQL Server 2014 y Cambios importantes en Full-Text Búsqueda.
Nota
SQL Server instrucciones DDL de Transact-SQL 2005 que especifican catálogos de texto completo funcionan correctamente.
Procesamiento de consultas integrado: el nuevo procesador de consultas de búsqueda de texto completo forma parte del motor de base de datos y está totalmente integrado con el procesador de consultas de SQL Server. Esto significa que, el optimizador de consultas reconoce los predicados de consulta de texto completo y los ejecuta automáticamente de la forma más eficaz posible.
La administración mejorada y la solución de problemas: la búsqueda de texto completo integrada proporciona herramientas para ayudarle a analizar estructuras de búsqueda como el índice de texto completo, la salida de un separador de palabras determinado, la configuración de palabras irrelevantes, etc.
Las listas de palabras irrelevantes han reemplazado a los archivos de palabras irrelevantes. Una lista de palabras irrelevantes es un objeto de base de datos que facilita las tareas de administración de las palabras irrelevantes y mejora la integridad entre instancias de servidor y entornos diferentes. Para obtener más información, vea Configurar y administrar palabras irrelevantes y listas de palabras irrelevantes para la búsqueda de texto completo.
SQL Server 2008 y versiones posteriores incluyen nuevos separadores de palabras para muchos de los idiomas que existen en SQL Server 2005. Los únicos separadores de palabras que siguen siendo iguales son los de inglés, coreano, tailandés y chino (tradicional y simplificado). En el caso de otros idiomas, si se importó un catálogo de texto completo cuando se actualizó una base de datos de SQL Server 2005 a SQL Server 2008 o una versión posterior, uno o varios idiomas usados por los índices de texto completo en el catálogo de texto completo podrían asociarse ahora con nuevos separadores de palabras que podrían comportarse de forma ligeramente diferente de los separadores de palabras importados. Para obtener más información sobre cómo garantizar la coherencia entre las consultas y el contenido del índice de texto completo, vea Actualizar Full-Text búsqueda.
Se ha agregado un nuevo servicio del iniciador del FDHOST (MSSQLFDLauncher). Para obtener más información, consulte Introducción a Full-Text Search.
La indexación de texto completo funciona con una columna FILESTREAM de la misma manera que con una
varbinary(max)
columna. La tabla FILESTREAM debe tener una columna con la extensión de nombre de archivo para cada BLOB FILESTREAM. Para obtener más información, vea Consulta con Full-Text Búsqueda, Configurar y administrar filtros para la búsqueda y sys.fulltext_document_types (Transact-SQL).El motor de texto completo indiza el contenido de los BLOB FILESTREAM. Indizar archivos como las imágenes podría no ser útil. Cuando se actualiza un BLOB FILESTREAM, vuelve a indizarse.
Consulte también
Búsqueda de texto completo
Compatibilidad con versiones anteriores de búsqueda de texto completo
Actualizar la búsqueda de texto completo
Introducción a la búsqueda de texto completo