Configurar archivos de sinónimos
Actualizado: 12 de diciembre de 2006
Todos los archivos de sinónimos que se incluyen en Microsoft SQL Server 2005 tienen el siguiente formato.
<XML ID="Microsoft Search Thesaurus">
<!-- Commented out
<thesaurus xmlns="x-schema:tsSchema.xml">
<diacritics = false/>
<expansion>
<sub>Internet Explorer</sub>
<sub>IE</sub>
<sub>IE5</sub>
</expansion>
<replacement>
<pat>NT5</pat>
<pat>W2K</pat>
<sub>Windows 2000</sub>
</replacement>
<expansion>
<sub>run</sub>
<sub>jog</sub>
</expansion>
</thesaurus>
-->
</XML>
Cada archivo de sinónimos cuenta con una o más de las siguientes secciones:
- Conjunto de expansión
Un conjunto de expansión contiene un grupo de sinónimos. En el código, estos sinónimos quedan identificados por medio de etiquetas "substitution" (<sub> y </sub>). Las consultas que contienen coincidencias en una sustitución se expanden para incluir todas las demás sustituciones del conjunto de expansión. - Conjunto de reemplazo
Un conjunto de reemplazo contiene un patrón de texto que se reemplazará por un conjunto de sustitución. Para obtener un ejemplo, vea la sección "Conjunto de reemplazo" más adelante en este tema.
Además, el archivo de sinónimos incluye una etiqueta <diacritics = false/>
. El valor false
indica que los términos especificados en los conjuntos de reemplazo o de expansión no distinguen acentos. Para realizar búsquedas de sinónimos con distinción de acentos, cambie esta etiqueta a <diacritics = true/>
. Por ejemplo, imagine que especifica el patrón "café" para que sea reemplazado por otros patrones en una consulta de búsqueda de texto. Si el archivo de sinónimos no distingue acentos, la búsqueda de texto reemplaza los patrones "café" y "cafe". Si el archivo de sinónimos distingue acentos, la búsqueda de texto reemplaza sólo el patrón "café". Tenga en cuenta que esta configuración sólo se puede aplicar una vez en el archivo, y que se aplica a todos los patrones de búsqueda del archivo. Esta configuración no se puede especificar para patrones individuales.
![]() |
---|
Al editar los archivos de sinónimos con las herramientas del editor de texto, los archivos deben guardarse en formato Unicode y deben especificarse marcas de orden de bytes. |
Conjunto de expansión
Cada conjunto de expansión está delimitado por una etiqueta <expansion>. Dentro de la etiqueta de expansión, se especifica una o más sustituciones delimitadas por una etiqueta <sub>. En el conjunto de expansión, puede especificar un grupo de sustituciones que sean sinónimas.
Por ejemplo, puede editar la sección de expansión para tratar las sustituciones "writer", "author" y "journalist" como sinónimos. Las consultas de búsqueda de texto que contienen coincidencias en una sustitución se expanden para incluir todas las demás sustituciones especificadas en el conjunto de expansión. Por tanto, en el ejemplo anterior, al emitir una consulta FORMS OF THESAURUS o FREETEXT para la palabra "author", la búsqueda de texto también devuelve resultados de búsqueda que contienen las palabras "writer" y "journalist".
Éste es el aspecto que tendrá la sección del conjunto de expansión en el caso del ejemplo anterior:
<expansion>
<sub>writer</sub>
<sub>author</sub>
<sub>journalist</sub>
</expansion>
Conjunto de reemplazo
Cada conjunto de reemplazo está delimitado por una etiqueta <replacement>. Dentro de cada etiqueta de reemplazo, puede especificar uno o más patrones delimitados por una etiqueta <pat>. Puede especificar una o más sustituciones delimitadas por etiquetas <sub>. Puede especificar un patrón para que sea reemplazado por un conjunto de sustitución. Los patrones y las sustituciones pueden contener una palabra o una secuencia de palabras.
Por ejemplo, imagine que desea que las consultas para "W2K", el patrón, sean reemplazadas por "Windows 2000" o "XP", las sustituciones. Si ejecuta una búsqueda de texto para "W2K", la búsqueda de texto sólo devolverá resultados de búsqueda que contienen "Windows 2000" o "XP". No devolverá resultados que contengan "W2K". Esto se debe a que el patrón "W2K" ha sido "reemplazado" por los patrones "Windows 2000" y "XP".
Éste es el aspecto que tendrá la sección del conjunto de reemplazo en el caso del ejemplo anterior:
<replacement>
<pat>W2K</pat>
<sub>Windows 2000</sub>
<sub>XP</sub>
</replacement>
Si tiene dos conjuntos de reemplazo con patrones similares para los que se buscan coincidencias, prevalecerá el más largo de los dos. Por ejemplo, si ejecuta una consulta FORMS OF THESAURUS para "Comunidad en línea de Internet Explorer" y tiene los siguientes conjuntos de reemplazo, el conjunto de reemplazo "Internet Explorer" tiene prioridad sobre el conjunto de reemplazo "Internet". Por tanto, la consulta se procesará como "Comunidad en línea de IE" o "Comunidad en línea de IE 5".
<replacement>
<pat>Internet</pat>
<sub>intranet</sub>
</replacement>
y
<replacement>
<pat>Internet Explorer</pat>
<sub>IE</sub>
<sub>IE 5</sub>
</replacement>
Vea también
Conceptos
Arquitectura de la búsqueda de texto
Diccionario de sinónimos
Búsqueda de texto
Otros recursos
CONTAINS (Transact-SQL)
FREETEXT (Transact-SQL)
FREETEXTTABLE (Transact-SQL)
Ayuda e información
Obtener ayuda sobre SQL Server 2005
Historial de cambios
Versión | Historial |
---|---|
12 de diciembre de 2006 |
|
17 de julio de 2006 |
|