Introducción

Completado

Búsqueda de Azure AI le permite crear soluciones de búsqueda en las que se usa una canalización de aptitudes de IA para enriquecer los datos y rellenar un índice. Los enriquecimientos de datos mediante las aptitudes de la canalización complementan los datos de origen con conclusiones como las siguientes:

  • El lenguaje en el que está escrito un documento.
  • Frases clave que pueden ayudar a determinar los temas principales que se tratan en un documento.
  • Una puntuación de opinión que indica lo positivo o negativo que es un documento.
  • Ubicaciones, personas, organizaciones o puntos de referencia específicos mencionados en el contenido.
  • Descripciones de imágenes generadas por IA o texto de imágenes extraído mediante el reconocimiento óptico de caracteres (OCR).

Los datos enriquecidos en el índice permiten crear una solución de búsqueda integral que va más allá de la búsqueda básica de texto completo en el contenido de origen.

Almacenes de conocimiento

Aunque el índice se podría considerar el resultado principal de un proceso de indexación, los datos enriquecidos que contiene también podrían resultar útiles de otras maneras. Por ejemplo:

  • Dado que el índice es esencialmente una colección de objetos JSON, cada uno de los cuales representa un registro indexado, podría ser útil exportar los objetos como archivos JSON para su integración en un proceso de orquestación de datos mediante herramientas como Azure Data Factory.
  • Puede que quiera normalizar los registros del índice en un esquema relacional de tablas para fines de análisis y para la generación de informes con herramientas como Microsoft Power BI.
  • Después de extraer las imágenes insertadas de los documentos durante el proceso de indexación, es posible que quiera guardar esas imágenes como archivos.

Diagrama que muestra cómo un indexador escribe un objeto, una tabla y proyecciones de imágenes en un almacén de conocimiento.

Búsqueda de Azure AI admite estos escenarios al permitirle definir un almacén de conocimiento en el conjunto de aptitudes que encapsula su canalización de enriquecimiento. El almacén de conocimiento se compone de proyecciones de los datos enriquecidos, que pueden ser objetos JSON, tablas o archivos de imagen. Cuando un indexador ejecuta una canalización para crear o actualizar un índice, se generan las proyecciones y se guardan en el almacén de conocimiento.

En este módulo, implementará un almacén de conocimiento para Margie's Travel, una agencia de viajes ficticia que usa información en folletos y opiniones de hoteles para ayudar a los clientes a planear viajes y aprenderá a:

  • Creación de un almacén de conocimiento desde una canalización de Búsqueda de Azure AI
  • Ver datos en proyecciones en un almacén de conocimiento

Nota:

En este módulo se supone que ya sabe cómo crear y usar una solución de Búsqueda de Azure AI que incluye aptitudes integradas. Si no es así, complete primero el módulo Creación de una solución de Búsqueda de Azure AI.