Compartir vía


¿Qué es Azure AI Search?

Búsqueda de Azure AI (anteriormente conocido como "Azure Cognitive Search") es un sistema de recuperación de información listo para la empresa para el contenido heterogéneo que ingiere en un índice de búsqueda y expone a los usuarios a través de consultas y aplicaciones. Incluye un conjunto completo de tecnologías de búsqueda avanzada, creadas para aplicaciones de alto rendimiento a cualquier escala.

Búsqueda de Azure AI es el sistema de recuperación recomendado principal al compilar aplicaciones basadas en RAG en Azure, con integraciones LLM nativas entre Azure OpenAI Service y Azure Machine Learning,un mecanismo de integración de modelos y procesos no nativos, así como varias estrategias para el ajuste de relevancia.

Azure AI Search se puede usar en escenarios de búsqueda tradicionales y de GenAI. Entre los casos de uso comunes se incluyen la búsqueda en catálogos o documentos, el descubrimiento de información (exploración de datos) y la generación aumentada de recuperación (RAG) para la búsqueda conversacional.

Al crear un servicio de búsqueda, trabaja con las siguientes funcionalidades:

En cuanto a la arquitectura, un servicio de búsqueda se coloca entre los almacenes de datos externos que contienen los datos no indexados y su aplicación cliente que envía solicitudes de consulta a un índice de búsqueda y controla la respuesta.

Arquitectura de Azure AI Search

En la aplicación cliente, la experiencia de búsqueda se define mediante las API de Azure AI Search y puede incluir las funciones de ajuste de relevancia, autocompletar, coincidencia de sinónimos, coincidencia aproximada, coincidencia de patrones, filtro y ordenación.

En toda la plataforma Azure, Azure AI Search puede integrarse con otros servicios de Azure en forma de indizadores que automatizan la ingesta y la recuperación de datos de los orígenes de datos de Azure, y de conjuntos de aptitudes que incorporan la inteligencia artificial consumible de los servicios de Azure AI, como el análisis de imágenes y lenguaje natural o la inteligencia artificial personalizada que se crea en Azure Machine Learning o que se encapsula en Azure Functions.

Dentro de un servicio de búsqueda

En el servicio de búsqueda en sí, las dos cargas de trabajo principales son la indexación y la realización de consultas.

  • La indexación es un proceso de admisión que carga contenido en un servicio de búsqueda y permite que se puedan realizar búsquedas en el mismo. Internamente, el texto entrante se procesa en tokens y se almacena en índices invertidos, y los vectores de entrada se almacenan en índices vectoriales. El formato de documento que Azure AI Search puede indexar es JSON. Puede cargar documentos JSON que ha ensamblado o usar un indexador para recuperar y serializar los datos en JSON.

    La inteligencia artificial aplicada a través de un conjunto de aptitudes amplía la indexación con modelos de imagen y lenguaje. Si tiene imágenes o texto no estructurado de gran tamaño en el documento origen, puede adjuntar capacidades que realicen OCR, analicen y describan imágenes, infieran estructuras, traduzcan texto y mucho más. La salida es texto que se puede serializar en JSON e ingerir en un índice de búsqueda.

    Los conjuntes de aptitudes también pueden realizar una fragmentación y vectorización de datos durante la indexación. Las aptitudes que se asocian a Azure OpenAI, el catálogo de modelos en el portal de Azure AI Foundry o las capacidades personalizadas que se asocian a cualquier modelo de fragmentación e inserción externos se pueden usar durante la indexación para crear datos vectoriales. La salida es contenido vectorial fragmentado que se puede ingerir en un índice de búsqueda.

  • La realización de consultas se puede producir una vez que un índice se rellena con contenido en el que se pueden realizar búsquedas, cuando la aplicación cliente envía solicitudes de consulta a un servicio de búsqueda y controla las respuestas. La ejecución de todas las consultas se determina por un índice de búsqueda que usted mismo controla.

    Clasificación semántica es una extensión de la ejecución de consultas. Agrega clasificación secundaria mediante el reconocimiento del lenguaje para volver a evaluar un conjunto de resultados, lo que promociona los resultados más pertinentes semánticamente a la parte superior.

    La Vectorización integrada también es una extensión de ejecución de consultas. Si tiene campos vectoriales en el índice de búsqueda, puede enviar consultas vectoriales sin formato o texto que se vectoriza en el momento de la consulta.

Azure AI Search es adecuado en los siguientes escenarios de aplicación:

  • Úselo para la búsqueda de texto completo tradicional y la búsqueda de similitud de vectores de próxima generación. Complemente las aplicaciones de IA generativa con recuperación de información que aproveche las ventajas de la búsqueda de palabras clave y de similitud. Use ambas modalidades para recuperar los resultados más relevantes.

  • Consolide contenido heterogéneo en un índice de búsqueda definido por el usuario y rellenado compuesto por vectores y texto. Mantiene la propiedad y el control sobre lo que se puede buscar.

  • Integración de la fragmentación y la vectorización para aplicaciones de IA y RAG generativas.

  • Aplicación de control de acceso pormenorizado en el nivel de documento.

  • Descarga de cargas de trabajo de indexación y consulta en un servicio de búsqueda dedicado.

  • Implementación con facilidad de características relacionadas con la búsqueda: ajuste de relevancia, navegación por facetas, filtros (incluida la búsqueda espacial geográfica), asignación de sinónimos y Autocompletar.

  • Transformación de grandes archivos de imagen o texto no diferenciados, o archivos de aplicación almacenados en Azure Blob Storage o Azure Cosmos DB, en fragmentos indexados. Esto se logra durante la indexación mediante habilidades de IA que agregan procesamiento externo desde Azure AI.

  • Adición de análisis de texto lingüístico o personalizado. Si tiene contenido que no está en inglés, Azure AI Search admite tanto los analizadores de Lucene como los procesadores de lenguaje natural de Microsoft. También puede configurar los analizadores para obtener un procesamiento especializado de contenido sin procesar, como el filtrado de los caracteres diacríticos o el reconocimiento y la preservación de patrones en las cadenas.

Para más información sobre la funcionalidad específica, consulte Características de Azure AI Search

Primeros pasos

La funcionalidad se expone a través de Azure Portal, API de REST o de los SDK de Azure, como SDK de Azure para .NET. Azure Portal admite para la administración de servicios y de contenido, con herramientas para la creación de prototipos y la consulta de índices y conjuntos de aptitudes.

Uso de Azure Portal

Una exploración integral de las características principales de la búsqueda se puede lograr en cuatro pasos:

  1. Decida el nivel y la región. Se permite solo un servicio Search gratuito por suscripción. Todos los inicios rápidos se pueden realizar en el nivel gratis. Para lograr más capacidad y funcionalidades, necesitará un nivel facturable.

  2. Cree un servicio Search en Azure Portal.

  3. Inicie el Asistente para importación de datos. Elija un ejemplo integrado o un origen de datos compatible para crear, cargar y consultar un índice en cuestión de minutos.

  4. Termine con el explorador de Search, mediante un cliente del portal para consultar el índice de búsqueda que acaba de crear.

Usar las API

Como alternativa, puede crear, cargar y consultar un índice de búsqueda en pasos atómicos:

  1. Cree un índice de búsqueda con Azure Portal, la API REST, el SDK para .NET u otro SDK. El esquema de índices define la estructura del contenido en el que se pueden realizar búsquedas.

  2. Cargue contenido mediante el modelo de "inserción" para insertar documentos JSON desde cualquier origen o use el modelo de "extracción" (indexadores) si los datos de origen son de un tipo compatible.

  3. Consulte un índice mediante el Explorador de búsqueda en Azure Portal, la API REST, el SDK de .NET u otro SDK.

Para utilizar aceleradores

O bien, pruebe los aceleradores de soluciones:

  • Chatear con los datos el acelerador de soluciones le ayuda a crear una solución RAG personalizada a través del contenido.

  • El acelerador de soluciones Minería de conocimiento conversacional ayuda a crear una solución interactiva para extraer información procesable de las transcripciones del centro de contactos posteriores.

  • El acelerador de extracción de conocimiento de documentos le ayuda a procesar y extraer resúmenes, entidades y metadatos de documentos no estructurados y multimodales.

  • Crear su propio acelerador de soluciones de copiloto, aprovecha Azure OpenAI Service, Azure AI Search y Microsoft Fabric, para crear soluciones de copiloto personalizadas.

    • Copilot genérico le ayuda a crear su propio copilot para identificar documentos relevantes, resumir información no estructurada y generar plantillas de documento de Word con sus propios datos.

    • Asesor de cliente todo en un copiloto personalizado permite a Asesor de Clientes aprovechar la eficacia de la inteligencia artificial generativa en datos estructurados y no estructurados. Ayudar a nuestros clientes a optimizar las tareas diarias y fomentar mejores interacciones con más clientes

    • Asistente de Investigación ayuda a crear su propio asistente de inteligencia artificial para identificar documentos relevantes, resumir y clasificar grandes cantidades de información no estructurada y acelerar la revisión de documentos y la generación de contenidos en general.

Sugerencia

Para obtener ayuda con soluciones complejas o personalizadas, póngase en contacto con un asociado con conocimientos profundos en la tecnología de Azure AI Search.

Comparar opciones de búsqueda

Los clientes a menudo preguntan cuáles son las diferencias de Azure AI Search con respecto a otras soluciones relacionadas de búsqueda. En la tabla siguiente se resumen las principales diferencias.

En comparación con Principales diferencias
Búsqueda de Microsoft Microsoft Search es para los usuarios autenticados de Microsoft 365 que necesitan realizar consultas en el contenido de SharePoint. Búsqueda de Azure AI extrae contenido en Azure y cualquier conjunto de datos JSON.
Bing Las API de Bing consultan los índices en Bing.com para conocer los términos coincidentes. Búsqueda de Azure AI busca en índices rellenados con el contenido. Puede controlar la ingesta de datos y el esquema.
Búsqueda de bases de datos Azure SQL tiene búsqueda de texto completo y búsqueda vectorial. Azure Cosmos DB también tiene búsqueda de texto y búsqueda de vectores. Azure AI Search se convierte en una alternativa atractiva cuando se necesitan características como el ajuste de relevancia o el contenido de orígenes heterogéneos. El uso de recursos es otro punto de inflexión. La indexación y las consultas consumen mucho cálculo. La descarga de la búsqueda de DBMS conserva los recursos del sistema para el procesamiento de transacciones.
Solución de búsqueda dedicada Suponiendo que haya decidido realizar búsquedas dedicadas con funcionalidad de espectro completo, una comparación de categorías final se da entre las tecnologías de búsqueda. Entre los proveedores de servicios en la nube, Búsqueda de Azure AI es el más potente para cargas de trabajo vectoriales, de palabras clave e híbridas sobre el contenido en Azure, para aplicaciones que dependen principalmente de la búsqueda para la recuperación de información y la navegación por el contenido.

Las principales ventajas incluyen:

  • Compatibilidad con indexación y consultas vectoriales y no vectoriales (texto). Con la búsqueda de similitud vectorial, puede encontrar información semánticamente similar a las consultas de búsqueda, incluso si los términos de búsqueda no son coincidencias exactas. Use la búsqueda híbrida para combinar los puntos fuertes de la palabra clave y el vector de búsqueda.
  • Optimización de clasificación y relevancia a través de perfiles de clasificación y puntuación semánticas. También puede aprovechar la sintaxis de consulta que admite el aumento de términos y la priorización de campos.
  • Integración de datos de Azure (rastreadores) en la capa de indexación.
  • Integración de Azure AI para transformaciones que hacen que el texto del contenido y los vectores sean buscables.
  • Seguridad de Microsoft Entra para conexiones de confianza y Azure Private Link para conexiones privadas en escenarios sin Internet.
  • Experiencia de búsqueda completa: análisis lingüístico y personalizado de texto en 56 idiomas. Facetas, autocompletar consultas y resultados sugeridos y sinónimos.
  • Escalado, confiabilidad y alcance global de Azure.