¿Qué es la búsqueda vectorial?
El vector de búsqueda es una funcionalidad disponible en la búsqueda de IA que se usa para indexar, almacenar y recuperar la inserción de vectores desde un índice de búsqueda. Puede usarlo para impulsar aplicaciones que implementan la arquitectura de generación aumentada de recuperación (RAG), la similitud y los motores de recomendaciones o búsquedas multimodales.
A continuación se muestra una ilustración de los flujos de trabajo de indexación y consulta para los vectores de búsqueda.
Se puede usar una consulta vectorial para que coincida con criterios en distintos tipos de datos de origen proporcionando una representación matemática del contenido generado por modelos de aprendizaje automático. Esto elimina las limitaciones de las búsquedas basadas en texto que devuelven resultados relevantes mediante la intención de la consulta.
Cuándo usar el vector de búsqueda
Estos son algunos escenarios en los que debe usar el vector de búsqueda:
- Use modelos OpenAI o de código abierto para codificar texto y use consultas codificadas como vectores para recuperar documentos.
- Realice una búsqueda de similitud entre imágenes codificadas, texto, vídeo y audio, o una combinación de estas (multimodal).
- Represente documentos en diferentes idiomas mediante un modelo incrustado multilingüe para buscar documentos en cualquier idioma.
- Compile búsquedas híbridas a partir de campos vectoriales y de texto con capacidad de búsqueda, dado que los vectores de búsqueda se implementan a nivel de campo. Los resultados se combinarán para devolver una sola respuesta.
- Aplique filtros a los campos de texto y numéricos e incluya esto en la consulta para reducir los datos que el vector de búsqueda necesita procesar.
- Cree una base de datos vectorial para proporcionar una base de conocimiento externa o usarla como memoria a largo plazo.
Limitaciones
Hay algunas limitaciones al usar el vector de búsqueda que debe tener en cuenta:
- Deberá proporcionar las incrustaciones mediante Azure OpenAI o una solución de código abierto similar, ya que Búsqueda de Azure AI no los genera para el contenido.
- No se admiten claves administradas por el cliente (CMK).
- Existen limitaciones de almacenamiento aplicables, por lo que debe comprobar lo que proporciona la cuota de servicio.
Nota:
Si los documentos son grandes, considere la posibilidad de fragmentar. Use la documentación sobre Fragmentación de documentos grandes para las soluciones de vector de búsqueda en Búsqueda de Azure AI para obtener más información.