O que é a pesquisa vetorial?

Concluído

A busca em vetores é uma capacidade disponível na Pesquisa de IA utilizada para indexar, armazenar e recuperar incorporações vetoriais a partir de um índice de pesquisa. Você pode usá-lo para alimentar aplicativos que implementam a arquitetura de geração aumentada de recuperação (RAG), pesquisas de modo semelhante e multimodal ou mecanismos de recomendação.

Abaixo está uma ilustração dos fluxos de trabalho de indexação e consulta para a busca em vetores.

Diagrama dos fluxos de trabalho de indexação e consulta.

Uma consulta de vetor pode ser utilizada para corresponder a critérios em diferentes tipos de dados de origem, fornecendo uma representação matemática do conteúdo gerado pelos modelos de machine learning. Isso elimina as limitações das pesquisas baseadas em texto que retornam resultados relevantes utilizando a intenção da consulta.

Aqui estão alguns cenários nos quais você deve usar a busca em vetores:

  • Usar modelos do OpenAI ou de código aberto para codificar texto e utilizar consultas codificadas como vetores para recuperar documentos.
  • Faça uma pesquisa de similaridade entre imagens, textos, vídeos e áudios codificados, ou uma mistura deles (multimodal).
  • Represente documentos em diferentes idiomas utilizando um modelo de inserção multilíngue para encontrar documentos em qualquer idioma.
  • Criar pesquisas híbridas a partir de campos de texto pesquisáveis e vetoriais, pois as buscas em vetores são implementadas em nível de campo. Os resultados serão mesclados para retornar uma única resposta.
  • Aplique filtros a campos de texto e numéricos e inclua-os em sua consulta para reduzir os dados que a busca em vetores precisa processar.
  • Criar um banco de dados de vetor para fornecer uma base de dados de conhecimento externa ou utilizar como memória de longo prazo.

Limitações

Existem algumas limitações ao utilizar a busca em vetores, que você deve anotar:

  • Você precisará fornecer as incorporações usando o OpenAI do Azure ou uma solução de código aberto semelhante, pois a Pesquisa de IA do Azure não as gera para o seu conteúdo.
  • Não há suporte para chaves gerenciadas pelo cliente (CMK).
  • Existem limitações de armazenamento aplicáveis, portanto, você deve verificar o que sua cota de serviço fornece.

Observação

Se os documentos forem grandes, considere a divisão em partes. Use a documentação Divisão em partes de documentos grandes para soluções de busca em vetores na Pesquisa de IA para obter mais informações.