O que é a pesquisa vetorial?
A pesquisa vetorial é um recurso disponível no AI Search usado para indexar, armazenar e recuperar a incorporação de vetores de um índice de pesquisa. Você pode usá-lo para impulsionar aplicativos que implementam a arquitetura Retrieval Augmented Generation (RAG), similaridade e pesquisas multimodais ou mecanismos de recomendação.
Abaixo está uma ilustração dos fluxos de trabalho de indexação e consulta para pesquisa vetorial.
Uma consulta vetorial pode ser usada para corresponder critérios em diferentes tipos de dados de origem, fornecendo uma representação matemática do conteúdo gerado por modelos de aprendizado de máquina. Isso elimina as limitações das pesquisas baseadas em texto que retornam resultados relevantes usando a intenção da consulta.
Quando usar a pesquisa vetorial
Aqui estão alguns cenários onde você deve usar a pesquisa vetorial:
- Use OpenAI ou modelos de código aberto para codificar texto e use consultas codificadas como vetores para recuperar documentos.
- Faça uma pesquisa de semelhança entre imagens codificadas, texto, vídeo e áudio, ou uma mistura destes (multimodal).
- Represente documentos em diferentes idiomas usando um modelo incorporado multilíngue para encontrar documentos em qualquer idioma.
- Crie pesquisas híbridas a partir de campos de texto vetoriais e pesquisáveis à medida que as pesquisas vetoriais são implementadas no nível do campo. Os resultados serão mesclados para retornar uma única resposta.
- Aplique filtros a texto e campos numéricos e inclua isso em sua consulta para reduzir os dados que sua pesquisa vetorial precisa processar.
- Crie um banco de dados vetorial para fornecer uma base de dados de conhecimento externa ou use como uma memória de longo prazo.
Limitações
Existem algumas limitações ao usar a pesquisa vetorial, que você deve observar:
- Você precisará fornecer as incorporações usando o Azure OpenAI ou uma solução de código aberto semelhante, já que o Azure AI Search não as gera para seu conteúdo.
- As chaves gerenciadas pelo cliente (CMK) não são suportadas.
- Há limitações de armazenamento aplicáveis, portanto, você deve verificar o que sua cota de serviço oferece.
Nota
Se os seus documentos forem grandes, considere fragmentar. Use o Chunking large documents for vetor search solutions na documentação do AI Search para obter mais informações.