Usar pipelines do Azure Machine Learning sem código para construir pipelines da RAG (versão prévia)
Este artigo oferece exemplos sobre como criar um pipeline de RAG. Para cenários avançados, você pode criar seus próprios pipelines personalizados do Azure Machine Learning a partir do código (normalmente notebooks) que permitem o controle granular do fluxo de trabalho da RAG. O Azure Machine Learning fornece vários componentes de pipeline internos para agrupamento de dados, geração de inserções, criação de dados de teste, geração automática de prompt, avaliação de prompt. Esses componentes podem ser usados de acordo com suas necessidades por meio de notebooks. Você pode até mesmo usar o Índice de Vetor criado no Azure Machine Learning no LangChain.
Importante
Esse recurso está atualmente em visualização pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos.
Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.
Pré-requisitos
Uma assinatura do Azure. Se você não tiver uma assinatura do Azure, crie uma conta gratuita.
Acesso ao OpenAI do Azure.
Habilite o fluxo de prompt no workspace do Azure Machine Learning
No workspace do Azure Machine Learning, você pode habilitar o fluxo de prompt ativando as Soluções de Criação de IA com o Fluxo de Prompt no painel Gerenciar recursos de visualização .
Repositório de exemplo do notebook de pipeline do Fluxo de Prompt
O Azure Machine Learning oferece tutoriais de notebook para vários casos de uso com pipelines de fluxo de prompt.
Geração de Dados de Garantia de Qualidade
A Geração de Dados de Garantia de Qualidade pode ser usada para obter o melhor prompt para RAG e para avaliar métricas para RAG. Este notebook mostra como criar um conjunto de dados de Garantia de qualidade com base em seus dados (repositório Git).
Testar a geração de dados e o Prompt Automático
Use índices de vetor para criar um modelo de geração aumentada de recuperação e avaliar o fluxo de prompt em um conjunto de dados de teste.
Criar um Índice de Vetor baseado em FAISS
Configure um Pipeline do Azure Machine Learning para efetuar pull de um Repositório Git, processar os dados em partes, inserir as partes e criar um índice de vetor FAISS compatível com langchain.
Próximas etapas
Como criar um índice de vetor no fluxo de prompt do Azure Machine Learning (versão prévia)
Como usar Repositórios de Vetores com o Azure Machine Learning (versão prévia)