Introdução à criação de aplicativos de IA generativa no Databricks
O Mosaic AI fornece uma plataforma abrangente para criar, implantar e gerenciar aplicativos de IA generativa. Este artigo apresenta os componentes e processos essenciais envolvidos no desenvolvimento de aplicativos de GenAI no Databricks.
Implante e consulte modelos de IA generativa
Para casos de uso simples, você pode fornecer e consultar diretamente modelos de IA generativa, incluindo modelos de código aberto de alta qualidade, bem como modelos de terceiros de provedores de LLM, como OpenAI e Anthropic.
O Serviço de Modelo de IA do Mosaic dá suporte ao serviço e à consulta de modelos de IA generativa por meio das seguintes funcionalidades:
- APIs do Foundation Model. Essa funcionalidade disponibiliza modelos abertos de última geração e variantes de modelo ajustadas para o ponto de extremidade de serviço do modelo. Esses modelos são arquiteturas de modelo de base com curadoria que dão suporte à inferência otimizada. Modelos básicos, como DBRX Instruct, Meta-Llama-3.1-70B-Instruct, GTE-Large e Mistral-7B estão disponíveis para uso imediato com preços de pagamento por token , e cargas de trabalho que exigem garantias de desempenho, como variantes de modelo ajustadas, podem ser implantadas com taxa de transferência provisionada.
- Modelos externos. Estes são modelos de IA generativa hospedados fora do Databricks. Os pontos de extremidade que atendem modelos externos podem ser controlados centralmente e os clientes podem estabelecer limites de taxa e controle de acesso para eles. Entre os exemplos estão os modelos base como o GPT-4 da OpenAI, o Claude da Anthropic e outros.
Confira Criar pontos de extremidade de serviço do modelo de IA generativa.
Estrutura de agente do Mosaic AI
A Estrutura de Agente de IA do Mosaico é composta por um conjunto de ferramentas do Databricks projetadas para ajudar os desenvolvedores a criar, implantar e avaliar agentes de qualidade de produção, como aplicativos de RAG (geração aumentada de recuperação).
Ela é compatível com estruturas de terceiros, como LangChain e LlamaIndex, permitindo que você desenvolva com sua estrutura preferida e aproveite o Catálogo gerenciado do Unity da Databricks, a Estrutura de Avaliação de Agentes e outros benefícios da plataforma.
Itere rapidamente no desenvolvimento do agente usando os seguintes recursos:
- Crie e registre agentes usando qualquer biblioteca e MLflow. Parametrize seus agentes para experimentar e iterar rapidamente no desenvolvimento do agente.
- O rastreamento do agente permite registrar, analisar e comparar rastreamentos no código do agente para depurar e entender como o agente responde às solicitações.
- Melhore a qualidade do agente usando o DSPy. O DSPy pode automatizar a engenharia rápida e o ajuste fino para melhorar a qualidade de seus agentes GenAI.
- Implante agentes para produção com suporte nativo para streaming de token e registro em log de solicitação/resposta, além de um aplicativo de revisão interno para obter comentários do usuário para seu agente.