Compartilhar via


Introdução à criação de aplicativos de IA generativa no Databricks

O Mosaic AI fornece uma plataforma abrangente para criar, implantar e gerenciar aplicativos de IA generativa. Este artigo apresenta os componentes e processos essenciais envolvidos no desenvolvimento de aplicativos de GenAI no Databricks.

Implante e consulte modelos de IA generativa

Para casos de uso simples, você pode fornecer e consultar diretamente modelos de IA generativa, incluindo modelos de código aberto de alta qualidade, bem como modelos de terceiros de provedores de LLM, como OpenAI e Anthropic.

O Serviço de Modelo de IA do Mosaic dá suporte ao serviço e à consulta de modelos de IA generativa por meio das seguintes funcionalidades:

  • APIs do Foundation Model. Essa funcionalidade disponibiliza modelos abertos de última geração e variantes de modelo ajustadas para o ponto de extremidade de serviço do modelo. Esses modelos são arquiteturas de modelo de base com curadoria que dão suporte à inferência otimizada. Modelos básicos, como DBRX Instruct, Meta-Llama-3.1-70B-Instruct, GTE-Large e Mistral-7B estão disponíveis para uso imediato com preços de pagamento por token , e cargas de trabalho que exigem garantias de desempenho, como variantes de modelo ajustadas, podem ser implantadas com taxa de transferência provisionada.
  • Modelos externos. Estes são modelos de IA generativa hospedados fora do Databricks. Os pontos de extremidade que atendem modelos externos podem ser controlados centralmente e os clientes podem estabelecer limites de taxa e controle de acesso para eles. Entre os exemplos estão os modelos base como o GPT-4 da OpenAI, o Claude da Anthropic e outros.

Confira Criar pontos de extremidade de serviço do modelo de IA generativa.

Estrutura de agente do Mosaic AI

A Estrutura de Agente de IA do Mosaico é composta por um conjunto de ferramentas do Databricks projetadas para ajudar os desenvolvedores a criar, implantar e avaliar agentes de qualidade de produção, como aplicativos de RAG (geração aumentada de recuperação).

Ela é compatível com estruturas de terceiros, como LangChain e LlamaIndex, permitindo que você desenvolva com sua estrutura preferida e aproveite o Catálogo gerenciado do Unity da Databricks, a Estrutura de Avaliação de Agentes e outros benefícios da plataforma.

Itere rapidamente no desenvolvimento do agente usando os seguintes recursos:

  • Crie e registre agentes usando qualquer biblioteca e MLflow. Parametrize seus agentes para experimentar e iterar rapidamente no desenvolvimento do agente.
  • O rastreamento do agente permite registrar, analisar e comparar rastreamentos no código do agente para depurar e entender como o agente responde às solicitações.
  • Melhore a qualidade do agente usando o DSPy. O DSPy pode automatizar a engenharia rápida e o ajuste fino para melhorar a qualidade de seus agentes GenAI.
  • Implante agentes para produção com suporte nativo para streaming de token e registro em log de solicitação/resposta, além de um aplicativo de revisão interno para obter comentários do usuário para seu agente.