Partilhar via


Recomendações de seleção de recursos para cargas de trabalho de IA no Azure

Este artigo oferece recomendações de seleção de recursos para organizações que executam cargas de trabalho de IA no Azure. Ele se concentra em soluções de plataforma como serviço (PaaS) de IA do Azure, incluindo Azure AI Foundry, Azure OpenAI, Azure Machine Learning e Azure AI Services. Abrange cargas de trabalho de IA generativas e não generativas.

Fazer escolhas informadas de recursos de IA permite que as organizações alcancem melhor desempenho, escalabilidade e custo-benefício ao gerenciar cargas de trabalho de IA. A tabela a seguir fornece uma visão geral das principais soluções de PaaS de IA do Azure e critérios de decisão importantes.

Plataforma de IA Tipo de IA Description Competências necessárias
Azure OpenAI IA generativa Plataforma para aceder a modelos OpenAI Habilidades de desenvolvedor e ciência de dados
Azure AI Foundry IA generativa Plataforma para engenharia imediata e implantação de endpoints de IA generativos Habilidades de desenvolvedor e ciência de dados
Serviços de IA do Azure IA analítica Plataforma para consumir modelos de aprendizagem automática pré-construídos Habilidades de desenvolvedor
Azure Machine Learning Aprendizagem automática Plataforma para treinamento e implantação de modelos de aprendizado de máquina Habilidades de desenvolvedor e habilidades avançadas de ciência de dados

Selecionar recursos para cargas de trabalho generativas de IA

A IA generativa requer a combinação de diferentes recursos para processar e gerar saídas significativas com base em dados de entrada. A seleção adequada garante que as aplicações de IA generativas, como as que usam geração aumentada de recuperação (RAG), forneçam modelos de IA precisos ao aterrar modelos.

Diagrama mostrando os componentes básicos de uma carga de trabalho de IA generativa.

Em uma carga de trabalho RAG típica, (1) a carga de trabalho recebe a consulta do usuário. (2) Um orquestrador, como Prompt flow, Semantic Kernel ou LangChain, gerencia o fluxo de dados. (3) Um mecanismo de pesquisa e recuperação encontra os dados de aterramento apropriados (4) para enviar ao parâmetro de avaliação da IA generativa. (5) Um endpoint de modelo de IA generativa gera uma resposta com base na consulta do usuário e nos dados de fundamentação. Use as recomendações a seguir como estrutura para criar cargas de trabalho RAG generativas.

  • Escolha uma plataforma de IA generativa. Use o Azure OpenAI ou o Azure AI Foundry para implantar e gerenciar modelos de IA generativos. O Serviço OpenAI do Azure fornece acesso a modelos OpenAI, rede privada e filtragem de conteúdo. Azure AI Foundry oferece uma plataforma "code-first" para o desenvolvimento de cargas de trabalho de IA. Ele tem ferramentas integradas para criar e implantar aplicativos. Ele também possui um grande catálogo de modelos, fluxo de prompts, ajuste fino, filtros de segurança de conteúdo e muito mais.

  • Escolha o tipo de computação de IA apropriado. O Azure AI Foundry requer instâncias de computação para o fluxo de prompts, criação de índices e abertura do Visual Studio Code (Web ou Desktop) no ambiente. Escolha um tipo de computação com base em suas necessidades de desempenho e orçamento.

  • Escolha um orquestrador. Orquestradores populares para IA generativa incluem Semantic Kernel, Prompt flow e LangChain. O Kernel Semântico integra-se com os serviços do Azure. LangChain fornece extensibilidade além do ecossistema da Microsoft.

  • Escolha um mecanismo de pesquisa e recuperação de conhecimento. Para fundamentar modelos de IA generativa, crie um índice ou banco de dados vetorial para recuperação de dados relevantes. Use a Pesquisa de IA do Azure para criar índices tradicionais e vetoriais de várias fontes de dados, aplicar fragmentação de dados e usar vários tipos de consulta. Se seus dados residirem em bancos de dados estruturados, considere usar o Azure Cosmos DB, o Banco de Dados do Azure para PostgreSQL e o Cache do Azure para Redis.

  • Escolha uma fonte de dados para fundamentar dados. Para imagens, áudio, vídeo ou grandes conjuntos de dados, armazene dados de aterramento no Armazenamento de Blobs do Azure. Como alternativa, use bancos de dados suportados pela Pesquisa de IA do Azure ou bancos de dados vetoriais.

  • Escolha uma plataforma de computação. Use a árvore de decisão de computação do Azure para escolher a plataforma certa para sua carga de trabalho.

Selecionar recursos para cargas de trabalho de IA não generativas

As cargas de trabalho de IA não generativas dependem de plataformas, recursos de computação, fontes de dados e ferramentas de processamento de dados para dar suporte a tarefas de aprendizado de máquina. Selecionar os recursos certos permite criar cargas de trabalho de IA usando soluções pré-criadas e personalizadas.

Diagrama mostrando os componentes básicos de uma carga de trabalho de IA não generativa.

Em uma carga de trabalho de IA não generativa, (1) a carga de trabalho ingere dados. (2) Um mecanismo opcional de tratamento de dados extrai ou manipula os dados recebidos. (3) Um endpoint de modelo de IA analisa os dados. (4) Os dados apoiam a formação ou o aperfeiçoamento dos modelos de IA. Use as recomendações a seguir como estrutura para criar cargas de trabalho de IA não generativas.

  • Escolha uma plataforma de IA não generativa.Os serviços de IA do Azure oferecem modelos de IA pré-criados que não exigem habilidades de ciência de dados. Para obter orientação sobre como selecionar o serviço de IA do Azure correto, consulte Escolher uma tecnologia de serviços de IA do Azure. O Azure Machine Learning fornece uma plataforma para criar modelos de aprendizagem automática com os seus próprios dados e consumir esses modelos em cargas de trabalho de IA.

  • Escolha o cálculo de IA apropriado. Para o Azure Machine Learning, você precisa de recursos de computação para executar um trabalho ou hospedar um ponto de extremidade. Use o tipo de computação que atenda às suas necessidades de desempenho e orçamento. Os serviços de IA do Azure não exigem recursos de computação.

  • Escolha uma fonte de dados. Para o Azure Machine Learning, use uma das fontes de dados com suporte para hospedar seus dados de treinamento. Para os serviços de IA do Azure, muitos dos serviços não exigem dados de ajuste fino, e alguns, como o Azure AI Custom Vision, fornecem uma opção para carregar arquivos locais para uma solução de armazenamento de dados gerenciado.

  • Escolha uma plataforma de computação. Use a árvore de decisão de computação do Azure para escolher a plataforma de carga de trabalho certa.

  • Escolha um serviço de processamento de dados (opcional). O Azure Functions é uma opção comum de processamento de dados porque fornece uma opção sem servidor. A Grade de Eventos do Azure também é um mecanismo de gatilho comum para iniciar um pipeline de processamento de dados.

Próximo passo