Recomendações de seleção de recursos para cargas de trabalho de IA no Azure
Este artigo contém recomendações de seleção de recursos para organizações que executam cargas de trabalho de IA no Azure. Ele se concentra em soluções de PaaS (plataforma como serviço) de IA do Azure, incluindo Estúdio de IA do Azure, OpenAI do Azure, Azure Machine Learning e Serviços de IA do Azure. Ele abrange cargas de trabalho de IA generativa e não generativa.
Fazer escolhas embasadas de recursos de IA permite que as organizações obtenham melhor desempenho, escalabilidade e economia ao gerenciar cargas de trabalho de IA. A tabela a seguir tem uma visão geral das principais soluções de PaaS de IA do Azure e critérios de decisão importantes.
Plataforma de inteligência artificial | Tipo de IA | Descrição | Habilidades requeridas |
---|---|---|---|
OpenAI do Azure | O que é IA generativa | Plataforma para acessar modelos OpenAI | Habilidades de desenvolvedor e ciência de dados |
Estúdio de IA do Azure | O que é IA generativa | Plataforma para engenharia de prompts e implantação de pontos de extremidade de IA generativa | Habilidades de desenvolvedor e ciência de dados |
Serviços de IA do Azure | IA analítica | Plataforma para consumir modelos de machine learning pré-criados | Habilidades de desenvolvedor |
Azure Machine Learning | Aprendizado de máquina | Plataforma para treinar e implantar modelos de machine learning | Habilidades de desenvolvedor e habilidades avançadas de ciência de dados |
Selecionar recursos para cargas de trabalho de IA generativa
A IA generativa envolve a combinação de diferentes recursos para processar e gerar resultados significativos com base nos dados de entrada. Com a seleção adequada, os aplicativos de IA generativa, como aqueles que usam geração aumentada de recuperação (RAG), entregam modelos de IA precisos e fundamentados.
Em uma carga de trabalho RAG típica, (1) a carga de trabalho recebe a consulta do usuário. (2) Um orquestrador, como prompt flow, Semantic Kernel ou LangChain, gerencia o fluxo de dados. (3) Um mecanismo de busca e recuperação encontra os dados de fundamentação apropriados (4) para enviar ao ponto de extremidade de IA generativa. (5) Um ponto de extremidade de modelo de IA generativa gera uma resposta com base na consulta do usuário e nos dados da fundamentação. Use as recomendações a seguir como estrutura para criar cargas de trabalho RAG generativas.
Escolha uma plataforma de IA generativa. Use o OpenAI do Azure ou o Estúdio de IA do Azure para implantar e gerenciar modelos de IA generativa. O Serviço OpenAI do Azure dá acesso a modelos OpenAI, rede privada e filtragem de conteúdo. O Estúdio de IA do Azure oferece uma plataforma code-first para desenvolver cargas de trabalho de IA. Ele tem ferramentas integradas para criar e implantar aplicativos. Ele também apresenta um grande catálogo de modelos, prompt flow, ajuste fino, filtros de segurança de conteúdo e muito mais.
Escolha o tipo de computação apropriado de IA. O Estúdio de IA do Azure requer instâncias de computação para prompt flow, criação de índices e abertura do Visual Studio Code (Web ou Área de Trabalho) dentro do estúdio. Escolha um tipo de computação com base em suas necessidades de desempenho e orçamento.
Escolha um orquestrador. Os orquestradores populares para IA generativa incluem Semantic Kernel, Prompt flow e LangChain. O Semantic Kernel se integra aos serviços do Azure. O LangChain fornece extensibilidade além do ecossistema da Microsoft.
Escolha um mecanismo de busca e recuperação de conhecimento. Para fundamentar modelos de IA generativa, crie um banco de dados de índice ou vetor para recuperação de dados relevantes. Use a Pesquisa de IA do Azure para criar índices tradicionais e vetoriais de várias fontes de dados, aplicar blocos de dados e usar vários tipos de consulta. Se os dados residirem em bancos de dados estruturados, use o Azure Cosmos DB, o Banco de Dados do Azure para PostgreSQL e o Cache do Azure para Redis.
Escolha uma fonte de dados para fundamentação de dados. Para imagens, áudio, vídeo ou grandes conjuntos de dados, armazene dados de fundamentação no Armazenamento de Blobs do Azure. Como alternativa, use bancos de dados compatíveis com a Pesquisa de IA do Azure ou bancos de dados vetoriais.
Escolha uma plataforma de computação. Use a árvore de decisão de computação do Azure para escolher a plataforma certa para sua carga de trabalho.
Selecionar recursos para cargas de trabalho de IA não generativa
As cargas de trabalho de IA não generativa dependem de plataformas, recursos de computação, fontes de dados e ferramentas de processamento de dados para consistir com tarefas de machine learning. A seleção dos recursos certos permite que você crie cargas de trabalho de IA usando soluções pré-criadas e personalizadas.
Em uma carga de trabalho de IA não generativa, (1) a carga de trabalho ingere dados. (2) Um mecanismo opcional de processamento de dados extrai ou manipula os dados recebidos. (3) Um ponto de extremidade de modelo de IA analisa os dados. (4) Os dados recebem treinamento ou ajuste fino dos modelos de IA. Use as recomendações a seguir como estrutura para criar cargas de trabalho de IA não generativa.
Escolha uma plataforma de IA não generativa. Os Serviços de IA do Azure oferecem modelos de IA predefinidos que não exigem habilidades de ciência de dados. Para ver orientações sobre como selecionar o serviço de IA do Azure correto, consulte Escolher uma tecnologia de serviços de IA do Azure. O Azure Machine Learning fornece uma plataforma para criar modelos de machine learning com seus próprios dados e consumir esses modelos em cargas de trabalho de IA.
Escolha a computação de IA apropriada. Para o Azure Machine Learning, você precisa de recursos de computação para executar um trabalho ou hospedar um ponto de extremidade. Use o tipo de computação que atenda às suas necessidades de desempenho e orçamento. Os Serviços de IA do Azure não exigem recursos de computação.
Escolha uma fonte de dados. Para o Azure Machine Learning, use uma das fontes de dados aceitas para hospedar seus dados de treinamento. Para os Serviços de IA do Azure, muitos dos serviços não exigem dados de ajuste fino e alguns, como a Visão Personalizada de IA do Azure, são uma opção para carregar arquivos locais em uma solução de armazenamento de dados gerenciada.
Escolha uma plataforma de computação. Use a árvore de decisão de computação do Azure para escolher a plataforma certa de carga de trabalho.
Escolha um serviço de processamento de dados (opcional). O Azure Functions é uma opção comum de processamento de dados porque é uma opção sem servidor. A Grade de Eventos do Azure também é um mecanismo de gatilho comum para iniciar um pipeline de processamento de dados.