Cargas de trabalho de IA no Azure
Este guia aborda os desafios arquitetônicos de projetar cargas de trabalho de IA, concentrando-se na funcionalidade não determinística, no design de dados e aplicativos e nas operações. As recomendações são baseadas nos princípios do Azure Well-Architected Framework (WAF) e incluem informações de implementações bem-sucedidas do Azure.
Estes artigos destinam-se a proprietários de carga de trabalho e partes interessadas técnicas, como arquitetos, líderes de desenvolvimento e líderes de TI. Funções especializadas em IA e dados, como cientistas de dados, também devem estar cientes dessa orientação, porque a colaboração entre várias funções e equipes é um aspeto fundamental.
Nota
O Microsoft Azure oferece uma variedade de serviços de IA que podem ser integrados à sua carga de trabalho ou criados em torno dela. Dependendo das suas necessidades de negócios, você pode escolher entre soluções SaaS totalmente gerenciadas, soluções PaaS ou criar sua própria solução de IA. Serviços específicos do Azure e seus recursos não são abordados aqui. Para estes, recomendamos consultar a respetiva documentação do produto.
Além disso, certas cargas de trabalho de IA não estão no escopo, como:
- Cargas de trabalho realizadas por meio de ofertas low-code e no-code, como o Microsoft Copilot Studio.
- Cargas de trabalho que exigem uma computação de alto desempenho.
- Cargas de trabalho que não implementam casos de uso de IA generativos ou discriminativos.
O que é uma carga de trabalho de IA?
No contexto do WAF, uma carga de trabalho de IA atende às necessidades de tarefas preditivas, discriminatórias ou generativas. Centra-se na funcionalidade ética, adaptando-se às tecnologias de IA em rápida evolução e mantendo-se relevante e explicável. Os pilares do WAF devem ser aplicados em todos os pontos de decisão para garantir que o sistema seja confiável, seguro, eficiente e econômico.
As cargas de trabalho de IA são diferentes das tradicionais porque substituem a funcionalidade determinística em partes da carga de trabalho por um comportamento não determinístico que resolve situações em que os resultados fixos são impraticáveis. Em vez disso, eles combinam código e dados em uma entidade ou um modelo, permitindo experiências únicas que os sistemas tradicionais não podem fornecer.
Antes de começar suas estratégias de design, considere esses pontos-chave primeiro.
Familiarize-se com as amplas categorias de modelos
A IA generativa usa aprendizado de máquina para criar novos conteúdos de forma autônoma. Inclui modelos de linguagem que podem ser personalizados com dados do utilizador ou utilizados como serviços como o Azure OpenAI. Por exemplo, o GPT, um tipo de modelo de linguagem, é especializado em imitar a linguagem conversacional humana e é ideal para experiências de bate-papo e linguagem natural.
Casos de uso: a IA generativa pode produzir artigos, histórias, arte, gerar dados sintéticos para equilibrar conjuntos de dados e tornar os chatbots mais parecidos com humanos.
A IA discriminativa usa programação explícita para executar tarefas específicas com base em regras e algoritmos. Pode dividir-se em:
Baseado em modelos. Sistemas preditivos que encontram padrões, com base em treinamento realizado a partir de observações anteriores, para fazer previsões, mas não conseguem criar novos conteúdos ou se adaptar por conta própria.
Não baseado em modelos. Agentes autônomos que seguem regras predefinidas para interagir com sistemas, como personagens de videogames.
Caso de uso: a IA discriminativa é usada para análise preditiva, sistemas de recomendação e deteção de fraudes.
Esta série de artigos abrange diferentes cargas de trabalho de IA, concentrando-se em tipos específicos, como modelos de linguagem, quando necessário.
Importante
Ao escolher entre modelos generativos e discriminativos, pense na tarefa que você precisa realizar. Os modelos generativos criam novos dados, enquanto os modelos discriminativos classificam os dados existentes com base em recursos. Para tarefas de classificação ou regressão, escolha modelos que se ajustem ao trabalho. Por exemplo, um modelo de linguagem que pode classificar pode ser mais versátil do que um que apenas classifica.
Avalie suas opções de construção versus compra
Se respostas genéricas forem aceitáveis, um modelo pré-construído ou uma solução baseada em serviços de IA que use processamento opaco deve ser suficiente para sua carga de trabalho. Mas se você precisar de dados específicos para sua empresa ou tiver requisitos de conformidade, precisará criar um modelo personalizado.
Ao escolher entre um modelo personalizado, um modelo pré-criado ou um serviço, considere estes fatores:
Controlo de dados. Os modelos personalizados oferecem mais controle sobre dados confidenciais. Os modelos pré-construídos são mais fáceis para tarefas gerais.
Personalização. Os modelos personalizados são melhores para necessidades únicas. Os modelos pré-construídos podem não ter flexibilidade.
Custo e manutenção. Os modelos personalizados precisam de manutenção e recursos contínuos. Os modelos pré-construídos geralmente têm custos iniciais mais baixos e menos carga de infraestrutura.
Desempenho. Os serviços pré-construídos oferecem infraestrutura e escalabilidade otimizadas. Eles são ideais para necessidades de baixa latência ou alta escalabilidade.
Perícia. Os modelos personalizados exigem uma equipa qualificada. Os modelos pré-construídos podem ser mais rápidos de implantar e mais fáceis de usar se a experiência for limitada.
Importante
Criar e manter seu próprio modelo requer muitos recursos, tempo e experiência. É importante pesquisar minuciosamente antes de decidir. Normalmente, escolher um modelo pré-construído ou um serviço gerenciado é uma opção melhor.
Quais são os desafios comuns?
Custos de cálculo. As funções de IA podem ser caras devido às altas necessidades de computação, e as necessidades de computação podem variar de acordo com o design da sua carga de trabalho. Compreenda os seus requisitos e escolha o serviço certo para gerir custos.
Requisitos de segurança e conformidade. As soluções prontas para uso podem não atender às suas necessidades de segurança e conformidade. Opções de investigação para evitar encargos desnecessários.
Volume de dados. O tratamento de grandes volumes de dados em vários formatos traz desafios para proteger informações confidenciais e processar eficientemente. Otimizar os custos de armazenamento, processamento e transferência deve ser uma atividade contínua.
Decadência do modelo. Os modelos podem degradar-se com o tempo, levando a resultados imprecisos. Testar sistemas de IA é um desafio devido à sua aleatoriedade.
Desafios de habilidade. Novas cargas de trabalho de IA podem precisar de funções especializadas e novos processos de operações que exigem treinamento extensivo.
Ritmo da inovação em IA. Adotar as tecnologias mais recentes pode ser tentador para se manter na vanguarda. Avalie as novas tecnologias cuidadosamente para garantir que elas melhorem a experiência do usuário e não apenas acrescentem complexidade para estarem atualizadas.
Requisitos éticos. Você precisa determinar claramente se seu caso de uso é um alvo ético para IA. Manter os padrões éticos é necessário durante as fases de planejamento e implementação para garantir que você esteja construindo um sistema responsável.
Como utilizar estas orientações?
✔ Comece com a Metodologia de Design, que descreve a lógica e os temas recorrentes nas áreas técnicas e operacionais. Essa abordagem sistemática ajuda a definir requisitos e estratégias de design. Reveja essa metodologia ao enfrentar escolhas incertas para se manter alinhado com os objetivos gerais da carga de trabalho. Ele também fornece uma estrutura para colaborar com as partes interessadas para justificar decisões técnicas e incorporar o feedback do cliente para melhoria contínua.
✔ Prossiga para os Princípios de Design para ver como a metodologia de design se alinha com os principais pilares do Well-Architected Framework, considerando a evolução do crescimento. Avaliar os princípios subjacentes a todos os pilares coletivamente, incluindo as compensações.
✔ Concentre-se nas áreas de design que têm o maior efeito na sua solução. Cada área inclui considerações e recomendações para guiá-lo através das decisões de design.
✔ Use a Ferramenta de revisão de avaliação para avaliar a prontidão de sua carga de trabalho otimizada de IA na produção.
Padrão de arquitetura típico e áreas de design
A arquitetura destaca a integração de diferentes componentes para permitir o processamento eficiente de dados, otimização de modelos e implantação de aplicativos em tempo real em soluções orientadas por IA. Ele inclui vários módulos, como fontes de dados, processamento de dados, treinamento de modelos, implantação de modelos e interfaces de usuário, ilustrando como os dados fluem pelo sistema desde a coleta inicial até a interação do usuário final.
A tabela a seguir descreve algumas das principais áreas de design relacionadas a esse padrão.
Estruturar áreas |
---|
Design de aplicações. Saiba mais sobre considerações exclusivas para cargas de trabalho de IA que podem ter um efeito significativo em seus padrões de design de aplicativos existentes. |
Plataforma de aplicação. Determine as melhores plataformas a serem usadas para dar suporte a funções de carga de trabalho de IA, como hospedagem de modelos, treinamento de modelos e inferência. |
Desenho de dados de formação. Projete estratégias para tópicos de ingestão, pré-processamento, retenção e governança de dados para lidar com os dados de treinamento do modelo. |
Projeto de dados de aterramento. Projete estratégias para otimizar a capacidade de pesquisa e recuperação, ao mesmo tempo em que atende aos requisitos de segurança e conformidade para seus dados de aterramento. |
Plataforma de dados. Determine a melhor plataforma de hospedagem para lidar com grandes quantidades e potencialmente muitos formatos de dados que sua carga de trabalho usa. |
Operações de Machine Learning e operações de IA Generativa. Estabeleça práticas modernas de DevOps para dar suporte às suas funções e sistemas de aprendizado de máquina ou IA generativa. |
Operações de carga de trabalho. Modernize suas práticas operacionais com novas abordagens e adicionando funções especializadas e treinamento. |
Testes e avaliação. Desenvolva estratégias de teste e avaliação para medir características como precisão, sensibilidade, sensibilidade e especificidade por meio de métricas que foram especificamente direcionadas para cargas de trabalho de IA. |
Personas de carga de trabalho. Entenda como as personas estão envolvidas no ciclo de vida completo de sua carga de trabalho de IA para ajudar a garantir que sua equipe seja totalmente capaz de construí-la e apoiá-la. |
IA responsável. A IA traz oportunidades incríveis para novos produtos e serviços, mas também acarreta um grau considerável de risco. Preste especial atenção à experiência do usuário e às implicações éticas de lançar sua solução de IA para o público. |
Gorjeta
Cada decisão arquitetônica envolve uma série de considerações e um conjunto de compromissos reconhecidos que equilibram diferentes aspetos da estrutura. Essas compensações são indicadas por este ícone .