Cargas de trabalho de IA no Azure
Este artigo aborda os desafios arquitetônicos de projetar cargas de trabalho de IA. Ele se concentra na funcionalidade não determinística, no design de dados e aplicativos e nas operações. As recomendações são baseadas nos princípios do Azure Well-Architected Framework e incluem informações de implementações bem-sucedidas do Azure.
Estes artigos destinam-se a proprietários de carga de trabalho e partes interessadas técnicas, como arquitetos, líderes de desenvolvimento e líderes de TI. Funções especializadas em IA e dados, como cientistas de dados, também devem estar cientes dessa orientação, porque a colaboração entre várias funções e equipes é um aspeto fundamental.
Nota
O Azure oferece vários serviços de IA que você pode integrar à sua carga de trabalho ou criar em torno dela. Dependendo das suas necessidades de negócios, você pode escolher entre soluções de software como serviço (SaaS) totalmente gerenciadas, soluções de plataforma como serviço (PaaS) ou criar sua própria solução de IA. Serviços específicos do Azure e seus recursos não são abordados aqui. Recomendamos que consulte a respetiva documentação do produto para obter essas informações.
Além disso, certas cargas de trabalho de IA não estão no escopo, como:
- Cargas de trabalho realizadas através de soluções low-code e no-code, como o Copilot Studio.
- Cargas de trabalho que exigem computação de alto desempenho.
- Cargas de trabalho que não implementam casos de uso de IA generativos ou discriminativos.
O que é uma carga de trabalho de IA?
No contexto do Well-Architected Framework, uma carga de trabalho de IA atende às necessidades de tarefas preditivas, discriminatórias ou generativas. Centra-se na funcionalidade ética, adaptando-se às tecnologias de IA em rápida evolução e mantendo-se relevante e explicável. Aplique os pilares do Well-Architected Framework em todos os pontos de decisão para garantir que o sistema seja confiável, seguro, eficiente e econômico.
As cargas de trabalho de IA são diferentes das tradicionais porque substituem a funcionalidade determinística em partes da carga de trabalho por um comportamento não determinístico que resolve situações em que os resultados fixos são impraticáveis. Em vez disso, eles combinam código e dados em uma entidade, ou um modelo , para permitir experiências únicas que os sistemas tradicionais não podem fornecer.
Antes de começar suas estratégias de design, considere esses pontos-chave primeiro.
Familiarize-se com as amplas categorias de modelos
Generative AI: Usa aprendizado de máquina para criar novos conteúdos de forma autônoma. Inclui modelos de linguagem que podem ser personalizados com dados do utilizador ou utilizados como serviços como o Serviço Azure OpenAI. Por exemplo, o GPT, um tipo de modelo de linguagem, é especializado em imitar a linguagem conversacional humana e é ideal para experiências de bate-papo e linguagem natural.
Casos de uso: A IA generativa pode produzir artigos, histórias e arte. Ele também pode gerar dados sintéticos para equilibrar conjuntos de dados e tornar os chatbots mais humanos.
Discriminative AI: Usa programação explícita para executar tarefas específicas com base em regras e algoritmos. Divide-se em:
- baseados em modelos: Os sistemas preditivos encontram padrões com base no treinamento realizado a partir de observações anteriores para fazer previsões, mas não podem criar novos conteúdos ou se adaptar por conta própria.
- não baseados em modelos: os agentes autônomos seguem regras predefinidas para interagir com sistemas, como personagens de videogames.
Caso de uso: a IA discriminativa é usada para análise preditiva, sistemas de recomendação e deteção de fraudes.
Esta série de artigos abrange diferentes cargas de trabalho de IA e se concentra em tipos específicos, como modelos de linguagem, quando necessário.
Importante
Ao escolher entre modelos generativos e discriminativos, pense na tarefa que precisa realizar. Os modelos generativos criam novos dados. Os modelos discriminativos classificam os dados existentes com base nas características. Para tarefas de classificação ou regressão, escolha modelos que se ajustem ao trabalho. Por exemplo, um modelo de linguagem que pode classificar pode ser mais versátil do que um que apenas classifica.
Avalie suas opções de construção versus compra
Se respostas genéricas forem aceitáveis, um modelo pré-construído ou uma solução baseada em serviços de IA que use processamento opaco deve ser suficiente para sua carga de trabalho. Mas se você precisar de dados específicos para sua empresa ou tiver requisitos de conformidade, crie um modelo personalizado.
Ao escolher entre um modelo personalizado, um modelo pré-criado ou um serviço, considere estes fatores:
- : Controle de Dados: Os modelos personalizados oferecem mais controlo sobre os dados confidenciais. Os modelos pré-construídos são mais fáceis para tarefas gerais.
- Personalização: Modelos personalizados são melhores para necessidades específicas. Os modelos pré-construídos podem não ter flexibilidade.
- Custo e manutenção: Os modelos personalizados precisam de manutenção e recursos contínuos. Os modelos pré-construídos geralmente têm custos iniciais mais baixos e menos carga de infraestrutura.
- Performance: Os serviços pré-construídos oferecem infraestrutura e escalabilidade otimizadas. Eles são ideais para necessidades de baixa latência ou alta escalabilidade.
- Expertise: Modelos personalizados exigem uma equipe qualificada. Os modelos pré-construídos geralmente são mais rápidos de implantar e mais fáceis de usar se a experiência for limitada.
Importante
Criar e manter seu próprio modelo requer muitos recursos, tempo e experiência. É importante pesquisar minuciosamente antes de decidir. Normalmente, escolher um modelo pré-construído ou um serviço gerenciado é uma opção melhor.
Quais são os desafios comuns?
- Custos de computação: as funções de IA podem ser caras devido às altas necessidades de computação, e as necessidades de computação podem variar de acordo com o design da sua carga de trabalho. Compreenda os seus requisitos e escolha o serviço certo para gerir custos.
- Requisitos de segurança e conformidade: As soluções prontas para uso podem não atender às suas necessidades de segurança e conformidade. Opções de investigação para evitar encargos desnecessários.
- Volume de dados: O tratamento de grandes volumes de dados em vários formatos traz desafios para proteger informações confidenciais e processar eficientemente. A otimização dos custos de armazenamento, processamento e transferência deve ser uma atividade contínua.
- Decaimento do modelo: Os modelos podem degradar-se ao longo do tempo, o que leva a resultados imprecisos. Testar sistemas de IA é um desafio por causa de sua aleatoriedade.
- Desafios de habilidades: Novas cargas de trabalho de IA podem precisar de funções especializadas e novos processos de operações que exigem treinamento extensivo.
- Ritmo da inovação em IA: Adotar as tecnologias mais recentes pode ser tentador para se manter na vanguarda. Avalie as novas tecnologias cuidadosamente para garantir que elas melhorem a experiência do usuário e não apenas acrescentem complexidade para estarem atualizadas.
- Requisitos éticos: Determine claramente se o seu caso de uso é um alvo ético para a IA. Manter os padrões éticos é necessário durante as fases de planejamento e implementação para garantir que você esteja construindo um sistema responsável.
Como utilizar estas orientações
✔ Comece com a metodologia Design, que descreve a lógica e os temas recorrentes entre as áreas técnicas e operacionais. Esta abordagem sistemática ajuda a definir requisitos e estratégias de conceção. Reveja essa metodologia quando enfrentar escolhas incertas para se manter alinhado com os objetivos gerais da carga de trabalho. Ele também fornece uma estrutura para colaborar com as partes interessadas para justificar decisões técnicas e incorporar o feedback do cliente para melhoria contínua.
✔ Prossiga para Princípios de Design para ver como a metodologia de design se alinha com os pilares principais do Framework Well-Architected. Considere a evolução do crescimento. Avaliar os princípios subjacentes a todos os pilares coletivamente, incluindo as compensações.
✔ Concentre-se nas áreas de design que têm o maior efeito na sua solução. Cada área inclui considerações e recomendações para guiá-lo através das decisões de design.
✔ Use a Ferramenta de Revisão de Avaliação para avaliar a prontidão da sua carga de trabalho otimizada de IA em produção.
Padrão de arquitetura típico e áreas de design
O diagrama a seguir ilustra como os dados fluem através do sistema desde a coleta inicial até a interação do usuário final.
A arquitetura destaca a integração de diferentes componentes para permitir o processamento eficiente de dados, otimização de modelos e implantação de aplicativos em tempo real em soluções orientadas por IA. Ele inclui módulos como fontes de dados, processamento de dados, treinamento de modelos, implantação de modelos e interfaces de usuário.
A tabela a seguir descreve algumas das principais áreas de design relacionadas a esse padrão.
Estruturar áreas |
---|
de conceção de aplicações: saiba mais sobre considerações exclusivas para tarefas de IA que podem ter um efeito significativo nas tuas normas atuais de conceção de aplicações. |
Plataforma de aplicativos: determine as melhores plataformas a serem usadas para dar suporte a funções de carga de trabalho de IA, como hospedagem de modelos, treinamento de modelos e inferência. |
Design de dados de treino: Projetar estratégias para a ingestão, pré-processamento, retenção e governança de modo a lidar com os dados de treino do modelo. |
Projeto de dados de aterramento: Projete estratégias para otimizar a capacidade de pesquisa e recuperação, ao mesmo tempo em que atende aos requisitos de segurança e conformidade para seus dados de aterramento. |
Plataforma de dados: Determine a melhor plataforma de hospedagem para lidar com grandes quantidades e potencialmente muitos formatos de dados que sua carga de trabalho usa. |
Operações de aprendizado de máquina e operações de IA generativa: Estabeleça práticas modernas de DevOps para dar suporte às suas funções e sistemas de aprendizado de máquina ou IA generativa. |
Operações de carga de trabalho: Modernize suas práticas operacionais com novas abordagens e adicione funções e treinamento especializados. |
Teste e avaliação: Desenvolver estratégias de teste e avaliação para medir características como precisão, sensibilidade, sensibilidade e especificidade por meio de métricas direcionadas para cargas de trabalho de IA. |
Workload personas: Entenda como as personas estão envolvidas no ciclo de vida completo da sua carga de trabalho de IA para ajudar a garantir que a sua equipa seja totalmente capaz de a criar e apoiar. |
de IA responsável: preste especial atenção à experiência do usuário e às implicações éticas de lançar sua solução de IA para o público. A IA traz oportunidades incríveis para novos produtos e serviços, mas também acarreta um grau considerável de risco. |
Gorjeta
Cada decisão arquitetônica envolve uma série de considerações e um conjunto de compromissos reconhecidos que equilibram diferentes aspetos da estrutura. Essas compensações são indicadas por este ícone .