Compartilhar via


Recomendações de governança para cargas de trabalho de IA na infraestrutura do Azure (IaaS)

Este artigo contém recomendações de governança para organizações que executam cargas de trabalho de IA na infraestrutura do Azure (IaaS). Essas recomendações ajudam as organizações a estabelecer uma estrutura bem projetada para gerenciamento de recursos, controle de custos, segurança e eficiência operacional. Ao seguir estas práticas, você pode dimensionar suas cargas de trabalho de IA com responsabilidade de forma que elas atendam às metas de conformidade, segurança e finanças.

Governança de recursos

A governança de recursos estabelece regras e padrões para gerenciar recursos do Azure. Ao aplicarem políticas de governança, as organizações podem garantir a conformidade, padronizar o uso de recursos e controlar os custos, que dão suporte ao dimensionamento responsável das operações de IA.

  • Aplique o uso de marcações. Use o Azure Policy para aplicar regras como localização de recursos, SKUs permitidos e marcações obrigatórias. Por exemplo, crie políticas para restringir a implantação de determinadas VMs de alto custo, ajudando a gerenciar orçamentos com eficiência.

  • Aplique políticas de governança para garantir a conformidade e a padronização. Use o Azure Policy para aplicar regras como localização de recursos, SKUs permitidos e marcações obrigatórias. Por exemplo, crie políticas para restringir a implantação de determinadas VMs de alto custo para controlar o orçamento.

  • Use grupos de recursos para o gerenciamento do ciclo de vida. Implante recursos de IA em grupos de recursos que compartilham um ciclo de vida comum. Com os grupos de recursos, você implanta, configura e exclui recursos coletivamente. Eles também impõem limites extras de governança (política), segurança (RBAC) e custo (orçamento).

  • Padronize as convenções de nomenclatura. Implemente uma convenção de nomenclatura padronizada para os recursos de IA. Essa prática melhora o rastreamento e o gerenciamento. Use as regras e restrições de nomenclatura para cada recurso do Azure e siga as abreviações recomendadas, pois muitos recursos têm restrições de comprimento de nome.

  • Governe a infraestrutura como código. Use o Microsoft Defender para Nuvem para monitorar e aplicar a segurança da IaC. Essa ferramenta ajuda a detectar configurações incorretas de IaC e concede implantações seguras.

Gerenciamento de custos

O gerenciamento de custos monitora e controla as despesas relacionadas a cargas de trabalho de IA no Azure. O gerenciamento eficiente de custos permite que as organizações definam orçamentos, acompanhem gastos e mantenham a sustentabilidade financeira em projetos de IA.

  • Use marcações personalizadas para alocar custos. Configure uma definição do Azure Policy para aplicar a marcação em recursos. Use marcações para categorizar recursos por projeto, centro de custo, ambiente e proprietário para um gerenciamento e cobrança mais eficientes.

  • Use herança de marcações. Use herança de marcações em Gerenciamento de Custo para aplicar marcações de faturamento, grupo de recursos e assinatura a registros de uso de recursos filhos.

  • Gerencie contas de faturamento. Use o Microsoft Billing para supervisionar contas de faturamento e gerenciar faturas. Atribua uma conta de faturamento a cada projeto ou equipe de IA para facilitar o rastreamento preciso de despesas.

  • Monitore os custos. Use o Gerenciamento de Custos da Microsoft para definir alertas de orçamento, alertas de anomalias de custo e alertas agendados. Monitorar os custos dessa maneira ajuda as organizações a manter a disciplina financeira.

  • Exiba padrões de gastos. Use a ferramenta de Análise de custo do Azure para examinar regularmente os padrões de gastos. Esse processo identifica tendências e revela áreas de possível economia, especialmente no uso da VM.

  • Permita SKUs de máquina virtual específicos. Use o Azure Policy para permitir apenas as SKUs de máquinas virtuais que se alinham ao seu orçamento de IA. A definição de política interna SKUs de máquina virtual permitidos pode aplicar esse controle.

  • Considere o dimensionamento automático. Use um conjunto de dimensionamento de máquinas virtuais para ajustar dinamicamente as contagens de VMs com base na demanda, otimizando os custos.

  • Configure o desligamento automático da VM. Use o recurso de desligamento automático para agendar o desligamento das VMs fora do horário comercial, para reduzir custos desnecessários.

Governança de segurança

A governança de segurança atende à necessidade de medidas de proteção robustas em cargas de trabalho de IA. Ao implementar políticas de segurança e controles de acesso, as organizações podem proteger dados e recursos confidenciais. Ela reduz o risco e ajuda a proteger o ambiente de IA no Azure.

  • Integre ao Microsoft Entra ID. Use o Microsoft Entra ID para o gerenciamento centralizado de identidades e recursos de SSO (logon único) em cargas de trabalho de IA.

  • Implemente controles de acesso distintos para cada ambiente. Limite a identidade de cada pipeline de implantação ao ambiente designado, reduzindo o risco de implantações acidentais.

  • Habilite o Azure Defender. Ative o Azure Defender para proteção avançada contra ameaças. O Azure Defender aumenta a segurança para cargas de trabalho, incluindo máquinas virtuais, contas de armazenamento e bancos de dados, promovendo uma postura de segurança robusta para cargas de trabalho de IA.

Governança operacional

A governança operacional garante monitoramento e gerenciamento consistentes de cargas de trabalho de IA. Ao usar ferramentas para monitoramento, alertas e implantações automatizadas, as organizações podem manter a integridade do sistema, detectar problemas antecipadamente e melhorar a eficiência operacional, o que contribui para operações de IA confiáveis e estáveis.

  • Implante agentes de monitoramento. Verifique se os agentes do Azure Monitor estão implantados por padrão nas máquinas virtuais, Conjuntos de Dimensionamento de Máquinas Virtuais do Azure e servidores Azure Arc conectados. Conecte-os ao workspace central do Log Analytics na assinatura de gerenciamento.

  • Configurar alertas. Habilite as regras de alerta recomendadas para receber notificações de desvios de métrica.

  • Use um pipeline de CI/CD. Implemente a integração contínua e a entrega contínua (CI/CD) para automatizar o teste e a implantação de código em diferentes ambientes.

Próxima etapa