Partilhar via


Recomendações de governança para cargas de trabalho de IA na infraestrutura do Azure (IaaS)

Este artigo fornece recomendações de governança para organizações que executam cargas de trabalho de IA na infraestrutura do Azure (IaaS). Essas recomendações ajudam as organizações a estabelecer uma estrutura estruturada para gerenciamento de recursos, controle de custos, segurança e eficiência operacional. Seguindo essas práticas, você pode dimensionar suas cargas de trabalho de IA de forma responsável e garantir que elas atendam às metas de conformidade, segurança e financeiras.

Gestão de recursos

A governança de recursos estabelece regras e padrões para gerenciar recursos do Azure. Ao aplicar políticas de governança, as organizações podem garantir a conformidade, padronizar o uso de recursos e controlar custos, o que dá suporte ao dimensionamento responsável das operações de IA.

  • Impor o uso da tag. Use a Política do Azure para impor regras como localização de recursos, SKUs permitidos e tags obrigatórias. Por exemplo, crie políticas para restringir a implantação de determinadas VMs de alto custo, ajudando a gerenciar orçamentos de forma eficaz.

  • Aplicar políticas de governança para garantir conformidade e padronização. Use a Política do Azure para impor regras como localização de recursos, SKUs permitidos e tags obrigatórias. Por exemplo, crie políticas para restringir a implantação de determinadas VMs de alto custo para controlar o orçamento.

  • Use grupos de recursos para gerenciamento do ciclo de vida. Implante recursos de IA em grupos de recursos que compartilham um ciclo de vida comum. Os grupos de recursos permitem implantar, configurar e excluir recursos coletivamente. Eles também fornecem limites extras de governança (política), segurança (RBAC) e custo (orçamento).

  • Padronizar convenções de nomenclatura. Implemente uma convenção de nomenclatura padronizada para recursos de IA. Esta prática melhora o acompanhamento e a gestão. Use as regras e restrições de nomenclatura para cada recurso do Azure e siga as abreviaturas recomendadas, pois muitos recursos geralmente têm restrições de comprimento de nome.

  • Governe a infraestrutura como código. Use o Microsoft Defender for Cloud para monitorar e aplicar a segurança do Iac. Essa ferramenta ajuda a detetar configurações incorretas do IaC e garante implantações seguras.

Gestão de custos

O gerenciamento de custos monitora e controla despesas relacionadas a cargas de trabalho de IA no Azure. O gerenciamento de custos eficaz permite que as organizações definam orçamentos, rastreiem gastos e mantenham a sustentabilidade financeira para projetos de IA.

  • Use tags para alocar custos. Configure uma definição de Política do Azure para impor a marcação em recursos. Use tags para categorizar recursos por projeto, centro de custo, ambiente e proprietário para melhor gerenciamento e faturamento.

  • Use a herança de tags. Use a herança de tags no Gerenciamento de Custos para aplicar marcas de cobrança, grupo de recursos e assinatura a registros de uso de recursos filho.

  • Gerencie contas de faturamento. Use o Microsoft Billing para supervisionar contas de faturamento e lidar com faturas. Atribua uma conta de faturamento a cada projeto ou equipe de IA para facilitar o rastreamento preciso de despesas.

  • Monitorizar custos. Use o Microsoft Cost Management para definir alertas de orçamento, alertas de anomalia de custo e alertas agendados. Monitorar os custos dessa forma ajuda as organizações a manter a disciplina financeira.

  • Veja os padrões de gastos. Use a análise de custos do Azure para usar a ferramenta para revisar regularmente os padrões de gastos. Esse processo identifica tendências e revela áreas para economias potenciais, especialmente no uso de VMs.

  • Permitir SKUs de máquinas virtuais específicas. Use a política do Azure para permitir apenas as SKUs de máquinas virtuais que se alinham com seu orçamento de IA. A definição de política interna SKUs de máquina virtual permitida pode impor esse controle.

  • Considere o dimensionamento automático. Use um conjunto de dimensionamento de máquina virtual para ajustar dinamicamente as contagens de VM com base na demanda, otimizando os custos.

  • Configure o desligamento automático da VM. Use o recurso de desligamento automático para agendar o desligamento de VMs fora do horário de expediente, reduzindo custos desnecessários.

Governação da segurança

A governança de segurança atende à necessidade de medidas de proteção robustas em cargas de trabalho de IA. Ao implementar políticas de segurança e controles de acesso, as organizações podem proteger dados e recursos confidenciais. Ele reduz o risco e dá suporte a um ambiente de IA seguro no Azure.

  • Integre com o Microsoft Entra ID. Use o Microsoft Entra ID para gerenciamento centralizado de identidades e recursos de logon único (SSO) em cargas de trabalho de IA.

  • Implemente controles de acesso distintos para cada ambiente. Limite a identidade de cada pipeline de implantação ao seu ambiente designado, reduzindo o risco de implantações acidentais.

  • Habilite o Azure Defender. Ative o Azure Defender para proteção avançada contra ameaças. O Azure Defender melhora a segurança para cargas de trabalho, incluindo máquinas virtuais, contas de armazenamento e bancos de dados, promovendo uma postura de segurança robusta para cargas de trabalho de IA.

Governação operacional

A governança operacional garante monitoramento e gerenciamento consistentes das cargas de trabalho de IA. Ao usar ferramentas para monitoramento, alertas e implantações automatizadas, as organizações podem manter a integridade do sistema, detetar problemas precocemente e melhorar a eficiência operacional, contribuindo para operações de IA confiáveis e estáveis.

  • Implante agentes de monitoramento. Certifique-se de que os agentes do Azure Monitor sejam implantados por padrão para máquinas virtuais, Conjuntos de Dimensionamento de Máquina Virtual do Azure e servidores conectados ao Azure Arc. Conecte-os a um espaço de trabalho central do Log Analytics dentro da assinatura de gerenciamento.

  • Configure alertas. Habilite as regras de alerta recomendadas para receber notificações de desvios métricos.

  • Use um pipeline de CI/CD. Implemente integração contínua e entrega contínua (CI/CD) para automatizar o teste de código e a implantação em diferentes ambientes.

Próximo passo