Dela via


Styrningsrekommendationer för AI-arbetsbelastningar i Azure-infrastruktur (IaaS)

Den här artikeln innehåller styrningsrekommendationer för organisationer som kör AI-arbetsbelastningar i Azure-infrastrukturen (IaaS). De här rekommendationerna hjälper organisationer att upprätta ett strukturerat ramverk för resurshantering, kostnadskontroll, säkerhet och driftseffektivitet. Genom att följa dessa metoder kan du skala dina AI-arbetsbelastningar på ett ansvarsfullt sätt och se till att de uppfyller efterlevnads-, säkerhets- och finansiella mål.

Resursstyrning

Resursstyrning upprättar regler och standarder för hantering av Azure-resurser. Genom att tillämpa styrningsprinciper kan organisationer säkerställa efterlevnad, standardisera resursanvändning och kontrollera kostnader som stöder ansvarsfull skalning av AI-åtgärder.

  • Framtvinga tagganvändning. Använd Azure Policy för att framtvinga regler som resursplats, tillåtna SKU:er och obligatoriska taggar. Skapa till exempel principer för att begränsa distributionen av vissa virtuella datorer med höga kostnader, vilket hjälper till att hantera budgetar effektivt.

  • Tillämpa styrningsprinciper för att säkerställa efterlevnad och standardisering. Använd Azure Policy för att framtvinga regler som resursplats, tillåtna SKU:er och obligatoriska taggar. Skapa till exempel principer för att begränsa distributionen av vissa virtuella datorer med höga kostnader för att kontrollera budgeten.

  • Använd resursgrupper för livscykelhantering. Distribuera AI-resurser i resursgrupper som delar en gemensam livscykel. Med resursgrupper kan du distribuera, konfigurera och ta bort resurser tillsammans. De ger också extra styrning (princip), säkerhet (RBAC) och kostnadsgränser (budget).

  • Standardisera namngivningskonventioner. Implementera en standardiserad namngivningskonvention för AI-resurser. Den här metoden förbättrar spårning och hantering. Använd namngivningsregler och begränsningar för varje Azure-resurs och följ de rekommenderade förkortningarna, eftersom många resurser ofta har namnlängdsbegränsningar.

  • Styr infrastrukturen som kod. Använd Microsoft Defender för molnet för att övervaka och framtvinga IaC-säkerhet. Det här verktyget hjälper till att identifiera IaC-felkonfigurationer och säkerställer säkra distributioner.

Kostnadshantering

Kostnadshantering övervakar och kontrollerar utgifter relaterade till AI-arbetsbelastningar i Azure. Effektiv kostnadshantering gör det möjligt för organisationer att ange budgetar, spåra utgifter och upprätthålla ekonomisk hållbarhet för AI-projekt.

  • Använd taggar för att allokera kostnader. Konfigurera en Azure Policy-definition för att framtvinga taggning av resurser. Använd taggar för att kategorisera resurser efter projekt, kostnadsställe, miljö och ägare för bättre hantering och fakturering.

  • Använd taggarv. Använd taggarv i Cost Management för att tillämpa taggar för fakturering, resursgrupp och prenumeration på underordnade resursanvändningsposter.

  • Hantera faktureringskonton. Använd Microsoft-fakturering för att övervaka faktureringskonton och hantera fakturor. Tilldela ett faktureringskonto till varje AI-projekt eller team för att underlätta korrekt kostnadsspårning.

  • Övervaka kostnader. Använd Microsoft Cost Management för att ange budgetaviseringar, kostnadsavvikelseaviseringar och schemalagda aviseringar. Övervakning av kostnader på detta sätt hjälper organisationer att upprätthålla finansiell disciplin.

  • Visa utgiftsmönster. Använd Azure Cost Analysis för att använda verktyget för att regelbundet granska utgiftsmönster. Den här processen identifierar trender och visar områden för potentiella besparingar, särskilt i VM-användning.

  • Tillåt specifika SKU:er för virtuella datorer. Använd Azure-principen för att endast tillåta de virtuella datorernas SKU:er som överensstämmer med din AI-budget. Den inbyggda principdefinitionen Tillåtna SKU:er för virtuella datorer kan framtvinga den här kontrollen.

  • Överväg automatisk skalning. Använd en VM-skalningsuppsättning för att dynamiskt justera antalet virtuella datorer baserat på efterfrågan och optimera kostnaderna.

  • Konfigurera automatisk nedskalning av virtuell dator. Använd funktionen autoshutdown för att schemalägga att virtuella datorer stängs av under lediga timmar, vilket minskar onödiga kostnader.

Säkerhetsstyrning

Säkerhetsstyrning åtgärdar behovet av robusta skyddsåtgärder för AI-arbetsbelastningar. Genom att implementera säkerhetsprinciper och åtkomstkontroller kan organisationer skydda känsliga data och resurser. Det minskar risken och stöder en säker AI-miljö i Azure.

  • Integrera med Microsoft Entra ID. Använd Microsoft Entra-ID för centraliserad identitetshantering och funktioner för enkel inloggning (SSO) mellan AI-arbetsbelastningar.

  • Implementera distinkta åtkomstkontroller för varje miljö. Begränsa varje distributionspipelines identitet till den avsedda miljön, vilket minskar risken för oavsiktliga distributioner.

  • Aktivera Azure Defender. Aktivera Azure Defender för avancerat skydd mot hot. Azure Defender förbättrar säkerheten för arbetsbelastningar, inklusive virtuella datorer, lagringskonton och databaser, vilket främjar en robust säkerhetsstatus för AI-arbetsbelastningar.

Driftstyrning

Driftstyrning säkerställer konsekvent övervakning och hantering av AI-arbetsbelastningar. Genom att använda verktyg för övervakning, aviseringar och automatiserade distributioner kan organisationer upprätthålla systemets hälsa, identifiera problem tidigt och förbättra drifteffektiviteten, bidra till tillförlitliga och stabila AI-åtgärder.

  • Distribuera övervakningsagenter. Se till att Azure Monitor-agenter distribueras som standard för virtuella datorer, Azure Virtual Machine Scale Sets och Azure Arc-anslutna servrar. Anslut dem till en central Log Analytics-arbetsyta i hanteringsprenumerationen.

  • Konfigurera aviseringar. Aktivera rekommenderade aviseringsregler för att ta emot meddelanden om måttavvikelser.

  • Använd en CI/CD-pipeline. Implementera kontinuerlig integrering och kontinuerlig leverans (CI/CD) för att automatisera kodtestning och distribution till olika miljöer.

Gå vidare