Governanceempfehlungen für KI-Workloads in der Azure-Infrastruktur (IaaS)
Dieser Artikel enthält Governanceempfehlungen für Organisationen, die KI-Workloads (künstliche Intelligenz) in der Azure-Infrastruktur (Infrastructure-as-a-Service, IaaS) ausführen. Diese Empfehlungen helfen Organisationen beim Aufbau eines strukturierten Frameworks für die Ressourcenverwaltung, Kostenkontrolle, Sicherheit und betriebliche Effizienz. Indem Sie diese Methoden befolgen, können Sie Ihre KI-Workloads verantwortungsvoll skalieren und sicherstellen, dass sie die Ziele im Hinblick auf die Compliance, Sicherheit und Finanzen erfüllen.
Ressourcengovernance
Die Ressourcengovernance legt Regeln und Standards für die Verwaltung von Azure-Ressourcen fest. Durch das Erzwingen von Governancerichtlinien können Organisationen die Konformität sicherstellen, die Ressourcenverwendung standardisieren und die Kosten kontrollieren, wodurch eine verantwortungsvolle Skalierung von KI-Vorgängen ermöglicht wird.
Erzwingen Sie die Verwendung von Tags. Verwenden Sie Azure Policy, um Regeln wie Ressourcenspeicherort, zulässige SKUs und erforderliche Tags zu erzwingen. Erstellen Sie beispielsweise Richtlinien zum Einschränken der Bereitstellung bestimmter kostenintensiver VMs, um Budgets effektiv zu verwalten.
Wenden Sie Governancerichtlinien an, um die Konformität und Standardisierung sicherzustellen. Verwenden Sie Azure Policy, um Regeln wie z. B. Ressourcenspeicherort, zulässige SKUs und erforderliche Tags zu erzwingen. Erstellen Sie beispielsweise Richtlinien zum Einschränken der Bereitstellung bestimmter kostenintensiver VMs, um das Budget zu kontrollieren.
Verwenden Sie Ressourcengruppen für die Lebenszyklusverwaltung. Stellen Sie KI-Ressourcen in Ressourcengruppen mit einem gemeinsamen Lebenszyklus bereit. Ressourcengruppen ermöglichen es Ihnen, Ressourcen gemeinsam bereitzustellen, zu konfigurieren und zu löschen. Sie bieten auch zusätzliche Governance (Richtlinien), Sicherheit (rollenbasierte Zugriffssteuerung, RBAC) und Kostengrenzen (Budget).
Standardisieren Sie Namenskonventionen. Implementieren Sie eine standardisierte Namenskonvention für KI-Ressourcen. Diese Vorgehensweise verbessert die Nachverfolgung und Verwaltung. Folgen Sie den Benennungsregeln und Einschränkungen für jede Azure-Ressource, und verwenden Sie die empfohlenen Abkürzungen, da für viele Ressourcen Einschränkungen bezüglich der Namenslänge gelten.
Steuern Sie Infrastructure-as-Code. Verwenden Sie Microsoft Defender for Cloud, um die Sicherheit von Infrastructure-as-Code (IaC) zu überwachen und zu erzwingen. Dieses Tool hilft bei der Erkennung von IaC-Fehlkonfigurationen und gewährleistet sichere Bereitstellungen.
Kostenverwaltung
Die Kostenverwaltung dient zum Überwachen und Kontrollieren der Ausgaben im Zusammenhang mit KI-Workloads in Azure. Eine effektive Kostenverwaltung ermöglicht es Organisationen, Budgets festzulegen, Ausgaben nachzuverfolgen und die finanzielle Nachhaltigkeit von KI-Projekten zu gewährleisten.
Verwenden Sie Tags, um Kosten zuzuordnen. Konfigurieren Sie eine Azure Policy-Definition, um das Tagging für Ressourcen zu erzwingen. Verwenden Sie Tags, um Ressourcen nach Projekt, Kostenstelle, Umgebung und Besitzer zu kategorisieren und so eine bessere Verwaltung und Abrechnung zu ermöglichen.
Verwenden Sie die Tagvererbung. Verwenden Sie die Tagvererbung in Cost Management + Billing, um Abrechnungs-, Ressourcengruppen- und Abonnementtags auf Datensätze zur Nutzung untergeordneter Ressourcen anzuwenden.
Verwalten Sie Abrechnungskonten. Verwenden Sie Microsoft Billing, um Abrechnungskonten zu überwachen und Rechnungen zu verarbeiten. Weisen Sie jedem KI-Projekt oder -Team ein Abrechnungskonto zu, um die genaue Nachverfolgung der Ausgaben zu unterstützen.
Überwachen Sie die Kosten. Verwenden Sie Azure Cost Management + Billing, um Budgetwarnungen, Warnungen für Kostenanomalien und geplante Warnungen einzurichten. Diese Art der Kostenüberwachung hilft Organisationen, ihre Finanzdisziplin zu wahren.
Zeigen Sie Ausgabenmuster an. Verwenden Sie die Azure-Kostenanalyse, um Ausgabenmuster regelmäßig zu überprüfen. Dieser Prozess identifiziert Trends und zeigt Bereiche auf, in denen Einsparungen möglich sind, insbesondere bei der VM-Nutzung.
Lassen Sie die Verwendung bestimmter VM-SKUs zu. Verwenden Sie Azure Policy, um nur die VḾ-SKUs zuzulassen, die Ihrem KI-Budget entsprechen. Die integrierte Richtliniendefinition Zulässige SKUs für virtuelle Computer kann diese Kontrolle erzwingen.
Ziehen Sie die automatische Skalierung in Betracht. Verwenden Sie eine VM-Skalierungsgruppe, um die Anzahl von VMs basierend auf dem Bedarf dynamisch anzupassen und so die Kosten zu optimieren.
Konfigurieren Sie das automatische Herunterfahren von VMs. Verwenden Sie das Feature zum automatischen Herunterfahren, um VMs außerhalb der Geschäftszeiten herunterzufahren und unnötige Kosten zu vermeiden.
Sicherheitsgovernance
Die Sicherheitsgovernance trägt dem Bedarf an stabilen Schutzmaßnahmen für KI-Workloads Rechnung. Durch die Implementierung von Sicherheitsrichtlinien und Zugriffssteuerungen können Organisationen sensible Daten und Ressourcen schützen. Diese Maßnahmen reduzieren Risiken und unterstützen eine sichere KI-Umgebung in Azure.
Integrieren Sie Microsoft Entra ID. Verwenden Sie Microsoft Entra ID, um Funktionen für die zentralisierte Identitätsverwaltung und einmaliges Anmelden (Single Sign-On, SSO) für KI-Workloads bereitzustellen.
Implementieren Sie unterschiedliche Zugriffssteuerungen für jede Umgebung. Beschränken Sie die Identität jeder Bereitstellungspipeline auf die zugewiesene Umgebung, um das Risiko versehentlicher Bereitstellungen zu verringern.
Aktivieren Sie Azure Defender. Aktivieren Sie Azure Defender, um von erweitertem Bedrohungsschutz zu profitieren. Azure Defender verbessert die Sicherheit für Workloads (einschließlich VMs, Speicherkonten und Datenbanken) und fördert so einen stabilen Sicherheitsstatus für KI-Workloads.
Betriebliche Governance
Die betriebliche Governance gewährleistet eine konsistente Überwachung und Verwaltung von KI-Workloads. Mithilfe von Tools für die Überwachung, Warnungen und automatisierten Bereitstellungen können Organisationen die Systemintegrität aufrechthalten, Probleme frühzeitig erkennen und die betriebliche Effizienz verbessern, was zu zuverlässigen und stabilen KI-Vorgängen beiträgt.
Stellen Sie Überwachungs-Agents bereit. Stellen Sie sicher, dass Azure Monitor-Agents standardmäßig für VMs, Azure Virtual Machine Scale Sets und mit Azure Arc verbundene Server bereitgestellt werden. Verbinden Sie sie mit einem zentralen Log Analytics-Arbeitsbereich im Verwaltungsabonnement.
Konfigurieren von Warnungen. Aktivieren Sie empfohlene Benachrichtigungsregeln, um Benachrichtigungen über Metrikabweichungen zu erhalten.
Verwenden Sie eine CI/CD-Pipeline. Implementieren Sie Continuous Integration und Continuous Delivery (CI/CD), um Codetests und die Bereitstellung in verschiedenen Umgebungen zu automatisieren.