Azure API Management-Zielzonenbeschleuniger
Der API Management-Zielzonenbeschleuniger bietet einen Architekturansatz und eine Referenzimplementierung zum Vorbereiten von Zielzonenabonnements für eine skalierbare API Management-Infrastruktur. Die Implementierung entspricht der Architektur und den Best Practices des Cloud Adoption Framework für Azure-Landezonen, mit Fokus auf die Designprinzipien von Landezonen im Unternehmensmaßstab.
Kunden nutzen API Management auf unterschiedliche Weise. Sie können diese Architektur als Entwurfsleitfaden für Greenfield-Implementierungen und als Bewertung für Brownfield-Implementierungen verwenden, die bereits API-Verwaltung verwenden. Sie können die Referenzimplementierung anpassen, um eine Architektur zu erstellen, die Ihrer Arbeitsauslastung entspricht, und Ihre Organisation auf einen Weg zu nachhaltiger Skalierung setzt.
Die bereitgestellte Infrastruktur als Codevorlage (IaC) kann an Ihre Benennungskonventionen angepasst werden, vorhandene Ressourcen wie Azure DevOps-Agents und Azure Key Vault verwenden und auf unterschiedliche Back-Ends erweitern. Sie können beispielsweise Verbindungen zu APIs hinzufügen, die auf Azure-App Service oder Azure Kubernetes Service (AKS) gehostet werden.
Implementierung einer Plattformbasis
Der Landing Zone Beschleuniger für das API-Management geht davon aus, dass eine Plattformgrundlage vorhanden ist. Diese Stiftung/Organisation verwaltet gemeinsame Dienste wie Netzwerk-, Sicherheits-, Identitäts- und Goveranancedienste. Diese Dienste sind erforderlich, um eine Landezone im Unternehmensmaßstab effektiv zu erstellen und zu operationalisieren und sicherzustellen, dass sie erfolgreich implementiert wird. Diese Plattformgrundlage ist nicht obligatorisch, wenn Sie den API-Verwaltungs-Zielzonenbeschleuniger implementieren, aber es übernimmt einen Großteil der Sicherheit und Verwaltung, die zum sicheren Verwalten Ihrer Cloudumgebung erforderlich ist. Falls Sie bereits über eine verfügen, können Sie diesen Schritt überspringen. Weitere Informationen finden Sie in den folgenden Artikeln:
Erste Schritte mit Cloud Adoption Framework-Zielzonen auf Unternehmensebene
Implementieren von Cloud Adoption Framework-Zielzonen auf Unternehmensebene in Azure
Vom API Management-Zielzonenbeschleuniger bereitgestellte Ressourcen
Der Ansatz zur Landungszonen-Beschleunigung bietet mehrere Szenarien und diese Ressourcen zur Unterstützung Ihres Projekts:
Ein modulares Konzept, so dass Umgebungsvariablen individuell angepasst werden können.
Entwurfsrichtlinien zur Unterstützung bei der Bewertung kritischer Entscheidungen.
Architektur der Zielzone
Eine Implementierung, die Folgendes umfasst:
Eine bereitstellungsfähige Referenz, die die API-Verwaltungsbereitstellung mit einer sicheren Basisplankonfiguration ohne Back-Ends und einer Beispiel-API erstellen kann.
Eine von Microsoft genehmigte API-Verwaltungsreferenzimplementierung zum Testen der bereitgestellten Umgebung.
Ein generatives KI-Gatewayszenario, das über die sichere Baseline bereitgestellt wird. Die Bereitstellung stellt Azure OpenAI Service-Endpunkte als Back-Ends bereit und stellt eine clientseitige API bereit, die mehrere Gateway-Offloadingfunktionen verarbeiten kann. Zu den Verantwortlichkeiten gehören die Lastverteilung mehrerer Azure OpenAI-Endpunkte, die Nachverfolgung der Tokennutzung, die Implementierung der adaptiven Ratenbegrenzung und das Verwalten von Spitzen mit nutzungsbasierten Modellen.
Entwurfsrichtlinien
Die folgenden Artikel enthalten Richtlinien zum Erstellen Ihrer Zielzone basierend auf den Designbereichen von Azure-Landezonen:
Beispiel für eine konzeptionelle Referenzarchitektur
Die folgende konzeptionelle Referenzarchitektur ist ein Beispiel, in dem Entwurfsbereiche und bewährte Methoden beschrieben werden.
Diese Architektur besteht aus dem API-Management, das in einem virtuellen Netzwerk im internen Modus bereitgestellt wird und durch ein Anwendungsgateway abgesichert wird.
Szenario des generativen KI-Gateways
Der generative KI-Gateway-Beispielcode beschreibt, wie sie über die API-Verwaltung generierende KI-Ressourcen bereitstellen und mit diesen interagieren. Das Offloading von Gateways ist ein gängiges Entwurfsmuster, wenn Sie mit generativen KI-Modellen interagieren. Weitere Informationen zu diesem Muster finden Sie unter Access Azure OpenAI und anderen Sprachmodellen über ein Gateway. Die Implementierung befindet sich über der API-Verwaltungsbasislinie und enthält private Bereitstellungen von Azure OpenAI-Endpunkten. Sie enthält auch API-Verwaltungsrichtlinien, die speziell auf generative KI-Anwendungsfälle zugeschnitten sind.
Verwenden Sie den Bereitstellungsleitfaden, um private Azure OpenAI-Endpunkte und einen meinungsierten Satz von Richtlinien in der API-Verwaltung bereitzustellen, um Datenverkehr zu diesen Endpunkten zu verwalten. Testen Sie die Richtlinien, indem Sie Anforderungen an das Gateway senden. Sie sollten die bereitgestellten Richtlinienfragmente verwenden oder die Lösung so ändern, dass sie Eigene benutzerdefinierte Richtlinien enthält.
Der empfohlene Ansatz für eine Unternehmensimplementierung besteht darin, mit einer Azure-Zielzone zu beginnen, um sicherzustellen, dass Skalierbarkeit, Governance und Sicherheit den bewährten Methoden des Cloud Adoption Framework entsprechen. Wenn Sie beabsichtigen, Ihre grundlegende Integration in Azure OpenAI in einer Azure-Zielzone zu starten, führen Sie die Schritte in der Azure OpenAI-Basislinie in einer Anwendungslandezone aus.
Bereitstellen des API Management-Zielzonenbeschleunigers
Die Implementierung des Landebereichs-Beschleunigers für API-Verwaltung mit IaC-Vorlagen ist auf GitHub verfügbar.
Nächster Schritt
Informieren Sie sich über Entwurfsüberlegungen für die Identitäts- und Zugriffsverwaltung in Ihren Azure-Zielzonen.