Udostępnij za pośrednictwem


Akcelerator strefy docelowej usługi Azure API Management

Akcelerator strefy docelowej usługi Azure API Management zapewnia podejście architektoniczne i implementację referencyjną w celu przygotowania subskrypcji strefy docelowej do skalowalnej infrastruktury usługi API Management. Implementacja jest zgodna z architekturą i najlepszymi rozwiązaniami przewodnika Cloud Adoption Framework dla stref docelowych platformy Azure, koncentrując się na zasadach projektowania stref docelowych w skali przedsiębiorstwa.

Klienci wdrażają usługę API Management na różne sposoby. Możesz użyć tej architektury jako wskazówek projektowych dotyczących implementacji greenfield i jako oceny implementacji pola brownfield, które już używają usługi API Management. Możesz dostosować implementację referencyjną, aby utworzyć architekturę pasującą do obciążenia i umieścić organizację na ścieżce do zrównoważonej skali.

Udostępniony szablon infrastruktury jako kodu (IaC) można zmodyfikować tak, aby pasował do konwencji nazewnictwa, używać istniejących zasobów, takich jak agenci usługi Azure DevOps i azure Key Vault, i rozszerzać je na różne zaplecza. Można na przykład dodawać połączenia do interfejsów API hostowanych w usłudze aplikacja systemu Azure Service lub Azure Kubernetes Service (AKS).

Implementowanie podstaw platformy

Akcelerator strefy docelowej usługi API Management zakłada, że podstawy platformy są na miejscu. Ta podstawa obsługuje usługi udostępnione, takie jak sieci, zabezpieczenia, tożsamość i usługi ładu. Te usługi są wymagane do efektywnego konstruowania i operacjonalizacji strefy docelowej w skali przedsiębiorstwa i zapewnienia pomyślnego wdrożenia. Ta podstawa platformy nie jest obowiązkowa podczas implementowania akceleratora strefy docelowej usługi API Management, ale obsługuje wiele zabezpieczeń i zarządzania wymaganych do bezpiecznego zarządzania środowiskiem chmury. Jeśli masz go już, możesz pominąć ten krok. Aby uzyskać więcej informacji, zobacz następujące artykuły:

Co zapewnia akcelerator strefy docelowej usługi API Management

Podejście akceleratora strefy docelowej zapewnia wiele scenariuszy i tych zasobów do obsługi projektu:

  • Modułowe podejście umożliwiające dostosowanie zmiennych środowiskowych.

  • Wskazówki dotyczące projektowania ułatwiające ocenę krytycznych decyzji.

  • Architektura strefy docelowej.

  • Implementacja obejmująca następujące elementy:

    • Możliwe do wdrożenia odwołanie, które umożliwia utworzenie wdrożenia usługi API Management z bezpieczną konfiguracją punktu odniesienia bez zaplecza i przykładowego interfejsu API.

    • Implementacja referencyjna usługi API Management zatwierdzona przez firmę Microsoft w celu przetestowania wdrożonego środowiska.

    • Generowanie scenariusza bramy sztucznej inteligencji , który jest wdrażany na podstawie bezpiecznej linii bazowej. Wdrożenie udostępnia punkty końcowe usługi Azure OpenAI jako zaplecza i aprowizuje interfejs API dostępny dla klienta, który może obsługiwać wiele funkcji odciążania bramy. Obowiązki obejmują równoważenie obciążenia wielu punktów końcowych usługi Azure OpenAI, śledzenie użycia tokenów, implementowanie adaptacyjnego ograniczania szybkości i zarządzanie skokami za pomocą modeli płatności zgodnie z rzeczywistym użyciem.

Wytyczne dotyczące projektowania

Poniższe artykuły zawierają wskazówki dotyczące tworzenia strefy docelowej na podstawie obszarów projektowych stref docelowych platformy Azure:

Przykładowa architektura referencyjna koncepcyjna

Poniższa architektura referencyjna koncepcyjna to przykład przedstawiający obszary projektowania i najlepsze rozwiązania.

Diagram przedstawiający architekturę akceleratora strefy docelowej usługi API Management.

Ta architektura składa się z usługi API Management wdrożonej w sieci wirtualnej w trybie wewnętrznym i jest frontonowana przez usługę Application Gateway.

Scenariusz bramy generowania sztucznej inteligencji

Przykładowy kod bramy generowania sztucznej inteligencji opisuje sposób aprowizowania zasobów generacyjnych sztucznej inteligencji i interakcji z nimi za pośrednictwem usługi API Management. Odciążanie bramy jest typowym wzorcem projektowania podczas interakcji z modelami generacyjnymi sztucznej inteligencji. Aby uzyskać więcej informacji na temat tego wzorca, zobacz Access Azure OpenAI and other language models through a gateway (Uzyskiwanie dostępu do usługi Azure OpenAI i innych modeli językowych za pośrednictwem bramy). Implementacja jest oparta na punkcie odniesienia usługi API Management i obejmuje prywatne wdrożenia punktów końcowych usługi Azure OpenAI. Obejmuje ona również zasady usługi API Management dostosowane specjalnie do generowania przypadków użycia sztucznej inteligencji.

Skorzystaj z przewodnika wdrażania, aby wdrożyć prywatne punkty końcowe usługi Azure OpenAI i zagrzany zestaw zasad w usłudze API Management, aby zarządzać ruchem do tych punktów końcowych. Przetestuj zasady, wysyłając żądania do bramy. Należy użyć podanych fragmentów zasad lub zmodyfikować rozwiązanie, aby uwzględnić własne zasady niestandardowe.

Diagram przedstawiający generowanie ładu zasobów sztucznej inteligencji za pośrednictwem usługi API Management.

Zalecaną metodą implementacji przedsiębiorstwa jest rozpoczęcie od strefy docelowej platformy Azure w celu zapewnienia, że skalowalność, ład i zabezpieczenia są zgodne z najlepszymi rozwiązaniami przewodnika Cloud Adoption Framework. Jeśli planujesz rozpocząć integrację linii bazowej z usługą Azure OpenAI w strefie docelowej platformy Azure, wykonaj kroki opisane w temacie Punkt odniesienia usługi Azure OpenAI w strefie docelowej aplikacji.

Wdrażanie akceleratora strefy docelowej usługi API Management

Implementacja akceleratora strefy docelowej usługi API Management z szablonami IaC jest dostępna w witrynie GitHub.

Następny krok

Dowiedz się więcej na temat zagadnień projektowych dotyczących zarządzania tożsamościami i dostępem w strefach docelowych platformy Azure.