Condividi tramite


Acceleratore della zona di destinazione API Management di Azure

L'acceleratore di zona di destinazione di Azure Gestione API offre un approccio architetturale e un'implementazione di riferimento per preparare le sottoscrizioni della zona di destinazione per un'infrastruttura Gestione API scalabile. L'implementazione è conforme all'architettura e alle procedure consigliate di Cloud Adoption Framework per le zone di destinazione di Azure con particolare attenzione ai principi di progettazione delle zone di destinazione su scala aziendale.

I clienti adottano Gestione API in vari modi. È possibile usare questa architettura come linee guida di progettazione per le implementazioni di greenfield e come valutazione per le implementazioni brownfield che usano già Gestione API. È possibile adattare l'implementazione di riferimento per produrre un'architettura adatta al carico di lavoro e mettere l'organizzazione in un percorso di scalabilità sostenibile.

Il modello di infrastruttura distribuita come codice (IaC) fornito può essere modificato per adattarsi alle convenzioni di denominazione, usare risorse esistenti come gli agenti Di Azure DevOps e Azure Key Vault ed estendersi a back-end diversi. Ad esempio, è possibile aggiungere connessioni alle API ospitate nel servizio app Azure o servizio Azure Kubernetes (servizio Azure Kubernetes).

Implementare una piattaforma di base

L'acceleratore di zona di destinazione Gestione API presuppone che sia attiva una piattaforma di base. Questa base gestisce servizi condivisi come servizi di rete, sicurezza, identità e governance. Questi servizi sono necessari per costruire e rendere operativa in modo efficace una zona di destinazione su scala aziendale e garantire che venga implementata correttamente. Questa piattaforma di base non è obbligatoria quando si implementa l'acceleratore di zona di destinazione Gestione API, ma gestisce gran parte della sicurezza e della gestione necessarie per gestire in modo sicuro l'ambiente cloud. Se ne è già presente una, è possibile ignorare questo passaggio. Per altre informazioni, vedere gli articoli seguenti:

Elementi forniti dall'acceleratore di zona di destinazione Gestione API

L'approccio dell'acceleratore di zona di destinazione offre più scenari e questi asset per supportare il progetto:

  • Un approccio modulare che consente di personalizzare le variabili di ambiente.

  • Linee guida di progettazione per facilitare la valutazione delle decisioni critiche.

  • Architettura della zona di destinazione.

  • Un'implementazione che include:

    • Riferimento distribuibile che può creare la distribuzione Gestione API con una configurazione di base sicura senza back-end e un'API di esempio.

    • Implementazione di riferimento approvata da Microsoft Gestione API per testare l'ambiente distribuito.

    • Uno scenario di gateway di intelligenza artificiale generativo che viene distribuito sopra la baseline sicura. La distribuzione fornisce endpoint del servizio OpenAI di Azure come back-end e effettua il provisioning di un'API rivolta al client in grado di gestire più funzionalità di offload del gateway. Le responsabilità includono il bilanciamento del carico di più endpoint OpenAI di Azure, il monitoraggio dell'utilizzo dei token, l'implementazione della limitazione della frequenza adattiva e la gestione dei picchi con modelli con pagamento in base al consumo.

Linee guida di progettazione

Gli articoli seguenti forniscono linee guida per creare la zona di destinazione in base alle aree di progettazione delle zone di destinazione di Azure:

Architettura di riferimento concettuale di esempio

L'architettura di riferimento concettuale seguente è un esempio che descrive le aree di progettazione e le procedure consigliate.

Diagramma che mostra l'architettura dell'acceleratore di zona di destinazione Gestione API.

Questa architettura è costituita da Gestione API distribuita in una rete virtuale in modalità interna e viene anteriore da gateway applicazione.

Scenario del gateway di intelligenza artificiale generativo

Il codice di esempio del gateway di intelligenza artificiale generativo descrive come effettuare il provisioning e interagire con le risorse di intelligenza artificiale generative tramite Gestione API. L'offload del gateway è un modello di progettazione comune quando si interagisce con i modelli di intelligenza artificiale generativi. Per altre informazioni su questo modello, vedere Accedere ad Azure OpenAI e ad altri modelli linguistici tramite un gateway. L'implementazione si basa sulla baseline di Gestione API e incorpora distribuzioni private degli endpoint OpenAI di Azure. Include anche criteri di Gestione API specifici per i casi d'uso generativi dell'IA.

Usare la guida alla distribuzione per distribuire endpoint OpenAI di Azure privati e un set di criteri con opinione in Gestione API per gestire il traffico verso questi endpoint. Testare i criteri inviando richieste al gateway. È consigliabile usare i frammenti di criteri forniti o modificare la soluzione per includere criteri personalizzati.

Diagramma che mostra la governance generativa delle risorse di intelligenza artificiale tramite Gestione API.

L'approccio consigliato per un'implementazione aziendale consiste nell'iniziare con una zona di destinazione di Azure per garantire che la scalabilità, la governance e la sicurezza siano allineate alle procedure consigliate di Cloud Adoption Framework. Se si prevede di avviare l'integrazione della baseline con Azure OpenAI all'interno di una zona di destinazione di Azure, seguire la procedura descritta nella baseline di Azure OpenAI in una zona di destinazione dell'applicazione.

Distribuire l'acceleratore di zona di destinazione Gestione API

L'implementazione dell'acceleratore di zona di destinazione Gestione API con i modelli IaC è disponibile in GitHub.

Passaggio successivo

Informazioni sulle considerazioni di progettazione per la gestione delle identità e degli accessi nelle zone di destinazione di Azure.