Condividi tramite


Ridimensionamento del gateway applicazione v2 e WAF v2

La scalabilità del gateway applicazione e di WAF può essere configurata nelle due modalità seguenti:

  • Scalabilità automatica: con la scalabilità automatica abilitata, gli SKU v2 del gateway applicazione e di WAF possono essere aumentati o diminuiti in base ai requisiti del traffico dell'applicazione. Questa modalità offre una migliore elasticità all'applicazione ed elimina la necessità di indovinare le dimensioni o il numero di istanze del gateway applicazione. Consente inoltre di ridurre i costi evitando che il gateway venga eseguito al massimo della capacità con provisioning per il carico di traffico massimo previsto. È necessario specificare il numero minimo e, facoltativamente, il numero massimo di istanze. La capacità minima garantisce che il gateway applicazione e WAF v2 non scendano al di sotto del numero minimo di istanze specificato, anche in assenza di traffico. Ogni istanza corrisponde approssimativamente a 10 unità di capacità riservata aggiuntive. "Zero" indica che non è disponibile alcuna capacità riservata ed è prevista esclusivamente la scalabilità automatica. Facoltativamente, è possibile specificare anche un numero massimo di istanze, in modo da garantire che il gateway applicazione non venga aumentato oltre il numero specificato di istanze. Viene addebitata solo la quantità di traffico gestito dal gateway. Il numero di istanze può essere compreso tra 0 e 125. Se non viene specificato, si userà il valore predefinito per il numero massimo di istanze, pari a 10. La scalabilità automatica deve essere sempre abilitata per ridurre al minimo l'impatto di qualsiasi errore di zona.

Nota

Se il numero massimo di istanze viene aggiornato a un valore minore del numero di istanze corrente, la nuova impostazione non avrà effetto immediato. Il valore massimo appena aggiornato verrà applicato solo dopo che un'operazione di riduzione del numero di istanze porta il conteggio corrente al di sotto del numero massimo appena aggiornato. Se l'operazione di riduzione del numero di istanze non si verifica perché le soglie di riduzione della scalabilità automatica non vengono raggiunte, la nuova impostazione massima non verrà applicata.

  • Manuale: è anche possibile scegliere modalità manuale in cui il gateway non esegue la scalabilità automatica. In questa modalità, se si genera più traffico di quanto possa essere gestito dal gateway applicazione o da WAF, potrebbe verificarsi una perdita di traffico. Con la modalità manuale, è obbligatorio specificare il numero di istanze. Il numero di istanze deve essere compreso tra 1 e 125.

Nota

Queste modalità di ridimensionamento non si applicano al gateway applicazione Basic. Il gateway applicazione Basic viene ridimensionato automaticamente fino a un valore stimato di 200 connessioni al secondo, in base a un certificato TLS con chiave RSA a 2048 bit.

Scalabilità automatica e disponibilità elevata

I gateway applicazione Azure vengono sempre distribuiti in una modalità a disponibilità elevata. Il servizio è costituito da più istanze create in base al tipo di configurazione, se la scalabilità automatica è disabilitata, o al carico applicativo, se la scalabilità automatica è disabilitata. Dal punto di vista dell'utente, non si ha necessariamente visibilità sulle singole istanze, ma solo nel servizio gateway applicazione nel suo complesso. Se in un'istanza si verifica un problema e smette di funzionare, il gateway applicazione Azure crea una nuova istanza in modo trasparente.

Anche se si configura la scalabilità automatica con zero istanze minime, il servizio continua a essere a disponibilità elevata, sempre inclusa nel prezzo fisso.

Tuttavia, è importante notare che il provisioning di una nuova istanza può richiedere circa tre-cinque minuti. Comprendere il comportamento di ridimensionamento delle istanze del gateway applicazione è fondamentale per mantenere le prestazioni in carichi variabili. Queste istanze aumentano in gruppi e le dimensioni del gruppo vengono aumentate in modo proattivo quando il numero di istanze corrente è superiore. Questa strategia consente al sistema di gestire in modo efficiente i picchi di carichi di lavoro, impedendo potenziali interruzioni del servizio o rallentamenti. Ogni istanza del gateway applicazione di Azure può gestire fino a 10 unità di capacità. Per ottimizzare le impostazioni di scalabilità automatica, prendere in considerazione i criteri di traffico tipici e impostare le istanze minime di conseguenza per garantire un funzionamento senza problemi.

Per gli eventi di scalabilità orizzontale, il gateway applicazione svuota le connessioni esistenti per 5 minuti nell'istanza soggetta alla rimozione. Dopo 5 minuti, le connessioni esistenti vengono chiuse e l'istanza rimossa. Tutte le nuove connessioni durante o dopo il tempo di ridimensionamento di 5 minuti vengono stabilite in altre istanze esistenti nello stesso gateway.

Passaggi successivi