Limiti dei servizi in Azure AI Search

Articolo
01/07/2025

I limiti massimi per archiviazione, carichi di lavoro e quantità di indici e altri oggetti dipendono dal piano tariffario scelto per Azure AI Search: Gratuito, Basic, Standard o Ottimizzato per l’archiviazione.

Il pianoGratuito è un servizio condiviso multi-tenant fornito con la sottoscrizione di Azure.
Il piano Basic fornisce risorse di calcolo dedicate per i carichi di lavoro di produzione su scala più ridotta, ma condivide alcune infrastrutture di rete con altri tenant.
Il piano Standard prevede computer dedicati con maggiore capacità di elaborazione e archiviazione a ogni livello. Il piano Standard è disponibile in quattro livelli: S1, S2, S3 ed S3 HD. S3 Alta densità (S3 HD) è progettato per configurazioni multi-tenancy e grandi quantità di indici di dimensioni ridotte (3.000 indici per ogni servizio). S3 HD non fornisce la funzionalità dell'indicizzatore e l'inserimento dei dati deve sfruttare le API che eseguono il push dei dati dall'origine all'indice.
Il piano Ottimizzato per l'archiviazione viene eseguito su computer dedicati con una maggiore quantità totale di archiviazione, larghezza di banda di archiviazione e memoria rispetto al piano Standard. Questo piano è destinato agli indici di grandi dimensioni e a modifica lenta. Il piano Ottimizzato per l'archiviazione comprende due livelli: L1 e L2.

Limiti delle sottoscrizioni

È possibile creare più servizi di ricerca fatturabili (Basic e superiori), fino al numero massimo di servizi consentiti a ogni livello, per area. Ad esempio, è possibile creare fino a 16 servizi al livello Basic e altri 16 servizi nel livello S1 all'interno della stessa sottoscrizione e area. È quindi possibile creare altri 16 servizi Basic in un'altra area per un totale combinato di 32 servizi Basic nella stessa sottoscrizione. Per altre informazioni sui livelli, vedere Scegliere un livello (o SKU) per Azure AI Search.

È possibile aumentare i limiti massimi del servizio su richiesta. Se sono necessari più servizi nell’ambito della stessa sottoscrizione, inviare una richiesta di supporto.

Conto risorse	Gratuito ¹	Di base	S1	S2	S3	S3 HD	L1	L2
Numero massimo di servizi per area	1	16	16	8	6	6	6	6
Numero massimo di unità di ricerca (SU)²	N/D	3 unità di ricerca	36 unità di ricerca	36 unità di ricerca	36 unità di ricerca	36 unità di ricerca	36 unità di ricerca	36 unità di ricerca

¹ È possibile avere un servizio di ricerca gratuito per ogni sottoscrizione di Azure. Il livello gratuito si basa sull'infrastruttura condivisa con altri clienti. Poiché l'hardware non è dedicato, la scalabilità orizzontale non è supportata e l'archiviazione è limitata a 50 MB. Un servizio di ricerca gratuito potrebbe essere eliminato dopo lunghi periodi di inattività per liberare spazio per più servizi.

² Le unità di ricerca sono unità di fatturazione allocate come replica o come partizione. Sono necessari entrambi. Per altre informazioni sulle combinazioni di unità di ricerca, vedere Stimare e gestire la capacità di un servizio di ricerca.

Limiti del servizio

La tabella seguente illustra il contratto di servizio, i conteggi delle partizioni e i conteggi delle repliche a livello di servizio.

Conto risorse	Gratuito	Di base	S1	S2	S3	S3 HD	L1	L2
Contratto di servizio (SLA)	No	Sì	Sì	Sì	Sì	Sì	Sì	Sì
Partizioni	N/D	3 ¹	12	12	12	3	12	12
Repliche	N/D	3	12	12	12	12	12	12

¹ Il livello Basic supporta tre partizioni e tre repliche, per un totale di nove unità di ricerca (SU) sui nuovi servizi di ricerca creati dopo il 3 aprile 2024. I servizi di base meno recenti sono limitati a una partizione e a tre repliche.

Un servizio di ricerca è soggetto a un limite massimo di archiviazione (dimensioni della partizione moltiplicate per il numero di partizioni) o a un limite rigido per il numero massimo di indici o indicizzatori, a seconda di quale evento si verifica per primo.

I contratti di servizio si applicano ai servizi fatturabili con due o più repliche per i carichi di lavoro di query o a tre o più repliche per carichi di lavoro di query e indicizzazione. Il numero di partizioni non è un fattore di cui viene tenuto conto ai fini del contratto di servizio. Per altre informazioni, vedere Affidabilità in Azure AI Search.

I servizi gratuiti non hanno partizioni o repliche fisse e condividono risorse con altri sottoscrittori.

Archiviazione della partizione (GB)

I limiti di archiviazione per servizio variano in base a due fattori: data di creazione del servizio e area. Esistono limiti più elevati per i servizi più recenti nella maggior parte delle aree supportate.

Questa tabella illustra l'avanzamento dell'aumento della quota di archiviazione in GB nel tempo. Le partizioni con capacità superiore sono state portate online a partire da aprile 2024, nelle aree elencate nelle note a piè di pagina. Una capacità superiore è limitata ai nuovi servizi di ricerca. Al momento, non è disponibile alcun aggiornamento sul posto.

Data di creazione servizio	Di base	S1	S2	S3/HD	L1	L2
Prima del 3 aprile 2024	2	25	100	200	1.024	2.048
Dal 3 aprile 2024 al 17 maggio 2024 ¹	15	160	512	1.024	1.024	2.048
Dopo il 17 maggio 2024 ²	15	160	512	1.024	2.048	4.096
Dopo il 10 febbraio 2025 ³	15	160	512	1.024	2.048	4.096

¹ Archiviazione con capacità superiore per Basic, S1, S2, S3 in queste aree. America:Brasile meridionale, Canada centrale, Canada orientale, Stati Uniti orientali, Stati Uniti orientali 2Stati Uniti centrali, Stati Uniti centro-settentrionali, Stati Uniti centro-meridionali, Stati Uniti occidentali, Stati Uniti occidentali 2, Stati Uniti occidentali 3, Stati Uniti centro-occidentali. Europa: Francia centrale. Italia settentrionale, Europa settentrionale, Norvegia orientale, Polonia centrale, Svizzera settentrionale, Svezia centrale, Regno Unito meridionale, Regno Unito occidentale. Medio Oriente: Emirati Arabi Uniti settentrionali. Africa: Sudafrica settentrionale. Asia Pacifico: Australia East, Australia sud-orientale, India centrale, Jio India occidentale, Asia orientale, Asia sudorientale, Giappone orientale, Giappone occidentale, Corea centrale, Corea meridionale.

² Maggiore capacità di archiviazione per L1 e L2. Più aree offrono capacità più elevata a ogni livello fatturabile. Europa: Germania settentrionale, Germania centro-occidentale, Svizzera occidentale. Azure per enti pubblici: Texas, Arizona, Virginia. Africa: Sudafrica settentrionale. Asia Pacifico: Cina settentrionale 3, Cina orientale 3.

³ L'archiviazione con capacità superiore è disponibile in Europa occidentale.

Alcune aree vengono ancora eseguite sull'infrastruttura precedente, soggette ai limiti del 3 aprile. Prima di creare un nuovo servizio, controllare le aree supportate per assicurarsi che l'area selezionata fornisca la capacità aggiuntiva.

Limiti per gli indici

Conto risorse	Gratuito	Basic ¹	S1	S2	S3	S3 HD	L1	L2
Numero massimo di indici	3	5 o 15	50	200	200	1000 per partizione o 3000 per servizio	10	10
Numero massimo di campi semplici per indice ²	1000	100	1000	1000	1000	1000	1000	1000
Dimensioni massime per campo vettoriale	4098	4098	4098	4098	4098	4098	4098	4098
Numero massimo di raccolte complesse per indice	40	40	40	40	40	40	40	40
Numero massimo di elementi in tutte le raccolte complesse per documento³	3000	3000	3000	3000	3000	3000	3000	3000
Profondità massima dei campi complessi	10	10	10	10	10	10	10	10
Numero massimo di suggerimenti per indice	1	1	1	1	1	1	1	1
Numero massimo di profili di punteggio per indice	100	100	100	100	100	100	100	100
Numero massimo di funzioni per profilo	8	8	8	8	8	8	8	8
Dimensioni massime dell’indice ⁴	N/D	N/D	N/D	1,88 TB	2,34 TB	100 GB	N/D	N/D

¹ I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indici. Il livello di base è l'unico livello con un limite inferiore di 100 campi per indice.

²Il limite superiore per i campi include sia i campi di primo livello che i sottocampi annidati in una raccolta complessa. Ad esempio, se un indice contiene 15 campi e ha due raccolte complesse con cinque sottocampi ciascuno, il numero dei campi dell'indice è 25. Gli indici con una raccolta di campi molto grandi possono essere lenti. Limitare i campi e gli attributi solo a quelli necessari ed eseguire l'indicizzazione e il test delle query per verificare che le prestazioni siano accettabili.

³ È previsto un limite superiore per gli elementi perché la presenza di un numero elevato di elementi aumenta significativamente lo spazio di archiviazione necessario per l'indice. Un elemento di una raccolta complessa viene considerato un membro di tale raccolta. Si supponga, ad esempio, di avere un documento Hotel con una raccolta Rooms complessa; ogni stanza nella raccolta Rooms sarà considerata un elemento. Durante l'indicizzazione, nel suo complesso il motore di indicizzazione può elaborare in modo sicuro un massimo di 3.000 elementi nel documento. Questo limite è stato introdotto in api-version=2019-05-06 e si applica solo a raccolte complesse e non a raccolte di stringhe o a campi complessi.

⁴ Nella maggior parte dei livelli, la dimensione massima dell'indice è tutta la risorsa di archiviazione disponibile nel servizio di ricerca. Per S2, S3 e S3 HD, la dimensione massima di qualsiasi indice è il numero specificato nella tabella. Si applica ai servizi di ricerca creati dopo il 3 aprile 2024.

Se il provisioning del servizio viene effettuato in un cluster più potente, è possibile che i limiti massimi risultino diversi. I limiti rappresentano il denominatore comune. Gli indici creati in base alle specifiche precedenti sono portabili tra livelli di servizio equivalenti in qualsiasi area.

Limiti per i documenti

Il numero massimo di documenti per indice è:

24 miliardi su Basic, S1, S2, S3
2 miliardi su S3 HD
288 miliardi di L1
576 miliardi di L2

Le dimensioni massime di ogni documento sono di circa 16 megabyte. Le dimensioni del documento sono in realtà un limite per le dimensioni del payload della richiesta API di indicizzazione, ovvero 16 megabyte. Tale payload può essere un singolo documento o un batch di documenti. Per un batch con un solo documento, la dimensione massima del documento è di 16 MB di JSON.

Le dimensioni del documento si applicano all'indicizzazione in modalità push che carica i documenti in un servizio di ricerca. Se si usa un indicizzatore per l'indicizzazione in modalità pull, i file di origine possono essere di qualsiasi dimensione del file, soggetti ai limiti dell'indicizzatore. Per l'indicizzatore BLOB, i limiti delle dimensioni dei file sono maggiori per i livelli più elevati. Ad esempio, il limite S1 è di 128 megabyte, il limite S2 è di 256 megabyte e così via.

Quando si stimano le dimensioni del documento, ricordarsi di indicizzare solo i campi che aggiungono valore agli scenari di ricerca ed escludere tutti i campi di origine che non hanno alcun scopo nelle query che si intende eseguire.

Limiti delle dimensioni dell'indice vettoriale

Quando si indicizzano documenti con campi vettoriali, Azure AI Search costruisce indici vettoriali interni usando i parametri dell'algoritmo forniti. Le dimensioni di questi indici vettoriali sono limitate dalla memoria riservata alla ricerca vettoriale del livello del servizio (o SKU). Per indicazioni sulla gestione e l'ottimizzazione dell'archiviazione vettoriale, vedere Dimensioni dell'indice vettoriale e mantenersi al di sotto dei limiti.

I limiti dei vettori variano in base a:

Esistono limiti di vettori più elevati a partire da aprile 2024 per in nuovi servizi di ricerca nelle aree che forniscono la capacità aggiuntiva, ovvero la maggior parte.

Questa tabella mostra l'avanzamento dell'aumento della quota vettoriale in GB nel corso del tempo. La quota è per partizione, quindi se si ridimensiona un nuovo servizio Standard (S1) a 6 partizioni, la quota totale del vettore è 35 moltiplicata per 6.

Data di creazione servizio	Di base	S1	S2	S3/HD	L1	L2
Prima del 1° luglio 2023¹	0.5	1	6	12	12	36
Dal 1° luglio 2023 al 3 aprile 2024²	1	3	12	36	12	36
Dal 3 aprile 2024 al 17 maggio 2024³	5	35	150	300	12	36
Dopo il 17 maggio 2024⁴	5	35	150	300	150	300

¹ Limiti iniziali del vettore durante l'anteprima anticipata.

² Limiti del vettore durante il periodo di anteprima successivo. Tre regioni non hanno i limiti più elevati: Germania centro-occidentale, India occidentale, Qatar centrale.

³ Quota di vettori più elevata in base alle partizioni più grandi per i livelli e le aree supportati.

⁴ Maggiore quota vettoriale per più livelli e aree in base agli aggiornamenti delle dimensioni della partizione.

Il servizio applica una quota pari alle dimensioni dell'indice vettoriale per ogni partizione nel servizio di ricerca. Ogni partizione aggiuntiva aumenta la quota relativa alle dimensioni dell'indice vettoriale disponibile. Questa quota è un limite rigido che ha lo scopo di garantire che il servizio rimanga integro, il che significa che si verifica un errore in caso di ulteriori tentativi di indicizzazione dopo il superamento del limite. È possibile riavviare l'indicizzazione dopo aver liberato la quota disponibile eliminando alcuni documenti vettoriali o effettuando un ridimensionamento nelle partizioni.

Importante

I limiti dei vettori più elevati sono associati a dimensioni di partizione maggiori. Le aree che vengono ancora eseguite in un’infrastruttura precedente sono soggette ai limiti di luglio-aprile. Rivedere l'elenco delle aree per verificare lo stato dei limiti di archiviazione delle partizioni.

Limiti dell'indicizzatore

Sono previsti tempi di esecuzione massimi per garantire il bilanciamento e la stabilità del servizio nel complesso, ma i set di dati di maggiori dimensioni potrebbero richiedere più tempo di indicizzazione rispetto al massimo consentito. Se un processo di indicizzazione non può essere completato nel tempo massimo consentito, provare a eseguirlo in modo pianificato. L'utilità di pianificazione tiene traccia dello stato di indicizzazione. Se un processo di indicizzazione pianificato viene interrotto per qualsiasi motivo, alla successiva esecuzione pianificata l'indicizzatore può riprendere dall'ultima interruzione.

Conto risorse	Gratuito ¹	Basic ²	S1	S2	S3	S3 HD ³	L1	L2
Numero massimo di indicizzatori	3	5 o 15	50	200	200	N/D	10	10
Numero massimo di origini dati	3	5 o 15	50	200	200	N/D	10	10
Numero massimo di set di competenze ⁴	3	5 o 15	50	200	200	N/D	10	10
Carico di indicizzazione massimo per chiamata	10.000 documenti	Limitato solo da numero massimo di documenti	Limitato solo da numero massimo di documenti	Limitato solo da numero massimo di documenti	Limitato solo da numero massimo di documenti	N/D	Nessun limite	Nessun limite
Pianificazione minima	5 minuti	5 minuti	5 minuti	5 minuti	5 minuti	5 minuti	5 minuti	5 minuti
Tempo massimo di esecuzione ⁵	1-3 o 3-10 minuti	2 o 24 ore	2 o 24 ore	2 o 24 ore	2 o 24 ore	N/D	2 o 24 ore	2 o 24 ore
Indicizzatore BLOB: dimensioni massime per un BLOB, MB	16	16	128	256	256	N/D	256	256
Indicizzatore BLOB: numero massimo di caratteri di contenuto estratto da un BLOB ⁶	32.000	64.000	4 milioni	8 milioni	16 milioni	N/D	4 milioni	4 milioni

¹ I servizi del livello Gratuito hanno un tempo massimo di esecuzione degli indicizzatori di 3 minuti per le origini BLOB e di 1 minuto per tutte le altre origini dati. La chiamata dell'indicizzatore viene eseguita una volta ogni 180 secondi. Per l'indicizzazione tramite intelligenza artificiale che effettua chiamate ai servizi Azure per intelligenza artificiale, i servizi gratuiti sono limitati a 20 transazioni gratuite al giorno per ogni indicizzatore, in cui una transazione viene definita come documento che passa correttamente attraverso la pipeline di arricchimento (suggerimento: è possibile reimpostare un indicizzatore per reimpostarne il conteggio).

² I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indicizzatori, le origini dati e i set di competenze.

³ I servizi del livello S3 HD non includono il supporto per l'indicizzatore.

⁴ Numero massimo di 30 competenze per set di competenze.

⁵ Per quanto riguarda la durata massima di 2 o 24 ore degli indicizzatori: un massimo di 2 ore è la durata più comune e quella che dovrebbe essere pianificata. Si riferisce agli indicizzatori eseguiti nell'ambiente pubblico, usati per eseguire l'offload dell'elaborazione a elevato utilizzo di calcolo e lasciare più risorse per le query. Il limite di 24 ore si applica se si configura l'indicizzatore per l'esecuzione in un ambiente privato usando solo l'infrastruttura allocata al servizio di ricerca. Si noti che alcuni indicizzatori meno recenti non sono in grado di essere eseguiti nell'ambiente pubblico e che tali indicizzatori hanno sempre un intervallo di elaborazione di 24 ore. Se gli indicizzatori non pianificati vengono eseguiti in modo continuo per 24 ore, è possibile presupporre che tali indicizzatori non possano essere migrati all'infrastruttura più recente. Come regola generale, per i processi di indicizzazione che non possono terminare entro due ore, impostare l'indicizzatore su una pianificazione di 5 minuti in modo che l'indicizzatore possa rapidamente selezionare la posizione in cui è stata interrotta. Nel livello Gratuito, il tempo di esecuzione massimo di 3-10 minuti è per gli indicizzatori con set di competenze.

⁶ Il numero massimo di caratteri è basato su unità di codice Unicode, in particolare UTF-16.

Nota

Come indicato in Limiti per gli indici, gli indicizzatori applicheranno anche il limite superiore di 3000 elementi in tutte le raccolte complesse per documento a partire dalla versione più recente dell'API disponibile a livello generale che supporta i tipi complessi (2019-05-06). Se l'indicizzatore è stato creato con una versione precedente dell'API, non sarà soggetto a questo limite. Per mantenere la massima compatibilità, un indicizzatore creato con una versione precedente dell'API e quindi aggiornato con una versione dell'API 2019-05-06 o successiva verrà comunque escluso dai limiti. I clienti devono essere consapevoli dell'impatto negativo della presenza di raccolte complesse di grandi dimensioni (come indicato in precedenza) ed è consigliabile creare nuovi indicizzatori con la versione più recente dell'API disponibile a livello generale.

Limiti delle risorse del collegamento privato condiviso

Gli indicizzatori possono accedere ad altre risorse di Azure tramite endpoint privati gestiti tramite l'API della risorsa del collegamento privato condiviso. Questa sezione descrive i limiti associati a questa funzionalità.

Conto risorse	Gratuito	Di base	S1	S2	S3	S3 HD	L1	L2
Supporto dell'indicizzatore per l’endpoint privato	No	Sì	Sì	Sì	Sì	No	Sì	Sì
Supporto dell'endpoint privato per gli indicizzatori con un set di competenze ¹	No	No	No	Sì	Sì	No	Sì	Sì
Supporto dell'endpoint privato per gli indicizzatori con un set di competenze e la vettorizzazione ^{integrata 2}	No	Sì	Sì	Sì	Sì	No	Sì	Sì
Numero massimo di endpoint privati	N/D	10 o 30	100	400	400	N/D	20	20
Numero massimo di tipi di^{risorse distinti 3}	N/D	4	7	15	15	N/D	4	4

¹ L'arricchimento tramite intelligenza artificiale e l'analisi delle immagini sono attività complesse e usano una quantità estremamente elevata della potenza di elaborazione disponibile. Per questo motivo, le connessioni private vengono disabilitate ai livelli inferiori allo scopo di garantire le prestazioni e la stabilità del servizio di ricerca stesso.

² Servizi a capacità elevata creati dopo il 3 aprile 2024 nelle aree elencate in Archiviazione partizioni ed esecuzione di carichi di lavoro di vettorizzazione integrati in fase di indicizzazione supportano collegamenti privati condivisi nei livelli a pagamento. Il sistema deve rilevare almeno una competenza che incorpora i dati.

³ Il numero di tipi di risorse distinti viene calcolato come numero di valori univoci groupId usati in tutte le risorse di collegamento privato condiviso per un determinato servizio di ricerca, indipendentemente dallo stato della risorsa.

Limiti per i sinonimi

Il numero massimo di mappe di sinonimi varia in base al livello. Ogni regola può avere fino a 20 espansioni, dove un'espansione è un termine equivalente. Se ad esempio si specifica "gatto", l'associazione con "gattino", "felino" e "felis" (il genere dei gatti) viene conteggiata come 3 espansioni.

Conto risorse	Gratuito	Di base	S1	S2	S3	S3-HD	L1	L2
Numero massimo di mappe di sinonimi	3	3	5	10	20	20	10	10
Numero massimo di regole per mappa	5000	20000	20000	20000	20000	20000	20000	20000

Limiti degli alias di indice

Il numero massimo di alias di indice varia in base alla data di creazione del livello e del servizio. In tutti i livelli, se il servizio è stato creato dopo ottobre 2022, il numero massimo di alias è doppio del numero massimo di indici consentiti. Se il servizio è stato creato prima di ottobre 2022, il limite è il numero di indici consentiti.

Data di creazione del servizio	Gratuito	Di base	S1	S2	S3	S3-HD	L1	L2
Prima di ottobre 2022	3	5 o 15 ¹	50	200	200	1000 per partizione o 3000 per servizio	10	10
Dopo ottobre 2022	6	30	100	400	400	2000 per partizione o 6000 per servizio	20	20

¹ I servizi di base creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) sugli indici

Limiti dei dati (arricchimento tramite intelligenza artificiale)

Una pipeline di arricchimento tramite intelligenza artificiale che effettua chiamate a una risorsa di Lingua di Azure AI per il riconoscimento di entità, il collegamento di entità, l'estrazione di frasi chiave, l'analisi del sentiment, il rilevamento della lingua e il rilevamento di informazioni personali è soggetta a limiti dei dati. Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli all'analizzatore di valutazione, usare la competenza cognitiva di divisione del testo.

Limitazioni

Le richieste API vengono limitate man mano che il sistema si avvicina alla capacità massima. La limitazione delle richieste si comporta in modo diverso per le diverse API. Le API di query (ricerca/suggerimenti/completamento automatico) e le API di indicizzazione vengono limitate in modo dinamico in base al carico del servizio. Le API di indice e l'API delle operazioni del servizio hanno limiti di frequenza per le richieste statiche.

Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:

Indici di elenco (GET /indexes): 3 al secondo per unità di ricerca
Ottenere un indice (GET /indexes/myindex): 10 al secondo per unità di ricerca
Creare un indice (POST /indexes): 12 al minuto per unità di ricerca
Creare o aggiornare un indice (PUT /indexes/myindex): 6 al secondo per unità di ricerca
Eliminare un indice (DELETE /indexes/myindex): 12 al minuto per unità di ricerca

Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:

Statistiche del servizio (GET /servicestats): 4 al secondo per unità di ricerca

Limiti di limitazione del ranker semantico

Il ranker semantico usa un sistema di accodamento per gestire le richieste simultanee. Questo sistema consente ai servizi di ricerca di ottenere il maggior numero possibile di query al secondo. Quando viene raggiunto il limite di richieste simultanee, le richieste aggiuntive vengono inserite in una coda. Se la coda è piena, ulteriori richieste vengono rifiutate e devono essere ritentate.

Le query semantiche totali al secondo variano in base ai fattori seguenti:

Livello del servizio di ricerca. Sia la capacità della coda che i limiti delle richieste simultanei variano in base al livello.
Numero di unità di ricerca nel servizio di ricerca. Il modo più semplice per aumentare il numero massimo di query di classificazione semantica simultanee consiste nell'aggiungere altre unità di ricerca al servizio di ricerca.
Capacità del ranker semantico totale disponibile nell'area.
Quantità di tempo impiegato per gestire una query usando il ranker semantico. Questo varia in base alla quantità di disponibilità del servizio di ricerca.

La tabella seguente descrive i limiti di limitazione del rango semantico per livello, soggetti alla capacità disponibile nell'area. È possibile contattare il supporto tecnico Microsoft per richiedere un aumento del limite.

Conto risorse	Di base	S1	S2	S3	S3-HD	L1	L2
Numero massimo di richieste simultanee (per unità di ricerca)	2	3	4	4	4	4	4
Dimensioni massime della coda delle richieste (per unità di ricerca)	4	6	8	8	8	8	8

Limiti delle richieste API

Esistono limiti per le query perché le query non associate possono destabilizzare il servizio di ricerca. In genere, tali query vengono create a livello di codice. Se l'applicazione genera query di ricerca a livello di codice, è consigliabile progettarla in modo che non generi query di dimensioni illimitate.

I limiti per i payload esistono per motivi simili, garantendo la stabilità del servizio di ricerca. Il limite si applica all'intera richiesta, inclusi tutti i relativi componenti. Ad esempio, se la richiesta esegue il batch di diversi documenti o comandi, l'intera richiesta deve rientrare nel limite supportato.

Se è necessario superare un limite supportato, è necessario testare il carico di lavoro in modo da sapere cosa aspettarsi.

Ad eccezione di quanto indicato, le richieste API seguenti si applicano a tutte le interfacce programmabili, inclusi gli SDK di Azure.

Generale:

Il limite massimo di payload supportato è di 16 MB per l'indicizzazione e la richiesta di query tramite l'API REST e gli SDK.
Lunghezza massima dell'URL di 8 KB (si applica solo alle API REST).

API di indicizzazione:

Supporto massimo di 1.000 documenti per batch di caricamenti, merge o eliminazioni di indici.

API di query:

Massimo 32 campi nella clausola $orderby.
Massimo 100.000 caratteri in una clausola di ricerca.
Il numero massimo di clausole nella ricerca è 3.000.
Limiti massimi per le query con caratteri jolly ed espressioni regolari, come applicato da Lucene. Viene limitato il numero di modelli, varianti o corrisponde a 1.000 istanze. Questo limite è previsto per evitare l'overload del motore.

Termini di ricerca:

La dimensione massima supportata del termine di ricerca è di 32.766 byte (32 KB meno 2 byte) di testo con codifica UTF-8. Si applica alla ricerca di parole chiave e alla proprietà text della ricerca vettoriale.
La dimensione massima supportata dei termini di ricerca è di 1.000 caratteri per la ricerca con prefisso e la ricerca regex.

Limiti delle risposte API

Al massimo 1,000 documenti restituiti per pagina di risultati della ricerca
100 suggerimenti al massimo restituiti per richiesta di API di suggerimento

Il motore di ricerca restituisce 50 risultati per impostazione predefinita, ma è possibile eseguire l'override di questo parametro fino al limite massimo.

Limiti delle chiavi API

Le chiavi API vengono usate per l'autenticazione del servizio. Sono disponibili due tipi. Le chiavi amministratore, specificate nell'intestazione della richiesta, consentono l'accesso completo in lettura e scrittura al servizio. Le chiavi di query sono di sola lettura, sono specificate nell'URL e in genere sono distribuite ad applicazioni client.

2 chiavi di amministrazione al massimo per ogni servizio
50 chiavi di query al massimo per ogni servizio

Condividi tramite