Limiti dei servizi in Azure AI Search
I limiti massimi per archiviazione, carichi di lavoro e quantità di indici e altri oggetti dipendono dal piano tariffario scelto per Azure AI Search: Gratuito, Basic, Standard o Ottimizzato per l’archiviazione.
Il pianoGratuito è un servizio condiviso multi-tenant fornito con la sottoscrizione di Azure.
Il piano Basic fornisce risorse di calcolo dedicate per i carichi di lavoro di produzione su scala più ridotta, ma condivide alcune infrastrutture di rete con altri tenant.
Il piano Standard prevede computer dedicati con maggiore capacità di elaborazione e archiviazione a ogni livello. Il piano Standard è disponibile in quattro livelli: S1, S2, S3 ed S3 HD. S3 Alta densità (S3 HD) è progettato per configurazioni multi-tenancy e grandi quantità di indici di dimensioni ridotte (3.000 indici per ogni servizio). S3 HD non fornisce la funzionalità dell'indicizzatore e l'inserimento dei dati deve sfruttare le API che eseguono il push dei dati dall'origine all'indice.
Il piano Ottimizzato per l'archiviazione viene eseguito su computer dedicati con una maggiore quantità totale di archiviazione, larghezza di banda di archiviazione e memoria rispetto al piano Standard. Questo piano è destinato agli indici di grandi dimensioni e a modifica lenta. Il piano Ottimizzato per l'archiviazione comprende due livelli: L1 e L2.
Limiti delle sottoscrizioni
È possibile creare più servizi di ricerca fatturabili (Basic e superiori), fino al numero massimo di servizi consentiti a ogni livello, per area. Ad esempio, è possibile creare fino a 16 servizi al livello Basic e altri 16 servizi nel livello S1 all'interno della stessa sottoscrizione e area. È quindi possibile creare altri 16 servizi Basic in un'altra area per un totale combinato di 32 servizi Basic nella stessa sottoscrizione. Per altre informazioni sui livelli, vedere Scegliere un livello (o SKU) per Azure AI Search.
È possibile aumentare i limiti massimi del servizio su richiesta. Se sono necessari più servizi nell’ambito della stessa sottoscrizione, inviare una richiesta di supporto.
Conto risorse | Gratuito 1 | Di base | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di servizi per area | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Numero massimo di unità di ricerca (SU)2 | N/D | 3 unità di ricerca | 36 unità di ricerca | 36 unità di ricerca | 36 unità di ricerca | 36 unità di ricerca | 36 unità di ricerca | 36 unità di ricerca |
1 È possibile avere un servizio di ricerca gratuito per ogni sottoscrizione di Azure. Il livello gratuito si basa sull'infrastruttura condivisa con altri clienti. Poiché l'hardware non è dedicato, la scalabilità orizzontale non è supportata e l'archiviazione è limitata a 50 MB. Un servizio di ricerca gratuito potrebbe essere eliminato dopo lunghi periodi di inattività per liberare spazio per più servizi.
2 Le unità di ricerca sono unità di fatturazione allocate come replica o come partizione. Sono necessari entrambi. Per altre informazioni sulle combinazioni di unità di ricerca, vedere Stimare e gestire la capacità di un servizio di ricerca.
Limiti del servizio
La tabella seguente illustra il contratto di servizio, i conteggi delle partizioni e i conteggi delle repliche a livello di servizio.
Conto risorse | Gratuito | Di base | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Contratto di servizio (SLA) | No | Sì | Sì | Sì | Sì | Sì | Sì | Sì |
Partizioni | N/D | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliche | N/D | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Il livello Basic supporta tre partizioni e tre repliche, per un totale di nove unità di ricerca (SU) sui nuovi servizi di ricerca creati dopo il 3 aprile 2024. I servizi di base meno recenti sono limitati a una partizione e a tre repliche.
Un servizio di ricerca è soggetto a un limite massimo di archiviazione (dimensioni della partizione moltiplicate per il numero di partizioni) o a un limite rigido per il numero massimo di indici o indicizzatori, a seconda di quale evento si verifica per primo.
I contratti di servizio si applicano ai servizi fatturabili con due o più repliche per i carichi di lavoro di query o a tre o più repliche per carichi di lavoro di query e indicizzazione. Il numero di partizioni non è un fattore di cui viene tenuto conto ai fini del contratto di servizio. Per altre informazioni, vedere Affidabilità in Azure AI Search.
I servizi gratuiti non hanno partizioni o repliche fisse e condividono risorse con altri sottoscrittori.
Archiviazione della partizione (GB)
I limiti di archiviazione per servizio variano in base a due fattori: data di creazione del servizio e area. Esistono limiti più elevati per i servizi più recenti nella maggior parte delle aree supportate.
Questa tabella illustra l'avanzamento dell'aumento della quota di archiviazione in GB nel tempo. Le partizioni con capacità superiore sono state portate online a partire da aprile 2024, nelle aree elencate nelle note a piè di pagina. Una capacità superiore è limitata ai nuovi servizi di ricerca. Al momento, non è disponibile alcun aggiornamento sul posto.
Data di creazione servizio | Di base | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Prima del 3 aprile 2024 | 2 | 25 | 100 | 200 | 1.024 | 2.048 |
Dal 3 aprile 2024 al 17 maggio 2024 1 | 15 | 160 | 512 | 1.024 | 1.024 | 2.048 |
Dopo il 17 maggio 2024 2 | 15 | 160 | 512 | 1.024 | 2.048 | 4.096 |
1 Archiviazione con capacità superiore per Basic, S1, S2, S3 in queste aree. America:Brasile meridionale, Canada centrale, Canada orientale, Stati Uniti orientali, Stati Uniti orientali 2Stati Uniti centrali, Stati Uniti centro-settentrionali, Stati Uniti centro-meridionali, Stati Uniti occidentali, Stati Uniti occidentali 2, Stati Uniti occidentali 3, Stati Uniti centro-occidentali. Europa: Francia centrale. Italia settentrionale, Europa settentrionale, Norvegia orientale, Polonia centrale, Svizzera settentrionale, Svezia centrale, Regno Unito meridionale, Regno Unito occidentale. Medio Oriente: Emirati Arabi Uniti settentrionali. Africa: Sudafrica settentrionale. Asia Pacifico: Australia East, Australia sud-orientale, India centrale, Jio India occidentale, Asia orientale, Asia sudorientale, Giappone orientale, Giappone occidentale, Corea centrale, Corea meridionale.
2 Maggiore capacità di archiviazione per L1 e L2. Più aree offrono capacità più elevata a ogni livello fatturabile. Europa: Germania settentrionale, Germania centro-occidentale, Svizzera occidentale. Azure per enti pubblici: Texas, Arizona, Virginia. Africa: Sudafrica settentrionale. Asia Pacifico: Cina settentrionale 3, Cina orientale 3.
Alcune aree vengono ancora eseguite sull'infrastruttura precedente, soggette ai limiti del 3 aprile. Prima di creare un nuovo servizio, controllare le aree supportate per assicurarsi che l'area selezionata fornisca la capacità aggiuntiva.
Limiti per gli indici
Conto risorse | Gratuito | Basic 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di indici | 3 | 5 o 15 | 50 | 200 | 200 | 1000 per partizione o 3000 per servizio | 10 | 10 |
Numero massimo di campi semplici per indice 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Dimensioni massime per campo vettoriale | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 |
Numero massimo di raccolte complesse per indice | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Numero massimo di elementi in tutte le raccolte complesse per documento3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Profondità massima dei campi complessi | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Numero massimo di suggerimenti per indice | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Numero massimo di profili di punteggio per indice | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Numero massimo di funzioni per profilo | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Dimensioni massime dell’indice 4 | N/D | N/D | N/D | 1,88 TB | 2,34 TB | 100 GB | N/D | N/D |
1 I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indici. Il livello di base è l'unico livello con un limite inferiore di 100 campi per indice.
2Il limite superiore per i campi include sia i campi di primo livello che i sottocampi annidati in una raccolta complessa. Ad esempio, se un indice contiene 15 campi e ha due raccolte complesse con cinque sottocampi ciascuno, il numero dei campi dell'indice è 25. Gli indici con una raccolta di campi molto grandi possono essere lenti. Limitare i campi e gli attributi solo a quelli necessari ed eseguire l'indicizzazione e il test delle query per verificare che le prestazioni siano accettabili.
3 È previsto un limite superiore per gli elementi perché la presenza di un numero elevato di elementi aumenta significativamente lo spazio di archiviazione necessario per l'indice. Un elemento di una raccolta complessa viene considerato un membro di tale raccolta. Si supponga, ad esempio, di avere un documento Hotel con una raccolta Rooms complessa; ogni stanza nella raccolta Rooms sarà considerata un elemento. Durante l'indicizzazione, nel suo complesso il motore di indicizzazione può elaborare in modo sicuro un massimo di 3.000 elementi nel documento. Questo limite è stato introdotto in api-version=2019-05-06
e si applica solo a raccolte complesse e non a raccolte di stringhe o a campi complessi.
4 Nella maggior parte dei livelli, la dimensione massima dell'indice è tutta la risorsa di archiviazione disponibile nel servizio di ricerca. Per S2, S3 e S3 HD, la dimensione massima di qualsiasi indice è il numero specificato nella tabella. Si applica ai servizi di ricerca creati dopo il 3 aprile 2024.
Se il provisioning del servizio viene effettuato in un cluster più potente, è possibile che i limiti massimi risultino diversi. I limiti rappresentano il denominatore comune. Gli indici creati in base alle specifiche precedenti sono portabili tra livelli di servizio equivalenti in qualsiasi area.
Limiti per i documenti
Il numero massimo di documenti per indice è:
- 24 miliardi su Basic, S1, S2, S3
- 2 miliardi su S3 HD
- 288 miliardi di L1
- 576 miliardi di L2
Ogni elemento di una raccolta complessa viene conteggiato come un documento distinto ai fini di questi limiti.
Le dimensioni massime di ogni documento sono di circa 16 megabyte. Le dimensioni del documento sono in realtà un limite per le dimensioni del payload della richiesta API di indicizzazione, ovvero 16 megabyte. Tale payload può essere un singolo documento o un batch di documenti. Per un batch con un solo documento, la dimensione massima del documento è di 16 MB di JSON.
Le dimensioni del documento si applicano all'indicizzazione in modalità push che carica i documenti in un servizio di ricerca. Se si usa un indicizzatore per l'indicizzazione in modalità pull, i file di origine possono essere di qualsiasi dimensione del file, soggetti ai limiti dell'indicizzatore. Per l'indicizzatore BLOB, i limiti delle dimensioni dei file sono maggiori per i livelli più elevati. Ad esempio, il limite S1 è di 128 megabyte, il limite S2 è di 256 megabyte e così via.
Quando si stimano le dimensioni del documento, ricordarsi di indicizzare solo i campi che aggiungono valore agli scenari di ricerca ed escludere tutti i campi di origine che non hanno alcun scopo nelle query che si intende eseguire.
Limiti delle dimensioni dell'indice vettoriale
Quando si indicizzano documenti con campi vettoriali, Azure AI Search costruisce indici vettoriali interni usando i parametri dell'algoritmo forniti. Le dimensioni di questi indici vettoriali sono limitate dalla memoria riservata alla ricerca vettoriale del livello del servizio (o SKU
). Per indicazioni sulla gestione e l'ottimizzazione dell'archiviazione vettoriale, vedere Dimensioni dell'indice vettoriale e mantenersi al di sotto dei limiti.
I limiti dei vettori variano in base a:
Esistono limiti di vettori più elevati a partire da aprile 2024 per in nuovi servizi di ricerca nelle aree che forniscono la capacità aggiuntiva, ovvero la maggior parte.
Questa tabella mostra l'avanzamento dell'aumento della quota vettoriale in GB nel corso del tempo. La quota è per partizione, quindi se si ridimensiona un nuovo servizio Standard (S1) a 6 partizioni, la quota totale del vettore è 35 moltiplicata per 6.
Data di creazione servizio | Di base | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Prima del 1° luglio 2023 1 | 0.5 | 1 | 6 | 12 | 12 | 36 |
Dal 1° luglio 2023 al 3 aprile 20242 | 1 | 3 | 12 | 36 | 12 | 36 |
Dal 3 aprile 2024 al 17 maggio 20243 | 5 | 35 | 150 | 300 | 12 | 36 |
Dopo il 17 maggio 20244 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Limiti iniziali del vettore durante l'anteprima anticipata.
2 Limiti del vettore durante il periodo di anteprima successivo. Tre regioni non hanno i limiti più elevati: Germania centro-occidentale, India occidentale, Qatar centrale.
3 Quota di vettori più elevata in base alle partizioni più grandi per i livelli e le aree supportati.
4 Maggiore quota vettoriale per più livelli e aree in base agli aggiornamenti delle dimensioni della partizione.
Il servizio applica una quota pari alle dimensioni dell'indice vettoriale per ogni partizione nel servizio di ricerca. Ogni partizione aggiuntiva aumenta la quota relativa alle dimensioni dell'indice vettoriale disponibile. Questa quota è un limite rigido che ha lo scopo di garantire che il servizio rimanga integro, il che significa che si verifica un errore in caso di ulteriori tentativi di indicizzazione dopo il superamento del limite. È possibile riavviare l'indicizzazione dopo aver liberato la quota disponibile eliminando alcuni documenti vettoriali o effettuando un ridimensionamento nelle partizioni.
Importante
I limiti dei vettori più elevati sono associati a dimensioni di partizione maggiori. Le aree che vengono ancora eseguite in un’infrastruttura precedente sono soggette ai limiti di luglio-aprile. Rivedere l'elenco delle aree per verificare lo stato dei limiti di archiviazione delle partizioni.
Limiti dell'indicizzatore
Sono previsti tempi di esecuzione massimi per garantire il bilanciamento e la stabilità del servizio nel complesso, ma i set di dati di maggiori dimensioni potrebbero richiedere più tempo di indicizzazione rispetto al massimo consentito. Se un processo di indicizzazione non può essere completato nel tempo massimo consentito, provare a eseguirlo in modo pianificato. L'utilità di pianificazione tiene traccia dello stato di indicizzazione. Se un processo di indicizzazione pianificato viene interrotto per qualsiasi motivo, alla successiva esecuzione pianificata l'indicizzatore può riprendere dall'ultima interruzione.
Conto risorse | Gratuito 1 | Basic 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di indicizzatori | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Numero massimo di origini dati | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Numero massimo di set di competenze 4 | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Carico di indicizzazione massimo per chiamata | 10.000 documenti | Limitato solo da numero massimo di documenti | Limitato solo da numero massimo di documenti | Limitato solo da numero massimo di documenti | Limitato solo da numero massimo di documenti | N/D | Nessun limite | Nessun limite |
Pianificazione minima | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti | 5 minuti |
Tempo massimo di esecuzione 5 | 1-3 o 3-10 minuti | 2 o 24 ore | 2 o 24 ore | 2 o 24 ore | 2 o 24 ore | N/D | 2 o 24 ore | 2 o 24 ore |
Indicizzatore BLOB: dimensioni massime per un BLOB, MB | 16 | 16 | 128 | 256 | 256 | N/D | 256 | 256 |
Indicizzatore BLOB: numero massimo di caratteri di contenuto estratto da un BLOB 6 | 32.000 | 64.000 | 4 milioni | 8 milioni | 16 milioni | N/D | 4 milioni | 4 milioni |
1 I servizi del livello Gratuito hanno un tempo massimo di esecuzione degli indicizzatori di 3 minuti per le origini BLOB e di 1 minuto per tutte le altre origini dati. La chiamata dell'indicizzatore viene eseguita una volta ogni 180 secondi. Per l'indicizzazione tramite intelligenza artificiale che effettua chiamate ai servizi Azure per intelligenza artificiale, i servizi gratuiti sono limitati a 20 transazioni gratuite al giorno per ogni indicizzatore, in cui una transazione viene definita come documento che passa correttamente attraverso la pipeline di arricchimento (suggerimento: è possibile reimpostare un indicizzatore per reimpostarne il conteggio).
2 I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indicizzatori, le origini dati e i set di competenze.
3 I servizi del livello S3 HD non includono il supporto per l'indicizzatore.
4 Numero massimo di 30 competenze per set di competenze.
5 Per quanto riguarda la durata massima di 2 o 24 ore degli indicizzatori: un massimo di 2 ore è la durata più comune e quella che dovrebbe essere pianificata. Si riferisce agli indicizzatori eseguiti nell'ambiente pubblico, usati per eseguire l'offload dell'elaborazione a elevato utilizzo di calcolo e lasciare più risorse per le query. Il limite di 24 ore si applica se si configura l'indicizzatore per l'esecuzione in un ambiente privato usando solo l'infrastruttura allocata al servizio di ricerca. Si noti che alcuni indicizzatori meno recenti non sono in grado di essere eseguiti nell'ambiente pubblico e che tali indicizzatori hanno sempre un intervallo di elaborazione di 24 ore. Se gli indicizzatori non pianificati vengono eseguiti in modo continuo per 24 ore, è possibile presupporre che tali indicizzatori non possano essere migrati all'infrastruttura più recente. Come regola generale, per i processi di indicizzazione che non possono terminare entro due ore, impostare l'indicizzatore su una pianificazione di 5 minuti in modo che l'indicizzatore possa rapidamente selezionare la posizione in cui è stata interrotta. Nel livello Gratuito, il tempo di esecuzione massimo di 3-10 minuti è per gli indicizzatori con set di competenze.
6 Il numero massimo di caratteri è basato su unità di codice Unicode, in particolare UTF-16.
Nota
Come indicato in Limiti per gli indici, gli indicizzatori applicheranno anche il limite superiore di 3000 elementi in tutte le raccolte complesse per documento a partire dalla versione più recente dell'API disponibile a livello generale che supporta i tipi complessi (2019-05-06
). Se l'indicizzatore è stato creato con una versione precedente dell'API, non sarà soggetto a questo limite. Per mantenere la massima compatibilità, un indicizzatore creato con una versione precedente dell'API e quindi aggiornato con una versione dell'API 2019-05-06
o successiva verrà comunque escluso dai limiti. I clienti devono essere consapevoli dell'impatto negativo della presenza di raccolte complesse di grandi dimensioni (come indicato in precedenza) ed è consigliabile creare nuovi indicizzatori con la versione più recente dell'API disponibile a livello generale.
Limiti delle risorse del collegamento privato condiviso
Gli indicizzatori possono accedere ad altre risorse di Azure tramite endpoint privati gestiti tramite l'API della risorsa del collegamento privato condiviso. Questa sezione descrive i limiti associati a questa funzionalità.
Conto risorse | Gratuito | Di base | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Supporto dell'indicizzatore per l’endpoint privato | No | Sì | Sì | Sì | Sì | No | Sì | Sì |
Supporto dell'endpoint privato per gli indicizzatori con un set di competenze 1 | No | No | No | Sì | Sì | No | Sì | Sì |
Supporto dell'endpoint privato per gli indicizzatori con un set di competenze e la vettorizzazione integrata 2 | No | Sì | Sì | Sì | Sì | No | Sì | Sì |
Numero massimo di endpoint privati | N/D | 10 o 30 | 100 | 400 | 400 | N/D | 20 | 20 |
Numero massimo di tipi dirisorse distinti 3 | N/D | 4 | 7 | 15 | 15 | N/D | 4 | 4 |
1 L'arricchimento tramite intelligenza artificiale e l'analisi delle immagini sono attività complesse e usano una quantità estremamente elevata della potenza di elaborazione disponibile. Per questo motivo, le connessioni private vengono disabilitate ai livelli inferiori allo scopo di garantire le prestazioni e la stabilità del servizio di ricerca stesso.
2 Servizi a capacità elevata creati dopo il 3 aprile 2024 nelle aree elencate in Archiviazione partizioni ed esecuzione di carichi di lavoro di vettorizzazione integrati in fase di indicizzazione supportano collegamenti privati condivisi nei livelli a pagamento. Il sistema deve rilevare almeno una competenza che incorpora i dati.
3 Il numero di tipi di risorse distinti viene calcolato come numero di valori univoci groupId
usati in tutte le risorse di collegamento privato condiviso per un determinato servizio di ricerca, indipendentemente dallo stato della risorsa.
Limiti per i sinonimi
Il numero massimo di mappe di sinonimi varia in base al livello. Ogni regola può avere fino a 20 espansioni, dove un'espansione è un termine equivalente. Se ad esempio si specifica "gatto", l'associazione con "gattino", "felino" e "felis" (il genere dei gatti) viene conteggiata come 3 espansioni.
Conto risorse | Gratuito | Di base | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Numero massimo di mappe di sinonimi | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Numero massimo di regole per mappa | 5000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Limiti degli alias di indice
Il numero massimo di alias di indice varia in base alla data di creazione del livello e del servizio. In tutti i livelli, se il servizio è stato creato dopo ottobre 2022, il numero massimo di alias è doppio del numero massimo di indici consentiti. Se il servizio è stato creato prima di ottobre 2022, il limite è il numero di indici consentiti.
Data di creazione del servizio | Gratuito | Di base | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Prima di ottobre 2022 | 3 | 5 o 15 1 | 50 | 200 | 200 | 1000 per partizione o 3000 per servizio | 10 | 10 |
Dopo ottobre 2022 | 6 | 30 | 100 | 400 | 400 | 2000 per partizione o 6000 per servizio | 20 | 20 |
1 I servizi di base creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) sugli indici
Limiti dei dati (arricchimento tramite intelligenza artificiale)
Una pipeline di arricchimento tramite intelligenza artificiale che effettua chiamate a una risorsa di Lingua di Azure AI per il riconoscimento di entità, il collegamento di entità, l'estrazione di frasi chiave, l'analisi del sentiment, il rilevamento della lingua e il rilevamento di informazioni personali è soggetta a limiti dei dati. Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length
. Se è necessario suddividere i dati prima di inviarli all'analizzatore di valutazione, usare la competenza cognitiva di divisione del testo.
Limitazioni
Le richieste API vengono limitate man mano che il sistema si avvicina alla capacità massima. La limitazione delle richieste si comporta in modo diverso per le diverse API. Le API di query (ricerca/suggerimenti/completamento automatico) e le API di indicizzazione vengono limitate in modo dinamico in base al carico del servizio. Le API di indice e l'API delle operazioni del servizio hanno limiti di frequenza per le richieste statiche.
Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:
- Indici di elenco (GET /indexes): 3 al secondo per unità di ricerca
- Ottenere un indice (GET /indexes/myindex): 10 al secondo per unità di ricerca
- Creare un indice (POST /indexes): 12 al minuto per unità di ricerca
- Creare o aggiornare un indice (PUT /indexes/myindex): 6 al secondo per unità di ricerca
- Eliminare un indice (DELETE /indexes/myindex): 12 al minuto per unità di ricerca
Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:
- Statistiche del servizio (GET /servicestats): 4 al secondo per unità di ricerca
Limiti di limitazione della classificazione semantica
Il ranker semantico usa un sistema di accodamento per gestire le richieste simultanee. Questo sytem consente ai servizi di ricerca di ottenere la quantità più elevata di query al secondo possibile. Quando viene raggiunto il limite di richieste simultanee, le richieste aggiuntive vengono inserite in una coda. Se la coda è piena, ulteriori richieste vengono rifiutate e devono essere ritentate.
Le query semantiche totali al secondo variano in base ai fattori seguenti:
- SKU del servizio di ricerca. Sia la capacità della coda che i limiti delle richieste simultanei variano in base alla SKU.
- Numero di unità di ricerca nel servizio di ricerca. Il modo più semplice per aumentare la quantità massima di query di classificazione semantica simultanee consiste nell'aggiungere altre unità di ricerca al servizio di ricerca.
- Capacità del ranker semantico totale disponibile nell'area.
- Quantità di tempo impiegato per gestire una query usando il ranker semantico. Questo varia in base alla quantità di disponibilità del servizio di ricerca.
La tabella seguente descrive i limiti di limitazione del ranker semantico in base allo SKU. In base alla capacità disponibile nell'area, contattare il supporto tecnico per richiedere un aumento del limite.
Conto risorse | Di base | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|
Numero massimo di richieste simultanee (per unità di ricerca) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
Dimensioni massime della coda delle richieste (per unità di ricerca) | 4 | 6 | 8 | 8 | 8 | 8 | 8 |
Limiti delle richieste API
Ad eccezione di quanto indicato, le richieste API seguenti si applicano a tutte le interfacce programmabili, inclusi gli SDK di Azure.
- Massimo 16 MB per indicizzazione o richiesta di query durante il push di un payload nel servizio di ricerca 1
- Lunghezza massima dell'URL di 8 KB (si applica solo alle API REST)
- Al massimo 1.000 documenti per ogni batch di carichi, unioni o eliminazioni di indice
- 32 campi al massimo nella clausola $orderby
- Al massimo 100.000 caratteri in una clausola di ricerca
- Il numero massimo di clausole in
search
(espressioni separate da AND o OR) è 1024 - 32.766 byte (32 KB meno 2 byte) di testo con codifica UTF-8 per la dimensione massima del termine di ricerca
- La dimensione massima del termine di ricerca è di 1.000 caratteri per la ricerca con prefisso e la ricerca regex
- La ricerca con caratteri jolly e la ricerca di espressioni regolari sono limitate a un massimo di 1.000 stati durante l'elaborazione da Lucene.
1 In Azure AI Search il corpo di una richiesta è soggetto a un limite massimo di 16 MB, che impone un limite pratico ai contenuti di singoli campi o raccolte non vincolati a limiti teorici. Per altre informazioni sulla composizione dei campi e sulle relative restrizioni, vedere Tipi di dati supportati.
Esistono limiti per le dimensioni e la composizione delle query perché le query non associate possono destabilizzare il servizio di ricerca. In genere, tali query vengono create a livello di codice. Se l'applicazione genera query di ricerca a livello di codice, è consigliabile progettarla in modo che non generi query di dimensioni illimitate.
Limiti delle risposte API
- Al massimo 1,000 documenti restituiti per pagina di risultati della ricerca
- 100 suggerimenti al massimo restituiti per richiesta di API di suggerimento
Limiti delle chiavi API
Le chiavi API vengono usate per l'autenticazione del servizio. Sono disponibili due tipi. Le chiavi amministratore, specificate nell'intestazione della richiesta, consentono l'accesso completo in lettura e scrittura al servizio. Le chiavi di query sono di sola lettura, sono specificate nell'URL e in genere sono distribuite ad applicazioni client.
- 2 chiavi di amministrazione al massimo per ogni servizio
- 50 chiavi di query al massimo per ogni servizio