Limites de service de la recherche Azure AI

Article
01/07/2025

Les limites maximales du stockage, des charges de travail et des quantités d’index et autres objets varient selon que vous créez le service de recherche Azure AI avec les niveaux tarifaires Gratuit, Essentiel , Standard ou À stockage optimisé.

Gratuit est un service partagé multi-locataire qui est fourni avec votre abonnement Azure.
De base : fournit des ressources de calcul dédiées pour des charges de travail de production à plus petite échelle, mais partage une infrastructure réseau avec d’autres locataires.
Le niveau Standard est exécuté sur des ordinateurs dédiés, avec une capacité de stockage et de traitement beaucoup plus grande, et ce, à chaque niveau. Le niveau Standard apparaît dans quatre catégories : S1, S2, S3 et S3 HD. La catégorie S3 HD (S3 High Density) est conçue pour des utilisateurs multiples et de grandes quantités de petits index (3 000 index par service). S3 HD ne fournit pas la fonctionnalité d’indexeur et l’ingestion des données doit tirer parti des API qui envoient (push) les données de la source vers l’index.
Stockage optimisé s’exécute sur des ordinateurs dédiés avec plus de stockage total, de bande passante de stockage et de mémoire que Standard. Ce niveau cible les index volumineux et à variation lente. À stockage optimisé est disponible en deux niveaux : L1 et L2.

Limites d’abonnement

Vous pouvez créer plusieurs services de recherche facturables (de niveau Essentiel et supérieur), dans la limite du nombre maximal de services autorisé à chaque niveau, par région. Par exemple, vous pouvez créer jusqu’à 16 services au niveau Essentiel, et 16 autres services au niveau S1, au sein du même abonnement et de la même région. Vous pouvez ensuite créer 16 services de niveau Essentiel supplémentaires dans une autre région, pour un total combiné de 32 services de niveau Essentiel dans le même abonnement. Si vous souhaitez obtenir plus d’informations sur les niveaux, voir Choisir un niveau (ou SKU) pour Recherche Azure AI.

Les limites de service maximales peuvent être augmentées sur demande. S’il vous faut davantage de services dans le même abonnement, remplissez une demande de support.

Ressource	Gratuit¹	De base	S1	S2	S3	S3 HD	L1	L2
Nombre maximal de services par région	1	16	16	8	6	6	6	6
Nombre maximal d’unités de recherche (SU)²	S/O	3 unités de recherche	36 unités de recherche	36 unités de recherche	36 unités de recherche	36 unités de recherche	36 unités de recherche	36 unités de recherche

¹ Vous pouvez avoir un service de recherche gratuit par abonnement Azure. Le niveau gratuit est basé sur l’infrastructure partagée avec d’autres clients. Étant donné que le matériel n’est pas dédié, le scale-up n’est pas pris en charge et le stockage est limité à 50 Mo. Un service de recherche gratuit peut être supprimé après de longues périodes d’inactivité pour faire de la place à des services supplémentaires.

² Les unités de recherche sont des unités de facturation, allouées en tant que réplicas ou partitions. Vous devez disposer des deux. Pour obtenir plus d’informations sur les combinaisons de SU, consultez Estimer et gérer la capacité d’un service de recherche.

Limites du service

Le tableau suivant couvre les contrats SLA, le nombre de partition et le nombre de réplicas au niveau du service.

Ressource	Gratuit	De base	S1	S2	S3	S3 HD	L1	L2
Contrat de niveau de service (SLA)	Non	Oui	Oui	Oui	Oui	Oui	Oui	Oui
Partitions	S/O	3 ¹	12	12	12	3	12	12
Réplicas	N/A	3	12	12	12	12	12	12

¹ Le niveau Essentiel prend en charge trois partitions et trois réplicas, pour un total de neuf unités de recherche (SU) sur les nouveaux services de recherche créés après le 3 avril 2024. Les services de base plus anciens sont limités à une partition et trois réplicas.

Un service de recherche est soumis à une limite maximale de stockage (taille de partition multipliée par le nombre de partitions) ou à une limite inconditionnelle sur le nombre maximal d’index ou les indexeurs, selon ce qui se produit en premier.

Les contrats de niveau de service (SLA) s’appliquent aux services facturables ayant deux réplicas ou plus pour les charges de travail de requête, ou trois réplicas ou plus pour les charges de travail de requête et d’indexation. Le nombre de partitions n’est pas pris en compte dans les SLA. Pour plus d’informations, consultez Fiabilité dans la Recherche Azure AI.

Les services gratuits n’ont pas de réplicas ou de partitions fixes et partagent des ressources avec d’autres abonnés.

Stockage de partitions (Go)

Les limites de stockage par service varient en fonction de deux choses : la date de création de service et la région. Il existe des limites plus élevées pour les services plus récents dans la plupart des régions prises en charge.

Ce tableau montre la progression des augmentations d’espace de stockage en Go au fil du temps. Des partitions de capacité plus élevées ont été mises en ligne à partir d’avril 2024, dans les régions répertoriées dans les notes de bas de page. La capacité supérieure est limitée aux nouveaux services de recherche. Il n’y a pas de mise à niveau sur place pour l’instant.

Date de création de service	De base	S1	S2	S3/HD	L1	L2
Avant le 3 avril 2024	2	25	100	200	1 024	2 048
Du 3 avril 2024 au 17 mai 2024 ¹	15	160	512	1 024	1 024	2 048
Après le 17 mai 2024 ²	15	160	512	1 024	2 048	4 096
Après le 10 février 2025 ³	15	160	512	1 024	2 048	4 096

¹ Stockage de capacité plus élevée pour les niveaux Essentiel, S1, S2 et S3 dans ces régions. Amériques : Brésil Sud, Canada Centre, Canada Est, USA Est, USA Est 2, USA Centre, USA Centre Nord, USA Centre Sud, USA Ouest, USA Ouest 2, USA Ouest 3, USA Centre-Ouest. Europe : France Centre. Italie Nord, Europe Nord, Norvège Est, Pologne Centre, Suisse Nord, Suède Centre, Royaume-Uni Sud, Royaume-Uni Ouest. Moyen-Orient : Émirats arabes unis Nord. Afrique : Afrique du Sud Nord. Asie-Pacifique : Australie Est, Australie Sud-Est, Inde Centre, Jio Inde Ouest, Asie Est, Asie Sud-Est, Japon Est, Japon Ouest, Corée Centre, Corée Sud.

² Stockage de capacité plus élevé pour L1 et L2. Plus de régions offrent une capacité plus élevée à chaque niveau facturable. Europe : Allemagne Nord, Allemagne Centre-Ouest, Suisse Ouest. Azure Government : Texas, Arizona, Virginie. Afrique : Afrique du Sud Nord. Asie-Pacifique : Chine Nord 3, Chine Est 3.

³ Un stockage de capacité plus élevé est disponible en Europe Ouest.

Quelques régions s’exécutent encore sur une infrastructure plus ancienne, soumise aux limites du 3 avril. Avant de créer un service, vérifiez les régions prises en charge pour vous assurer que votre région de choix fournit la capacité supplémentaire.

Limites d’index

Ressource	Gratuit	De base¹	S1	S2	S3	S3 HD	L1	L2
Nombre maximal d’index	3	5 ou 15	50	200	200	1 000 par partition ou 3 000 par service	10	10
Nombre maximal de champs simples par index ²	1000	100	1000	1 000	1 000	1 000	1 000	1 000
Dimensions maximales par champ vectoriel	4098	4098	4098	4098	4098	4098	4098	4098
Champs de collection complexe par index	40	40	40	40	40	40	40	40
Nombre maximal d’éléments dans toutes les collections complexes par document ³	3000	3000	3000	3000	3000	3000	3000	3000
Profondeur maximale des champs complexes	10	10	10	10	10	10	10	10
Nombre maximal de générateurs de suggestions par index	1	1	1	1	1	1	1	1
Nombre maximal de profils de score par index	100	100	100	100	100	100	100	100
Nombre maximal de fonctions par profil	8	8	8	8	8	8	8	8
Taille maximale d’index ⁴	N/A	N/A	N/A	1,88 To	2,34 To	100 Go	N/A	N/A

¹ Les services de base créés avant décembre 2017 présentent des limites inférieures (5 au lieu de 15) sur les index. Le niveau essentiel est le seul niveau soumis à une limite inférieure de 100 champs par index.

² La limite supérieure des champs comprend à la fois les champs de premier niveau et les sous-champs imbriqués dans une collection complexe. Par exemple, si un index contient 15 champs et a deux collections complexes avec cinq sous-champs chacun, le nombre de champs de votre index est de 25. Les index avec une collection de champs de très grande taille peuvent être lents. Limitez les champs et attributs aux seuls dont vous avez besoin et exécutez l’indexation et le test de requête pour garantir que les performances sont acceptables.

³ Il existe une limite supérieure pour les éléments, car un grand nombre d’entre eux augmente considérablement la capacité de stockage nécessaire à votre index. Un élément d’une collection complexe est défini en tant que membre de cette collection. Supposons, par exemple, qu’un document Hôtel avec une collection complexe de Chambres, chaque espace de la collection Chambres est considéré comme un élément. Pendant l’indexation, le moteur d’indexation peut traiter en toute sécurité un maximum de 3 000 éléments dans l’ensemble du document. Cette limite a été introduite dans api-version=2019-05-06 et s’applique uniquement aux collections complexes, et non aux collections de chaînes ou aux champs complexes.

⁴ Sur la plupart des niveaux, la taille maximale d’index est l’ensemble du stockage disponible sur votre service de recherche. Pour S2, S3 et S3 HD, la taille maximale d’un index est le nombre fourni dans le tableau. S’applique aux services de recherche créés après le 3 avril 2024.

Il se peut que vous trouviez une variation des limites maximales pour le niveau de base si votre service est approvisionné sur un cluster plus puissant. Les limites ici représentent le dénominateur commun. Les index intégrés aux spécifications ci-dessus sont portables sur les niveaux de service équivalents dans n’importe quelle région.

Limites du document

Le nombre maximum de documents par index est :

24 milliards sur Basic, S1, S2, S3
2 milliards sur S3 HD
288 milliards sur L1
576 milliards sur L2

La taille maximale de chaque document est d’environ 16 mégaoctets. La taille du document est en fait une limite de la taille de la charge utile de requête de l’API d’indexation, qui est de 16 mégaoctets. Cette charge utile peut être un document unique ou un lot de documents. Pour un lot comprenant un seul document, la taille maximale du document est de 16 Mo de JSON.

La taille du document s’applique à l’indexation en mode Push qui charge les documents dans un service de recherche. Si vous utilisez un indexeur pour l’indexation en mode Pull, vos fichiers sources peuvent être n’importe quelle taille de fichier, sous réserve de limitesd’indexeur. Pour l’indexeur d’objets blob, les limites de taille de fichier sont plus grandes pour les niveaux supérieurs. Par exemple, la limite S1 est de 128 mégaoctets, la limite S2 est de 256 mégaoctets, et ainsi de suite.

Quand vous estimez la taille du document, rappelez-vous d’indexer seulement les champs qui ajoutent de la valeur à vos scénarios de recherche, et excluez les champs sources qui n’ont pas d’intérêt dans les requêtes que vous prévoyez d’exécuter.

Limite de la taille de l’index vectoriel

Quand vous indexez des documents avec des champs vectoriels, la Recherche Azure AI construit des index vectoriels internes en utilisant les paramètres d’algorithme que vous avez spécifiés. La taille de ces index vectoriels est limitée par la mémoire réservée à la recherche vectorielle pour le niveau de votre service (ou SKU). Pour obtenir des conseils sur la gestion et l’optimisation du stockage vectoriel, consultez Taille d’index vectoriel et respect des limites.

Les limites vectorielles varient en fonction des éléments suivants :

Depuis avril 2024, les limites vectorielles sont plus élevées sur les nouveaux services de recherche dans les régions fournissant la capacité supplémentaire, c’est-à-dire la plupart d’entre elles.

Ce tableau indique la progression des augmentations des quotas de vecteurs en Go au fil du temps. Le quota s’applique à chaque partition. Ainsi, si vous adaptez un nouveau service standard (S1) à 6 partitions, le quota total de vecteurs est de 35 multiplié par 6.

Date de création de service	De base	S1	S2	S3/HD	L1	L2
Avant le 1er juillet 2023¹	0.5	1	6	12	12	36
Du 1er juillet 2023 au 3 avril 2024²	1	3	12	36	12	36
Du 3 avril 2024 au 17 mai 2024³	5	35	150	300	12	36
Après le 17 mai 2024⁴	5	35	150	300	150	300

¹ Limites initiales du vecteur lors de la préversion anticipée.

² Limites du vecteur pendant la dernière période de prévision. Trois régions n’avaient pas de limites plus élevées : Allemagne Centre-Ouest, Inde Ouest, Qatar Central.

³ Quota de vecteurs plus élevé en fonction des partitions les plus grandes pour les régions et les niveaux pris en charge.

⁴ Quota de vecteurs plus élevé pour un plus grand nombre de régions et de niveaux en fonction des mises à jour de la taille des partitions.

Le service applique un quota de taille d’index vectoriel pour chaque partition dans votre service de recherche. Chaque partition supplémentaire que vous ajoutez à votre service augmente le quota de taille d’index vectoriel disponible. Ce quota est une limite stricte pour garantir que votre service reste en bon état, ce qui signifie que d’autres tentatives d’indexation une fois la limite dépassée entraînent un échec. Vous pouvez reprendre l’indexation une fois que vous avez libéré le quota disponible en supprimant certains documents vectoriels ou en effectuant un scale-up dans des partitions.

Important

Les limites vectorielles plus élevées sont liées à des tailles de partition plus grandes. Les régions qui s’exécutent sur une infrastructure plus ancienne sont soumises aux limites de juillet-avril. Consultez la liste des régions pour connaître l’état des limites de stockage de partition.

Limites de l’indexeur

Les durées d’exécution maximales existent pour fournir équilibre et stabilité au service dans son ensemble, mais l’indexation des jeux de données volumineux peut prendre plus de temps que la valeur maximale ne le permet. Si un travail d’indexation ne peut pas être terminé dans le délai maximal autorisé, essayez de l’exécuter selon une planification. Le planificateur effectue le suivi de l’état de l’indexation. Si une tâche d’indexation planifiée est interrompue pour une raison quelconque, à la prochaine exécution planifiée, l’indexeur peut repartir de là où il s’était arrêté.

Ressource	Gratuit¹	De base²	S1	S2	S3	S3 HD³	L1	L2
Nombre maximal d’indexeurs	3	5 ou 15	50	200	200	N/A	10	10
Nombre maximal de sources de données	3	5 ou 15	50	200	200	N/A	10	10
Compétences maximales ⁴	3	5 ou 15	50	200	200	N/A	10	10
Charge d’indexation maximale par appel	10 000 documents	Limité uniquement par le nombre maximal de documents	Limité uniquement par le nombre maximal de documents	Limité uniquement par le nombre maximal de documents	Limité uniquement par le nombre maximal de documents	N/A	Aucune limite	Aucune limite
Planification minimale	5 minutes	5 minutes	5 minutes	5 minutes	5 minutes	5 minutes	5 minutes	5 minutes
Durée maximale d’exécution ⁵	1 à 3 ou 3 à 10 minutes	2 ou 24 heures	2 ou 24 heures	2 ou 24 heures	2 ou 24 heures	N/A	2 ou 24 heures	2 ou 24 heures
Indexeur d’objets blob : taille maximale des objets blob, en Mo	16	16	128	256	256	N/A	256	256
Indexeur d’objets blob : nombre maximal de caractères du contenu extrait d’un objet blob ⁶	32 000	64 000	4 millions	8 millions	16 millions	N/A	4 millions	4 millions

¹ Les services du niveau Gratuit bénéficient d’une durée d’exécution maximale de l’indexeur de 3 minutes pour les sources d’objets blob, et de 1 minute pour toutes les autres sources de données. L’appel de l’indexeur se fait une fois toutes les 180 secondes. Pour l’indexation de l’intelligence artificielle qui appelle les Azure AI services, les services gratuits sont limités à 20 transactions gratuites par indexeur par jour, une transaction étant définie comme un document qui traverse le pipeline d’enrichissement (conseil : vous pouvez réinitialiser un indexeur pour le remettre à zéro).

² Les services de base créés avant décembre 2017 présentent des limites inférieures (5 au lieu de 15) sur les index, les sources de données et les ensembles de compétences.

³ Les services S3 HD ne comprennent pas de prise en charge de l’indexeur.

⁴ Nombre maximal de 30 compétences par group de compétences.

⁵ Concernant la durée maximale de 2 ou 24 heures pour les indexeurs : une durée maximale de 2 heures est la plus courante et c’est ce que vous devez planifier. Il fait référence aux indexeurs qui s’exécutent dans l’environnement public, utilisés pour décharger le traitement gourmand en calcul et laisser plus de ressources pour les requêtes. La limite de 24 heures s’applique si vous configurez l’indexeur pour qu’il s’exécute dans un environnement privé en utilisant uniquement l’infrastructure allouée à votre service de recherche. Notez que certains indexeurs plus anciens ne peuvent pas s’exécuter dans l’environnement public et que ces indexeurs ont toujours une plage de traitement de 24 heures. Si vous avez des indexeurs non planifiés qui s’exécutent en continu pendant 24 heures, vous pouvez supposer que ces indexeurs n’ont pas pu être migrés vers l’infrastructure plus récente. En règle générale, pour les travaux d’indexation qui ne peuvent pas se terminer dans les deux heures, placez l’indexeur sur un programme de 5 minutes afin que l’indexeur puisse rapidement reprendre là où il s’est arrêté. Sur le niveau Gratuit, le temps d’exécution maximal de 3 à 10 minutes est destiné aux indexeurs avec des ensembles de compétences.

⁶ Le nombre maximal de caractères est basé sur les unités de code Unicode, en particulier UTF-16.

Remarque

Comme indiqué dans les limites des index, les indexeurs appliquent également la limite supérieure de 3 000 éléments à toutes les collections complexes par document, en commençant par la dernière version de l’API en disponibilité générale qui prend en charge les types complexes (2019-05-06). Cela signifie que si vous avez créé votre indexeur avec une version antérieure de l’API, vous ne serez pas soumis à cette limite. Pour préserver une compatibilité maximale, un indexeur qui a été créé avec une version antérieure de l’API, puis mis à jour avec une version de l’API 2019-05-06 ou ultérieure, sera toujours exclu des limites. Les clients doivent être conscients de l’impact négatif dans le cas de collections complexes très grandes (comme indiqué précédemment) et nous recommandons vivement de créer les indexeurs avec la dernière version de l’API en disponibilité générale.

Limites de ressource de liaison privée partagée

Les indexeurs peuvent accéder aux autres ressources Azure via des points de terminaison privés gérés via l’API de ressource de liaison privée partagée. Cette section décrit les limites associées à cette fonctionnalité.

Ressource	Gratuit	De base	S1	S2	S3	S3 HD	L1	L2
Prise en charge de l’indexeur de point de terminaison privé	Non	Oui	Oui	Oui	Oui	Non	Oui	Oui
Prise en charge du point de terminaison privé pour les indexeurs avec un ensemble de compétences¹	No	Non	Non	Oui	Oui	Non	Oui	Oui
Prise en charge des points de terminaison privés pour les indexeurs ayant un ensemble de compétences et une vectorisation intégrée ²	Non	Oui	Oui	Oui	Oui	Non	Oui	Oui
Nombre maximal de points de terminaison privés	N/A	10 ou 30	100	400	400	N/A	20	20
Nombre maximal de types de ressources distincts³	S/O	4	7	15	15	N/A	4	4

¹ L’enrichissement par IA et l’analyse d’images sont gourmands en ressources et consomment une quantité disproportionnée de la puissance de traitement disponible. Pour cette raison, les connexions privées sont désactivées sur les niveaux inférieurs pour garantir les performances et la stabilité du service de recherche lui-même.

² Les services à haute capacité créés après le 3 avril 2024 dans les régions listées sous Stockage par partition, et qui exécutent des charges de travail de vectorisation intégrée au moment de l’indexation, prennent en charge les liaisons privées partagées dans les niveaux payants. Le système doit détecter au moins une compétence qui incorpore des données.

³ Le nombre de types de ressources distincts est calculé en tant que nombre de valeurs groupId uniques utilisées dans toutes les ressources de liaison privée partagée pour un service de recherche donné, quel que soit l’état de la ressource.

Limites des synonymes

Le nombre maximal de cartes de synonymes varie en fonction du niveau. Chaque règle peut avoir jusqu’à 20 expansions, où une expansion est un terme equivalvent. Par exemple, pour le mot « chat », l’association avec « minou », « félin » et « felis » (le genre des chats) est comptée comme 3 expansions.

Ressource	Gratuit	De base	S1	S2	S3	S3-HD	L1	L2
Mappages de synonymes maximum	3	3	5	10	20	20	10	10
Nombre maximal de règles par mappage	5 000	20000	20000	20000	20000	20000	20000	20000

Limites des alias d’index

Le nombre maximal d’alias d’index varie selon le niveau et la date de création du service. Dans tous les niveaux, si le service a été créé après octobre 2022, le nombre maximal d’alias est le double du nombre maximal d’index autorisés. Si le service a été créé avant octobre 2022, la limite correspond au nombre d’index autorisés.

Date de création du service	Gratuit	De base	S1	S2	S3	S3-HD	L1	L2
Avant octobre 2022	3	5 ou 15 ¹	50	200	200	1 000 par partition ou 3 000 par service	10	10
Après octobre 2022	6	30	100	400	400	2 000 par partition ou 6 000 par service	20	20

¹ Les services de niveau Essentiel créés avant décembre 2017 ont des limites inférieures (5 au lieu de 15) sur les index

Limites de données (enrichissement de l’IA)

Un pipeline d’enrichissement par IA faisant appel à une ressource Azure AI Language pour la reconnaissance d’entités, la liaison d’entités, l’extraction de phrases clés, l’analyse des sentiments, la détection de la langue et la détection d’informations personnelles est soumis à des limites de données. La taille maximale d’un enregistrement doit être de 50 000 caractères telle que mesurée par String.Length. Si vous avez besoin de découper vos données avant de les envoyer à l’Analyseur des sentiments, utilisez la compétence Fractionnement du texte.

Limitations

Les demandes d’API sont limitées dès que le système s’approche de la capacité maximale. Le comportement de la limitation varie en fonction des API. Les API de requête (recherche/suggestion/saisie semi-automatique) et les API d’indexation se limitent dynamiquement en fonction de la charge du service. Les API d’index et les API d’opérations de service ont des limites de taux de requêtes statiques.

Limites de taux de requêtes statiques pour les opérations liées à un index :

Lister les index (GET /indexes) : 3 par seconde par unité de recherche
Obtenir les index (GET /indexes/myindex) : 10 par seconde par unité de recherche
Créer un index (POST /index) : 12 par minute par unité de recherche
Créer ou mettre à jour les index (PUT /indexes/myindex) : 6 par seconde par unité de recherche
Supprimer un index (DELETE /indexes/myindex) : 12 par minute par unité de recherche

Limites de taux de requêtes statiques pour les opérations liées à un service :

Statistiques de service (GET /servicestats) : 4 par seconde par unité de recherche

Limites de limitation de l’éditeur de classement sémantique

Ranker sémantique utilise un système de mise en file d’attente pour gérer les requêtes simultanées. Ce système permet aux services de recherche d’obtenir le plus grand nombre de requêtes par seconde possible. Lorsque la limite des requêtes simultanées est atteinte, des requêtes supplémentaires sont placées dans une file d’attente. Si la file d’attente est pleine, d’autres demandes sont rejetées et doivent être retentées.

Le nombre total de requêtes de classement sémantique par seconde varie en fonction des facteurs suivants :

Niveau du service de recherche. La capacité de file d’attente et les limites de requête simultanées varient selon le niveau.
Nombre d’unités de recherche dans le service de recherche. La façon la plus simple d’augmenter le nombre maximal de requêtes de classement sémantique simultanées consiste à ajouter plus d’unités de recherche à votre service de recherche.
Capacité totale du ranker sémantique disponible dans la région.
Temps nécessaire pour traiter une requête à l’aide d’un ranker sémantique. Cela varie en fonction de la disponibilité du service de recherche.

Le tableau suivant décrit les limites d'étranglement de l'outil de classement sémantique par niveau, en fonction de la capacité disponible dans la région. Vous pouvez contacter le support technique de Microsoft pour demander une augmentation de limite.

Ressource	De base	S1	S2	S3	S3-HD	L1	L2
Nombre maximal de requêtes simultanées (par unité de recherche)	2	3	4	4	4	4	4
Taille maximale de la file d’attente des requêtes (par unité de recherche)	4	6	8	8	8	8	8

Limites de requête d’API

Il existe des limites sur les requêtes, car les requêtes non liées peuvent déstabiliser votre service de recherche. En général, de telles requêtes sont créées par programmation. Si votre application génère des requêtes de recherche par programmation, nous vous recommandons de la concevoir de façon à ce qu’elle ne génère pas des requêtes d’une taille illimitée.

Des limites sur les charges utiles existent pour des raisons similaires, afin de garantir la stabilité de votre service de recherche. La limite s'applique à l'ensemble de la demande, y compris tous ses composants. Par exemple, si la demande regroupe plusieurs documents ou commandes, l'ensemble de la demande doit tenir dans la limite autorisée.

Si vous devez dépasser une limite prise en charge, vous devez tester votre charge de travail afin de savoir ce que vous devez attendre.

Sauf indication contraire, les demandes d’API suivantes s’appliquent à toutes les interfaces programmables, y compris les Kits de développement logiciel (SDK) Azure.

Général :

La charge utile maximale prise en charge est de 16 Mo pour l'indexation et les requêtes via l'API REST et les SDK.
Longueur maximale de l’URL de 8 Ko (s’applique uniquement aux API REST).

API d’indexation :

1 000 documents maximum pris en charge par lot de charges, de fusions ou de suppressions d’index.

API de requête :

32 champs maximum dans la clause $orderby.
Maximum 100 000 caractères dans une clause de recherche.
Le nombre maximum de clauses dans la recherche est de 3 000.
Limites maximales sur les requêtes de caractères génériques et d’expression régulière, comme appliqué par Lucene. Il limite le nombre de motifs, de variations ou de correspondances à 1 000 cas. Cette limite a pour but d'éviter la surcharge du moteur.

Rechercher des termes :

La taille maximale pris en charge des termes de recherche du texte encodé en UTF-8 est de 32 766 octets (32 Ko moins 2 octets) S'applique à la recherche par mot-clé et à la propriété texte de la recherche vectorielle.
La taille maximale prise en charge des termes de recherche est de 1 000 caractères pour la recherche de préfixe et la recherche par expression régulière.

Limites de réponse d’API

1 000 documents maximum retournés par page de résultats de recherche
100 suggestions maximum retournées par requête d’API de suggestion

Le moteur de recherche retourne 50 résultats par défaut, mais vous pouvez remplacer ce paramètre jusqu’à la limite maximale.

Limites de clés API

Les clés API sont utilisées pour l’authentification de service. Il existe deux types de clé API. Les clés d’administration sont spécifiées dans l’en-tête de la demande et accordent un accès complet en lecture et en écriture au service. Les clés de requête sont en lecture seule, spécifiées dans l’URL et généralement distribuées aux applications clientes.

2 clés administrateur maximum par service
50 clés de requête maximum par service

Partager via