Limites de service de la recherche Azure AI
Les limites maximales du stockage, des charges de travail et des quantités d’index et autres objets varient selon que vous créez le service de recherche Azure AI avec les niveaux tarifaires Gratuit, Essentiel , Standard ou À stockage optimisé.
Gratuit est un service partagé multi-locataire qui est fourni avec votre abonnement Azure.
De base : fournit des ressources de calcul dédiées pour des charges de travail de production à plus petite échelle, mais partage une infrastructure réseau avec d’autres locataires.
Le niveau Standard est exécuté sur des ordinateurs dédiés, avec une capacité de stockage et de traitement beaucoup plus grande, et ce, à chaque niveau. Le niveau Standard apparaît dans quatre catégories : S1, S2, S3 et S3 HD. La catégorie S3 HD (S3 High Density) est conçue pour des utilisateurs multiples et de grandes quantités de petits index (3 000 index par service). S3 HD ne fournit pas la fonctionnalité d’indexeur et l’ingestion des données doit tirer parti des API qui envoient (push) les données de la source vers l’index.
Stockage optimisé s’exécute sur des ordinateurs dédiés avec plus de stockage total, de bande passante de stockage et de mémoire que Standard. Ce niveau cible les index volumineux et à variation lente. À stockage optimisé est disponible en deux niveaux : L1 et L2.
Limites d’abonnement
Vous pouvez créer plusieurs services de recherche facturables (de niveau Essentiel et supérieur), dans la limite du nombre maximal de services autorisé à chaque niveau, par région. Par exemple, vous pouvez créer jusqu’à 16 services au niveau Essentiel, et 16 autres services au niveau S1, au sein du même abonnement et de la même région. Vous pouvez ensuite créer 16 services de niveau Essentiel supplémentaires dans une autre région, pour un total combiné de 32 services de niveau Essentiel dans le même abonnement. Si vous souhaitez obtenir plus d’informations sur les niveaux, voir Choisir un niveau (ou SKU) pour Recherche Azure AI.
Les limites de service maximales peuvent être augmentées sur demande. S’il vous faut davantage de services dans le même abonnement, remplissez une demande de support.
Ressource | Gratuit1 | De base | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Nombre maximal de services par région | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Nombre maximal d’unités de recherche (SU)2 | S/O | 3 unités de recherche | 36 unités de recherche | 36 unités de recherche | 36 unités de recherche | 36 unités de recherche | 36 unités de recherche | 36 unités de recherche |
1 Vous pouvez avoir un service de recherche gratuit par abonnement Azure. Le niveau gratuit est basé sur l’infrastructure partagée avec d’autres clients. Étant donné que le matériel n’est pas dédié, le scale-up n’est pas pris en charge et le stockage est limité à 50 Mo. Un service de recherche gratuit peut être supprimé après de longues périodes d’inactivité pour faire de la place à des services supplémentaires.
2 Les unités de recherche sont des unités de facturation, allouées en tant que réplicas ou partitions. Vous devez disposer des deux. Pour obtenir plus d’informations sur les combinaisons de SU, consultez Estimer et gérer la capacité d’un service de recherche.
Limites du service
Le tableau suivant couvre les contrats SLA, le nombre de partition et le nombre de réplicas au niveau du service.
Ressource | Gratuit | De base | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Contrat de niveau de service (SLA) | Non | Oui | Oui | Oui | Oui | Oui | Oui | Oui |
Partitions | S/O | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Réplicas | N/A | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Le niveau Essentiel prend en charge trois partitions et trois réplicas, pour un total de neuf unités de recherche (SU) sur les nouveaux services de recherche créés après le 3 avril 2024. Les services de base plus anciens sont limités à une partition et trois réplicas.
Un service de recherche est soumis à une limite maximale de stockage (taille de partition multipliée par le nombre de partitions) ou à une limite inconditionnelle sur le nombre maximal d’index ou les indexeurs, selon ce qui se produit en premier.
Les contrats de niveau de service (SLA) s’appliquent aux services facturables ayant deux réplicas ou plus pour les charges de travail de requête, ou trois réplicas ou plus pour les charges de travail de requête et d’indexation. Le nombre de partitions n’est pas pris en compte dans les SLA. Pour plus d’informations, consultez Fiabilité dans la Recherche Azure AI.
Les services gratuits n’ont pas de réplicas ou de partitions fixes et partagent des ressources avec d’autres abonnés.
Stockage de partitions (Go)
Les limites de stockage par service varient en fonction de deux choses : la date de création de service et la région. Il existe des limites plus élevées pour les services plus récents dans la plupart des régions prises en charge.
Ce tableau montre la progression des augmentations d’espace de stockage en Go au fil du temps. Des partitions de capacité plus élevées ont été mises en ligne à partir d’avril 2024, dans les régions répertoriées dans les notes de bas de page. La capacité supérieure est limitée aux nouveaux services de recherche. Il n’y a pas de mise à niveau sur place pour l’instant.
Date de création de service | De base | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Avant le 3 avril 2024 | 2 | 25 | 100 | 200 | 1 024 | 2 048 |
Du 3 avril 2024 au 17 mai 2024 1 | 15 | 160 | 512 | 1 024 | 1 024 | 2 048 |
Après le 17 mai 2024 2 | 15 | 160 | 512 | 1 024 | 2 048 | 4 096 |
1 Stockage de capacité plus élevée pour les niveaux Essentiel, S1, S2 et S3 dans ces régions. Amériques : Brésil Sud, Canada Centre, Canada Est, USA Est, USA Est 2, USA Centre, USA Centre Nord, USA Centre Sud, USA Ouest, USA Ouest 2, USA Ouest 3, USA Centre-Ouest. Europe : France Centre. Italie Nord, Europe Nord, Norvège Est, Pologne Centre, Suisse Nord, Suède Centre, Royaume-Uni Sud, Royaume-Uni Ouest. Moyen-Orient : Émirats arabes unis Nord. Afrique : Afrique du Sud Nord. Asie-Pacifique : Australie Est, Australie Sud-Est, Inde Centre, Jio Inde Ouest, Asie Est, Asie Sud-Est, Japon Est, Japon Ouest, Corée Centre, Corée Sud.
2 Stockage de capacité plus élevé pour L1 et L2. Plus de régions offrent une capacité plus élevée à chaque niveau facturable. Europe : Allemagne Nord, Allemagne Centre-Ouest, Suisse Ouest. Azure Government : Texas, Arizona, Virginie. Afrique : Afrique du Sud Nord. Asie-Pacifique : Chine Nord 3, Chine Est 3.
Quelques régions s’exécutent encore sur une infrastructure plus ancienne, soumise aux limites du 3 avril. Avant de créer un service, vérifiez les régions prises en charge pour vous assurer que votre région de choix fournit la capacité supplémentaire.
Limites d’index
Ressource | Gratuit | De base1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Nombre maximal d’index | 3 | 5 ou 15 | 50 | 200 | 200 | 1 000 par partition ou 3 000 par service | 10 | 10 |
Nombre maximal de champs simples par index 2 | 1000 | 100 | 1000 | 1 000 | 1 000 | 1 000 | 1 000 | 1 000 |
Dimensions maximales par champ vectoriel | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 |
Champs de collection complexe par index | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Nombre maximal d’éléments dans toutes les collections complexes par document 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Profondeur maximale des champs complexes | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Nombre maximal de générateurs de suggestions par index | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Nombre maximal de profils de score par index | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Nombre maximal de fonctions par profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Taille maximale d’index 4 | N/A | N/A | N/A | 1,88 To | 2,34 To | 100 Go | N/A | N/A |
1 Les services de base créés avant décembre 2017 présentent des limites inférieures (5 au lieu de 15) sur les index. Le niveau essentiel est le seul niveau soumis à une limite inférieure de 100 champs par index.
2 La limite supérieure des champs comprend à la fois les champs de premier niveau et les sous-champs imbriqués dans une collection complexe. Par exemple, si un index contient 15 champs et a deux collections complexes avec cinq sous-champs chacun, le nombre de champs de votre index est de 25. Les index avec une collection de champs de très grande taille peuvent être lents. Limitez les champs et attributs aux seuls dont vous avez besoin et exécutez l’indexation et le test de requête pour garantir que les performances sont acceptables.
3 Il existe une limite supérieure pour les éléments, car un grand nombre d’entre eux augmente considérablement la capacité de stockage nécessaire à votre index. Un élément d’une collection complexe est défini en tant que membre de cette collection. Supposons, par exemple, qu’un document Hôtel avec une collection complexe de Chambres, chaque espace de la collection Chambres est considéré comme un élément. Pendant l’indexation, le moteur d’indexation peut traiter en toute sécurité un maximum de 3 000 éléments dans l’ensemble du document. Cette limite a été introduite dans api-version=2019-05-06
et s’applique uniquement aux collections complexes, et non aux collections de chaînes ou aux champs complexes.
4 Sur la plupart des niveaux, la taille maximale d’index est l’ensemble du stockage disponible sur votre service de recherche. Pour S2, S3 et S3 HD, la taille maximale d’un index est le nombre fourni dans le tableau. S’applique aux services de recherche créés après le 3 avril 2024.
Il se peut que vous trouviez une variation des limites maximales pour le niveau de base si votre service est approvisionné sur un cluster plus puissant. Les limites ici représentent le dénominateur commun. Les index intégrés aux spécifications ci-dessus sont portables sur les niveaux de service équivalents dans n’importe quelle région.
Limites du document
Le nombre maximum de documents par index est :
- 24 milliards sur Basic, S1, S2, S3
- 2 milliards sur S3 HD
- 288 milliards sur L1
- 576 milliards sur L2
Chaque instance d’une collection complexe compte comme un document distinct dans le cadre de ces limites.
La taille maximale de chaque document est d’environ 16 mégaoctets. La taille du document est en fait une limite de la taille de la charge utile de requête de l’API d’indexation, qui est de 16 mégaoctets. Cette charge utile peut être un document unique ou un lot de documents. Pour un lot comprenant un seul document, la taille maximale du document est de 16 Mo de JSON.
La taille du document s’applique à l’indexation en mode Push qui charge les documents dans un service de recherche. Si vous utilisez un indexeur pour l’indexation en mode Pull, vos fichiers sources peuvent être n’importe quelle taille de fichier, sous réserve de limitesd’indexeur. Pour l’indexeur d’objets blob, les limites de taille de fichier sont plus grandes pour les niveaux supérieurs. Par exemple, la limite S1 est de 128 mégaoctets, la limite S2 est de 256 mégaoctets, et ainsi de suite.
Quand vous estimez la taille du document, rappelez-vous d’indexer seulement les champs qui ajoutent de la valeur à vos scénarios de recherche, et excluez les champs sources qui n’ont pas d’intérêt dans les requêtes que vous prévoyez d’exécuter.
Limite de la taille de l’index vectoriel
Quand vous indexez des documents avec des champs vectoriels, la Recherche Azure AI construit des index vectoriels internes en utilisant les paramètres d’algorithme que vous avez spécifiés. La taille de ces index vectoriels est limitée par la mémoire réservée à la recherche vectorielle pour le niveau de votre service (ou SKU
). Pour obtenir des conseils sur la gestion et l’optimisation du stockage vectoriel, consultez Taille d’index vectoriel et respect des limites.
Les limites vectorielles varient en fonction des éléments suivants :
Depuis avril 2024, les limites vectorielles sont plus élevées sur les nouveaux services de recherche dans les régions fournissant la capacité supplémentaire, c’est-à-dire la plupart d’entre elles.
Ce tableau indique la progression des augmentations des quotas de vecteurs en Go au fil du temps. Le quota s’applique à chaque partition. Ainsi, si vous adaptez un nouveau service standard (S1) à 6 partitions, le quota total de vecteurs est de 35 multiplié par 6.
Date de création de service | De base | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Avant le 1er juillet 2023 1 | 0.5 | 1 | 6 | 12 | 12 | 36 |
Du 1er juillet 2023 au 3 avril 2024 2 | 1 | 3 | 12 | 36 | 12 | 36 |
Du 3 avril 2024 au 17 mai 2024 3 | 5 | 35 | 150 | 300 | 12 | 36 |
Après le 17 mai 2024 4 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Limites initiales du vecteur lors de la préversion anticipée.
2 Limites du vecteur pendant la dernière période de prévision. Trois régions n’avaient pas de limites plus élevées : Allemagne Centre-Ouest, Inde Ouest, Qatar Central.
3 Quota de vecteurs plus élevé en fonction des partitions les plus grandes pour les régions et les niveaux pris en charge.
4 Quota de vecteurs plus élevé pour un plus grand nombre de régions et de niveaux en fonction des mises à jour de la taille des partitions.
Le service applique un quota de taille d’index vectoriel pour chaque partition dans votre service de recherche. Chaque partition supplémentaire que vous ajoutez à votre service augmente le quota de taille d’index vectoriel disponible. Ce quota est une limite stricte pour garantir que votre service reste en bon état, ce qui signifie que d’autres tentatives d’indexation une fois la limite dépassée entraînent un échec. Vous pouvez reprendre l’indexation une fois que vous avez libéré le quota disponible en supprimant certains documents vectoriels ou en effectuant un scale-up dans des partitions.
Important
Les limites vectorielles plus élevées sont liées à des tailles de partition plus grandes. Les régions qui s’exécutent sur une infrastructure plus ancienne sont soumises aux limites de juillet-avril. Consultez la liste des régions pour connaître l’état des limites de stockage de partition.
Limites de l’indexeur
Les durées d’exécution maximales existent pour fournir équilibre et stabilité au service dans son ensemble, mais l’indexation des jeux de données volumineux peut prendre plus de temps que la valeur maximale ne le permet. Si un travail d’indexation ne peut pas être terminé dans le délai maximal autorisé, essayez de l’exécuter selon une planification. Le planificateur effectue le suivi de l’état de l’indexation. Si une tâche d’indexation planifiée est interrompue pour une raison quelconque, à la prochaine exécution planifiée, l’indexeur peut repartir de là où il s’était arrêté.
Ressource | Gratuit1 | De base2 | S1 | S2 | S3 | S3 HD3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Nombre maximal d’indexeurs | 3 | 5 ou 15 | 50 | 200 | 200 | N/A | 10 | 10 |
Nombre maximal de sources de données | 3 | 5 ou 15 | 50 | 200 | 200 | N/A | 10 | 10 |
Compétences maximales 4 | 3 | 5 ou 15 | 50 | 200 | 200 | N/A | 10 | 10 |
Charge d’indexation maximale par appel | 10 000 documents | Limité uniquement par le nombre maximal de documents | Limité uniquement par le nombre maximal de documents | Limité uniquement par le nombre maximal de documents | Limité uniquement par le nombre maximal de documents | N/A | Aucune limite | Aucune limite |
Planification minimale | 5 minutes | 5 minutes | 5 minutes | 5 minutes | 5 minutes | 5 minutes | 5 minutes | 5 minutes |
Durée maximale d’exécution 5 | 1 à 3 ou 3 à 10 minutes | 2 ou 24 heures | 2 ou 24 heures | 2 ou 24 heures | 2 ou 24 heures | N/A | 2 ou 24 heures | 2 ou 24 heures |
Indexeur d’objets blob : taille maximale des objets blob, en Mo | 16 | 16 | 128 | 256 | 256 | N/A | 256 | 256 |
Indexeur d’objets blob : nombre maximal de caractères du contenu extrait d’un objet blob 6 | 32 000 | 64 000 | 4 millions | 8 millions | 16 millions | N/A | 4 millions | 4 millions |
1 Les services du niveau Gratuit bénéficient d’une durée d’exécution maximale de l’indexeur de 3 minutes pour les sources d’objets blob, et de 1 minute pour toutes les autres sources de données. L’appel de l’indexeur se fait une fois toutes les 180 secondes. Pour l’indexation de l’intelligence artificielle qui appelle les Azure AI services, les services gratuits sont limités à 20 transactions gratuites par indexeur par jour, une transaction étant définie comme un document qui traverse le pipeline d’enrichissement (conseil : vous pouvez réinitialiser un indexeur pour le remettre à zéro).
2 Les services de base créés avant décembre 2017 présentent des limites inférieures (5 au lieu de 15) sur les index, les sources de données et les ensembles de compétences.
3 Les services S3 HD ne comprennent pas de prise en charge de l’indexeur.
4 Nombre maximal de 30 compétences par group de compétences.
5 Concernant la durée maximale de 2 ou 24 heures pour les indexeurs : une durée maximale de 2 heures est la plus courante et c’est ce que vous devez planifier. Il fait référence aux indexeurs qui s’exécutent dans l’environnement public, utilisés pour décharger le traitement gourmand en calcul et laisser plus de ressources pour les requêtes. La limite de 24 heures s’applique si vous configurez l’indexeur pour qu’il s’exécute dans un environnement privé en utilisant uniquement l’infrastructure allouée à votre service de recherche. Notez que certains indexeurs plus anciens ne peuvent pas s’exécuter dans l’environnement public et que ces indexeurs ont toujours une plage de traitement de 24 heures. Si vous avez des indexeurs non planifiés qui s’exécutent en continu pendant 24 heures, vous pouvez supposer que ces indexeurs n’ont pas pu être migrés vers l’infrastructure plus récente. En règle générale, pour les travaux d’indexation qui ne peuvent pas se terminer dans les deux heures, placez l’indexeur sur un programme de 5 minutes afin que l’indexeur puisse rapidement reprendre là où il s’est arrêté. Sur le niveau Gratuit, le temps d’exécution maximal de 3 à 10 minutes est destiné aux indexeurs avec des ensembles de compétences.
6 Le nombre maximal de caractères est basé sur les unités de code Unicode, en particulier UTF-16.
Remarque
Comme indiqué dans les limites des index, les indexeurs appliquent également la limite supérieure de 3 000 éléments à toutes les collections complexes par document, en commençant par la dernière version de l’API en disponibilité générale qui prend en charge les types complexes (2019-05-06
). Cela signifie que si vous avez créé votre indexeur avec une version antérieure de l’API, vous ne serez pas soumis à cette limite. Pour préserver une compatibilité maximale, un indexeur qui a été créé avec une version antérieure de l’API, puis mis à jour avec une version de l’API 2019-05-06
ou ultérieure, sera toujours exclu des limites. Les clients doivent être conscients de l’impact négatif dans le cas de collections complexes très grandes (comme indiqué précédemment) et nous recommandons vivement de créer les indexeurs avec la dernière version de l’API en disponibilité générale.
Limites de ressource de liaison privée partagée
Les indexeurs peuvent accéder aux autres ressources Azure via des points de terminaison privés gérés via l’API de ressource de liaison privée partagée. Cette section décrit les limites associées à cette fonctionnalité.
Ressource | Gratuit | De base | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Prise en charge de l’indexeur de point de terminaison privé | Non | Oui | Oui | Oui | Oui | No | Oui | Oui |
Prise en charge du point de terminaison privé pour les indexeurs avec un ensemble de compétences1 | No | Non | Non | Oui | Oui | No | Oui | Oui |
Prise en charge des points de terminaison privés pour les indexeurs ayant un ensemble de compétences et une vectorisation intégrée 2 | Non | Oui | Oui | Oui | Oui | No | Oui | Oui |
Nombre maximal de points de terminaison privés | N/A | 10 ou 30 | 100 | 400 | 400 | N/A | 20 | 20 |
Nombre maximal de types de ressources distincts3 | S/O | 4 | 7 | 15 | 15 | N/A | 4 | 4 |
1 L’enrichissement par IA et l’analyse d’images sont gourmands en ressources et consomment une quantité disproportionnée de la puissance de traitement disponible. Pour cette raison, les connexions privées sont désactivées sur les niveaux inférieurs pour garantir les performances et la stabilité du service de recherche lui-même.
2 Les services à haute capacité créés après le 3 avril 2024 dans les régions listées sous Stockage par partition, et qui exécutent des charges de travail de vectorisation intégrée au moment de l’indexation, prennent en charge les liaisons privées partagées dans les niveaux payants. Le système doit détecter au moins une compétence qui incorpore des données.
3 Le nombre de types de ressources distincts est calculé en tant que nombre de valeurs groupId
uniques utilisées dans toutes les ressources de liaison privée partagée pour un service de recherche donné, quel que soit l’état de la ressource.
Limites des synonymes
Le nombre maximal de cartes de synonymes varie en fonction du niveau. Chaque règle peut avoir jusqu’à 20 expansions, où une expansion est un terme equivalvent. Par exemple, pour le mot « chat », l’association avec « minou », « félin » et « felis » (le genre des chats) est comptée comme 3 expansions.
Ressource | Gratuit | De base | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Mappages de synonymes maximum | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Nombre maximal de règles par mappage | 5 000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Limites des alias d’index
Le nombre maximal d’alias d’index varie selon le niveau et la date de création du service. Dans tous les niveaux, si le service a été créé après octobre 2022, le nombre maximal d’alias est le double du nombre maximal d’index autorisés. Si le service a été créé avant octobre 2022, la limite correspond au nombre d’index autorisés.
Date de création du service | Gratuit | De base | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Avant octobre 2022 | 3 | 5 ou 15 1 | 50 | 200 | 200 | 1 000 par partition ou 3 000 par service | 10 | 10 |
Après octobre 2022 | 6 | 30 | 100 | 400 | 400 | 2 000 par partition ou 6 000 par service | 20 | 20 |
1 Les services de niveau Essentiel créés avant décembre 2017 ont des limites inférieures (5 au lieu de 15) sur les index
Limites de données (enrichissement de l’IA)
Un pipeline d’enrichissement par IA faisant appel à une ressource Azure AI Language pour la reconnaissance d’entités, la liaison d’entités, l’extraction de phrases clés, l’analyse des sentiments, la détection de la langue et la détection d’informations personnelles est soumis à des limites de données. La taille maximale d’un enregistrement doit être de 50 000 caractères telle que mesurée par String.Length
. Si vous avez besoin de découper vos données avant de les envoyer à l’Analyseur des sentiments, utilisez la compétence Fractionnement du texte.
Limitations
Les demandes d’API sont limitées dès que le système s’approche de la capacité maximale. Le comportement de la limitation varie en fonction des API. Les API de requête (recherche/suggestion/saisie semi-automatique) et les API d’indexation se limitent dynamiquement en fonction de la charge du service. Les API d’index et les API d’opérations de service ont des limites de taux de requêtes statiques.
Limites de taux de requêtes statiques pour les opérations liées à un index :
- Lister les index (GET /indexes) : 3 par seconde par unité de recherche
- Obtenir les index (GET /indexes/myindex) : 10 par seconde par unité de recherche
- Créer un index (POST /index) : 12 par minute par unité de recherche
- Créer ou mettre à jour les index (PUT /indexes/myindex) : 6 par seconde par unité de recherche
- Supprimer un index (DELETE /indexes/myindex) : 12 par minute par unité de recherche
Limites de taux de requêtes statiques pour les opérations liées à un service :
- Statistiques de service (GET /servicestats) : 4 par seconde par unité de recherche
Limites de limitation de l’éditeur de classement sémantique
Ranker sémantique utilise un système de mise en file d’attente pour gérer les requêtes simultanées. Ce syteme permet aux services de recherche d’obtenir la plus grande quantité de requêtes par seconde possible. Lorsque la limite des requêtes simultanées est atteinte, des requêtes supplémentaires sont placées dans une file d’attente. Si la file d’attente est pleine, d’autres demandes sont rejetées et doivent être retentées.
Le nombre total de requêtes de classement sémantique par seconde varie en fonction des facteurs suivants :
- Référence SKU du service de recherche. La capacité de file d’attente et les limites de requête simultanées varient selon la référence SKU.
- Nombre d’unités de recherche dans le service de recherche. La façon la plus simple d’augmenter la quantité maximale de requêtes de classement sémantique simultanées consiste à ajouter des unités de recherche supplémentaires à votre service de recherche.
- Capacité totale du ranker sémantique disponible dans la région.
- Temps nécessaire pour traiter une requête à l’aide d’un ranker sémantique. Cela varie en fonction de la disponibilité du service de recherche.
Le tableau suivant décrit les limites de limitation du classement sémantique par référence SKU. Sous réserve de la capacité disponible dans la région, contactez le support technique pour demander une augmentation de limite.
Ressource | De base | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|
Nombre maximal de requêtes simultanées (par unité de recherche) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
Taille maximale de la file d’attente des requêtes (par unité de recherche) | 4 | 6 | 8 | 8 | 8 | 8 | 8 |
Limites de requête d’API
Sauf indication contraire, les demandes d’API suivantes s’appliquent à toutes les interfaces programmables, y compris les Kits de développement logiciel (SDK) Azure.
- Maximum de 16 Mo par indexation ou requête lors de l’envoi (push) d’une charge utile au service de recherche 1
- Longueur maximale de l’URL de 8 Ko (s’applique uniquement aux API REST)
- 1 000 documents maximum par lot de charges, de fusions ou de suppressions d’index
- 32 champs maximum dans la clause $orderby
- Maximum 100 000 caractères dans une clause de recherche
- Le nombre maximal de clauses dans
search
(les expressions séparées par and ou or) est de 1024 - La taille maximale des termes de recherche du texte encodé en UTF-8 est de 32 766 octets (32 Ko moins 2 octets)
- La taille maximale des termes de recherche est de 1 000 caractères pour la recherche de préfixe et la recherche par expression régulière
- La recherche par caractères génériques et la recherche par expression régulière sont limitées à un maximum de 1 000 états quand elles sont traitées par Lucene.
1 Dans la recherche Azure AI, le corps d’une requête est soumis à une limite supérieure de 16 Mo. Cela signifie qu’une limite pratique est imposée au contenu des champs individuels ou des collections qui ne font pas l’objet de limites théoriques (pour plus d’informations sur la composition et les restrictions des champs, consultez Types de données pris en charge).
Il existe des limites sur la taille et la composition de la requête, car les requêtes non liées peuvent déstabiliser votre service de recherche. En général, de telles requêtes sont créées par programmation. Si votre application génère des requêtes de recherche par programmation, nous vous recommandons de la concevoir de façon à ce qu’elle ne génère pas des requêtes d’une taille illimitée.
Limites de réponse d’API
- 1 000 documents maximum retournés par page de résultats de recherche
- 100 suggestions maximum retournées par requête d’API de suggestion
Limites de clés API
Les clés API sont utilisées pour l’authentification de service. Il existe deux types de clé API. Les clés d’administration sont spécifiées dans l’en-tête de la demande et accordent un accès complet en lecture et en écriture au service. Les clés de requête sont en lecture seule, spécifiées dans l’URL et généralement distribuées aux applications clientes.
- 2 clés administrateur maximum par service
- 50 clés de requête maximum par service