Gérer la capacité
Pour créer une solution de Recherche Azure AI, vous devez créer une ressource Recherche Azure AI dans votre abonnement Azure. Selon la solution spécifique que vous avez l’intention de créer, vous pouvez également avoir besoin de ressources Azure pour le stockage de données et d’autres services d’application.
Niveaux de service et gestion de la capacité
Lorsque vous créez une ressource Recherche Azure AI, vous devez spécifier un niveau tarifaire. Le niveau tarifaire que vous sélectionnez détermine les limites de capacité de votre service de recherche et les options de configuration disponibles, ainsi que le coût du service. Les niveaux tarifaires disponibles sont les suivants :
- Gratuit (F). Utilisez ce niveau pour explorer le service ou consultez les didacticiels dans la documentation du produit.
- Essentiel (B) : Utilisez ce niveau pour les solutions de recherche à petite échelle qui incluent un maximum de 15 index et 5 Go de données d’index.
- Standard (S): utilisez ce niveau pour les solutions à l’échelle de l’entreprise. Il existe plusieurs variantes de ce niveau, notamment S, S2et S3, qui offrent une capacité accrue en termes d’index et de stockage, et S3HD, qui est optimisé pour les performances de lecture rapide sur un nombre réduit d’index.
- Stockage optimisé (L): utilisez un niveau de stockage optimisé (L1 ou L2) si vous devez créer des index volumineux, au prix d’une latence de requête supérieure.
Notes
Il est important de sélectionner le niveau tarifaire le plus approprié pour votre solution, car vous ne pouvez pas le modifier ultérieurement. Si vous constatez que le niveau tarifaire choisi n’est plus adapté à votre solution, vous devez créer une nouvelle ressource Recherche Azure AI et recréer tous les index et tous les objets.
Réplicas et partitions
Selon le niveau tarifaire que vous sélectionnez, vous pouvez optimiser votre solution pour l’évolutivité et la disponibilité en créant des réplicas et des partitions.
Les réplicas sont des instances du service de recherche : vous pouvez les considérer comme des nœuds dans un cluster. L’amélioration du nombre de réplicas peut contribuer à garantir une capacité suffisante pour traiter plusieurs demandes de requête simultanées tout en gérant les opérations d’indexation en cours.
Les partitions permettent de diviser un index en plusieurs emplacements de stockage, ce qui vous permet de fractionner des opérations d’E/S telles que l’interrogation ou la reconstruction d’un index.
La combinaison de réplicas et de partitions que vous configurez détermine les unités de recherche utilisées par votre solution. En d’autres termes, le nombre d’unités de recherche est le nombre de réplicas multiplié par le nombre de partitions (R x P = SU). Par exemple, une ressource avec quatre réplicas et trois partitions utilise 12 unités de recherche.
Conseil
Vous pouvez en savoir plus sur les niveaux de tarification et la gestion de la capacité dans la documentation recherche Azure AI.