Partager via


Attacher une ressource multiservices Azure AI à un ensemble de compétences dans Azure AI Search

Lors de la configuration d’un pipeline d’enrichissement par IA facultatif dans Recherche Azure AI, vous pouvez enrichir un petit nombre de documents gratuitement, limité à 20 transactions quotidiennes par index. Pour les charges de travail plus volumineuses et plus fréquentes, vous devez attacher une ressource multiservices Azure AI.

Un compte multiservices fournit une collection de Azure AI services, plutôt que des services individuels. Fournir un compte dans un ensemble de compétences Recherche Azure AI permet à Microsoft de vous facturer l’utilisation de ces services :

  • Azure AI Vision pour l’analyse d’images, la reconnaissance optique de caractères (OCR) et le texte modal et l’incorporation d’images.
  • Azure AI Language pour la détection de langage, la reconnaissance d’entité, l’analyse des sentiments et l’extraction d’expressions clés
  • Azure AI Speech pour la reconnaissance vocale et la synthèse vocale
  • Azure AI Traducteur pour la traduction de texte de l’ordinateur

Vous devez fournir des informations de connexion à la multi-ressource Azure AI dans l’ensemble de compétences. Recherche Azure AI n’utilise pas la connexion pour les charges de travail d’ensemble de compétences, mais elle utilise la connexion pour accéder aux compteurs de facturation sur la ressource. Par conséquent, votre compte Azure AI Services est utilisé pour la facturation et non pour le traitement des compétences. Recherche Azure AI utilise des ressources dédiées distinctes pour le traitement des compétences.

Vous pouvez utiliser une clé sur la connexion ou mettre en place une approche sans clé, actuellement disponible en préversion.

Conseil

Azure propose une infrastructure pour contrôler la facturation et les budgets. Pour plus d’informations sur la surveillance des services Azure AI, consultez Planifier et gérer les coûts des services Azure AI.

Prérequis

  • Connectivité sur un point de terminaison public, sauf si votre service de recherche correspond à la date de création, au niveau et à la région requise pour les connexions privées à un compte multiservices Azure AI.

Remarque

Si votre ressource Azure AI est configurée pour utiliser un point de terminaison privé, Recherche Azure AI peut se connecter à l’aide d’une liaison privée partagée si le service de recherche a été créé après le 3 avril 2024 et se trouve dans une région qui offre une puissance de calcul de capacité supérieure ainsi qu’un niveau pris en charge. Pour plus d’informations, consultez les conditions requises pour utiliser des liens privés partagés.

Facturation par le biais d’une connexion sans clé

Remarque

Cette fonctionnalité est actuellement disponible en préversion publique. Cette préversion est fournie sans contrat de niveau de service et n’est pas recommandée pour les charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

À l’aide du portail Azure ou des API REST disponibles dans la préversion la plus récente et des packages de SDK bêta, vous pouvez joindre une ressource multiservice Azure AI à l’aide d’une identité managée et d’autorisations. L’avantage de cette approche est que la facturation est sans clé et ne dépend pas des régions.

  1. Configurez Recherche Azure AI pour utiliser une identité managée.

  2. Sur votre ressource multiservice Azure AI, attribuez l’identité au rôle utilisateur Cognitive Services.

  3. Configurez un ensemble de compétences pour utiliser une identité à l’aide du portail Azure, de l’API REST Skillset 2024-11-01-preview ou d’un package bêta du Kit de développement logiciel (SDK) Azure qui fournit la syntaxe :

    • L’identité managée utilisée sur la connexion appartient au service de recherche.
    • L’identité peut être gérée par le système ou affectée par l’utilisateur.
    • L’identité doit disposer d’autorisations utilisateur Cognitive Services sur la ressource Azure AI.
    • @odata.type est toujours #Microsoft.Azure.Search.AIServicesByIdentity.
    • subdomainUrl est le point de terminaison de votre ressource multiservice Azure AI. Il peut se trouver dans n’importe quelle région prise en charge conjointement par les services Recherche Azure AI et Azure AI.

Comme pour les clés, les détails que vous fournissez sur la ressource Azure AI Services sont utilisés pour la facturation, et non pour les connexions. Toutes les demandes d’API effectuées par Recherche Azure AI vers les services Azure AI pour le traitement des compétences intégrées sont toujours internes et gérées par Microsoft.

L’URL de sous-domaine doit inclure un nom unique (par exemple https://hereismyuniquename.cognitiveservices.azure.com). Si le service a été créé via le portail Azure, un sous-domaine unique est automatiquement généré dans le cadre de la configuration de votre service. Vérifiez que votre service inclut un sous-domaine unique avant de l’utiliser avec l’intégration du service Recherche Azure AI.

Exemple : identité managée affectée par le système

L’identité est définie sur null.

POST https://[service-name].search.windows.net/skillsets/[skillset-name]?api-version=2024-11-01-Preview  

{  
    "name": "my skillset name",  
    "skills":   
    [  
      // skills definition goes here 
    ],  
    "cognitiveServices": {  
        "@odata.type": "#Microsoft.Azure.Search.AIServicesByIdentity",  
        "description": "",  
        "subdomainUrl": “https://[subdomain-name].cognitiveservices.azure.com",  
        "identity": null 
    }  
} 

Exemple : identité managée affectée par l'utilisateur

L'identité est définie sur l'ID de la ressource de l'identité managée affectée par l'utilisateur. Pour créer une identité managée affectée par l’utilisateur, consultezGérer les identités managées affectées par l’utilisateur.

Pour une identité managée affectée par l’utilisateur, définissez les propriétés @odata.type et les propriétés userAssignedIdentity.

POST https://[service-name].search.windows.net/skillsets/[skillset-name]?api-version=2024-11-01-Preview  

{  
    "name": "my skillset name",  
    "skills":   
    [  
      // skills definition goes here 
    ],  
    "cognitiveServices": {  
        "@odata.type": "#Microsoft.Azure.Search.AIServicesByIdentity",  
        "description": "",  
        "subdomainUrl": “https://[subdomain-name].cognitiveservices.azure.com",  
        "identity": {   
            "@odata.type":  "#Microsoft.Azure.Search.DataUserAssignedIdentity",   
            "userAssignedIdentity": ""/subscriptions/{subscription-ID}/resourceGroups/{resource-group-name}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{user-assigned-managed-identity-name}"" 
        }
    } 
}

Facturation par le biais d’une clé de ressource

Recherche Azure AI peut également facturer des transactions à l’aide de la clé de ressource multiservice Azure AI. Cette approche est la valeur par défaut et est généralement disponible. Vous pouvez utiliser le portail Azure, l’API REST ou un Kit de développement logiciel (SDK) Azure pour ajouter la clé à un ensemble de compétences.

Il existe deux types de clés pris en charge : #Microsoft.Azure.Search.CognitiveServicesByKey qui appelle le point de terminaison régional et "#Microsoft.Azure.Search.AIServicesByKey qui appelle le sous-domaine. Nous vous recommandons d’utiliser AIServicesByKey pour sa prise en charge de la liaison privée partagée et la possibilité de fonctionner sans exigences régionales par rapport au service de recherche.

Si vous laissez la propriété cognitiveServices non spécifiée, votre service de recherche tentera d’utiliser quotidiennement les enrichissements gratuits disponibles pour votre indexeur. L’exécution de compétences facturables s’arrête à 20 transactions par appel d’indexeur et un message « Délai d’attente » s’affiche dans l’historique d’exécution de l’indexeur.

  1. Connectez-vous au portail Azure.

  2. Créez une ressource multiservices Azure AI dans la même région que votre service de recherche.

  3. Obtenez la clé de ressource à partir de la page Ressources>Clés et point de terminaison.

  4. Ajoutez la clé à une définition d’ensemble de compétences :

    • Si vous utilisez un Assistant Importation de données, créez ou sélectionnez le compte Azure AI. L’Assistant ajoute la clé de ressource à votre définition d’ensemble de compétences.

    • Pour un ensemble de compétences nouveau ou existant, fournissez la clé dans la définition de l’ensemble de compétences.

Capture d’écran de la page Clé.

Remarque

Le portail Azure attache actuellement automatiquement la clé de type #Microsoft.Azure.Search.CognitiveServicesByKey.

Supprimer la clé

Les enrichissements sont des opérations facturables. Si vous n’avez plus besoin d’appeler des services Azure AI, suivez ces instructions pour supprimer la clé multiservices et empêcher l’utilisation de la ressource externe. Sans la clé, l’ensemble de compétences rétablit l’allocation par défaut de 20 transactions gratuites par indexeur, par jour. L’exécution de compétences facturables s’arrête à 20 transactions et un message «expiration du délai d’attente » s’affiche dans l’historique d’exécution de l’indexeur lorsque l’allocation est utilisée.

  1. Connectez-vous au portail Azure.

  2. Sous gestion de recherche > ensembles de compétences, sélectionnez un ensemble de compétences dans la liste.

    Capture d’écran de la page des ensembles de compétences.

  3. Faites défiler jusqu’à la section du fichier contenant "cognitiveServices".

  4. Supprimez la valeur de clé du json et enregistrez l’ensemble de compétences.

    Capture d’écran des ensembles de compétences JSON.

Utilisation de la clé

La facturation s’applique lorsque les appels d’API aux ressources des services Azure AI dépassent 20 appels d’API par indexeur et par jour. Vous pouvez réinitialiser l’indexeur pour réinitialiser le nombre d’API.

Les connexions sans clé et basées sur des clés sont utilisées pour la facturation, mais pas pour les connexions des opérations d’enrichissement. Pour les connexions, un service de recherche se connecte via le réseau interne à une ressource Azure AI services localisée dans la même région physique. La plupart des régions qui offrent Azure AI Search offrent également d’autres services Azure AI tels que Langage. Si vous essayez l’enrichissement par IA dans une région qui ne présente pas les deux services, le message suivant s’affiche : « La clé fournie n’est pas une clé de type CognitiveServices valide pour la région de votre service de recherche ».

Les indexeurs peuvent être configurés pour s’exécuter dans un environnement d’exécution privé pour un traitement dédié utilisant uniquement des nœuds de recherche de votre propre service de recherche. Même si vous utilisez un environnement d’exécution privé, Recherche Azure AI utilise toujours sa ressource multiservice Azure AI approvisionnée en interne pour effectuer tous les enrichissements de compétences.

Remarque

Certaines compétences intégrées sont basées sur des services Azure AI non régionaux (par exemple, la compétence de traduction de texte ). L’utilisation d’une compétence non régionale signifie que votre requête peut être prise en charge dans une région autre que la région Azure AI Search. Pour plus d’informations sur les services non régionaux, consultez la page produit par région des services Azure AI.

Conditions requises pour la connexion publique

Selon le moment où votre service de recherche a été créé, son niveau et sa région, la facturation des compétences intégrées peut nécessiter une connexion publique de Recherche Azure AI à Azure AI Multi-service. La désactivation de l’accès au réseau public interrompt la facturation dans certains cas. Passez en revue les conditions requises pour les connexions via une liaison privée partagée pour déterminer si votre service de recherche nécessite une connexion publique.

Si vous ne pouvez pas utiliser le réseau public, vous pouvez configurer une compétence d’API web personnalisée implémentée avec un Fonction Azure prenant en charge les points de terminaison privés et ajouter la ressource services Azure AI au même réseau virtuel. De cette façon, vous pouvez appeler la ressource des services Azure AI directement à partir de la compétence personnalisée à l’aide de points de terminaison privés.

Cas particuliers pour les exigences de clé

La recherche d’entité personnalisée est mesurée par Azure AI Search, et non par les services Azure AI, mais elle nécessite une clé de ressource multiservices Azure AI pour déverrouiller les transactions au-delà de 20 par indexeur, par jour. Pour cette compétence uniquement, même si la clé de ressource permet de débloquer le nombre de transactions, elle n’est pas liée à la facturation.

Enrichissements libres

L’enrichissement par IA offre une petite quantité de traitement libre d’enrichissements facturables, ce qui vous permet d’effectuer des opérations courtes sans avoir à joindre une ressource multi-service Azure AI . Les enrichissements libres sont de 20 documents par jour, par indexeur. Vous pouvez réinitialiser l’indexeur pour réinitialiser le compteur si vous souhaitez répéter une opération.

Certains enrichissements sont toujours gratuits :

Enrichissements facturables

Pendant l’enrichissement par IA, Azure AI Search appelle les API des services Azure AI pour compétences intégrées basées sur Azure AI Vision, Translator et Azure AI Language.

Les compétences intégrées facturables qui effectuent des appels principaux aux services Azure AI incluent la liaison d’entités, la reconnaissance d’entité, l’Analyse des images, l’extraction d’expressions clés, la Détection de langue, l’OCR, la détection d’informations d’identification personnelle (PII), le Sentimentet la traduction de texte.

L’extraction d’images est une opération de Azure AI Search qui se produit lorsque les documents sont décodés avant l’enrichissement. L’extraction d’images est facturable pour tous les niveaux, sauf pour les 20 extractions quotidiennes gratuites du niveau Gratuit. Les coûts d’extraction d’images s’appliquent aux fichiers image contenus dans les objets blob, aux images incorporées dans d’autres fichiers (fichiers PDF et autres fichiers d’application) ainsi qu’aux images extraites à l’aide de l’extraction de documents. Pour connaître les prix appliqués à l’extraction d’images, voir la page de tarification du service Azure AI Search.

Conseil

Pour réduire le coût du traitement des ensembles de compétences, activez l’enrichissement incrémentiel afin de mettre en cache et de réutiliser les enrichissements non affectés par les changements apportés à un ensemble de compétences. La mise en cache nécessite Stockage Azure (consultez les tarifs). Toutefois, le coût cumulé de l’exécution des ensembles de compétences est moindre si les enrichissements existants peuvent être réutilisés, en particulier pour les ensembles de compétences qui utilisent l’analyse et l’extraction d’images.

Exemple : Estimer les coûts

Pour estimer les coûts associés à l’indexation Azure AI Search, commencez par une idée de l’apparence d’un document moyen afin de pouvoir exécuter des nombres. Par exemple, vous pourriez faire une approximation :

  • 1 000 fichiers PDF.
  • Six pages par fichier.
  • Une image par page (6 000 images).
  • 3 000 caractères par page.

Supposons un pipeline consistant en un craquage de document PDF, une extraction d’image et de texte, une reconnaissance optique de caractères (OCR) d’images, et une reconnaissance d’entités d’organisations.

Les prix indiqués dans cet article sont hypothétiques. Ils sont utilisés pour illustrer le processus d’estimation. Vos coûts peuvent être inférieurs. Pour connaître le prix réel des transactions, consultez latarification des services Azure AI.

  1. Pour le décodage de documents avec contenu de texte et d’image, l’extraction de texte est actuellement gratuite. Pour 6 000 images, supposez un prix de 1 USD pour chaque tranche de 1 000 images extraites. Cela revient à un coût de 6,00 USD pour cette étape.

  2. Pour la reconnaissance optique de caractères (OCR) de 6 000 images en anglais, la qualification cognitive OCR utilise le meilleur algorithme (DescribeText). À raison de 2,50 $ par lot de 1 000 images à analyser, cette étape vous coûterait 15 $.

  3. Pour l’extraction d’entité, vous auriez un total de trois enregistrements texte par page. Chaque enregistrement contient 1 000 caractères. Trois enregistrements texte par page multipliés par 6 000 pages équivalent à 18 000 enregistrements texte. À raison de 2 $ par lot de 1 000 enregistrements texte, cette étape vous coûterait 36 $.

En additionnant tout cela, l’ingestion de 1 000 documents PDF de ce type avec l’ensemble de qualifications décrit vous reviendrait à environ 57 USD.

Étapes suivantes