Recommandations de sélection des ressources pour les charges de travail d’IA sur Azure
Cet article offre des recommandations de sélection des ressources pour les organisations exécutant des charges de travail d’IA sur Azure. Il se concentre sur les solutions de plateforme en tant que service (PaaS) Azure AI, y compris Azure AI Studio, Azure OpenAI, Azure Machine Learning, et Azure AI Services. Il couvre à la fois les charges de travail d’IA générative et non générative.
Faire des choix de ressources d’IA éclairés permet aux organisations d’obtenir une meilleure performance, évolutivité, et rentabilité lors de la gestion des charges de travail IA. Le tableau suivant fournit un aperçu des principales solutions PaaS Azure AI et des critères de décision importants.
Plateforme Intelligence artificielle | Type d’IA | Description | Compétences requises |
---|---|---|---|
Azure OpenAI | IA générative | Plateforme d’accès aux modèles OpenAI | Compétences en développement et en science des données |
Azure AI Studio | IA générative | Plateforme pour l’ingénierie d’invite et le déploiement de points de terminaison IA générative | Compétences en développement et en science des données |
Azure AI services | IA analytique | Plateforme pour la consommation de modèles de machine learning prédéfinis | Compétences en développement |
Azure Machine Learning | Machine Learning | Plateforme pour l’entraînement et le déploiement de modèles de machine learning | Compétences en développement et compétences avancées en science des données |
Sélectionnez les ressources pour les charges de travail IA générative
L’IA générative nécessite la combinaison de différentes ressources pour traiter et générer des sorties significatives en fonction des données d’entrée. Une sélection adéquate assure que les applications d’IA générative, comme celles utilisant le modèle de génération augmentée par récupération (RAG), fournissent des résultats précis en ancrant les modèles d’IA.
Dans une charge de travail RAG typique, (1) la charge de travail reçoit la requête de l’utilisateur. (2) Un orchestrateur, tel que Prompt flow, Semantic Kernel, ou LangChain, gère le flux de données. (3) Un mécanisme de recherche et de récupération trouve les données d’ancrage appropriées (4) à envoyer au point de terminaison IA générative. (5) Un point de terminaison de modèle d’IA générative génère une réponse basée sur la requête de l’utilisateur et les données d’ancrage. Utilisez les recommandations suivantes comme cadre pour construire des charges de travail RAG génératives.
Choisissez une plateforme d’IA générative. Utilisez Azure OpenAI ou Azure AI Studio pour déployer et gérer des modèles d’IA générative. Azure OpenAI Service offre un accès aux modèles OpenAI, des options de mise en réseau privée, et des filtres de contenu. Azure AI Studio offre une plateforme orientée code pour le développement de charges de travail d’IA. Il comprend des outils intégrés pour la création et le déploiement d’applications. Il dispose également d’un catalogue de modèles large, d’un flux d’invite, de fonctionnalités de personnalisation, de filtres de sécurité de contenu, et plus encore.
Choisissez le type de calcul IA approprié. Azure AI Studio nécessite des instances de calcul pour le flux d’invite, la création d’index, et l’ouverture de Visual Studio Code (Web ou Bureau) au sein du studio. Choisissez un type de calcul en fonction de vos besoins en performance et budget.
Sélectionnez un orchestrateur. Les orchestrateurs populaires pour l’IA générative incluent Semantic Kernel, Prompt flow, et LangChain. Semantic Kernel s’intègre aux services Azure. LangChain offre une extensibilité au-delà de l’écosystème de Microsoft.
Choisissez un mécanisme de recherche et de récupération de connaissances. Pour ancrer les modèles d’IA générative, créez un index ou une base de données vectorielle pour la récupération des données pertinentes. Utilisez Azure AI Search pour construire des index traditionnels et vectoriels à partir de diverses sources de données, appliquez le chunking de données, et utilisez plusieurs types de requêtes. Si vos données résident dans des bases de données structurées, envisagez d’utiliser Azure Cosmos DB, Azure Database pour PostgreSQL, et Azure Cache for Redis.
Choisissez une source de données pour les données d’ancrage. Pour les images, les audios, les vidéos ou les grands ensembles de données, stockez les données d’ancrage dans Azure Blob Storage. Vous pouvez également utiliser des bases de données prises en charge par Azure AI Search ou des bases de données vectorielles.
Choisissez une plateforme de calcul. Utilisez l’arbre de décision pour le calcul d’Azure pour choisir la bonne plateforme pour votre charge de travail.
Sélectionnez les ressources pour les charges de travail IA non générative
Les charges de travail IA non générative reposent sur des plateformes, des ressources de calcul, des sources de données et des outils de traitement des données pour soutenir les tâches de machine learning. Sélectionner les bonnes ressources permet de créer des charges de travail IA en utilisant des solutions prédéfinies et personnalisées.
Dans une charge de travail IA non générative, (1) la charge de travail ingère des données. (2) Un mécanisme de traitement de données optionnel extrait ou manipule les données entrantes. (3) Un point de terminaison de modèle d’IA analyse les données. (4) Les données soutiennent l’entraînement ou l’ajustement des modèles d’IA. Utilisez les recommandations suivantes comme cadre pour construire des charges de travail IA non générative.
Choisissez une plateforme IA non générative. Les services IA Azure offrent des modèles IA prédéfinis qui ne nécessitent pas de compétences en science des données. Pour des conseils sur le choix du bon service Azure AI, veuillez consulter la section Choisir une technologie des services IA Azure. Azure Machine Learning fournit une plateforme pour construire des modèles de machine learning avec vos propres données et consommer ces modèles dans des charges de travail IA.
Choisissez le calcul IA approprié. Pour Azure Machine Learning, vous avez besoin de ressources de calcul pour exécuter une tâche ou héberger un point de terminaison. Utilisez le type de calcul qui répond à vos besoins en performance et budget. Les services IA Azure ne nécessitent pas de ressources de calcul.
Choisissez une source de données. Pour Azure Machine Learning, utilisez l’une des sources de données prises en charge pour héberger vos données d’entraînement. Pour les services IA Azure, beaucoup de services ne nécessitent pas de données pour la personnalisation, et certains, comme Azure AI Custom Vision, offrent une option pour télécharger des fichiers locaux dans une solution de stockage de données gérée.
Choisissez une plateforme de calcul. Utilisez l’arbre de décision pour le calcul d’Azure pour choisir la bonne plateforme de charge de travail.
Choisissez un service de traitement de données (optionnel). Azure Functions est un choix commun de traitement de données car il offre une option sans serveur. Azure Event Grid est également un mécanisme déclencheur courant pour lancer un pipeline de traitement de données.