Charges de travail IA sur Azure
Cet article traite des défis architecturaux liés à la conception de charges de travail IA. Il se concentre sur les fonctionnalités non déterministes, la conception des données et les opérations d’application. Les recommandations sont basées sur les principes d’Azure Well-Architected Framework et incluent des insights sur les implémentations Azure réussies.
Ces articles sont destinés aux propriétaires de charge de travail et aux parties prenantes techniques telles que les architectes, les prospects de développement et les responsables informatiques. L’IA spécialisée et les rôles de données, tels que les scientifiques des données, doivent également être conscients de ces conseils, car la collaboration entre différents rôles et équipes est un aspect clé.
Remarque
Azure propose différents services IA que vous pouvez intégrer à votre charge de travail ou créer autour de celui-ci. En fonction des besoins de votre entreprise, vous pouvez choisir entre des solutions SaaS (Software as a Service), des solutions PaaS (Platform as a Service) ou créer votre propre solution IA. Les services Azure spécifiques et leurs fonctionnalités ne sont pas abordés ici. Nous vous recommandons de consulter la documentation de produit correspondante pour ces informations.
En outre, certaines charges de travail IA ne sont pas dans l’étendue, telles que :
- Charges de travail qui sont réalisées par le biais d’offres à faible code et sans code, telles que Copilot Studio.
- Charges de travail nécessitant un calcul hautes performances.
- Charges de travail qui n’implémentent pas de cas d’usage d’IA dégénératives ou discriminatoires.
Qu’est-ce qu’une charge de travail IA ?
Dans le contexte de Well-Architected Framework, une charge de travail d'IA répond aux besoins des tâches prédictives, discriminatoires ou génératives. Il se concentre sur les fonctionnalités éthiques, en s’adaptant aux technologies d’IA en évolution rapide, et en restant pertinent et explicable. Appliquez les piliers Well-Architected Framework à chaque point de décision pour garantir que le système est fiable, sécurisé, efficace et rentable.
Les charges de travail IA sont différentes des charges de travail traditionnelles, car elles remplacent les fonctionnalités déterministes dans certaines parties de la charge de travail par un comportement non déterministe qui résout les situations où les résultats fixes ne sont pas pratiques. Au lieu de cela, ils combinent du code et des données dans une entité, ou un modèle , pour permettre des expériences uniques que les systèmes traditionnels ne peuvent pas fournir.
Avant de commencer vos stratégies de conception, considérez d’abord ces points clés.
Familiarisez-vous avec les grandes catégories de modèles
ia générative: utilise le Machine Learning pour créer de manière autonome du contenu. Il inclut des modèles de langage qui peuvent être personnalisés avec des données utilisateur ou utilisés en tant que services tels qu’Azure OpenAI Service. Par exemple, GPT, un type de modèle de langage, se spécialise dans l’imiter le langage conversationnel humain et est idéal pour les expériences de conversation et de langage naturel.
Cas d’usage : l’IA générative peut produire des articles, des histoires et des arts. Il peut également générer des données synthétiques pour équilibrer les jeux de données et rendre les chatbots plus humains.
IA discriminative: utilise la programmation explicite pour effectuer des tâches spécifiques basées sur des règles et des algorithmes. Il est divisé en :
- basée sur des modèles : les systèmes prédictifs recherchent des modèles basés sur l’entraînement effectué à partir d’observations antérieures pour effectuer des prédictions, mais ne peuvent pas créer de contenu ni s’adapter eux-mêmes.
- non basée sur un modèle : les agents autonomes suivent des règles prédéfinies pour interagir avec les systèmes, comme les personnages de jeux vidéo.
Cas d’usage : l’IA discriminative est utilisée pour l’analytique prédictive, les systèmes de recommandation et la détection des fraudes.
Cette série d’articles couvre différentes charges de travail IA et se concentre sur des types spécifiques tels que des modèles de langage si nécessaire.
Important
Lorsque vous choisissez entre les modèles dégénératifs et discriminatifs, réfléchissez à la tâche que vous devez accomplir. Les modèles générateurs créent de nouvelles données. Les modèles discriminatifs classifient les données existantes en fonction des fonctionnalités. Pour les tâches de classification ou de régression, choisissez des modèles qui correspondent au travail. Par exemple, un modèle de langage qui peut classifier peut être plus polyvalent qu’un seul classifie.
Évaluer vos options de build et d’achat
Si les réponses génériques sont acceptables, un modèle prédéfini ou une solution basée sur un service IA qui utilise un traitement opaque doit être suffisant pour votre charge de travail. Toutefois, si vous avez besoin de données spécifiques à votre entreprise ou si vous avez des exigences de conformité, créez un modèle personnalisé.
Lorsque vous choisissez entre un modèle personnalisé, un modèle prédéfini ou un service, tenez compte des facteurs suivants :
- contrôle de données: les modèles personnalisés vous donnent davantage de contrôle sur les données sensibles. Les modèles prédéfinis sont plus faciles pour les tâches générales.
- Personnalisation: Les modèles sur mesure répondent mieux aux besoins spécifiques. Les modèles prédéfinis peuvent ne pas avoir de flexibilité.
- Coût et maintenance: les modèles personnalisés nécessitent une maintenance et des ressources continues. Les modèles prédéfinis ont généralement des coûts initiaux inférieurs et moins de charge d’infrastructure.
- performance: les services prédéfinis offrent une infrastructure et une scalabilité optimisées. Elles sont idéales pour les besoins de faible latence ou d’extensibilité.
- Expertise: les modèles personnalisés nécessitent une équipe qualifiée. Les modèles prédéfinis sont souvent plus rapides à déployer et plus faciles à utiliser si l’expertise est limitée.
Important
La création et la maintenance de votre propre modèle nécessitent beaucoup de ressources, de temps et d’expertise. Il est important de faire des recherches approfondies avant de décider. En règle générale, le choix d’un modèle prédéfini ou d’un service managé est une meilleure option.
Quels sont les défis courants ?
- coûts de calcul: les fonctions IA peuvent être coûteuses en raison de besoins de calcul élevés et les besoins de calcul peuvent varier en fonction de la conception de votre charge de travail. Comprendre vos besoins et choisir le bon service pour gérer les coûts.
- exigences en matière de sécurité et de conformité: les solutions prêtes à l’emploi peuvent ne pas répondre à vos besoins en matière de sécurité et de conformité. Options de recherche pour éviter les charges inutiles.
- volume de données: la gestion de volumes de données volumineux dans différents formats pose des problèmes de protection des informations sensibles et d’un traitement efficace. L’optimisation du stockage, du traitement et des coûts de transfert doit être une activité continue.
- désintégration de modèle: les modèles peuvent se dégrader au fil du temps, ce qui entraîne des résultats incorrects. Le test des systèmes IA est difficile en raison de leur aléatoire.
- défis de compétences: les nouvelles charges de travail IA peuvent nécessiter des rôles spécialisés et de nouveaux processus d’exploitation nécessitant une formation approfondie.
- Pace of AI innovation: Il peut être tentant d'adopter les technologies les plus récentes pour rester à la pointe. Évaluez attentivement les nouvelles technologies pour vous assurer qu’elles améliorent l’expérience utilisateur et n’ajoutent pas simplement de la complexité pour être à jour.
- exigences éthiques: déterminez clairement si votre cas d’usage est une cible éthique pour l’IA. Le maintien des normes éthiques est nécessaire tout au long des phases de planification et d’implémentation pour vous assurer que vous créez un système responsable.
Guide pratique pour utiliser ces conseils
✔ Commencez par la méthodologie de conception, qui décrit la logique et les thèmes récurrents dans les domaines techniques et opérationnels. Cette approche systématique permet de définir des exigences et des stratégies de conception. Revisitez cette méthodologie lorsque vous rencontrez des choix incertains pour rester aligné sur les objectifs globaux de la charge de travail. Il fournit également un cadre de collaboration avec les parties prenantes afin de justifier les décisions techniques et d’incorporer les commentaires des clients pour une amélioration continue.
✔ passer aux principes de conception pour voir comment la méthodologie de conception s’aligne sur les piliers principaux du Well-Architected Framework. Envisagez l’évolution de la croissance. Évaluez les principes sous-jacents de tous les piliers collectivement, y compris les compromis.
✔ Concentrez-vous sur les domaines de conception qui ont le plus grand effet sur votre solution. Chaque domaine comprend des considérations et des recommandations pour vous guider dans les décisions de conception.
✔ Utilisez l’Assessment Review Tool (l’outil de révision d’évaluation) pour évaluer la disponibilité de votre charge de travail IA optimisée en production.
Modèles d’architecture et zones de conception classiques
Le diagramme suivant illustre la façon dont les données transitent par le système de la collecte initiale jusqu’à l’interaction utilisateur finale.
L’architecture met en évidence l’intégration de différents composants pour permettre un traitement efficace des données, l’optimisation des modèles et le déploiement d’applications en temps réel dans des solutions basées sur l’IA. Il inclut des modules tels que les sources de données, le traitement des données, l’entraînement du modèle, le déploiement de modèles et les interfaces utilisateur.
Le tableau suivant décrit certains domaines de conception clés liés à ce modèle.
Zones de conception |
---|
conception d’application: découvrez les considérations propres aux charges de travail IA susceptibles d’avoir un effet significatif sur vos normes de conception d’application existantes. |
plateforme d’applications: déterminez les meilleures plateformes à utiliser pour prendre en charge les fonctions de charge de travail IA, telles que l’hébergement de modèles, l’entraînement de modèle et l’inférence. |
Training data design (Conception des données d’entraînement ) : Concevez des stratégies pour l’ingestion des données, le prétraitement, la rétention et les sujets de gouvernance pour gérer vos données d’entraînement de modèle. |
Conception des données de référence: Stratégies de conception pour optimiser la recherche et la récupération, tout en répondant aux exigences de sécurité et de conformité pour vos données de référence. |
plateforme de données: déterminez la meilleure plateforme d’hébergement pour gérer les grandes quantités et potentiellement de nombreux formats de données que votre charge de travail utilise. |
opérations de machine learning et d'intelligence artificielle générative: établissez des pratiques DevOps modernes pour prendre en charge vos fonctions et systèmes de machine learning ou d'intelligence artificielle générative. |
opérations de charge de travail: moderniser vos pratiques opérationnelles avec de nouvelles approches et ajouter des rôles et des formations spécialisés. |
test et évaluation: développez des stratégies de test et d’évaluation pour mesurer les caractéristiques telles que la précision, la précision, la sensibilité et la spécificité par le biais de métriques ciblées pour les charges de travail IA. |
Profils de charge de travail: Comprendre comment les profils sont impliqués dans le cycle de vie complet de votre charge de travail en intelligence artificielle pour vous garantir que votre équipe est pleinement capable de la concevoir et de la soutenir. |
l’IA responsable: portez une attention particulière à l’expérience utilisateur et aux implications éthiques de la publication de votre solution IA au public. L’IA offre des opportunités incroyables pour les nouveaux produits et services, mais elle présente également un degré considérable de risque. |
Conseil
Chaque décision architecturale implique une série de considérations et un ensemble de compromis reconnus qui équilibrent différents aspects du cadre. Ces compromis sont indiqués par cette icône .