Concevoir un travail Azure Batch pour exécuter votre travail parallèle

Effectué

Azure Batch utilise des tâches parallèles pour diviser un travail entre des nœuds de calcul.

En tant qu’architecte de solutions de l’association, vous voulez comprendre comment concevoir un travail Azure Batch et comment activer un traitement parallèle afin de pouvoir utiliser ces fonctionnalités dans le scénario de reconnaissance optique de caractères.

Ici, vous allez découvrir les éléments principaux d’une tâche parallèle Batch.

Utilisation d’Azure Batch avec Azure CLI

Vous décidez de créer la solution pour aider l’association dans sa mission en utilisant Azure Batch et l’interface CLI, de façon à bénéficier rapidement d’une infrastructure en place et à l’améliorer progressivement, sans passer du temps à structurer tout le code de base que vous auriez besoin pour démarrer. Il est vrai que d’autres méthodes de création de solutions Azure Batch telles que .NET et Node.js offrent un contrôle enrichi et plus précis de Batch et d’autres API Azure, mais aucune de ces méthodes ne peut égaler l’agilité et les commentaires immédiats que vous obtenez en envoyant des commandes dans l’interface CLI et en observant leurs résultats.

Une exemple de tâche parallèle

Pour prendre la mesure d’Azure Batch et de l’interface CLI, vous décidez d’une simple preuve de concept pour montrer les différents nœuds travaillant ensemble en parallèle. Vous allez diffuser en boucle plusieurs fois dans l’interface CLI, ajouter une tâche numérotée par itération de la boucle, puis télécharger et observer les métadonnées que chaque tâche génère. Ces métadonnées montrent le service Azure Batch planifiant des tâches de façon séquentielle au fil de leur création sur différents nœuds pour qu’elles effectuent toutes leur travail en parallèle.

Ce type de preuve de concept sous-tend en fait de nombreuses applications du monde réel d’Azure Batch. Par exemple, dans le scénario de reconnaissance optique de caractères, des tâches installeront également un logiciel comme Imagemagick pour convertir les images de purification d’eau chargées au format TIF, puis installeront Tesseract pour effectuer le travail de conversion. Ces tâches seraient partitionnées de telle sorte que chaque nœud Worker effectue une partie du travail de reconnaissance optique de caractères en parallèle avec les autres afin d’effectuer le tout plus rapidement.

Même cette preuve de concept va montrer des composants importants d’Azure Batch travaillant de concert. Vous allez créer un pool, des nœuds Worker, un travail, puis des tâches, le tout en utilisant Azure CLI pour émettre des commandes et obtenir un feedback immédiat.

Diagramme du workflow Azure Batch.

Avantages de l’utilisation d’Azure Batch

Azure Batch convient particulièrement pour l’exécution de tâches Batch de calcul haute performance massivement parallèles. Le service gère tout pour vous ; il gère et planifie tous les nœuds et toutes les applications nécessaires pour exécuter vos scénarios. Il s’agit également d’un service gratuit et vous ne payez donc que les ressources sous-jacentes de calcul, de stockage et de mise en réseau que vous utilisez.