Wat is Azure Batch?
Weinig organisaties hebben de resources om permanente implementaties van superkrachtige rekenplatforms te ondersteunen die mogelijk slechts af en toe worden gebruikt voor capaciteit. Doorgaans hebt u een flexibele en schaalbare rekenoplossing nodig, zoals Azure Batch, om de rekenkracht te bieden.
Als onderdeel van het proces voor het uitvoeren van OCR op de geüploade afbeeldingen van waterzuiveringsmeters met behulp van Azure Batch, moet u inzicht hebben in de belangrijkste onderdelen van een Azure Batch-werkstroom.
Hier bekijkt u wat Azure Batch is ontworpen om te doen en hoe Batch-onderdelen worden gebruikt in een typische werkstroom.
Rekenintensieve taken en parallelle werkbelastingen
Voor sommige workloads is enorme rekenkracht vereist. Voorbeelden hiervan zijn modellering van financiële risico's, rendering van 3D-afbeeldingen, mediatranscodering en genetische sequentieanalyse. In sommige gevallen kunnen deze workloads worden opgesplitst in afzonderlijke subtaken en parallel worden uitgevoerd, zodat de taken veel minder tijd worden uitgevoerd. Drie virtuele machines (VM's) kunnen het werk van één in een derde van de tijd uitvoeren.
Als onderdeel van het OCR-project voor de non-profitorganisatie kunt u Azure Batch gebruiken om het werk van het uitvoeren van de OCR te partitioneren, zodat de verwerking parallel wordt uitgevoerd en veel minder tijd in beslag neemt.
De onderdelen van Azure Batch
U kunt Azure Batch gebruiken voor deze grootschalige parallelle en rekenintensieve taken in Azure. Op hoog niveau omvat Azure Batch veel onderdelen die samenwerken. Alles moet plaatsvinden binnen de context van een Azure Batch-account, dat fungeert als een container voor alle Batch-resources.
Voor sommige gebruiksscenario's kunt u dit account koppelen aan een Azure Storage-account om invoerbestanden en toepassingen te downloaden voor gebruik tijdens de uitvoering en het opslaan van hun resultaten. Binnen uw Azure Batch-account kunt u pools met virtuele rekenknooppunten maken, met Windows of Linux, van het aantal en de CPU- en geheugengrootte die u opgeeft, die de Azure Batch-service voor u beheert en plant. Een Batch-account kan veel Batch-pools bevatten.
Nadat u een of meer pools hebt gemaakt, maakt u afzonderlijke taken, die fungeren als logische containers voor alle taken die u plant en algemene eigenschappen kunnen delen. Nogmaals, het is perfect mogelijk om veel banen te hebben.
En ten slotte maakt u taken, waarin wordt beschreven hoe het werk daadwerkelijk wordt uitgevoerd. U kunt taken gebruiken om de opdrachtregel rechtstreeks aan te roepen, of de taken kunnen toepassingen uitvoeren die u uploadt naar Azure Storage. In de volgende oefening zien we alle belangrijkste onderdelen van Azure Batch die samenwerken.
Typische Azure Batch-workflow
Hoe ziet een typische Azure Batch-werkstroom er eigenlijk uit? Zoals in de volgende afbeelding wordt weergegeven, zijn voor een typisch Azure Batch-scenario in de praktijk gegevens en toepassingsbestanden vereist. De Batch-werkstroom begint met het uploaden van deze gegevens en toepassingsbestanden naar een Azure-opslagaccount. Vervolgens maakt u een Batch-pool met zo veel virtuele Rekenknooppunten van Windows of Linux als dat nodig is. U kunt ze ook automatisch opschalen indien de vereisten van uw workloads in de loop van de tijd variëren.
De Batch-service zorgt vervolgens voor het online brengen van de knooppunten en het inplannen van taken voor uitvoering op de knooppunten. Voordat de taken worden uitgevoerd, kunnen ze alle gegevens en toepassingsbestanden downloaden uit de opslag die ze nodig hebben voor verwerking. Terwijl de taken worden uitgevoerd, is het mogelijk om een query uit te voeren op de status van de knooppunten en de voortgang van de taken. Zodra de knooppunten hun taken hebben voltooid, kan de taakuitvoer worden onderzocht of gepusht naar Azure Storage.