Wat is Azure Batch?

Voltooid

Weinig organisaties hebben de resources om permanente implementaties van superkrachtige rekenplatforms te ondersteunen die mogelijk slechts af en toe worden gebruikt voor capaciteit. Doorgaans hebt u een flexibele en schaalbare rekenoplossing nodig, zoals Azure Batch, om de rekenkracht te bieden.

Als onderdeel van het proces voor het uitvoeren van OCR op de geüploade afbeeldingen van waterzuiveringsmeters met behulp van Azure Batch, moet u inzicht hebben in de belangrijkste onderdelen van een Azure Batch-werkstroom.

Hier ziet u waarvoor Azure Batch is ontworpen en hoe Batch-onderdelen in een standaardwerkstroom worden gebruikt.

Rekenintensieve taken en parallelle workloads

Voor sommige workloads is een grote rekenkracht vereist, bijvoorbeeld voor modellering van financiële risico's, rendering van 3D-afbeeldingen, transcodering van media en genetische sequentieanalyse. In sommige gevallen kunnen deze workloads worden opgesplitst in afzonderlijke subtaken en parallel worden uitgevoerd, zodat de taken veel minder tijd worden uitgevoerd. Drie virtuele machines kunnen het werk in een derde van de tijd uitvoeren.

Als onderdeel van het OCR-project voor de non-profitorganisatie kunt u Azure Batch gebruiken om het werk van het uitvoeren van de OCR te partitioneren, zodat de verwerking parallel wordt uitgevoerd en veel minder tijd in beslag neemt.

De onderdelen van Azure Batch

U kunt Azure Batch gebruiken voor deze grootschalige parallelle en rekenintensieve taken in Azure. Op hoog niveau omvat Azure Batch veel onderdelen die samenwerken. Alle taken moeten worden uitgevoerd in de context van een Azure Batch-account, dat als een container voor alle Batch-resources fungeert.

Voor sommige gebruiksscenario's kunt u dit account koppelen aan een Azure Storage-account om invoerbestanden en toepassingen te downloaden voor gebruik tijdens de uitvoering en het opslaan van hun resultaten. Binnen uw Azure Batch-account kunt u pools met virtuele rekenknooppunten maken, met Windows of Linux, van het aantal en de CPU- en geheugengrootte die u opgeeft, die de Azure Batch-service voor u beheert en plant. Een Batch-account kan vele Batch-pools bevatten.

Nadat u een of meerdere pools hebt gemaakt, maakt u afzonderlijke jobs die fungeren als logische containers voor alle taken die u plant, en algemene eigenschappen kunnen delen. Zoals gezegd is het geen enkel probleem als u meerdere jobs hebt.

Ten slotte maakt u taken die beschrijven hoe het werk daadwerkelijk wordt uitgevoerd. U kunt taken gebruiken om de opdrachtregel rechtstreeks aan te roepen of om toepassingen uit te voeren die u naar Azure Storage hebt geüpload. In de volgende oefening ziet u hoe alle belangrijke onderdelen van Azure Batch met elkaar samenwerken.

Standaard Azure Batch-werkstroom

Hoe ziet een standaard Azure Batch-werkstroom er werkelijk uit? Zoals in de volgende afbeelding wordt weergegeven, zijn voor een typisch Azure Batch-scenario in de praktijk gegevens en toepassingsbestanden vereist. De Batch-werkstroom begint met het uploaden van deze gegevens en toepassingsbestanden naar een Azure Batch-opslagaccount. Vervolgens maakt u een Batch-pool met het vereiste aantal virtuele Windows- of Linux-rekenknooppunten. U kunt ze ook automatisch schalen voor het geval de vereisten van uw workloads in de loop van de tijd variëren.

De Batch-service verwerkt vervolgens de knooppunten online en planningstaken voor uitvoering op de knooppunten. Voordat de taken worden uitgevoerd, kunnen ze alle gegevens en toepassingsbestanden downloaden uit de opslag die ze nodig hebben voor verwerking. U kunt tijdens de uitvoering van de taken de status van de knooppunten en de voortgang van de taken controleren. Zodra de taken op de knooppunten zijn voltooid, kan de uitvoer van de taken worden onderzocht of naar Azure Storage worden gepusht.

Diagram of the Azure Batch workflow.