Utforma ett Azure Batch-jobb till att köra den parallella uppgiften

Slutförd

Azure Batch använder parallella uppgifter för att dela upp ett jobb mellan beräkningsnoder.

Som lösningsarkitekt för den ideella organisationen vill du förstå hur du utformar ett Azure Batch-jobb och hur du aktiverar parallell bearbetning så att dessa funktioner kan användas för OCR-scenariot.

Här lär du dig de viktigaste delarna i en parallell Batch-uppgift.

Använda Azure Batch med Azure CLI

Du bestämmer dig för att skapa lösningen för att hjälpa den ideella organisationen med deras uppdrag med hjälp av Azure Batch och CLI, så att du kan få ett snabbt ramverk på plats och stegvis förbättra det utan att lägga tid på att skapa all grundläggande kod som du annars skulle behöva för att komma igång. Det är sant att andra metoder för att skapa Azure Batch-lösningar som .NET och Node.js ger bättre och mer detaljerad kontroll över Batch och andra Azure-API:er, men ingen av dessa metoder kan matcha den smidighet och omedelbara feedback du får genom att utfärda kommandon i CLI och observera deras resultat.

En parallell exempelaktivitet

För att få ett grepp om Azure Batch och CLI använder du ett enkelt koncepttest för att demonstrera hur de olika noderna arbetar ihop parallellt. Du loopar flera gånger i CLI, lägger till en numrerad uppgift per iteration av loopen och laddar senare ned och tittar på de metadata som varje uppgift genererar. Dessa metadata visar schemaläggningsuppgifterna för Azure Batch-tjänsten när de skapas på olika noder i sekventiellt sätt, så att alla utför sitt arbete parallellt.

Den här typen av koncepttest ligger faktiskt till grund för många verkliga tillämpningar av Azure Batch. I OCR-scenariot skulle uppgifter till exempel även installera programvara som Imagemagick för att konvertera de uppladdade vattenreningsavbildningarna till TIF-formatet och sedan installera Tesseract för att utföra konverteringsarbetet. Dessa uppgifter skulle partitioneras så att varje arbetsnod skulle utföra en del av OCR-arbetet parallellt med de andra för att slutföra processen snabbare.

Även det här konceptbeviset visar viktiga komponenter i Azure Batch som arbetar tillsammans. Du skapar en pool, arbetsnoder, ett jobb och uppgifter med hjälp av Azure CLI för att utfärda kommandon och få omedelbar feedback.

Diagram över Azure Batch-arbetsflödet.

Fördelar med att använda Azure Batch

Azure Batch lämpar sig särskilt väl för körning av storskaliga, parallella batchjobb för högpresterande beräkning (HPC). Tjänsten hanterar allt åt dig och hanterar och schemalägger alla noder och program som krävs för att köra dina scenarier. Det är också en kostnadsfri tjänst, så du betalar bara för de underliggande beräknings-, lagrings- och nätverksresurserna som du använder.