Akcelerátor cílových zón Azure pro vysokovýkonné výpočetní prostředí (HPC)
Akcelerátor cílových zón vysokovýkonného výpočetního prostředí (HPC) automatizuje nasazení prostředí. Toto prostředí poskytuje základní architekturu, kterou můžete přizpůsobit a vytvořit ucelený mechanismus nasazení pro kompletní řešení clusteru PROSTŘEDÍ HPC v Azure. Akcelerátor je skupina open-sourceových skriptů & šablon, které mohou připravovat cílové zóny na úrovni podniku. Může poskytnout specifický přístup k architektuře a referenční implementaci, která dodržuje architekturu a osvědčené postupy rámce pro přechod na cloud.
Zákazníci přecházejí na prostředí HPC různými způsoby tak, aby vyhovovaly obchodním potřebám, a akcelerátor cílové zóny PROSTŘEDÍ HPC můžete přizpůsobit tak, aby vznikla architektura, která vašemu cestě. Použití akcelerátoru pomáhá dát organizaci na cestu k udržitelnému škálování.
Implementovat zónu přistání na podnikové úrovni
Akcelerátor cílové zóny HPC předpokládá, že začínáte s podnikovou úrovní landing zone, která byla úspěšně implementována. Další informace o tomto předpokladu najdete v následujících článcích:
- Začínáme s cílovými zónami architektury přechodu na cloud na podnikové úrovni
- Implementace cílových zón architektury Přechodu na cloud v podnikovém měřítku v Azure
Co poskytuje akcelerátor přistávací zóny HPC
Přístup k přistávacím zónám akcelerátoru HPC poskytuje vašemu projektu následující prostředky:
- Modulární přístup, abyste mohli přizpůsobit proměnné prostředí
- Pokyny k návrhu, které vám pomůžou vyhodnotit kritická rozhodnutí
- Architektura cílové zóny
- Implementace, která zahrnuje:
- Nasaditelná referenční příručka umožňující vytvoření prostředí pro nasazení prostředí HPC
- Referenční implementace prostředí HPC schválená Microsoftem pro otestování nasazeného prostředí
Pokyny k návrhu pro energii, výrobu a finance
Architektury cílových zón se liší podle obchodního sektoru, kromě toho, že se liší podle organizace. Tato část obsahuje články, které obsahují pokyny pro vytvoření cílové zóny:
- Správa identit a přístupu pro azure HPC
- topologie sítě a možnosti připojení pro azure HPC
- Organizace prostředků pro prostředí HPC
- cs-CZ: Výpočet velkých pracovních zátěží HPC aplikací na virtuálních počítačích Azure
- Úložiště pro prostředí HPC
Pokyny k návrhu pro výběr HPC výpočetních prostředků pro úlohy AI
Volba správné skladové položky gpu optimalizované pro úlohy AI je důležitá pro optimalizaci výkonu a řízení nákladů. Microsoft nabízí mnoho různých skladových položek, které jsou optimalizované pro úlohy, které využívají větší výkon GPU. Při výběru správné skladové položky pro úlohy AI je potřeba vzít v úvahu několik aspektů. Menší úlohy mohou využívat pouze část výkonu CPU, GPU a šířky pásma výkonnějších jednotek, jako je například NDv4. U menších úloh můžete zvážit jiné konfigurace výpočetních prostředků, jako jsou NCv4 a NDv2. Tady je několik důležitých aspektů při výběru správného preferovaného SKU výpočetní jednotky optimalizované pro GPU pro pracovní úlohy v oblasti umělé inteligence.
- Vytváření kontrolních bodů Při spouštění modelů strojového učení zvažte faktory, jako je interval kontrolního bodu. To může mít vliv na výkon GPU během fáze trénování. Zajištění rovnováhy mezi efektivitou úložiště a udržováním hladkých operací GPU. Monitorujte využití GPU.
- Odvozování. Odvozování požadavků se liší od požadavků na trénování s možným vyšším zatížením procesoru, které může dosáhnout maximálního výkonu procesoru. Při výběru výpočetního SKU zvažte požadavky na inferenci vašeho modelu. Monitorujte využití procesoru.
- Školení. Při trénování zvažte požadavky modelu a monitorujte využití procesoru i GPU.
- Určení velikosti úlohy Při zvažování specifikací výpočetní SKU pro vaše AI úlohy vezměte v úvahu velikost úkolu. Menší úlohy, například přibližně OPT 1.3B, nemusí využívat větší velikosti skladových položek a v závislosti na fázi úlohy (odvozování, trénování) můžou ponechat procesor a GPU nečinné.
- Šířka pásma. Větší šířka pásma s nižší latencí může být nákladná, pokud není využita. Zvažte InfiniBand pouze pro největší modely, které budou vyžadovat další šířku pásma.
Prohlédněte si velikosti virtuálních počítačů optimalizovaných pro GPU Azure.
Příklad: koncepční referenční architektura pro energii
Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro energetické prostředí.
Příklad: koncepční referenční architektura pro finance
Následující koncepční referenční architektura je příklad, který ukazuje oblasti návrhu a osvědčené postupy pro finance prostředí.
Příklad: koncepční referenční architektura pro výrobu
Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro výrobní prostředí.
Získání akcelerátoru přistávací plochy HPC
Akcelerátor cílové zóny HPC je k dispozici na GitHubu: akcelerátor platformy Azure HPC OnDemand
Další kroky
Důležité úvahy a doporučení pro architekturu akcelerátoru přistávací zóny HPC najdete v klíčových oblastech návrhu tohoto akcelerátoru v Azure Identity and Access Management.