Sdílet prostřednictvím


Akcelerátor cílových zón Azure pro vysokovýkonné výpočetní prostředí (HPC)

Akcelerátor cílových zón vysokovýkonného výpočetního prostředí (HPC) automatizuje nasazení prostředí. Toto prostředí poskytuje základní architekturu, kterou můžete přizpůsobit a vytvořit ucelený mechanismus nasazení pro kompletní řešení clusteru PROSTŘEDÍ HPC v Azure. Akcelerátor je skupina open-sourceových skriptů & šablon, které mohou připravovat cílové zóny na úrovni podniku. Může poskytnout specifický přístup k architektuře a referenční implementaci, která dodržuje architekturu a osvědčené postupy rámce pro přechod na cloud.

Zákazníci přecházejí na prostředí HPC různými způsoby tak, aby vyhovovaly obchodním potřebám, a akcelerátor cílové zóny PROSTŘEDÍ HPC můžete přizpůsobit tak, aby vznikla architektura, která vašemu cestě. Použití akcelerátoru pomáhá dát organizaci na cestu k udržitelnému škálování.

Implementovat zónu přistání na podnikové úrovni

Akcelerátor cílové zóny HPC předpokládá, že začínáte s podnikovou úrovní landing zone, která byla úspěšně implementována. Další informace o tomto předpokladu najdete v následujících článcích:

Co poskytuje akcelerátor přistávací zóny HPC

Přístup k přistávacím zónám akcelerátoru HPC poskytuje vašemu projektu následující prostředky:

  • Modulární přístup, abyste mohli přizpůsobit proměnné prostředí
  • Pokyny k návrhu, které vám pomůžou vyhodnotit kritická rozhodnutí
  • Architektura cílové zóny
  • Implementace, která zahrnuje:
    • Nasaditelná referenční příručka umožňující vytvoření prostředí pro nasazení prostředí HPC
    • Referenční implementace prostředí HPC schválená Microsoftem pro otestování nasazeného prostředí

Pokyny k návrhu pro energii, výrobu a finance

Architektury cílových zón se liší podle obchodního sektoru, kromě toho, že se liší podle organizace. Tato část obsahuje články, které obsahují pokyny pro vytvoření cílové zóny:

Pokyny k návrhu pro výběr HPC výpočetních prostředků pro úlohy AI

Volba správné skladové položky gpu optimalizované pro úlohy AI je důležitá pro optimalizaci výkonu a řízení nákladů. Microsoft nabízí mnoho různých skladových položek, které jsou optimalizované pro úlohy, které využívají větší výkon GPU. Při výběru správné skladové položky pro úlohy AI je potřeba vzít v úvahu několik aspektů. Menší úlohy mohou využívat pouze část výkonu CPU, GPU a šířky pásma výkonnějších jednotek, jako je například NDv4. U menších úloh můžete zvážit jiné konfigurace výpočetních prostředků, jako jsou NCv4 a NDv2. Tady je několik důležitých aspektů při výběru správného preferovaného SKU výpočetní jednotky optimalizované pro GPU pro pracovní úlohy v oblasti umělé inteligence.

  • Vytváření kontrolních bodů Při spouštění modelů strojového učení zvažte faktory, jako je interval kontrolního bodu. To může mít vliv na výkon GPU během fáze trénování. Zajištění rovnováhy mezi efektivitou úložiště a udržováním hladkých operací GPU. Monitorujte využití GPU.
  • Odvozování. Odvozování požadavků se liší od požadavků na trénování s možným vyšším zatížením procesoru, které může dosáhnout maximálního výkonu procesoru. Při výběru výpočetního SKU zvažte požadavky na inferenci vašeho modelu. Monitorujte využití procesoru.
  • Školení. Při trénování zvažte požadavky modelu a monitorujte využití procesoru i GPU.
  • Určení velikosti úlohy Při zvažování specifikací výpočetní SKU pro vaše AI úlohy vezměte v úvahu velikost úkolu. Menší úlohy, například přibližně OPT 1.3B, nemusí využívat větší velikosti skladových položek a v závislosti na fázi úlohy (odvozování, trénování) můžou ponechat procesor a GPU nečinné.
  • Šířka pásma. Větší šířka pásma s nižší latencí může být nákladná, pokud není využita. Zvažte InfiniBand pouze pro největší modely, které budou vyžadovat další šířku pásma.

Prohlédněte si velikosti virtuálních počítačů optimalizovaných pro GPU Azure.

Příklad: koncepční referenční architektura pro energii

Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro energetické prostředí.

Diagram znázorňující ukázkovou architekturu pro energetické prostředí, včetně výpočetních prostředků, úložiště, podsítí, databáze a front-endu pro místní uživatele

Příklad: koncepční referenční architektura pro finance

Následující koncepční referenční architektura je příklad, který ukazuje oblasti návrhu a osvědčené postupy pro finance prostředí.

diagram, který ukazuje ukázkovou architekturu pro finanční prostředí, včetně místních prostředků, virtuální sítě, podsítí a skupin zabezpečení sítě.

Příklad: koncepční referenční architektura pro výrobu

Následující koncepční referenční architektura je příkladem, který ukazuje oblasti návrhu a osvědčené postupy pro výrobní prostředí.

diagram, který znázorňuje ukázkovou architekturu výrobního prostředí, včetně místních a cloudových prostředků a přistávací zóny HPC.

Získání akcelerátoru přistávací plochy HPC

Akcelerátor cílové zóny HPC je k dispozici na GitHubu: akcelerátor platformy Azure HPC OnDemand

Další kroky

Důležité úvahy a doporučení pro architekturu akcelerátoru přistávací zóny HPC najdete v klíčových oblastech návrhu tohoto akcelerátoru v Azure Identity and Access Management.