Sdílet prostřednictvím


Přehled: Nasazení modelů AI na portálu Azure AI Foundry

Katalog modelů na portálu Azure AI Foundry je centrum pro zjišťování a používání široké škály modelů pro vytváření aplikací generující AI. Modely je potřeba nasadit, aby byly dostupné pro příjem žádostí o odvozování. Proces interakce s nasazeným modelem se nazývá odvozování. Azure AI Foundry nabízí komplexní sadu možností nasazení pro tyto modely v závislosti na vašich potřebách a požadavcích modelu.

Nasazení modelů

Možnosti nasazení se liší v závislosti na typu modelu:

  • Modely Azure OpenAI: Nejnovější modely OpenAI, které mají podnikové funkce z Azure.
  • Modely jako služby: Tyto modely nevyžadují kvótu výpočetních prostředků z vašeho předplatného. Tato možnost umožňuje nasadit model jako službu (MaaS). Používáte nasazení bezserverového rozhraní API a účtuje se podle tokenu způsobem průběžných plateb.
  • Otevřené a vlastní modely: Katalog modelů nabízí přístup k široké škále modelů napříč způsoby, které jsou otevřené. Ve vlastním předplatném můžete hostovat otevřené modely se spravovanou infrastrukturou, virtuálními počítači a počtem instancí pro správu kapacity. Existuje široká škála modelů od Azure OpenAI, Hugging Face a NVIDIA.

Azure AI Foundry nabízí čtyři různé možnosti nasazení:

Název Azure OpenAI Service Odvození modelu Azure AI Bezserverové rozhraní API Spravované výpočetní prostředky
Které modely je možné nasadit? Modely Azure OpenAI Modely a modely Azure OpenAI jako služba Modely jako služba Otevření a vlastní modely
Prostředek nasazení Prostředek Azure OpenAI Prostředek služeb Azure AI Zdroj projektu AI Zdroj projektu AI
Nejvhodnější v případech, kdy Plánujete používat pouze modely OpenAI. Plánujete využít hlavní modely v katalogu Azure AI, včetně OpenAI. Plánujete použít jeden model od konkrétního poskytovatele (s výjimkou OpenAI). Pokud plánujete používat otevřené modely a máte v předplatném k dispozici dostatečnou kvótu výpočetních prostředků.
Fakturační báze Využití tokenů a PTU Využití tokenů Využitítokenů 1 Výpočetní jádro hodiny2
Pokyny k nasazení Nasazení do služby Azure OpenAI Nasazení do odvozování modelu Azure AI Nasazení do bezserverového rozhraní API Nasazení do spravovaného výpočetního prostředí

1 Minimální infrastruktura koncových bodů se účtuje za minutu. Za infrastrukturu, která je hostitelem modelu v průběžných platbách, se vám neúčtuje. Po odstranění koncového bodu se nebudou účtovat žádné další poplatky.

2 Fakturace se provádí za minutu v závislosti na úrovni produktu a počtu instancí používaných v nasazení od okamžiku vytvoření. Po odstranění koncového bodu se nebudou účtovat žádné další poplatky.

Tip

Další informace o sledování nákladů najdete v tématu Monitorování nákladů na modely nabízené prostřednictvím Azure Marketplace.

Jak mám uvažovat o možnostech nasazení?

Azure AI Foundry doporučuje zákazníkům prozkoumat možnosti nasazení a vybrat si ten, který nejlépe vyhovuje jejich obchodním a technickým potřebám. Obecně můžete použít následující proces myšlení:

  1. Začněte možnostmi nasazení, které mají větší rozsahy. Díky tomu můžete iterovat a vytvářet prototypy ve vaší aplikaci rychleji, aniž byste museli znovu sestavit architekturu pokaždé, když se rozhodnete něco změnit. Odvozování modelů Azure AI je cíl nasazení, který podporuje všechny vlajkové modely v katalogu Azure AI, včetně nejnovějších inovací z Azure OpenAI. Začněte tím, že podle konfigurace projektu AI použijete odvozování modelu Azure AI.

  2. Když chcete použít konkrétní model:

    1. Pokud vás zajímají modely Azure OpenAI, použijte službu Azure OpenAI, která pro ně nabízí širokou škálu funkcí a je určená pro ně.

    2. Pokud vás zajímá konkrétní model z modelů jako služba a neočekáváte použití jiného typu modelu, použijte koncové body bezserverového rozhraní API. Umožňují nasazení jednoho modelu v rámci jedinečné sady adres URL a klíčů koncového bodu.

  3. Pokud váš model není k dispozici v modelech jako služba a máte ve svém předplatném dostupnou kvótu výpočetních prostředků, použijte spravované výpočetní prostředky , které podporují nasazení otevřených a vlastních modelů. Umožňuje také vysokou úroveň přizpůsobení serveru pro odvozování nasazení, protokolů a podrobné konfigurace.

Tip

Každá možnost nasazení může nabízet různé možnosti z hlediska sítí, zabezpečení a dalších funkcí, jako je bezpečnost obsahu. Projděte si dokumentaci pro každou z nich a seznamte se s jejich omezeními.