Sdílet prostřednictvím


Přehled: Nasazení modelů AI na portálu Azure AI Foundry

Katalog modelů na portálu Azure AI Foundry je centrum pro zjišťování a používání široké škály modelů pro vytváření aplikací generující AI. Modely je potřeba nasadit, aby byly dostupné pro příjem žádostí o odvozování. Proces interakce s nasazeným modelem se nazývá odvozování. Azure AI Foundry nabízí komplexní sadu možností nasazení pro tyto modely v závislosti na vašich potřebách a požadavcích modelu.

Nasazení modelů

Možnosti nasazení se liší v závislosti na typu modelu:

  • Modely Azure OpenAI: Nejnovější modely OpenAI, které mají podnikové funkce z Azure.
  • Modely jako služby: Tyto modely nevyžadují kvótu výpočetních prostředků z vašeho předplatného. Tato možnost umožňuje nasadit model jako službu (MaaS). Používáte nasazení bezserverového rozhraní API a účtuje se podle tokenu způsobem průběžných plateb.
  • Otevřené a vlastní modely: Katalog modelů nabízí přístup k široké škále modelů napříč způsoby, které jsou otevřené. Ve vlastním předplatném můžete hostovat otevřené modely se spravovanou infrastrukturou, virtuálními počítači a počtem instancí pro správu kapacity. Existuje široká škála modelů od Azure OpenAI, Hugging Face a NVIDIA.

Azure AI Foundry nabízí čtyři různé možnosti nasazení:

Název Azure OpenAI Service Služba odvozování modelů Azure AI Bezserverové rozhraní API Spravované výpočetní prostředky
Které modely je možné nasadit? Modely Azure OpenAI Modely a modely Azure OpenAI jako služba Modely jako služba Otevření a vlastní modely
Prostředek nasazení Prostředek Azure OpenAI Prostředek služeb Azure AI Zdroj projektu AI Zdroj projektu AI
Nejvhodnější v případech, kdy Plánujete používat pouze modely OpenAI. Plánujete využít hlavní modely v katalogu Azure AI, včetně OpenAI. Plánujete použít jeden model od konkrétního poskytovatele (s výjimkou OpenAI). Pokud plánujete používat otevřené modely a máte v předplatném k dispozici dostatečnou kvótu výpočetních prostředků.
Fakturační báze Využití tokenů a PTU Využití tokenů Využitítokenů 1 Výpočetní jádro hodiny2
Pokyny k nasazení Nasazení do služby Azure OpenAI Nasazení do odvozování modelu Azure AI Nasazení do bezserverového rozhraní API Nasazení do spravovaného výpočetního prostředí

1 Minimální infrastruktura koncových bodů se účtuje za minutu. Za infrastrukturu, která je hostitelem modelu v průběžných platbách, se vám neúčtuje. Po odstranění koncového bodu se nebudou účtovat žádné další poplatky.

2 Fakturace se provádí za minutu v závislosti na úrovni produktu a počtu instancí používaných v nasazení od okamžiku vytvoření. Po odstranění koncového bodu se nebudou účtovat žádné další poplatky.

Tip

Další informace o sledování nákladů najdete v tématu Monitorování nákladů na modely nabízené prostřednictvím Azure Marketplace.

Jak mám uvažovat o možnostech nasazení?

Azure AI Foundry doporučuje zákazníkům prozkoumat možnosti nasazení a vybrat si ten, který nejlépe vyhovuje jejich obchodním a technickým potřebám. Obecně můžete použít následující proces myšlení:

  1. Začněte možnostmi nasazení, které mají větší rozsahy. Díky tomu můžete iterovat a vytvářet prototypy ve vaší aplikaci rychleji, aniž byste museli znovu sestavit architekturu pokaždé, když se rozhodnete něco změnit. Služba odvozování modelů Azure AI je cíl nasazení, který podporuje všechny vlajkové modely v katalogu Azure AI, včetně nejnovějších inovací z Azure OpenAI.

  2. Když chcete použít konkrétní model:

    1. Pokud vás zajímají modely Azure OpenAI, použijte službu Azure OpenAI, která pro ně nabízí širokou škálu funkcí a je určená pro ně.

    2. Pokud vás zajímá konkrétní model z modelů jako služba a neočekáváte použití jiného typu modelu, použijte koncové body bezserverového rozhraní API. Umožňují nasazení jednoho modelu v rámci jedinečné sady adres URL a klíčů koncového bodu.

  3. Pokud váš model není k dispozici v modelech jako služba a máte ve svém předplatném dostupnou kvótu výpočetních prostředků, použijte spravované výpočetní prostředky , které podporují nasazení otevřených a vlastních modelů. Umožňuje také vysokou úroveň přizpůsobení serveru pro odvozování nasazení, protokolů a podrobné konfigurace.

Tip

Každá možnost nasazení může nabízet různé možnosti z hlediska sítí, zabezpečení a dalších funkcí, jako je bezpečnost obsahu. Projděte si dokumentaci pro každou z nich a seznamte se s jejich omezeními.