Sdílet prostřednictvím


Nasazení modelů jako bezserverových rozhraní API

V tomto článku se dozvíte, jak nasadit model z katalogu modelů jako bezserverové rozhraní API s fakturací na základě tokenů s průběžnými platbami.

Důležité

Modely, které jsou ve verzi Preview, jsou na kartách modelu v katalogu modelů označené jako náhled .

Některé modely v katalogu modelů je možné nasadit jako bezserverové rozhraní API s průběžnými platbami. Tento druh nasazení poskytuje způsob, jak využívat modely jako rozhraní API bez jejich hostování ve vašem předplatném a současně udržovat podnikové zabezpečení a dodržování předpisů, které organizace potřebují. Tato možnost nasazení nevyžaduje kvótu z vašeho předplatného.

Tento článek používá k ilustraci nasazení modelu Meta Llama. Stejný postup ale můžete použít k nasazení libovolného modelu v katalogu modelů, které jsou k dispozici pro nasazení bezserverového rozhraní API.

Požadavky

  • Předplatné Azure s platným způsobem platby. Bezplatná nebo zkušební předplatná Azure nebudou fungovat. Pokud nemáte předplatné Azure, vytvořte si placený účet Azure, abyste mohli začít.

  • Centrum Azure AI Foundry

  • Projekt Azure AI Foundry

  • Řízení přístupu na základě role v Azure (Azure RBAC) se používá k udělení přístupu k operacím na portálu Azure AI Foundry. Pokud chcete provést kroky v tomto článku, musí být vašemu uživatelskému účtu přiřazena role Vývojář Azure AI ve skupině prostředků. Další informace o oprávněních najdete v tématu Řízení přístupu na základě role na portálu Azure AI Foundry.

  • Abyste mohli pracovat s Azure AI Foundry, musíte nainstalovat následující software:

    K navigaci v Azure AI Foundry můžete použít libovolný kompatibilní webový prohlížeč.

Vyhledání modelu a ID modelu v katalogu modelů

  1. Přihlaste se k Azure AI Foundry.
  2. Pokud ještě nejste v projektu, vyberte ho.
  3. V levém navigačním podokně vyberte Katalog modelů.

Poznámka:

U modelů nabízených prostřednictvím Azure Marketplace se ujistěte, že váš účet má oprávnění role Azure AI Developer ve skupině prostředků nebo že splňujete oprávnění potřebná k přihlášení k odběru nabídek modelů.

Modely, které nabízejí poskytovatelé jiných společností než Microsoft (například modely Llama a Mistral), se účtují prostřednictvím Azure Marketplace. U takových modelů musíte svůj projekt přihlásit k odběru konkrétní nabídky modelu. Modely, které nabízí Microsoft (například modely Phi-3), nemají tento požadavek, protože fakturace se provádí jinak. Podrobnosti o fakturaci bezserverového nasazení modelů v katalogu modelů najdete v tématu Fakturace bezserverových rozhraní API.

  1. Vyberte kartu modelu modelu, který chcete nasadit. V tomto článku vyberete model Meta-Llama-3-8B-Instruct .

    1. Pokud model nasazujete pomocí Azure CLI, Pythonu nebo ARM, zkopírujte ID modelu.

      Důležité

      Při kopírování ID modelu nezahrnujte verzi. Koncové body bezserverového rozhraní API vždy nasazují nejnovější dostupnou verzi modelu. Například pro ID azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3modelu , kopírovat azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Snímek obrazovky zobrazující stránku podrobností modelu

V další části najdete postup pro přihlášení k odběru projektu k nabídce modelu. Pokud nasazujete model Microsoftu, můžete tuto část přeskočit a přejít na nasazení modelu do koncového bodu bezserverového rozhraní API.

Přihlášení projektu k odběru nabídky modelů

Koncové body bezserverového rozhraní API můžou nasazovat modely od Microsoftu i od jiných společností než Microsoft. Pro modely Microsoftu (například modely Phi-3) nemusíte vytvářet předplatné Azure Marketplace a můžete je nasadit přímo do koncových bodů bezserverového rozhraní API, abyste mohli využívat jejich predikce. V případě modelů jiných společností než Microsoft je potřeba nejprve vytvořit předplatné. Pokud model nasazujete v projektu poprvé, musíte se přihlásit k odběru konkrétní nabídky modelu z Azure Marketplace. Každý projekt má vlastní předplatné konkrétní nabídky modelu Azure Marketplace, která umožňuje řídit a monitorovat útraty.

Tip

Tento krok přeskočte, pokud nasazujete modely z řady modelů Phi-3. Přímo nasaďte model do koncového bodu bezserverového rozhraní API.

Poznámka:

Modely nabízené prostřednictvím Azure Marketplace jsou k dispozici pro nasazení do koncových bodů bezserverového rozhraní API v konkrétních oblastech. Zkontrolujte dostupnost modelu a oblasti pro nasazení bezserverového rozhraní API a ověřte, které modely a oblasti jsou k dispozici. Pokud tu, kterou potřebujete, není uvedený, můžete ho nasadit do pracovního prostoru v podporované oblasti a pak využívat koncové body bezserverového rozhraní API z jiného pracovního prostoru.

  1. Vytvořte předplatné marketplace modelu. Při vytváření předplatného přijímáte podmínky a ujednání přidružené k nabídce modelu.

    1. Na stránce Podrobnosti modelu vyberte Nasadit. Otevře se okno možností nasazení, ve které si můžete vybrat mezi nasazením bezserverového rozhraní API a nasazením pomocí spravovaného výpočetního prostředí.

      Poznámka:

      U modelů, které je možné nasadit pouze prostřednictvím nasazení bezserverového rozhraní API, se průvodce nasazením bezserverového rozhraní API otevře hned po výběru možnosti Nasadit na stránce podrobností modelu.

    2. Výběrem bezserverového rozhraní API s Azure AI Content Safety (Preview) otevřete průvodce nasazením bezserverového rozhraní API.

    3. Vyberte projekt, ve kterém chcete modely nasadit. Pokud chcete použít nabídku nasazení bezserverového modelu rozhraní API, musí váš projekt patřit do jedné z oblastí podporovaných pro bezserverové nasazení pro konkrétní model.

      Snímek obrazovky znázorňující, jak nasadit model s možností bezserverového rozhraní API

    4. Pokud se zobrazí poznámka , že pro tento projekt už máte předplatné Azure Marketplace, nemusíte předplatné vytvářet, protože ho už máte. Můžete pokračovat nasazením modelu do koncového bodu bezserverového rozhraní API.

    5. V průvodci nasazením vyberte odkaz na podmínky Azure Marketplace, kde najdete další informace o podmínkách použití. Můžete také vybrat kartu Ceny a podmínky , kde se dozvíte o cenách vybraného modelu.

    6. Vyberte Přihlášení k odběru a nasazení.

  2. Jakmile se přihlásíte k odběru projektu pro konkrétní nabídku Azure Marketplace, následná nasazení stejné nabídky ve stejném projektu nevyžadují opětovné přihlášení k odběru.

  3. Kdykoliv uvidíte nabídky modelu, ke kterým je váš projekt aktuálně přihlášený:

    1. Přejděte na Azure Portal.

    2. Přejděte do skupiny prostředků, do které projekt patří.

    3. Ve filtru Typ vyberte SaaS.

    4. Zobrazí se všechny nabídky, ke kterým jste aktuálně přihlášení k odběru.

    5. Výběrem libovolného prostředku zobrazíte podrobnosti.

Nasazení modelu do koncového bodu bezserverového rozhraní API

Po vytvoření předplatného pro model jiného než Microsoftu můžete přidružený model nasadit do koncového bodu bezserverového rozhraní API. Pro modely Microsoftu (například modely Phi-3) nemusíte vytvářet předplatné.

Koncový bod bezserverového rozhraní API poskytuje způsob, jak využívat modely jako rozhraní API bez jejich hostování ve vašem předplatném a současně zajistit, aby organizace v podnikovém prostředí potřebovaly zabezpečení a dodržování předpisů. Tato možnost nasazení nevyžaduje kvótu z vašeho předplatného.

V této části vytvoříte koncový bod s názvem meta-llama3-8b-qwerty.

  1. Vytvoření bezserverového koncového bodu

    1. Nasazení modelu Microsoftu, který nevyžaduje přihlášení k odběru nabídky modelů:

      1. Vyberte Nasadit a pak výběrem bezserverového rozhraní API s Azure AI Content Safety (Preview) otevřete průvodce nasazením.
      2. Vyberte projekt, ve kterém chcete model nasadit. Všimněte si, že nejsou podporované všechny oblasti.
    2. Pokud jste projekt právě přihlásili k odběru nabídky modelu v předchozí části, můžete pro model, který vyžaduje jiný model než Microsoft, vybrat možnost Nasadit. Případně vyberte Pokračovat k nasazení (pokud průvodce nasazením měl poznámku , že pro tento projekt už máte předplatné Azure Marketplace).

      Snímek obrazovky znázorňující projekt, který je už přihlášený k odběru nabídky

    3. Pojmenujte nasazení. Tento název se stane součástí adresy URL rozhraní API nasazení. Tato adresa URL musí být v každé oblasti Azure jedinečná.

      Snímek obrazovky znázorňující, jak zadat název nasazení, které chcete vytvořit

      Tip

      Možnost Filtr obsahu (Preview) je ve výchozím nastavení povolená. Ponechte výchozí nastavení, aby služba zjistila škodlivý obsah, jako je nenávist, sebeškozování, sexuální a násilné obsah. Další informace o filtrování obsahu (Preview) najdete v tématu Filtrování obsahu na portálu Azure AI Foundry.

    4. Vyberte Nasadit. Počkejte, až bude nasazení připravené a budete přesměrováni na stránku Nasazení.

  2. V libovolném okamžiku uvidíte koncové body nasazené do projektu:

    1. Přejděte na svůj projekt.

    2. V části Moje prostředky vyberte Modely a koncové body.

    3. Zobrazují se koncové body bezserverového rozhraní API.

  3. Vytvořený koncový bod používá pro autorizaci ověřování pomocí klíče. Pomocí následujícího postupu získejte klíče přidružené k danému koncovému bodu.

    Můžete vybrat nasazení a poznamenat si cílový identifikátor URI a klíč koncového bodu. Použijte je k volání nasazení a generování předpovědí.

    Poznámka:

    Při použití webu Azure Portal se ve skupině prostředků ve výchozím nastavení nezobrazují koncové body bezserverového rozhraní API. Pomocí možnosti Zobrazit skryté typy je můžete zobrazit ve skupině prostředků.

  4. V tuto chvíli je váš koncový bod připravený k použití.

  5. Pokud potřebujete toto nasazení využívat z jiného projektu nebo centra nebo plánujete použít tok výzvy k vytváření inteligentních aplikací, musíte vytvořit připojení k nasazení bezserverového rozhraní API. Informace o konfiguraci existujícího koncového bodu bezserverového rozhraní API v novém projektu nebo centru najdete v tématu Využití nasazených koncových bodů bezserverového rozhraní API z jiného projektu nebo z toku výzvy.

    Tip

    Pokud používáte tok výzvy ve stejném projektu nebo centru, ve kterém bylo nasazení nasazeno, stále potřebujete vytvořit připojení.

Použití koncového bodu bezserverového rozhraní API

Modely nasazené ve službě Azure Machine Learning a Azure AI Foundry v koncových bodech bezserverového rozhraní API podporují rozhraní API pro odvozování modelů Azure AI, které zpřístupňuje společnou sadu funkcí pro základní modely a které můžou vývojáři používat k využívání predikcí z různorodé sady modelů jednotným a konzistentním způsobem.

Přečtěte si další informace o možnostech tohoto rozhraní API a o tom, jak ho můžete použít při vytváření aplikací.

Izolace sítě

Koncové body pro modely nasazené jako bezserverová rozhraní API se řídí nastavením příznaku PNA (Public Network Access) centra portálu Azure AI Foundry s projektem, ve kterém nasazení existuje. Pokud chcete zabezpečit koncový bod MaaS, zakažte příznak PNA ve službě Azure AI Foundry Hub. Příchozí komunikaci z klienta do koncového bodu můžete zabezpečit pomocí privátního koncového bodu centra.

Nastavení příznaku PNA pro centrum Azure AI Foundry:

  1. Přejděte na Azure Portal.
  2. Vyhledejte skupinu prostředků, do které centrum patří, a vyberte centrum Azure AI z prostředků uvedených pro tuto skupinu prostředků.
  3. Na stránce Přehled centra v nabídce vlevo vyberte Nastavení>sítě.
  4. Na kartě Veřejný přístup můžete nakonfigurovat nastavení příznaku přístupu k veřejné síti.
  5. Uložte provedené změny. Rozšíření změn může trvat až pět minut.

Odstranění koncových bodů a předplatných

Můžete odstranit předplatná a koncové body modelu. Odstraněním předplatného modelu se všechny přidružené koncové body stanou nedostupnými a nepoužitelnými.

Odstranění koncového bodu bezserverového rozhraní API:

  1. Přejděte do Azure AI Foundry.

  2. Přejděte na svůj projekt.

  3. V části Moje prostředky vyberte Modely a koncové body.

  4. Otevřete nasazení, které chcete odstranit.

  5. Vyberte Odstranit.

Odstranění přidruženého předplatného modelu:

  1. Přejděte na web Azure Portal.

  2. Přejděte do skupiny prostředků, do které projekt patří.

  3. Ve filtru Typ vyberte SaaS.

  4. Vyberte předplatné, které chcete odstranit.

  5. Vyberte Odstranit.

Důležité informace o nákladech a kvótách pro modely nasazené jako koncové body bezserverového rozhraní API

Kvóta se spravuje podle nasazení. Každé nasazení má limit rychlosti 200 000 tokenů za minutu a 1 000 požadavků rozhraní API za minutu. V současné době ale omezujeme jedno nasazení na model na jeden projekt. Pokud aktuální limity sazeb pro vaše scénáře nestačí, obraťte se na podporu Microsoft Azure.

Náklady na modely Microsoftu

Informace o cenách najdete na kartě Ceny a podmínky průvodce nasazením při nasazování modelů Microsoftu (například modelů Phi-3) jako koncových bodů bezserverového rozhraní API.

Náklady na modely jiné společnosti než Microsoft

Modely jiných společností než Microsoft nasazené jako koncové body bezserverového rozhraní API jsou nabízeny prostřednictvím Azure Marketplace a integrované s Azure AI Foundry pro použití. Ceny za Azure Marketplace najdete při nasazování nebo vyladění těchto modelů.

Pokaždé, když si projekt předplatí danou nabídku z tržiště Azure Marketplace, vytvoří se nový prostředek pro sledování nákladů spojených s jeho spotřebou. Ke sledování nákladů spojených s odvozováním a dolaďováním se používá stejný zdroj, nicméně ke sledování každého scénáře je k dispozici více měřidel nezávisle.

Další informace o sledování nákladů naleznete v části Sledování nákladů na modely nabízené prostřednictvím služby Azure Marketplace.

Snímek obrazovky znázorňující různé prostředky odpovídající různým nabídkám modelu a jejich přidruženým měřičům

Oprávnění potřebná k přihlášení k odběru nabídek modelů

Řízení přístupu na základě role v Azure (Azure RBAC) se používá k udělení přístupu k operacím na portálu Azure AI Foundry. Pokud chcete provést kroky v tomto článku, musíte mít uživatelský účet přiřazenou roli Vlastník, Přispěvatel nebo Vývojář Azure AI pro předplatné Azure. Případně můžete svému účtu přiřadit vlastní roli, která má následující oprávnění:

  • V předplatném Azure – pokud chcete přihlásit pracovní prostor k odběru nabídky Azure Marketplace, jednou pro každý pracovní prostor pro každou nabídku:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Ve skupině prostředků – vytvoření a použití prostředku SaaS:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • V pracovním prostoru – nasazení koncových bodů (role datového vědce Azure Machine Learning už tato oprávnění obsahuje):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Další informace o oprávněních najdete v tématu Řízení přístupu na základě role na portálu Azure AI Foundry.