Sdílet prostřednictvím


Plánování správy nákladů na odvozování modelů ve službách Azure AI

Tento článek popisuje, jak můžete plánovat a spravovat náklady na odvozování modelů ve službách Azure AI Services. Jakmile začnete používat odvozování modelů v prostředcích služeb Azure AI Services, nastavte rozpočty a monitorujte náklady pomocí funkcí služby Cost Management.

I když se tento článek týká plánování a správy nákladů na odvozování modelů ve službách Azure AI, účtuje se vám všechny služby a prostředky Azure používané ve vašem předplatném Azure.

Požadavky

  • Analýza nákladů ve službě Cost Management podporuje většinu typů účtů Azure, ale ne všechny. Úplný seznam podporovaných typů účtů si můžete prohlédnout v článku Vysvětlení dat služby Cost Management.
  • Pokud chcete zobrazit data o nákladech, potřebujete alespoň přístup pro čtení pro účet Azure. Informace o přiřazování přístupu k datům služby Cost Management naleznete v tématu Přiřazení přístupu k datům.

Vysvětlení modelu odvozování fakturačního modelu

Modely nasazené ve službách Azure AI se účtují na 1 000 tokenů. Jazykové modely chápou a zpracovávají text tím, že ho rozdělí na tokeny. Pro informaci má každý token zhruba čtyři znaky u typického anglického textu. Náklady na token se liší v závislosti na zvolené řadě modelů. Modely, které můžou zpracovávat obrázky, rozdělují obrázky také v tokenech. Počet tokenů na obrázku závisí na modelu a rozlišení vstupního obrázku.

Náklady na tokeny se vztahují na vstup i výstup. Předpokládejme například, že máte ukázku kódu JavaScriptu s 1 000 tokeny, kterou požádáte o převod modelu na Python. Při odeslání počátečního vstupního požadavku se vám bude účtovat přibližně 1 000 tokenů a 1 000 dalších tokenů pro výstup přijatý v odpovědi na celkem 2 000 tokenů.

V praxi by pro tento typ volání dokončení nebyl vstup a výstup tokenu dokonale 1:1. Převod z jednoho programovacího jazyka na jiný by mohl vést k delšímu nebo kratšímu výstupu v závislosti na mnoha faktorech. Jedním z takových faktorů je hodnota přiřazená parametru max_tokens .

Rozpis nákladů

Abyste pochopili rozpis nákladů, může být užitečné použít nástroj Analýza nákladů na webu Azure Portal. Pokud chcete porozumět nákladům na odvozování, postupujte takto:

  1. Přejděte na portál Azure AI Foundry.

  2. V pravém horním rohu obrazovky vyberte název prostředku služby Azure AI Nebo pokud pracujete na projektu AI, vyberte název projektu.

  3. Vyberte název projektu. Azure Portal se otevře v novém okně.

    Snímek obrazovky znázorňuje přístup ke stránce podrobností skupiny prostředků na webu Azure Portal z portálu Azure AI Foundry.

  4. V části Správa nákladů vyberte Analýzu nákladů.

  5. Ve výchozím nastavení je analýza nákladů vymezena na vybranou skupinu prostředků.

    Důležité

    Je důležité nastavit rozsah analýzy nákladů na skupinu prostředků, ve které je nasazený prostředek Azure AI Services. Měřiče nákladů přidružené k některým poskytovatelům modelů, jako je Mistral AI nebo Cohere, se místo prostředku Azure AI Services zobrazují ve skupině prostředků.

  6. Umožňuje upravit seskupení podle měřiče. Teď vidíte, že pro tuto konkrétní skupinu prostředků pochází zdroj nákladů z různých řad modelů.

    Snímek obrazovky znázorňuje, jak zobrazit náklady podle jednotlivých měřičů ve skupině prostředků

Následující části popisují podrobnosti o položkách.

Modely Azure OpenAI a Microsoftu

Řada modelů Azure OpenAI a Microsoftu (například Phi) se účtují přímo a zobrazují se jako měřiče fakturace v rámci jednotlivých prostředků služeb Azure AI. K této fakturaci dochází přímo prostřednictvím Microsoftu. Při kontrole faktury si všimnete, že měřiče fakturace započítávají vstupy a výstupy pro každý spotřebovaný model.

Snímek obrazovky řídicího panelu analýzy nákladů s vymezeným oborem skupiny prostředků, ve které je nasazený prostředek Azure AI Services, se zvýrazněním měřičů pro modely Azure OpenAI a Microsoftu Náklady se seskupují podle měřiče.

Modely zprostředkovatelů

Modely poskytované jiným poskytovatelem, jako je Mistral AI, Cohere, Meta AI nebo AI21 Labs, se účtují pomocí Azure Marketplace. Stejně jako u měřičů fakturace Microsoftu jsou tyto položky přidružené ke skupině prostředků, ve které se vaše služby Azure AI nasazují místo samotného prostředku azure AI Services. Zobrazí se položky pod názvemslužby SaaS , které započítávají vstupy a výstupy pro každý spotřebovaný model.

Snímek obrazovky řídicího panelu analýzy nákladů s vymezeným oborem skupiny prostředků, ve které je nasazený prostředek azure AI Services, se zvýrazněním měřičů pro modely fakturované v rámci Azure Marketplace Náklady se seskupují podle měřiče.

Použití zálohy na Azure

Poplatky za Azure OpenAI a modely Microsoftu můžete platit pomocí kreditu zálohy na Azure. Kredit azure Prepayment ale nemůžete použít k úhradě poplatků za jiné modely poskytovatele, protože se účtují prostřednictvím Azure Marketplace.

Kód odpovědi na chybu HTTP a stav fakturace

Pokud služba provádí zpracování, budou se vám účtovat poplatky i v případě, že stavový kód není úspěšný (ne 200). Například chyba 400 kvůli filtru obsahu nebo limitu vstupu nebo chybě 408 kvůli vypršení časového limitu.

Pokud služba neprovádí zpracování, nebudou se vám účtovat poplatky. Například chyba 401 kvůli ověření nebo chybě 429 kvůli překročení limitu rychlosti.

Další náklady

Povolení možností, jako je odesílání dat do protokolů služby Azure Monitor a upozorňování, se za tyto služby účtují další náklady. Tyto náklady jsou viditelné v rámci těchto dalších služeb a na úrovni předplatného, ale nejsou viditelné, pokud jsou omezené pouze na prostředek služeb Azure AI.

Monitorování nákladů

Náklady na jednotku využití prostředků Azure se liší podle časových intervalů, jako jsou sekundy, minuty, hodiny a dny nebo podle využití jednotek, jako jsou bajty a megabajty. Jakmile se služby Azure AI začnou používat, můžou vzniknout náklady a náklady se zobrazí v analýze nákladů.

Podrobnější fakturační údaje můžete získat pomocí analýzy nákladů:

Abyste pochopili rozpis toho, co tyto náklady tvoří, může být užitečné použít nástroj Analýza nákladů na webu Azure Portal.

  1. Přejděte na portál Azure AI Foundry.

  2. V pravém horním rohu obrazovky vyberte název prostředku služby Azure AI Nebo pokud pracujete na projektu AI, vyberte název projektu.

  3. Vyberte název projektu. Azure Portal se otevře v novém okně.

  4. V části Správa nákladů vyberte Analýzu nákladů.

  5. Ve výchozím nastavení je analýza nákladů vymezená na skupinu prostředků, kterou jste vybrali.

  6. Vzhledem k tomu, že vidíme náklady na celou skupinu prostředků, je užitečné zobrazit náklady podle prostředků. V takovém případě vyberte Zobrazit>náklady podle prostředku.

    Snímek obrazovky znázorňuje, jak zobrazit náklady podle jednotlivých prostředků ve skupině prostředků.

  7. Teď můžete zobrazit prostředky, které generují každý z měřičů fakturace.

  8. Modely Azure OpenAI a modely Microsoftu, jak je vysvětleno dříve, se zobrazují jako měřiče v rámci jednotlivých prostředků služeb Azure AI:

    Snímek obrazovky řídicího panelu analýzy nákladů s vymezeným oborem skupiny prostředků, ve které je nasazený prostředek Azure AI Services, se zvýrazněním měřičů pro modely Azure OpenAI a Microsoftu Náklady jsou seskupovány podle prostředků.

  9. Některé modely poskytovatelů se zobrazují jako měřiče v rámci globálních prostředků. Všimněte si, že slovo Global nesouvisí se skladovou jednotkou nasazení modelu (například globální standard). Pokud máte více prostředků služeb Azure AI, faktura obsahuje jednu položku pro každý model pro každý prostředek služeb Azure AI. Měřiče prostředků mají formát [název_modelu]-[GUID], kde [GUID] je jedinečný identifikátor přidružený k danému prostředku azure AI Services. Všimněte si, že měřiče fakturace se započítávají do vstupů a výstupů pro každý model, který jste spotřebovali.

    Snímek obrazovky řídicího panelu analýzy nákladů s vymezeným oborem skupiny prostředků, ve které je nasazený prostředek azure AI Services, se zvýrazněním měřičů pro modely fakturované v rámci Azure Marketplace Náklady jsou seskupovány podle prostředků.

Při vyhodnocování nákladů spojených se službami Azure AI je důležité porozumět rozsahu. Pokud jsou vaše prostředky součástí stejné skupiny prostředků, můžete určit rozsah analýzy nákladů na této úrovni, abyste porozuměli vlivu na náklady. Pokud jsou vaše prostředky rozložené do více skupin prostředků, můžete nastavit rozsah na úroveň předplatného.

Tvorba rozpočtů

Můžete vytvářet rozpočty pro správu nákladů a vytvářet výstrahy , které zúčastněné strany informují o anomáliích útraty a rizikech přetížení. Upozornění jsou založena na porovnání útraty s rozpočtem a prahovými hodnotami nákladů. Vytvoříte rozpočty a upozornění pro předplatná Azure a skupiny prostředků. Jsou užitečné jako součást celkové strategie monitorování nákladů.

Pokud chcete mít v monitorování větší členitost, můžete vytvořit rozpočty s filtry pro konkrétní prostředky nebo služby v Azure. Filtry pomáhají zajistit, že nechtěně nevytáčíte nové prostředky, které vás budou stát více peněz. Další informace o možnostech filtru, které jsou k dispozici při vytváření rozpočtu, najdete v tématu Možnosti skupiny a filtru.

Export nákladových dat

Data nákladů můžete také exportovat do účtu úložiště, což je užitečné, když potřebujete další analýzy dat za náklady. Finanční tým může například analyzovat data pomocí Excelu nebo Power BI. Náklady můžete exportovat denně, týdně nebo měsíčně a nastavit vlastní rozsah kalendářních dat. Jako způsob načtení datových sad nákladů doporučujeme exportovat data nákladů.

Další kroky