Generování metrik pro spotřebu velkých tokenů jazykového modelu
PLATÍ PRO: Všechny úrovně služby API Management
Tato llm-emit-token-metric
zásada odesílá vlastní metriky do Application Insights o spotřebě velkých tokenů jazykového modelu (LLM) prostřednictvím rozhraní API LLM. Mezi metriky počtu tokenů patří celkový počet tokenů, tokeny výzvy a tokeny dokončení.
Poznámka:
V současné době je tato zásada ve verzi Preview.
Poznámka:
Nastavte prvky zásad a podřízené prvky v pořadí uvedeném v prohlášení o zásadách. Přečtěte si další informace o tom, jak nastavit nebo upravit zásady služby API Management.
Podporované modely
Použijte zásadu s rozhraními LLM API přidanými do služby Azure API Management, které jsou dostupné prostřednictvím rozhraní API pro odvozování modelů Azure AI.
Omezení pro vlastní metriky
Azure Monitor ukládá limity využití pro vlastní metriky, které můžou ovlivnit vaši schopnost generovat metriky ze služby API Management. Azure Monitor například v současné době nastavuje limit 10 klíčů dimenzí na metriku a limit 50 000 celkového počtu aktivních časových řad na oblast v předplatném (v rámci 12hodinového období).
Tato omezení mají následující důsledky pro konfiguraci vlastních metrik v zásadách služby API Management, například emit-metric
azure-openai-emit-token-metric
:
Pro každou zásadu můžete nakonfigurovat maximálně 10 vlastních dimenzí.
Počet aktivních časových řad vygenerovaných zásadou během 12hodinového období je součinem počtu jedinečných hodnot jednotlivých nakonfigurovaných dimenzí během období. Pokud byly například v zásadách nakonfigurovány tři vlastní dimenze a každá dimenze měla v daném období 10 možných hodnot, zásada by přispěla 1 000 (10 x 10 x 10) aktivních časových řad.
Pokud zásadu nakonfigurujete v několika instancích služby API Management, které jsou ve stejné oblasti v předplatném, můžou všechny instance přispívat k limitu regionálních aktivních časových řad.
Přečtěte si další informace o omezeních a aspektech návrhu pro vlastní metriky ve službě Azure Monitor.
Požadavky
- Do instance služby API Management je potřeba přidat jedno nebo více rozhraní API LLM.
- Vaše instance služby API Management musí být integrovaná se službou Application Insights. Další informace najdete v tématu Integrace služby Azure API Management s Aplikace Azure lication Insights.
- Povolte protokolování Application Insights pro vaše rozhraní API LLM.
- Povolte vlastní metriky s dimenzemi v Application Insights. Další informace najdete v tématu Generování vlastních metrik.
Prohlášení o zásadách
<llm-emit-token-metric
namespace="metric namespace" >
<dimension name="dimension name" value="dimension value" />
...additional dimensions...
</llm-emit-token-metric>
Atributy
Atribut | Popis | Povinní účastníci | Default value |
---|---|---|---|
namespace | Řetězec. Obor názvů metriky Výrazy zásad nejsou povolené. | No | API Management |
Elementy
Element (Prvek) | Popis | Povinní účastníci |
---|---|---|
Dimenze | Přidejte jeden nebo více těchto prvků pro každou dimenzi, která je součástí metriky. | Ano |
atributy dimenze
Atribut | Popis | Povinní účastníci | Default value |
---|---|---|---|
name | Řetězcový výraz nebo výraz zásad. Název dimenze. | Yes | – |
hodnota | Řetězcový výraz nebo výraz zásad. Hodnota dimenze Tuto možnost je možné vynechat, pouze pokud name odpovídá jedné z výchozích dimenzí. Pokud ano, je hodnota zadaná podle názvu dimenze. |
No | – |
Výchozí názvy dimenzí, které lze použít bez hodnoty
- API ID
- ID operace
- ID produktu
- ID uživatele
- Subscription ID
- Umístění
- ID brány
Využití
- Oddíly zásad: příchozí
- Obory zásad: globální, pracovní prostor, produkt, rozhraní API, operace
- Brány: Classic, v2, consumption, self-host, workspace
Poznámky k využití
- Tuto zásadu je možné použít vícekrát pro každou definici zásady.
- Pro tuto zásadu můžete nakonfigurovat maximálně 10 vlastních dimenzí.
- Pokud jsou k dispozici, hodnoty v části využití odpovědi z rozhraní LLM API se používají k určení metrik tokenů.
- Některé koncové body LLM podporují streamování odpovědí. Pokud
stream
je v požadavku rozhraní API nastavená natrue
povolení streamování, odhadují se metriky tokenů.
Příklad
Následující příklad odešle metriky počtu tokenů LLM do Application Insights spolu s ID rozhraní API jako vlastní dimenze.
<policies>
<inbound>
<llm-emit-token-metric
namespace="MyLLM">
<dimension name="API ID" />
</llm-emit-token-metric>
</inbound>
<outbound>
</outbound>
</policies>
Související zásady
- Protokolování
- zásady emit-metric
- azure-openai-emit-token-metric policy
- zásady pro omezení tokenů llm
Související obsah
Další informace o práci se zásadami najdete v tématech:
- Kurz: Transformace a ochrana rozhraní API
- Referenční informace o zásadách pro úplný seznam prohlášení o zásadách a jejich nastavení
- Výrazy zásad
- Nastavení nebo úprava zásad
- Opakované použití konfigurací zásad
- Úložiště fragmentů zásad
- Sada nástrojů zásad služby Azure API Management
- Vytváření zásad pomocí Microsoft Copilotu v Azure