Övervaka kostnader för modellhantering
Den här artikeln innehåller exempel på hur du använder system tables för att övervaka kostnaden för Mosaic AI Model Serving-slutpunkter i ditt Azure Databricks-konto.
Krav
- Om du vill komma åt system tablesmåste arbetsytan vara aktiverad för Unity Catalog. Mer information finns i Aktivera systemscheman table.
Faktureringsanvändningssystem table SKU
Du kan spåra kostnader för modellbetjäning i Azure Databricks med hjälp av fakturerbart användningssystem table. När faktureringssystemet table har aktiverats fylls table automatiskt i med den senaste användningen i ditt Databricks-konto. Kostnader visas i system.billing.usage
table med columnsku_name
som något av följande:
sku_name |
beskrivning |
---|---|
<tier>_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_<region> |
Den här SKU:n innehåller alla DBU:er som ackumuleras när en slutpunkt börjar efter skalning till noll. |
<tier>_SERVERLESS_REAL_TIME_INFERENCE_<region> |
Alla andra modellbetjäningskostnader grupperas under den här SKU:n.
Where
tier motsvarar din Azure Databricks-plattformsnivå och region motsvarar molnregionen för din Azure Databricks-distribution. |
Fråga efter och visualisera användning
Du kan ställa frågor till system.billing.usage
table för att aggregera alla DBUs (Databricks Units) som är associerade med Mosaic AI Model Serving. Följande är en exempelfråga som sammanställer en modell som betjänar DBUs per dag under de senaste 30 dagarna med SQL:
SELECT SUM(usage_quantity) AS model_serving_dbus,
usage_date
FROM system.billing.usage
WHERE sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
GROUP BY(usage_date)
ORDER BY usage_date DESC
LIMIT 30
Instrumentpanel för kostnadsobservabilitet
Ladda ned exempelinstrumentpanelen för kostnadstillskrivning från GitHub för att hjälpa dig get börjat övervaka din modell som betjänar kostnader. Se instrumentpanelen för kostnadstillskrivning för modellserver.
När du har laddat ned JSON-filen importerar du instrumentpanelen till din arbetsyta. Anvisningar om hur du importerar instrumentpaneler finns i Importera en instrumentpanelsfil.
Så här använder du den här instrumentpanelen
Den här instrumentpanelen drivs av AI/BI- och du måste ha åtkomst till systemet tables. Den ger insikter om dina serveringsslutpunktskostnader och din användning på arbetsytans nivå.
Följande steg get du startade:
- Ange arbetsytans ID.
- Select startdatum och slutdatum.
- Filtrera instrumentpanelen genom att välja det specifika slutpunktsnamnet i listrutan list (om du är intresserad av en viss slutpunkt).
- Ange taggnyckeln separat om du använder anpassade taggar för slutpunkten.
Kommentar
Modellservern tillämpar standardgränser på arbetsytan för att säkerställa att det inte finns några skenande utgifter. Se Gränser och regioner för modellservering.
Diagram som du kan använda
Följande diagram ingår i den här instrumentpanelen. Dessa är avsedda att vara utgångspunkten för att du ska kunna skapa din egen anpassade version av modellen som betjänar instrumentpanelen för kostnadsattribution.
- Senaste 7 dagarnas högsta slutpunktsförbrukning
- Daglig total $DBU användning
- Modellbetjäningskostnader efter slutpunktstyp
- Betala per token
- CPU/GPU
- Grundmodell
- Daglig förbrukning per modell, serveringstyp
- De 10 mest kostsamma serveringsslutpunkterna
- De 10 mest kostsamma slutpunkterna för betala per token
- LLM Finjustering De senaste 7 dagarnas utgifter
- LLM-finjusteringsutgifter per e-post
Använda taggar för att övervaka kostnader
Initialt kan aggregerade kostnader vara tillräckliga för att observera övergripande modell som betjänar kostnader. Men när antalet slutpunkter ökar kanske du vill dela upp kostnader baserat på användningsfall, affärsenhet eller andra anpassade identifierare. Modellservern har stöd för att skapa anpassade taggar som kan tillämpas på din modell som betjänar slutpunkter.
Alla anpassade taggar som tillämpas på modellserverslutpunkter sprids till system.billing.usage
table under custom_tags
column och kan användas för att aggregera och visualisera kostnader. Databricks rekommenderar att du lägger till beskrivande taggar till varje slutpunkt för exakt kostnadsspårning.
Exempelfrågor
De översta slutpunkterna efter kostnad:
SELECT
usage_metadata.endpoint_name AS endpoint_name,
SUM(usage_quantity) AS model_serving_dbus
FROM
system.billing.usage
WHERE
sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
AND usage_metadata.endpoint_name IS NOT NULL
GROUP BY endpoint_name
ORDER BY model_serving_dbus DESC
LIMIT 30;
Kostnad med taggar ("business_unit": "data science") över tid:
SELECT
SUM(usage_quantity) AS model_serving_dbus,
usage_date
FROM
system.billing.usage
WHERE sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
AND custom_tags['business_unit'] = 'data science'
GROUP BY usage_date
ORDER BY usage_date DESC
LIMIT 30
Ytterligare resurser
Exempel på hur du övervakar kostnaden för jobb i ditt konto finns i Övervaka jobbkostnader & prestanda med system tables.