Ondersteunde metrische gegevens voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor het resourcetype Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Tabelkoppen
Metrische waarde : de weergavenaam van metrische gegevens zoals deze wordt weergegeven in Azure Portal.
Naam in Rest API - Metrische naam zoals wordt genoemd in de REST API.
Eenheid : maateenheid.
Aggregatie: het standaardaggregatietype. Geldige waarden: Gemiddelde, Minimum, Maximum, Totaal, Aantal.
Dimensies die - beschikbaar zijn voor de metrische waarde.
Tijdsintervallen - waarmee de metrische gegevens worden bemonsterd. Geeft bijvoorbeeld PT1M
aan dat de metrische waarde elke minuut, PT30M
om de 30 minuten, PT1H
elk uur enzovoort wordt genomen.
DS Exporteren: of de metrische waarde kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen.
Zie voor meer informatie over het exporteren van metrische gegevens - Metrische gegevens exporteren met behulp van regels voor gegevensverzameling en diagnostische instellingen maken in Azure Monitor.
Zie het overzicht van metrische gegevens in Azure Monitor voor meer informatie over het bewaren van metrische gegevens.
Categorie | Metrische gegevens | Naam in REST API | Eenheid | Statistische functie | Afmetingen | Tijdsinterval | DS Exporteren |
---|---|---|---|---|---|---|---|
Bron | Percentage CPU-geheugengebruik Percentage geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
CpuMemoryUtilizationPercentage |
Procent | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Ja |
Bron | PERCENTAGE CPU-gebruik Percentage CPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
CpuUtilizationPercentage |
Procent | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Ja |
Bron | Fouten bij het verzamelen van gegevens per minuut Het aantal gegevensverzamelingsgebeurtenissen is per minuut verwijderd. |
DataCollectionErrorsPerMinute |
Tellen | Minimum, Maximum, Gemiddelde | instanceId , , reason type |
PT1M | Nee |
Bron | Gebeurtenissen voor gegevensverzameling per minuut Het aantal gegevensverzamelingsgebeurtenissen dat per minuut wordt verwerkt. |
DataCollectionEventsPerMinute |
Tellen | Minimum, Maximum, Gemiddelde | instanceId , type |
PT1M | Nee |
Bron | Implementatiecapaciteit Het aantal exemplaren in de implementatie. |
DeploymentCapacity |
Tellen | Minimum, Maximum, Gemiddelde | instanceId , State |
PT1M | Nee |
Bron | Schijfgebruik Percentage schijfgebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
DiskUtilization |
Procent | Minimum, Maximum, Gemiddelde | instanceId , disk |
PT1M | Ja |
Bron | GPU Energy in Joules Interval energie in Joules op een GPU-knooppunt. Energie wordt met intervallen van één minuut gerapporteerd. |
GpuEnergyJoules |
Tellen | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Nee |
Bron | PERCENTAGE GPU-geheugengebruik Percentage gpu-geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
GpuMemoryUtilizationPercentage |
Procent | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Ja |
Bron | PERCENTAGE GPU-gebruik Percentage GPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd. |
GpuUtilizationPercentage |
Procent | Minimum, Maximum, Gemiddelde | instanceId |
PT1M | Ja |
Verkeer | Aanvraaglatentie P50 De gemiddelde P50-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode |
RequestLatency_P50 |
Milliseconden | Gemiddeld | <geen> | PT1M | Ja |
Verkeer | Aanvraaglatentie P90 De gemiddelde P90-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode |
RequestLatency_P90 |
Milliseconden | Gemiddeld | <geen> | PT1M | Ja |
Verkeer | Aanvraaglatentie P95 De gemiddelde P95-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode |
RequestLatency_P95 |
Milliseconden | Gemiddeld | <geen> | PT1M | Ja |
Verkeer | Aanvraaglatentie P99 De gemiddelde P99-aanvraaglatentie geaggregeerd door alle aangevraagde latentiewaarden die zijn verzameld over de geselecteerde periode |
RequestLatency_P99 |
Milliseconden | Gemiddeld | <geen> | PT1M | Ja |
Verkeer | Aanvragen per minuut Het aantal aanvragen dat binnen een minuut naar de online-implementatie wordt verzonden |
RequestsPerMinute |
Tellen | Gemiddeld | envoy_response_code |
PT1M | Nee |