Delen via


Ondersteunde metrische gegevens voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor het resourcetype Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Tabelkoppen

Metrische waarde : de weergavenaam van metrische gegevens zoals deze wordt weergegeven in Azure Portal.
Naam in Rest API - Metrische naam zoals wordt genoemd in de REST API.
Eenheid : maateenheid.
Aggregatie: het standaardaggregatietype. Geldige waarden: Gemiddelde, Minimum, Maximum, Totaal, Aantal.
Dimensies die - beschikbaar zijn voor de metrische waarde.
Tijdsintervallen - waarmee de metrische gegevens worden bemonsterd. Geeft bijvoorbeeld PT1M aan dat de metrische waarde elke minuut, PT30M om de 30 minuten, PT1H elk uur enzovoort wordt genomen.
DS Exporteren: of de metrische waarde kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen.

Zie voor meer informatie over het exporteren van metrische gegevens - Metrische gegevens exporteren met behulp van regels voor gegevensverzameling en diagnostische instellingen maken in Azure Monitor.

Zie het overzicht van metrische gegevens in Azure Monitor voor meer informatie over het bewaren van metrische gegevens.

Categorie Metrische gegevens Naam in REST API Eenheid Statistische functie Afmetingen Tijdsinterval DS Exporteren
Bron Percentage CPU-geheugengebruik

Percentage geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
CpuMemoryUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
Bron PERCENTAGE CPU-gebruik

Percentage CPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
CpuUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
Bron Fouten bij het verzamelen van gegevens per minuut

Het aantal gegevensverzamelingsgebeurtenissen is per minuut verwijderd.
DataCollectionErrorsPerMinute Tellen Minimum, Maximum, Gemiddelde instanceId, , reasontype PT1M Nee
Bron Gebeurtenissen voor gegevensverzameling per minuut

Het aantal gegevensverzamelingsgebeurtenissen dat per minuut wordt verwerkt.
DataCollectionEventsPerMinute Tellen Minimum, Maximum, Gemiddelde instanceId, type PT1M Nee
Bron Implementatiecapaciteit

Het aantal exemplaren in de implementatie.
DeploymentCapacity Tellen Minimum, Maximum, Gemiddelde instanceId, State PT1M Nee
Bron Schijfgebruik

Percentage schijfgebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
DiskUtilization Procent Minimum, Maximum, Gemiddelde instanceId, disk PT1M Ja
Bron GPU Energy in Joules

Interval energie in Joules op een GPU-knooppunt. Energie wordt met intervallen van één minuut gerapporteerd.
GpuEnergyJoules Tellen Minimum, Maximum, Gemiddelde instanceId PT1M Nee
Bron PERCENTAGE GPU-geheugengebruik

Percentage gpu-geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
GpuMemoryUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
Bron PERCENTAGE GPU-gebruik

Percentage GPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
GpuUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
Verkeer Aanvraaglatentie P50

De gemiddelde P50-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode
RequestLatency_P50 Milliseconden Gemiddeld <geen> PT1M Ja
Verkeer Aanvraaglatentie P90

De gemiddelde P90-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode
RequestLatency_P90 Milliseconden Gemiddeld <geen> PT1M Ja
Verkeer Aanvraaglatentie P95

De gemiddelde P95-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode
RequestLatency_P95 Milliseconden Gemiddeld <geen> PT1M Ja
Verkeer Aanvraaglatentie P99

De gemiddelde P99-aanvraaglatentie geaggregeerd door alle aangevraagde latentiewaarden die zijn verzameld over de geselecteerde periode
RequestLatency_P99 Milliseconden Gemiddeld <geen> PT1M Ja
Verkeer Aanvragen per minuut

Het aantal aanvragen dat binnen een minuut naar de online-implementatie wordt verzonden
RequestsPerMinute Tellen Gemiddeld envoy_response_code PT1M Nee

Volgende stappen