Obsługiwane metryki dla microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
W poniższej tabeli wymieniono metryki dostępne dla typu zasobu Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Nagłówki tabeli
Metryka — nazwa wyświetlana metryki wyświetlana wyświetlana w witrynie Azure Portal.
Nazwa w interfejsie API REST — nazwa metryki określona w interfejsie API REST.
Jednostka — jednostka miary.
Agregacja — domyślny typ agregacji. Prawidłowe wartości: Average, Minimum, Maximum, Total, Count.
- Wymiary dostępne dla metryki.
Interwały ziarna - czasu, w których próbkowana jest metryka. Na przykład wskazuje, PT1M
że metryka jest próbkowana co minutę, PT30M
co 30 minut, PT1H
co godzinę itd.
Eksportowanie ds — określa, czy metryka jest eksportowana do dzienników usługi Azure Monitor za pośrednictwem ustawień diagnostycznych.
Aby uzyskać informacje na temat eksportowania metryk, zobacz Eksportowanie metryk przy użyciu reguł zbierania danych i Tworzenie ustawień diagnostycznych w usłudze Azure Monitor.
Aby uzyskać informacje na temat przechowywania metryk, zobacz Omówienie metryk usługi Azure Monitor.
Kategoria | Metric | Nazwa w interfejsie API REST | Jednostka | Agregacja | Wymiary | Ziarna czasu | Eksportowanie ds |
---|---|---|---|---|---|---|---|
Zasób | Procent wykorzystania pamięci procesora CPU Procent wykorzystania pamięci w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty. |
CpuMemoryUtilizationPercentage |
Procent | Minimum, Maksimum, Średnia | instanceId |
PT1M | Tak |
Zasób | Procent wykorzystania procesora CPU Procent wykorzystania procesora CPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty. |
CpuUtilizationPercentage |
Procent | Minimum, Maksimum, Średnia | instanceId |
PT1M | Tak |
Zasób | Błędy zbierania danych na minutę Liczba zdarzeń zbierania danych spadła na minutę. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maksimum, Średnia | instanceId , , reason type |
PT1M | Nie. |
Zasób | Zdarzenia zbierania danych na minutę Liczba przetworzonych zdarzeń zbierania danych na minutę. |
DataCollectionEventsPerMinute |
Count | Minimum, Maksimum, Średnia | instanceId , type |
PT1M | Nie. |
Zasób | Pojemność wdrożenia Liczba wystąpień we wdrożeniu. |
DeploymentCapacity |
Count | Minimum, Maksimum, Średnia | instanceId , State |
PT1M | Nie. |
Zasób | Wykorzystanie dysku Procent wykorzystania dysku w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty. |
DiskUtilization |
Procent | Minimum, Maksimum, Średnia | instanceId , disk |
PT1M | Tak |
Zasób | Energia procesora GPU w joulesach Interwał energii w joules w węźle procesora GPU. Energia jest zgłaszana w odstępach jednej minuty. |
GpuEnergyJoules |
Count | Minimum, Maksimum, Średnia | instanceId |
PT1M | Nie. |
Zasób | Procent wykorzystania pamięci procesora GPU Procent wykorzystania pamięci procesora GPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty. |
GpuMemoryUtilizationPercentage |
Procent | Minimum, Maksimum, Średnia | instanceId |
PT1M | Tak |
Zasób | Procent wykorzystania procesora GPU Procent wykorzystania procesora GPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty. |
GpuUtilizationPercentage |
Procent | Minimum, Maksimum, Średnia | instanceId |
PT1M | Tak |
Ruch | Opóźnienie żądania P50 Średnie opóźnienie żądania P50 zagregowane według wszystkich wartości opóźnienia żądań zebranych w wybranym okresie |
RequestLatency_P50 |
Milisekundy | Średnia | <none> | PT1M | Tak |
Ruch | Opóźnienie żądania P90 Średnie opóźnienie żądania P90 zagregowane według wszystkich wartości opóźnienia żądań zebranych w wybranym okresie |
RequestLatency_P90 |
Milisekundy | Średnia | <none> | PT1M | Tak |
Ruch | Opóźnienie żądania P95 Średnie opóźnienie żądania P95 zagregowane przez wszystkie wartości opóźnienia żądań zebrane w wybranym okresie |
RequestLatency_P95 |
Milisekundy | Średnia | <none> | PT1M | Tak |
Ruch | Opóźnienie żądania P99 Średnie opóźnienie żądania P99 zagregowane przez wszystkie wartości opóźnienia żądań zebrane w wybranym okresie |
RequestLatency_P99 |
Milisekundy | Średnia | <none> | PT1M | Tak |
Ruch | Żądania na minutę Liczba żądań wysyłanych do wdrożenia online w ciągu minuty |
RequestsPerMinute |
Count | Średnia | envoy_response_code |
PT1M | Nie. |