Udostępnij za pośrednictwem


Monitorowanie punktów końcowych online

Usługa Azure Machine Learning używa integracji z usługą Azure Monitor do śledzenia i monitorowania metryk i dzienników dla punktów końcowych online. Metryki można wyświetlać na wykresach, porównywać metryki między punktami końcowymi i wdrożeniami, przypinać metryki do pulpitów nawigacyjnych witryny Azure Portal, konfigurować alerty, tabele dzienników zapytań i wypychać dzienniki do obsługiwanych obiektów docelowych. Możesz również użyć usługi Application Insights do analizowania zdarzeń z kontenerów użytkowników.

  • Metryki: w przypadku metryk na poziomie punktu końcowego, takich jak opóźnienie żądań, żądania na minutę, nowe połączenia na sekundę i bajty sieciowe, można przejść do szczegółów, aby wyświetlić szczegółowe informacje na poziomie wdrożenia lub na poziomie stanu. Możesz również przejść do szczegółów metryk na poziomie wdrożenia, takich jak użycie procesora CPU/procesora GPU i pamięć lub użycie dysku na poziomie wystąpienia. W obszarze Monitorowanie możesz śledzić te metryki na wykresach i skonfigurować pulpity nawigacyjne i alerty w celu dalszej analizy.

  • Dzienniki: Metryki można wysyłać do obszaru roboczego usługi Log Analytics, w którym można użyć składni zapytań Kusto do wykonywania zapytań dotyczących dzienników. Możesz również wysyłać metryki do kont usługi Azure Storage lub usługi Azure Event Hubs w celu dalszego przetwarzania. W przypadku ruchu, dzienników konsoli (kontenera) i zdarzeń związanych z punktami końcowymi online można użyć dedykowanych tabel dzienników. Zapytania Kusto obsługują złożone możliwości analizy i łączenie wielu tabel.

  • Application Insights: środowiska nadzorowane obejmują integrację z usługą Application Insights. Tę integrację można włączyć lub wyłączyć podczas tworzenia wdrożenia online. Po włączeniu wbudowanych metryk i dzienników są wysyłane do usługi Application Insights. Następnie możesz użyć wbudowanych funkcji usługi Application Insights do dalszej analizy. Przykładami tych funkcji są metryki na żywo, wyszukiwanie transakcji, widok niepowodzeń i widok wydajności.

W tym artykule przedstawiono, jak wykonać następujące działania:

  • Wybierz odpowiednią metodę, aby wyświetlić i śledzić metryki i dzienniki.
  • Wyświetlanie metryk dla punktu końcowego online.
  • Utwórz pulpit nawigacyjny dla metryk.
  • Utwórz alert dotyczący metryki.
  • Wyświetlanie dzienników dla punktu końcowego online.
  • Użyj usługi Application Insights, aby śledzić metryki i dzienniki.

Wymagania wstępne

  • Punkt końcowy online usługi Azure Machine Learning
  • Co najmniej dostęp czytelnika w punkcie końcowym

Używanie metryk

W witrynie Azure Portal można wyświetlić strony metryk dla punktów końcowych i wdrożeń online.

Uzyskiwanie dostępu do metryk z usługi Azure Machine Learning Studio

Łatwym sposobem uzyskiwania dostępu do stron metryk jest linki dostępne w interfejsie użytkownika usługi Azure Machine Learning Studio. Te linki można znaleźć na karcie Szczegóły strony punktu końcowego. Te linki prowadzą do strony metryk w witrynie Azure Portal na potrzeby punktu końcowego lub wdrożenia.

Aby uzyskać dostęp do stron metryk za pośrednictwem linków dostępnych w programie Studio, wykonaj następujące kroki:

  1. W usłudze Azure Machine Learning Studio przejdź do obszaru roboczego.

  2. W obszarze Zasoby wybierz pozycję Punkty końcowe.

  3. Wybierz nazwę punktu końcowego.

  4. W obszarze Atrybuty punktu końcowego wybierz pozycję Wyświetl metryki.

    Zrzut ekranu przedstawiający stronę punktu końcowego w studio, która pokazuje atrybuty punktu końcowego. Wyróżniono metryki zasoby, punkty końcowe, atrybuty punktu końcowego i widok.

    Strona metryk punktu końcowego zostanie otwarta w witrynie Azure Portal.

  5. W usłudze Azure Machine Learning Studio na stronie punktu końcowego przejdź do sekcji wdrożenia, a następnie wybierz pozycję Wyświetl metryki.

    Zrzut ekranu przedstawiający stronę punktu końcowego w programie Studio, która zawiera informacje o wdrożeniu. Metryki wdrożenia niebieskie i Wyświetl są wyróżnione.

    Strona metryk wdrożenia zostanie otwarta w witrynie Azure Portal.

Uzyskiwanie dostępu do metryk w witrynie Azure Portal

Innym sposobem wyświetlenia strony metryk dla punktu końcowego lub wdrożenia jest przejście bezpośrednio do witryny Azure Portal:

  1. Przejdź do portalu Azure Portal.

  2. Przejdź do punktu końcowego online lub zasobu wdrożenia.

    Punkty końcowe i wdrożenia online to zasoby usługi Azure Resource Manager. Możesz je znaleźć, przechodząc do grupy zasobów, a następnie wyszukując typy zasobów Usługa Machine Learning online iwdrożenie online usługi Machine Learning.

  3. Na stronie zasobu w obszarze Monitorowanie wybierz pozycję Metryki.

    Zrzut ekranu witryny Azure Portal przedstawiający stronę Metryki wdrożenia. Monitorowanie i metryki są wyróżnione.

Dostępne metryki

Widoczne metryki zależą od wybranego zasobu. Metryki dla punktów końcowych online i wdrożeń online mają różne zakresy.

Metryki w zakresie punktu końcowego

Aby uzyskać informacje o metrykach dostępnych w zakresie punktu końcowego online, zobacz Obsługiwane metryki dla microsoft.MachineLearningServices/workspaces/onlineEndpoints.

Ograniczanie przepustowości

Przepustowość jest ograniczana w przypadku przekroczenia limitów przydziału dla zarządzanych punktów końcowych online. Aby uzyskać więcej informacji na temat limitów dla punktów końcowych online, zobacz Punkty końcowe online usługi Azure Machine Learning i punkty końcowe wsadowe w artykule dotyczącym limitów przydziałów i limitów w usłudze Azure Machine Learning. Aby określić, czy żądania są ograniczane:

  • Monitoruj metryki Bajty sieciowe.
  • Sprawdź następujące pola w zwiastunach odpowiedzi: ms-azureml-bandwidth-request-delay-ms i ms-azureml-bandwidth-response-delay-ms. Wartości pól to opóźnienia w milisekundach ograniczania przepustowości.

Aby uzyskać więcej informacji, zobacz Problemy z limitem przepustowości.

Metryki w zakresie wdrażania

Aby uzyskać informacje o metrykach dostępnych w zakresie wdrażania, zobacz Obsługiwane metryki dla microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Tworzenie pulpitów nawigacyjnych i alertów

W obszarze Monitorowanie można tworzyć pulpity nawigacyjne i alerty oparte na metrykach.

Tworzenie pulpitów nawigacyjnych i wizualizowanie zapytań

Możesz tworzyć niestandardowe pulpity nawigacyjne, aby można było wizualizować metryki z wielu źródeł w witrynie Azure Portal, w tym metryki dla punktu końcowego online. Aby uzyskać więcej informacji na temat tworzenia pulpitów nawigacyjnych i wizualizacji zapytań, zobacz Tworzenie i udostępnianie pulpitów nawigacyjnych danych usługi Log Analytics oraz Tworzenie niestandardowych pulpitów nawigacyjnych wskaźników KPI przy użyciu usługi Application Insights.

Tworzenie alertów

Możesz również utworzyć alerty niestandardowe, aby otrzymywać powiadomienia o ważnych aktualizacjach stanu punktu końcowego online:

  1. W witrynie Azure Portal przejdź do strony metryk, a następnie wybierz pozycję Nowa reguła alertu.

    Zrzut ekranu witryny Azure Portal przedstawiający stronę Metryki wdrożenia. Wyróżniono nową regułę alertu.

  2. W oknie Wybieranie sygnału wybierz sygnał, dla którego chcesz utworzyć alert, a następnie wybierz pozycję Zastosuj.

  3. Na stronie Tworzenie reguły alertu wprowadź próg i zmodyfikuj inne ustawienia, które chcesz dostosować. Aby uzyskać więcej informacji na temat ustawień reguły alertu, zobacz Konfigurowanie warunków reguły alertu. Następnie wybierz pozycję Dalej: Akcje.

    Zrzut ekranu przedstawiający stronę Tworzenie reguły alertu w witrynie Azure Portal. Pole Próg i następne akcje są wyróżnione.

  4. W oknie Wybieranie grup akcji utwórz lub wybierz grupę akcji, aby określić, co się stanie po wyzwoleniu alertu. Aby uzyskać więcej informacji, zobacz Konfigurowanie szczegółów reguły alertu.

  5. Wybierz pozycję Przejrzyj i utwórz , aby zakończyć tworzenie alertu.

Automatyczne skalowanie na podstawie metryk

Wdrożenia można skonfigurować do automatycznego skalowania na podstawie metryk. Aby włączyć funkcję autoskalowania, możesz użyć interfejsu użytkownika lub kodu.

Opcje kodu to interfejs wiersza polecenia usługi Azure Machine Learning i zestaw AZURE Machine Learning SDK dla języka Python. W przypadku używania kodu należy skonfigurować warunki wyzwalania automatycznego skalowania, podając nazwę interfejsu API REST metryk.

Aby uzyskać więcej informacji, zobacz Autoskaluj punkty końcowe online w usłudze Azure Machine Learning.

Korzystanie z dzienników

Istnieją trzy dzienniki, które można włączyć dla punktów końcowych online:

  • AmlOnlineEndpointTrafficLog: ten dziennik ruchu umożliwia sprawdzenie informacji o żądaniach do punktu końcowego. Ten dziennik jest przydatny w następujących przypadkach:

    • Odpowiedź na żądanie nie jest 200 i chcesz uzyskać więcej informacji. Kolumna ResponseCodeReason w dzienniku zawiera listę przyczyn. Opisy kodów stanu i powodów można znaleźć w artykule dotyczącym rozwiązywania problemów z punktami końcowymi online.
    • Chcesz wyszukać kod odpowiedzi i przyczynę odpowiedzi modelu dla żądania. Kolumny ModelStatusCode i ModelStatusReason zawierają te informacje.
    • Chcesz poznać czas trwania żądania. Dzienniki zawierają podział opóźnienia. Ten podział pokazuje łączny czas trwania, czas trwania żądania, czas trwania odpowiedzi i opóźnienie spowodowane ograniczaniem przepustowości sieci.
    • Chcesz sprawdzić liczbę ostatnich żądań zakończonych powodzeniem i niepowodzeniem. Dzienniki zawierają te informacje.
  • AmlOnlineEndpointConsoleLog: ten dziennik zawiera instrukcje, które kontenery zapisują jako dane wyjściowe w konsoli. Ten dziennik jest przydatny w następujących przypadkach:

    • Nie można uruchomić kontenera. Dziennik konsoli może być przydatny do debugowania.
    • Chcesz monitorować zachowanie kontenera i upewnić się, że wszystkie żądania są poprawnie obsługiwane.
    • Chcesz śledzić żądanie z punktu wejścia sieciowego punktu końcowego online do kontenera. Możesz użyć zapytania usługi Log Analytics, które łączy identyfikator żądania z informacjami z dzienników AmlOnlineEndpointConsoleLog i AmlOnlineEndpointTrafficLog.
    • Na przykład chcesz uruchomić analizę wydajności, aby określić czas potrzebny modelowi na przetworzenie każdego żądania.
  • AmlOnlineEndpointEventLog: ten dziennik zawiera informacje o cyklu życia kontenera. Obecnie dziennik zawiera informacje o następujących typach zdarzeń:

    Nazwisko Komunikat
    Wycofywanie Wycofywanie ponownego uruchamiania kontenera nie powiodło się
    Wyciągnął Obraz kontenera "<IMAGE_NAME>" już obecny na maszynie
    Zabijania Sonda liveness serwera wnioskowania kontenera nie powiodła się. Zostanie ponownie uruchomiona
    Utworzone Utworzono kontener image-fetcher
    Utworzone Utworzono kontener inference-server
    Utworzone Utworzono instalację modelu kontenera
    LivenessProbeFailed Sonda liveness nie powiodła się: <FAILURE_CONTENT>
    GotowośćProbeFailed Sonda gotowości nie powiodła się: <FAILURE_CONTENT>
    Rozpoczęto Uruchomiono moduł image-fetcher kontenera
    Rozpoczęto Uruchomiono wnioskowanie kontenera-server
    Rozpoczęto Rozpoczęto instalowanie modelu kontenera
    Zabijania Zatrzymywanie wnioskowania kontenera-server
    Zabijania Zatrzymywanie instalacji modelu kontenera

Włączanie dzienników

Ważne

Rejestrowanie korzysta z funkcji Log Analytics monitora. Jeśli obecnie nie masz obszaru roboczego usługi Log Analytics, możesz go utworzyć, wykonując kroki opisane w temacie Tworzenie obszaru roboczego.

  1. W witrynie Azure Portal przejdź do grupy zasobów zawierającej punkt końcowy, a następnie wybierz punkt końcowy.

  2. W obszarze Monitorowanie wybierz pozycję Ustawienia diagnostyczne, a następnie wybierz pozycję Dodaj ustawienie diagnostyczne.

  3. W oknie Ustawienia diagnostyczne wprowadź następujące informacje:

    • Obok pozycji Nazwa ustawienia diagnostycznego wprowadź nazwę ustawienia.
    • W obszarze Dzienniki wybierz kategorie dzienników, które chcesz włączyć.
    • W obszarze Szczegóły miejsca docelowego wybierz pozycję Wyślij do obszaru roboczego usługi Log Analytics, a następnie wybierz subskrypcję i obszar roboczy usługi Log Analytics do użycia.

    Zrzut ekranu przedstawiający okno Ustawienia diagnostyczne. Wybrano wszystkie dzienniki i Pozycję Wyślij do obszaru roboczego usługi Log Analytics. Subskrypcja i obszar roboczy są widoczne.

  4. Wybierz pozycję Zapisz.

    Ważne

    Udostępnienie połączenia z obszarem roboczym usługi Log Analytics może potrwać do godziny. Poczekaj godzinę przed kontynuowaniem kroków w następnej sekcji.

Wykonywanie zapytań dotyczących dzienników

  1. Prześlij żądania oceniania do punktu końcowego, aby utworzyć wpisy w dziennikach.

  2. Przejdź do portalu Azure Portal. Aby otworzyć dzienniki, użyj jednej z następujących opcji:

    • Przejdź do strony właściwości punktu końcowego online. W obszarze Monitorowanie wybierz pozycję Dzienniki.
    • Przejdź do obszaru roboczego Log usługi Analytics. Po lewej stronie wybierz pozycję Dzienniki.
  3. Zamknij okno Centrum zapytań, które zostanie otwarte domyślnie.

  4. W obszarze Inne kliknij dwukrotnie pozycję AmlOnlineEndpointConsoleLog. Jeśli nie widzisz elementu AmlOnlineEndpointConsoleLog, wprowadź wartość w polu wyszukiwania.

    Zrzut ekranu przedstawiający stronę Dzienniki witryny Azure Portal dla punktu końcowego. Element AmlOnlineEndpointConsoleLog jest wyróżniony w polu wyszukiwania i wynikach.

  5. Wybierz Uruchom.

    Zrzut ekranu przedstawiający stronę Dzienniki witryny Azure Portal dla punktu końcowego. Przebieg jest wyróżniony, a wyniki zapytania AmlOnlineEndpointConsoleLog są widoczne.

Przykładowe zapytania

Przykładowe zapytania są dostępne do użycia. Aby wyświetlić zapytania, wykonaj następujące czynności:

  1. Na stronie Dzienniki wybierz pozycję Zapytania.

  2. W polu wyszukiwania wprowadź punkt końcowy online.

    Zrzut ekranu przedstawiający kartę Zapytania na stronie Dzienniki witryny Azure Portal. Widoczne są dwa przykładowe zapytania, a karta Zapytania i pole wyszukiwania są wyróżnione.

Szczegóły kolumny dziennika

Poniższe tabele zawierają szczegółowe informacje o danych przechowywanych w każdym dzienniku:

AmlOnlineEndpointTrafficLog

Właściwości opis
Metoda Metoda żądana przez klienta.
Ścieżka Ścieżka żądana przez klienta.
SubscriptionId Identyfikator subskrypcji uczenia maszynowego punktu końcowego online.
AzureMLWorkspaceId Identyfikator obszaru roboczego uczenia maszynowego punktu końcowego online.
AzureMLWorkspaceName Nazwa obszaru roboczego uczenia maszynowego punktu końcowego online.
Nazwa punktu końcowego Nazwa punktu końcowego online.
Nazwa wdrożenia Nazwa wdrożenia online.
Protokół Protokół żądania.
Kod odpowiedzi Końcowy kod odpowiedzi zwrócony klientowi.
ResponseCodeReason Ostateczna przyczyna kodu odpowiedzi zwrócona klientowi.
ModelStatusCode Kod stanu odpowiedzi z modelu.
ModelStatusReason Przyczyna stanu odpowiedzi z modelu.
RequestPayloadSize Łączna liczba bajtów odebranych od klienta.
ResponsePayloadSize Łączna liczba bajtów wysłanych z powrotem do klienta.
UserAgent Nagłówek żądania user-agent, w tym komentarze, ale obcięty do maksymalnie 70 znaków.
Identyfikator XRequestId Identyfikator żądania generowany przez usługę Azure Machine Learning na potrzeby śledzenia wewnętrznego.
XMSClientRequestId Identyfikator śledzenia generowany przez klienta.
TotalDurationMs Czas trwania w milisekundach od godziny rozpoczęcia żądania do czasu ostatniego bajtu odpowiedzi jest wysyłany z powrotem do klienta. Jeśli klient rozłączy się, czas trwania jest pobierany od czasu rozpoczęcia do czasu rozłączenia klienta.
RequestDurationMs Czas trwania w milisekundach od godziny rozpoczęcia żądania do czasu odebrania ostatniego bajtu żądania od klienta.
ResponseDurationMs Czas trwania w milisekundach od godziny rozpoczęcia żądania do czasu pierwszego bajtu odpowiedzi jest odczytywany z modelu.
RequestThrottlingDelayMs Opóźnienie w milisekundach transferu danych żądania z powodu ograniczania przepustowości sieci.
ResponseThrottlingDelayMs Opóźnienie w milisekundach transferu danych odpowiedzi z powodu ograniczania przepustowości sieci.

AmlOnlineEndpointConsoleLog

Właściwości opis
TimeGenerated Sygnatura czasowa UTC czasu wygenerowania dziennika
OperationName Operacja skojarzona z rekordem dziennika
InstanceId Identyfikator wystąpienia, które generuje rekord dziennika
Nazwa wdrożenia Nazwa wdrożenia skojarzonego z rekordem dziennika
NazwaKontenera Nazwa kontenera, w którym jest generowany dziennik
Komunikat Zawartość dziennika

AmlOnlineEndpointEventLog

Właściwości opis
TimeGenerated Sygnatura czasowa UTC czasu wygenerowania dziennika
OperationName Operacja skojarzona z rekordem dziennika
InstanceId Identyfikator wystąpienia, które generuje rekord dziennika
Nazwa wdrożenia Nazwa wdrożenia skojarzonego z rekordem dziennika
Nazwisko Nazwa zdarzenia
Komunikat Zawartość zdarzenia

Korzystanie z usługi Application Insights

Nadzorowane środowiska obejmują integrację z usługą Application Insights. Dzięki tej integracji wbudowane metryki i dzienniki są wysyłane do usługi Application Insights. W związku z tym możesz użyć wbudowanych funkcji usługi Application Insights do dalszej analizy. Przykładami tych funkcji są metryki na żywo, wyszukiwanie transakcji, widok niepowodzeń i widok wydajności.

Aby uzyskać więcej informacji, zobacz Omówienie usługi Application Insights.

Integrację z usługą Application Insights można włączyć podczas tworzenia wdrożenia online w programie Studio. Na stronie Wdrażanie w obszarze Diagnostyka usługi Application Insights wybierz pozycję Włączone.

Zrzut ekranu przedstawiający stronę wdrażania programu Studio, na której użytkownik tworzy punkt końcowy online. Ustawienie diagnostyki usługi Application Insights zostało wyróżnione.

Po włączeniu usługi Application Insights można zobaczyć wykresy monitora aktywności wysokiego poziomu dla zarządzanego punktu końcowego online. W programie Studio przejdź do strony punktu końcowego, a następnie wybierz kartę Monitorowanie .

Zrzut ekranu przedstawiający kartę Monitorowanie na stronie punktu końcowego programu Studio. Karta Monitorowanie jest wyróżniona. Wykres przedstawia żądania na minutę do punktu końcowego.