Udostępnij za pośrednictwem


Rozwiązywanie problemów z wystąpieniem zarządzanym SCOM usługi Azure Monitor

W tym artykule opisano błędy, które mogą wystąpić podczas wdrażania lub używania wystąpienia zarządzanego usługi Azure Monitor oraz sposobu ich rozwiązywania.

Scenariusz: tworzenie/wdrażanie wystąpienia zarządzanego programu SCOM

Ogólne wskazówki dotyczące rozwiązywania problemów

  1. Upewnij się, że zostały spełnione wszystkie wymagania wstępne. Problemy z tworzeniem mogą wystąpić z powodu nieprawidłowych/niekompletnych wymagań wstępnych.
  2. Upewnij się, że dokładnie przeczytasz/sprawdź komunikat o błędzie. Komunikaty o błędach przechwytują problem/błąd podczas tworzenia.
  3. Sprawdź link Dzienniki instalacji programu SCOM podany w komunikacie o błędzie. Wybierz link, aby pobrać dzienniki instalacji programu System Center Operations Manager. Przeanalizuj dzienniki, aby zidentyfikować i usunąć błędy/błędy.
  4. Jeśli nie możesz zidentyfikować problemu z powyższymi krokami, zaloguj się do wystąpienia zestawów skalowania maszyn wirtualnych i sprawdź dzienniki w obszarze C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows<>, co pomaga zidentyfikować problem.
  5. Jeśli problem będzie się powtarzać, zgłoś bilet pomocy technicznej ze wszystkimi odpowiednimi szczegółami [correlation-id, subscription-iditd.]

Problem: Grupa %ResourceGroupName% zasobów jest zarządzana przez inny zasób platformy Azure

Przyczyna: występuje, gdy właściwość ManagedBy jest ustawiona dla grupy zasobów.

Rozwiązanie: podaj inną grupę zasobów z właściwością ManagedBy jako pustą.

Problem: Wybrana podsieć %SubnetName% jest przeznaczona dla innej usługi

Przyczyna: występuje, gdy podsieć ma delegacje.

Rozwiązanie: podaj podsieć, która nie jest delegowana do żadnej innej usługi.

Problem: Błąd, gdy wystąpienie zarządzane SCOM nie może nawiązać połączenia z wystąpieniem zarządzanym SQL %instance%

Przyczyna: Ten błąd może być spowodowany dowolnym z następujących powodów:

  • Brak widoczności linii widzenia z sieci wirtualnej wystąpienia zarządzanego SCOM do punktu końcowego wystąpienia zarządzanego SQL.
  • Brak odpowiedniego poziomu reguł sieciowej grupy zabezpieczeń, aby zezwolić na ruch przez publiczny punkt końcowy usługi SQL Managed Instance.
  • Tożsamość usługi zarządzanej nie jest dodawana jako administrator usługi Active Directory.
  • Wystąpienie zarządzane programu SCOM może nie mieć uprawnień do odczytu w usłudze SQL Managed Instance.
  • Może wystąpić problem z siecią wirtualną/regionem.

Rozwiązanie:

  • Podaj uprawnienie do odczytu do wystąpienia zarządzanego SQL.
  • Tożsamość usługi zarządzanej musi zostać dodana jako administrator usługi Active Directory w usłudze SQL Managed Instance.
  • Upewnij się, że łączność między usługą SCOM Managed Instance i sieciami usługi SQL Managed Instance. Aby uzyskać więcej informacji, zobacz Tworzenie i konfigurowanie wystąpienia zarządzanego SQL.

Problem: Za mało rdzeni do utworzenia %instance% w danym regionie

Przyczyna: występuje, gdy nie ma wystarczającej liczby rdzeni, aby utworzyć wystąpienie w danym regionie.

Rozwiązanie: Sprawdź sekcję limitu przydziału w witrynie Azure Portal i w razie potrzeby przydziel więcej rdzeni typu Standardowa Ds3v2 w regionie.

Problem: Klucz tajny o tej samej nazwie jest już obecny w magazynie kluczy

Przyczyna: występuje, gdy w magazynie kluczy znajduje się już inny klucz tajny o tej samej nazwie.

Rozwiązanie: zmień nazwę wystąpienia.

Problem: maszyna wirtualna zgłosiła błąd podczas przetwarzania rozszerzenia joindomain w celu dołączenia do domeny %DomainName%

Przyczyna: Występuje z następujących powodów:

  1. Widoczność linii wzroku z serwera wystąpienia zarządzanego SCOM do kontrolera domeny.
  2. Poświadczenia użytkownika domeny nie są podane ani niepoprawne.
  3. Ścieżka jednostki organizacyjnej dla domeny usługi AD nie jest podana.

Rozwiązanie: Sprawdź przyczynę i odpowiednio spróbuj rozwiązać problem.

Problem: Statyczny adres IP jest już używany

Przyczyna: występuje, jeśli statyczny adres IP jest używany przez inne wystąpienie.

Rozwiązanie: użyj innego statycznego adresu IP.

Problem: Nieprawidłowy typ tożsamości %identityType%

Przyczyna: występuje z powodu nieprawidłowej tożsamości zarządzanej.

Rozwiązanie: podaj jeden z możliwych typów tożsamości ((Brak), (SystemAssigned,UserAssigned)) i spróbuj ponownie.

Problem: Prywatny statyczny adres %LbIpAddr% IP nie należy do zakresu podsieci %subnet%

Przyczyna: występuje, ponieważ adres IP nie znajduje się w zakresie podsieci.

Rozwiązanie: podaj dostępny adres IP z zakresu podsieci i spróbuj ponownie wykonać operację.

Problem: Tożsamość nie jest administratorem systemu w wystąpieniu zarządzanym SQL: "%instance".

Przyczyna: Występuje z następujących powodów:

  1. Tożsamość zarządzana użytkownika nie jest administratorem SQL w programie SQL MI.
  2. Tożsamość zarządzana użytkownika jest potwierdzana jako administrator SQL w programie SQL MI i jest wdrażana przy użyciu usługi ARM, BICEP, narzędzia Terraform lub innego rozwiązania wdrożeniowego.

Rozwiązanie: Upewnij się, że tożsamość zarządzana użytkownika jest wdrożona przy użyciu identyfikatora AppId, a nie identyfikatora ObjectId. Możesz sprawdzić, czy ma to zastosowanie, przechodząc do okienka administratora wystąpienia zarządzanego SQL, microsoft Entra ID. Sprawdź, czy identyfikator GUID, który znajduje się na liście z tożsamością zarządzaną użytkownika, to ObjectId lub AppId jednostki usługi. Gdy jest to identyfikator ObjectId:

  • Ustawianie go przy użyciu portalu
  • Ponowne wdrażanie przy użyciu preferowanego rozwiązania przy użyciu identyfikatora AppId.

Scenariusz: Wdrażanie raportów w usłudze Power BI

Problem: wystąpienie zarządzane SQL nie jest osiągalne

Przyczyna: występuje, jeśli publiczny punkt końcowy nie jest włączony. Usługa Power BI nie będzie mogła nawiązać połączenia z usługą SQL Managed Instance.

Rozwiązanie: Sprawdź uprawnienia użytkownika w usłudze SQL Managed Instance i podaj wymagane uprawnienia.

Problem: Nie można odświeżyć poświadczeń zestawu danych

Przyczyna: występuje, jeśli użytkownik nie ma odpowiednich uprawnień w usłudze SQL Managed Instance.

Rozwiązanie: Sprawdź uprawnienia użytkownika w usłudze SQL Managed Instance i podaj wymagane uprawnienia.

Problem: Raport nie może odświeżyć

Przyczyna: występuje z powodu dużego rozmiaru danych. Raport może nie zostać odświeżyny.

Rozwiązanie: jeśli obszar roboczy usługi Power BI znajduje się w warstwie Pro , zmień go na warstwę Premium lub zmień pojemność obszaru roboczego.

Scenariusz: Ręczne skalowanie w górę/w dół

Problem: Test łączności z Internetem zakończył się niepowodzeniem. Wymagane punkty końcowe są niedostępne z sieci wirtualnej

Przyczyna: Problem z siecią.

Rozwiązanie: Upewnij się, że wystąpienie zarządzane programu SCOM ma wychodzący dostęp do Internetu, a sieciowa grupa zabezpieczeń/zapora została prawidłowo skonfigurowana w celu umożliwienia dostępu do wymaganych punktów końcowych zgodnie z opisem w wymaganiach zapory.

Problem: Przekroczono limit przydziału

Przyczyna: występuje, jeśli nie ma dostępnych rdzeni do skalowania.

Rozwiązanie: zwiększ liczbę rdzeni w subskrypcji.

Sprawdź sekcję limitu przydziału w witrynie Azure Portal i w razie potrzeby przydziel więcej rdzeni typu Standardowa Ds3v2 w regionie.

Problem: Błąd aprowizacji rozszerzeń

Przyczyna: Ten błąd może wystąpić podczas aprowizacji rozszerzenia programu System Center Operations Manager lub instalacji programu System Center Operations Manager.

Rozwiązanie: Sprawdź ogólne rozwiązywanie problemów, spróbuj zidentyfikować problem i odpowiednio go rozwiązać.

Problem: Konflikt

Przyczyna: występuje, jeśli trwa stosowanie poprawek lub skalowanie. Nie można wyzwolić nowej operacji.

Rozwiązanie: Poczekaj na ukończenie trwającego procesu i spróbuj ponownie.

Scenariusz: stosowanie poprawek

Problem: Test łączności z Internetem zakończył się niepowodzeniem. Wymagane punkty końcowe są niedostępne z sieci wirtualnej

Przyczyna: Problem z siecią.

Rozwiązanie: Upewnij się, że wystąpienie zarządzane programu SCOM ma wychodzący dostęp do Internetu, a sieciowa grupa zabezpieczeń/zapora została prawidłowo skonfigurowana w celu umożliwienia dostępu do wymaganych punktów końcowych zgodnie z opisem w wymaganiach zapory.

Problem: Powiadomienie jest zablokowane podczas pobierania aktualizacji , mimo że operacja aktualizacji została ukończona

Przyczyna: Problem z siecią/problem z programowaniem.

Rozwiązanie: Spróbuj odświeżyć aktualizacje. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Stan aktualizacji nie jest poprawnie odzwierciedlony na karcie

Przyczyna: Problem z siecią/problem z programowaniem.

Rozwiązanie: Spróbuj odświeżyć aktualizacje. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Niespójność kontrolek na karcie

Przyczyna: Problem ze spójnością. Na przykład przycisk aktualizacji jest włączony, mimo że tytuł karty odczytuje SCOM jest aktualny.

Rozwiązanie: spróbuj odświeżyć. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Zostanie wyświetlony komunikat ostrzegawczy dotyczący aktualizacji

Przyczyna: Występuje z dowolnego z następujących powodów:

  1. Dostępna jest nowa aktualizacja, a użytkownik nie wyzwolił wystąpienia aktualizacji; lub
  2. Ostatnia aktualizacja nie powiodła się, a użytkownik nie wyzwolił innego wystąpienia aktualizacji.

Rozwiązanie: wyzwalanie wystąpienia aktualizacji.

Problem: Aktualizacja kończy się niepowodzeniem po wielu ponownych próbach

Rozwiązanie: Aby rozwiązać ten problem, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Aktualizacja kończy się niepowodzeniem i wycofywanie nie może pozostawić niespójnego stanu, w którym liczba maszyn wirtualnych w wystąpieniu usługi Virtual Machine Scale Sets została zmodyfikowana

Rozwiązanie: przejdź do konsoli programu System Center Operations Manager i usuń niespójne węzły.

Problem: Aktualizacja kończy się niepowodzeniem, ale aktualizacja bazy danych zakończyła się pomyślnie

Przyczyna: występuje z powodu nieudanej aktualizacji po pomyślnej aktualizacji bazy danych.

Rozwiązanie: spróbuj ponownie po pewnym czasie.

Problem: Po pomyślnej aktualizacji konsola programu System Center Operations Manager nie działa prawidłowo w wystąpieniu

Przyczyna: występuje, jeśli program System Center Operations Manager nie został poprawnie zainstalowany lub jakiś proces może zostać zablokowany.

Rozwiązanie: spróbuj ponownie uruchomić wystąpienie. Jeśli problem będzie nadal występował, skontaktuj się z działem pomocy technicznej firmy Microsoft.

Problem: Aktualizacja trwa dłużej niż 3 godziny i ostatecznie kończy się niepowodzeniem

Przyczyna: występuje, gdy aktualizacja trwa dłużej niż 3 godziny.

Rozwiązanie: Skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Niektóre sporadyczne problemy podczas aktualizacji

Przyczyna: występuje w przypadku awarii lub ponownego uruchomienia usługi Service Fabric lub RP.

Rozwiązanie: Uruchom ponownie aktualizację.

Problem: Skalowanie i stosowanie poprawek wyzwalane jednocześnie, a następnie kończy się niepowodzeniem

Przyczyna: występuje, jeśli żądania skalowania i stosowania poprawek są wysyłane i akceptowane w tym samym czasie.

Rozwiązanie: w przypadku wyzwolenia operacji skalowania poczekaj na zakończenie operacji przed podjęciem próby zaktualizowania operacji.

Problem: Aktualizacja rozszerzenia trwa dłużej i kończy się niepowodzeniem

Przyczyna: występuje, jeśli wystąpienie zarządzane SQL i wystąpienie zarządzane SCOM znajdują się w różnych regionach, z powodu których rozszerzenie zajmuje więcej czasu na aktualizację i ostatecznie kończy się niepowodzeniem.

Rozwiązanie: ma wystąpienie zarządzane SQL i wystąpienie zarządzane SCOM w tym samym regionie.

Problem: Po wprowadzeniu poprawek dane użytkownika w bazie danych są zmieniane lub nie są prawidłowo zachowywane

Przyczyna: występuje, jeśli aktualizacja nie została wykonana prawidłowo.

Rozwiązanie: Uruchom ponownie aktualizację.

Problem: Żądanie poprawiania kończy się niepowodzeniem

Przyczyna: występuje z powodu problemu z portalem lub usługą ARM.

Rozwiązanie: poczekaj trochę czasu i ponów próbę. Jeśli problem występuje nawet po rozwiązaniu problemu z portalem/arm, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Operacja stosowania poprawek lub skalowania jest już w toku, spróbuj ponownie po pewnym czasie.

Przyczyna: występuje, jeśli operacja stosowania poprawek lub skalowania jest już w toku.

Rozwiązanie: Poczekaj na ukończenie istniejącej operacji i spróbuj po pewnym czasie.

Problem: Nieaktywne serwery zarządzania widoczne w konsoli

Przyczyna: występuje, jeśli operacja stosowania poprawek lub skalowania pozostawiła niespójny stan po zakończeniu.

Rozwiązanie: Zestawy skalowania maszyn wirtualnych platformy Microsoft Azure służą do aprowizowania serwerów zarządzania dla wystąpień zarządzanych programu SCOM. Aby usunąć nieaktualny serwer zarządzania z systemu, wykonaj następujące kroki:

  1. Uzyskaj dostęp do zestawów skalowania maszyn wirtualnych platformy Azure i zaloguj się do jednego z serwerów zarządzania dla wystąpienia zarządzanego programu SCOM.

  2. Uruchom program PowerShell w trybie administracyjnym i przejdź do następującego katalogu.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Uwaga

    Aby znaleźć wersję, przejdź do C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows strony i przejrzyj wszystkie dostępne wersje, a następnie wybierz najnowszą.

  3. Wykonaj następujący skrypt:

    .\RemoveStaleManagementServers.ps1 
    

    Skrypt jest interaktywny i monituje o nazwę FQDN nieaktualnego serwera.

  4. Podaj dokładną nazwę FQDN nieaktualnego serwera zarządzania, który chcesz usunąć.

    Na przykład nazwa FQDN: SCOMMI2000001.contoso.com.