Rozwiązywanie problemów z klastrami danych big data przy użyciu notesów Jupyter i narzędzia Azure Data Studio
Ta strona jest indeksem notesów dla klastrów dużych zbiorów danych w SQL Server. Te notatniki wykonywalne (.ipynb) są przeznaczone dla SQL Server 2019, aby ułatwić rozwiązywanie problemów z klastrami big data.
Ważny
Dodatek Microsoft SQL Server 2019 Big Data Clusters zostanie wycofany. Obsługa klastrów danych big data programu SQL Server 2019 zakończy się 28 lutego 2025 r. Wszyscy istniejący użytkownicy programu SQL Server 2019 z pakietem Software Assurance będą w pełni obsługiwani na platformie, a oprogramowanie będzie nadal utrzymywane za pośrednictwem aktualizacji zbiorczych programu SQL Server do tego czasu. Aby uzyskać więcej informacji, zobacz wpis na blogu ogłoszeniowym i opcje big data na platformie Microsoft SQL Server.
Każdy notes jest przeznaczony do sprawdzania własnych zależności. Opcja Uruchom wszystkie komórki kończy się pomyślnie lub zgłasza wyjątek, dołączając wskazówkę z hiperlinkiem do innego notatnika, aby rozwiązać brakującą zależność. Postępuj zgodnie z hiperłączem wskazówek do notesu docelowego, kliknij Uruchom wszystkie komórki. Po powodzeniu wróć do oryginalnego notesu, a następnie kliknij przycisk Uruchom wszystkie komórki.
Po zainstalowaniu wszystkich zależności, jeśli Run all cells nie powiedzie się, każdy notes przeanalizuje wyniki i, gdzie to możliwe, utworzy wskazówkę z hiperlinkiem do innego notesu, aby dodatkowo pomóc w rozwiązaniu problemu.
- Aby uzyskać więcej informacji na temat używania notesów do zarządzania klastrami danych big data programu SQL Server, zobacz Manage SQL Server Big Data Clusters with Azure Data Studio notebooks (Zarządzanie klastrami danych big data programu SQL Server za pomocą notesów usługi Azure Data Studio).
- Aby uzyskać informacje o lokalizacji notesów administracyjnych klastra danych big data, zobacz Gdzie znaleźć notesy administracyjne klastrów danych big data programu SQL Server.
Rozwiązywanie problemów z klastrami danych big data
Ta sekcja zawiera zestaw notesów do pobierania dzienników z klastra danych big data programu SQL Server.
Nazwa | Opis |
---|---|
TSG100 — narzędzie do rozwiązywania problemów z klastrami danych big data | Omówienie wszystkich dostępnych notatników dotyczących rozwiązywania problemów z klastrami Big Data oraz wskazówki, kiedy z nich korzystać. |
TSG101 — narzędzie do rozwiązywania problemów z programem SQL Server | Omówienie wszystkich dostępnych notesów dotyczących rozwiązywania problemów z programem SQL Server i ich używania |
TSG102 — narzędzie do rozwiązywania problemów z systemem plików HDFS | Przegląd wszystkich dostępnych notatników do rozwiązywania problemów z HDFS oraz kiedy z nich korzystać |
TSG103 — narzędzie do rozwiązywania problemów z platformą Spark | Omówienie wszystkich dostępnych notatników dotyczących rozwiązywania problemów z platformą Spark i kiedy ich używać. |
TSG104 — narzędzie do rozwiązywania problemów z kontrolkami | Omówienie wszystkich dostępnych notesów dotyczących rozwiązywania problemów z kontrolerem i czasu ich używania |
TSG105 — narzędzie do rozwiązywania problemów z bramą | Przegląd wszystkich dostępnych notatników dotyczących rozwiązywania problemów z usługą Knox Gateway i instrukcje, kiedy ich używać |
TSG106 — narzędzie do rozwiązywania problemów z aplikacjami | Omówienie wszystkich dostępnych notesów dotyczących rozwiązywania problemów z App-Deploy oraz kiedy z nich korzystać |
Diagnozowanie problemów z klastrami danych big data
Zestaw notesów do diagnozowania sytuacji i stanów z klastrem danych big data.
Nazwa | Opis |
---|---|
TSG002 — CrashLoopBackoff | Ta specjalistyczna grupa techniczna połączy się z każdym kontenerem, którego ostatnia próba przejścia do stanu „Uruchomiono” zakończyła się niepowodzeniem i pobierze bieżące oraz poprzednie dzienniki kontenera. Jest to przydatne w przypadku debugowania problemów CrashLoopBackOff zgłoszonych w poleceniu kubectl get pods. |
TSG025 — PRZEGLĄDARKA FSM — stan zapytań kontrolera FSM | Użyj tego notatnika, aby nawiązać połączenie z bazą danych kontrolera i przejrzeć stan automatu stanów skończonych (FSM). Użyj tego notatnika, aby wyświetlić listę aktywnych maszyn stanowych i zidentyfikować zablokowane przepływy pracy. |
TSG026 — nawiązywanie połączenia z węzłem puli danych (w celu uruchomienia języka T-SQL) | Użyj tego notesu, aby nawiązać połączenie z węzłem puli danych (w celu uruchomienia języka T-SQL) |
TSG027 — Obserwowanie wdrożenia klastra | Ten notatnik służy do obserwowania wdrażania klastrów. Zawiera wskazówki dotyczące rozwiązywania problemów z klastrami big data SQL Server. W przypadku problemów podczas tworzenia często przydatne są następujące polecenia do określenia podstawowych przyczyn. |
TSG029 — znajdowanie zrzutów w klastrze | Ten notatnik służy do wyszukiwania zrzutów rdzeni i minidumpów z procesów, takich jak SQL Server lub kontroler w klastrze dużych zbiorów danych. |
TSG032 — użycie procesora CPU i pamięci dla wszystkich kontenerów | Użyj tego notatnika, aby sprawdzić użycie CPU i pamięci dla wszystkich kontenerów. |
TSG037 — Określenie zasobnika głównej puli hostującego replikę podstawową | Użyj tego notesu, aby określić pod puli głównej hostujący replikę podstawową dla klastra big data po włączeniu wysokiej dostępności puli głównej. |
TSG044 — Uruchom sqlcmd w kontenerze puli głównej | Użyj tego notebooka, aby nawiązać połączenie z węzłem puli głównej bezpośrednio za pośrednictwem języka T-SQL. |
TSG055 — Time Curl do Sparkhead | Użyj tego notesu, aby przeprowadzić diagnostykę, jakiego czasu odpowiedzi Curl należy spodziewać się od poda kontrolera do poda sparkhead. |
TSG060 — trwałe miejsce na dysku woluminu dla wszystkich klastrów danych big data | Ten notatnik umożliwia nawiązanie połączenia z każdym kontenerem i uzyskanie informacji o używanym/dostępnym miejscu na dysku dla każdego trwałego woluminu (PV) zamapowanego na każde roszczenie woluminu (PVC) klastra big data. |
TSG078 — czy klaster jest w dobrej kondycji | Użyj tego notesu, aby sprawdzić, czy klaster danych big data jest w dobrej kondycji. |
TSG079 — generowanie zrzutu rdzenia kontrolera | Użyj tego notatnika, aby wygenerować zrzut pamięci rdzenia kontrolera. |
TSG086 — uruchamianie top we wszystkich kontenerach | Użyj tego zeszytu, aby uruchomić komendę top we wszystkich kontenerach. |
TSG087 — używanie interfejsu wiersza polecenia hadoop fs w zasobniku namenode | Użyj tego notesu, aby użyć interfejsu wiersza polecenia hadoop fs w zasobniku namenode. |
TSG108 — wyświetlanie mapy konfiguracji uaktualnienia kontrolera | Użyj tego notatnika, aby rozwiązać problemy z niepowodzeniem podczas uruchamiania uaktualnienia klastra big data przy użyciu azdata bdc upgrade. |
TSG112 — kontrole przed wdrożeniem usługi Active Directory | Użyj tego notesu, aby zweryfikować, czy konfiguracja klastra danych big data jest prawidłowa dla wdrożenia usługi Active Directory. |
TSG115 — SQL Server w translatorze dzienników zabezpieczeń systemu Linux | Ten notes służy do analizowania dzienników generowanych przez rejestratory security.ldap i security.kerberos dla programu SQL Server w systemie Linux. Aby włączyć te rejestratory, umieść poniższe wiersze w pliku /var/opt/mssql/logger.ini na maszynie z programem SQL Server w systemie Linux. Uwaga: w tym pliku jest rozróżniana wielkość liter. |
TSG116 — tłumacz dzienników wsparcia bezpieczeństwa SQL BDC | Użyj tego notesu, aby przeanalizować dzienniki wygenerowane przez usługę pomocy technicznej zabezpieczeń w usłudze SQL BDC. Aby pobrać dzienniki, skopiujemy dzienniki debugowania z klastra i wyodrębnimy je. Wykonaj poniższe kroki — uruchom polecenie "azdata bdc debug copy-logs -n <przestrzeni nazw>". Spowoduje to utworzenie kilku plików .tar.gz — wyodrębnij zawartość debuglogs-<przestrzeni nazw>-<data>-<godzina>.tar.gz — odnaleźć dziennik wsparcia bezpieczeństwa znajdujący się w ./<przestrzeni nazw>/control-<…>/security-support/supervisol/log/secsupp-stderr---<…>.log. |
TSG119 — kontrole po wdrożeniu usługi Active Directory | Ten notatnik jest przeznaczony do weryfikowania konfiguracji BDC po wdrożeniu AD. Sprawdzi istnienie wpisów DNS dla wszystkich punktów końcowych z atrybutem dnsName, a te wpisy DNS powinny być rekordami A, a nie rekordami aliasów (tj. rekordy A, a nie rekordy CNAME). Ponadto zostanie sprawdzone istnienie dobrze znanych kont Active Directory i czy są one włączone, a także istnienie oczekiwanych nazw głównych usługi (SPN). |
Naprawa problemów z klastrami Big Data
Zestaw notesów do naprawiania znanych sytuacji i stanów klastra danych big data programu SQL Server.
Nazwa | Opis |
---|---|
TSG005 — wykryto pętlę przekazywania | Użyj tego notesu do radzenia sobie z wykrytą pętlą przekazywania, ponieważ narzędzie dnsmasq może umieścić lokalną pętlę zwrotną w pliku resolv.conf, co może spowodować przejście zasobników kontrolera do CrashLoopBackOff podczas początkowego wdrożenia klastra: https://askubuntu.com/questions/627899/nameserver-127-0-1-1-in-resolv-conf-wont-go-away| |
TSG011 — ponowne uruchamianie serwera sparkhistory | Użyj tego notesu, aby ponownie uruchomić serwer sparkhistory, ponieważ proces SparkHistory w Java może przestać odpowiadać podczas uruchamiania. Ponowne uruchomienie serwera sparkhistory (supervisorctl restart sparkhistory) może rozwiązać ten problem. |
TSG018 — kill sqlservr process on the master pool (TSG018 — zabij proces sqlservr w puli głównej) | Użyj tego notatnika, gdy polecenie T-SQL SHUTDOWN nie pomyślnie ponownie uruchomi procesu ./sqlservr. Użyj tego notebooka, aby zabić główny proces sqlservr, który zostanie automatycznie uruchomiony ponownie przez proces frontendowy ./sqlservr. |
TSG024 — Namenode jest w trybie ochronnym | Użyj tego notatnika, gdy system plików HDFS przechodzi w tryb awaryjny. Jeśli na przykład zbyt wiele zasobników jest przełączanych zbyt szybko w puli pamięci, tryb bezpieczny może być automatycznie włączony. |
TSG028 — Ponowne uruchomienie menedżera węzła na wszystkich węzłach puli pamięci masowej | Użyj tego notesu, gdy konieczne jest ponowne uruchomienie menedżera węzłów we wszystkich węzłach puli pamięci masowej. |
TSG038 — błędy tworzenia w BDC z powodu braku klucza | Użyj tego notesu, gdy usługa BDC tworzy błędy z powodu — brakuje klucza. |
TSG039 — nieprawidłowa nazwa obiektu "role_permissions" | Użyj tego notesu w przypadku wystąpienia problemu z nieprawidłowym obiektem ze względu na uprawnienia roli w pliku dziennika Knox gateway.log |
TSG040 — nie można pobrać nazw plików z kontrolera z błędem | Użyj tego notesu, gdy wystąpi błąd 504 Gateway Time-out podczas pobierania nazw plików z kontrolera. |
TSG041 — Nie można utworzyć nowego kontekstu asynchronicznego I/O (zwiększ wartość parametru sysctl fs.aio-max-nr) | Użyj tego notatnika, gdy nie można utworzyć nowego kontekstu asynchronicznego I/O (zwiększ sysctl fs.aio-max-nr). |
TSG045 — maksymalna liczba dysków danych, które mogą być dołączone do maszyny wirtualnej o tym rozmiarze (AKS) | Użyj tego notatnika, gdy maksymalna liczba dysków danych, które mogą być dołączone do maszyny wirtualnej o rozmiarze (AKS), zostanie osiągnięta. |
TSG047 — ConfigException — oczekiwano tylko jednego obiektu o nazwie | Tego notesu należy używać w przypadku używania programu ConfigException, który oczekuje tylko jednego obiektu o nazwie. |
TSG048 — Wdrożenie utknęło na "oczekiwaniu na uruchomienie zasobnika kontrolera" | Użyj tego notesu, gdy wdrożenie utknęło na "Oczekiwanie na uruchomienie kontrolerowego podu". |
TSG050 — tworzenie klastra zawiesza się z komunikatem "Upłynął limit czasu oczekiwania na dołączenie lub zainstalowanie woluminów dla zasobnika" | Użyj tego notatnika, gdy tworzenie klastra zawiesza się z komunikatem "upłynął limit czasu oczekiwania na dołączenie lub zamontowanie woluminów dla zasobnika". |
TSG052 — Próba pobrania serwera DNS master-svc nie powiodła się i spróbuje ponownie | Użyj tego notatnika, gdy tworzenie klastra zawiesza się z "upłynął limit czasu oczekiwania na dołączenie lub zainstalowanie woluminów dla podu". |
TSG057 — niepowodzenie podczas uruchamiania usługi kontrolera . System.TimeoutException | Użyj tego notesu podczas uruchamiania usługi kontrolera oraz napotkania wyjątku System.TimeoutException. |
TSG067 — nie można ukończyć konfiguracji narzędzia kube | Użyj tego notatnika, gdy konfiguracja kube kończy się niepowodzeniem. |
TSG074 — usuwanie App-Deploys | Użyj tego notatnika, gdy masz problem z usunięciem aplikacji w klastrze big data. |
TSG075 — FailedCreatePodSandBox z powodu niepowodzenia konfiguracji zasobnika przez wtyczkę sieciową CNI. | Użyj tego notesu, gdy pojawi się wyjątek FailedCreatePodSandBox z powodu błędu NetworkPlugin cni w ustawieniu pod. |
TSG080 — usuwanie sesji platformy Spark przy użyciu polecenia azdata | Użyj tego notesu, gdy napotkasz problem podczas usuwania sesji Spark. |
TSG109 — ustawianie limitów czasu uaktualniania | Użyj tego notesu, gdy masz problem z aktualizacją BDC. |
TSG110 — Polecenie Azdata zwraca błąd ApiError | Użyj tego notatnika, gdy narzędzie Azdata zwraca błąd ApiError. |
Następne kroki
Aby uzyskać więcej informacji na temat klastrów danych big data, zobacz Co to są klastry danych big data programu SQL Server?.