Sdílet prostřednictvím


Oprava uzlu v Azure Local

Platí pro: Azure Local 2311.2 a novější

Tento článek popisuje, jak opravit uzel v místní instanci Azure. V tomto článku se každý server označuje jako uzel.

O opravách uzlů

Azure Local je hyperkonvergovaný systém, který umožňuje opravit uzly z existujících systémů. Pokud dojde k selhání hardwaru, možná budete muset opravit uzel v systému.

Před opravou uzlu se ujistěte, že u poskytovatele řešení zkontrolujete, které komponenty v uzlu jsou náhradní jednotky (FRU), které můžete nahradit sami sobě a které komponenty by vyžadovaly nahrazení technikem.

Části, které podporují horkou výměnu, obvykle nevyžadují, abyste znovu vytvořili uzel, na rozdíl od komponent, které nepodporují horkou výměnu, jako například základní deska. Obraťte se na výrobce hardwaru a zjistěte, které součásti by vyžadovaly opětovné vytvoření image uzlu. Další informace naleznete v tématu Nahrazení komponent.

Pracovní postup opravy uzlu

Následující vývojový diagram znázorňuje celkový proces opravy uzlu.

Diagram znázorňující proces uzlu opravy

*Uzel nemusí být ve stavu, kdy je možné vypnout nebo je to nutné*

Pokud chcete opravit existující uzel, postupujte podle těchto kroků vysoké úrovně:

  1. Pokud je to možné, vypněte uzel, který chcete opravit. V závislosti na stavu uzlu nemusí být vypnutí možné nebo nezbytné.

  2. Znovu naimažte uzel, který je potřeba opravit.

  3. Spusťte operaci opravy uzlu. V rámci operace opravy se aktualizuje operační systém, ovladače a firmware Azure Stack HCI.

    Úložiště se automaticky vyrovnává na přeinstalovaném uzlu. Vyvážení úložiště je úloha s nízkou prioritou, která může běžet několik dnů v závislosti na počtu uzlů a použitém úložišti.

Podporované scénáře

Oprava uzlu znovu vytvoří obrázek uzlu a vrátí ho do systému s předchozím názvem a konfigurací.

Oprava jednoho uzlu způsobí opětovné nasazení s možností zachování datových svazků. Během nasazení se odstraní a nově zřídí jenom systémový svazek.

Důležité

Ujistěte se, že vždy máte zálohy pro vaše úlohy a nespoléhejte pouze na odolnost systému. To je zvlášť důležité ve scénářích s jedním uzlem.

Nastavení odolnosti

V této verzi se pro operaci opravy uzlu neprovádějí konkrétní úlohy na pracovních svazcích, které jste vytvořili po nasazení. V případě operace uzlu opravy se obnoví a zobrazí se pouze požadované svazky infrastruktury a svazky úloh jako sdílené svazky clusteru (CSV).

Ostatní svazky úloh, které jste vytvořili po nasazení, zůstanou zachovány a tyto svazky můžete zjistit spuštěním rutiny Get-VirtualDisk . Budete muset ručně odemknout svazek (pokud má svazek povolený BitLocker) a v případě potřeby vytvořit soubor CSV (pokud je to potřeba).

Požadavky na hardware

Při opravě uzlu systém ověří hardware nového, příchozího uzlu a zajistí, aby uzel splňoval hardwarové požadavky, než se přidá do systému.

Součást Kontrola dodržování předpisů
Procesor Ověřte, že nový uzel má stejný počet nebo více jader procesoru. Pokud jádra procesoru na příchozím uzlu nesplňují tento požadavek, zobrazí se upozornění. Operace je však povolená.
Memory (Paměť) Ověřte, že má nový uzel nainstalovaný stejný počet nebo více paměti. Pokud paměť na příchozím uzlu nesplňuje tento požadavek, zobrazí se upozornění. Operace je však povolená.
Jednotky Ověřte, že nový uzel má stejný počet datových jednotek dostupných pro Storage Spaces Direct. Pokud počet jednotek na příchozím uzlu nesplňuje tento požadavek, zobrazí se chyba a operace se zablokuje.

Nahrazení uzlu

Můžete nahradit celý uzel:

  • S novým uzlem, který má jiné sériové číslo v porovnání se starým uzlem.
  • Jakmile ho znovu vytvoříte, s aktuálním uzlem.

Při nahrazování uzlů se podporují následující scénáře:

Node Disk Podporuje se
Nový uzel Nové disky Ano
Nový uzel Aktuální disky Ano
Aktuální uzel (zmage) Aktuální disky přeformátované ** Ne
Aktuální uzel (přeobrazený) Nové disky Ano
Aktuální uzel (zmage) Aktuální disky Ano

Disky, které byly použity ve Storage Spaces Direct, vyžadují správné vyčištění. Přeformátování nestačí. Podívejte se, jak vyčistit jednotky.

Důležité

Pokud komponentu nahradíte během opravy uzlu, nemusíte nahradit ani resetovat datové jednotky. Pokud jednotku nahradíte nebo ji resetujete, jednotka se po připojení k systému nerozpozná.

Výměna komponent

Na vaší místní instanci Azure komponenty, které se nedají vyměnit za provozu, zahrnují následující položky:

  • Základní deska / řadič pro správu základní desky (BMC) / grafická karta
  • Diskový řadič / adaptér hostitelské sběrnice (HBA) / zpětná deska
  • Síťový adaptér
  • Grafická procesorová jednotka
  • Datové jednotky (jednotky, které nepodporují výměnu za provozu, například přídavné karty PCI-e)

Skutečný postup nahrazení nehořitelných komponent se liší podle výrobce hardwaru výrobce OEM (Original Equipment Manufacturer). Pokud je pro komponenty, které nejsou vyměnitelné za provozu, nutná oprava uzlu, podívejte se do dokumentace svého dodavatele OEM.

Požadavky

Před opravou uzlu je nutné zajistit, aby:

  • AzureStackLCMUser je aktivní ve službě Active Directory. Další informace najdete v tématu Příprava služby Active Directory.
  • Přihlášení jako AzureStackLCMUser nebo jiný uživatel s ekvivalentními oprávněními
  • Přihlašovací údaje se AzureStackLCMUser nezměnily.

Oprava uzlu

Tato část popisuje, jak opravit uzel pomocí PowerShellu, monitorovat stav Repair-Server operace a řešit případné problémy.

Ujistěte se, že jste si prošli požadavky.

Postupujte podle těchto kroků na uzlu, který se pokoušíte opravit.

  1. Přihlaste se k webu Azure Portal pomocí oprávnění role správce Azure Stack HCI.

    1. Přejděte do skupiny prostředků použité k nasazení místní instance Azure. Ve skupině prostředků identifikujte prostředek virtuálního počítače Azure Arc, který odpovídá vadnému uzlu, jejž chcete opravit.

    2. V prostředku Azure Arc přejděte na Nastavení > Zámky. V pravém panelu zobrazíte zámek prostředku.

    3. Vyberte zámek a pak výběrem ikony koše zámek odstraňte.

      snímek obrazovky s odstraněním zámku prostředku na chybném uzlu počítače Azure Arc

    4. Na stránce Přehled prostředku počítače Azure Arc v pravém podokně vyberte Odstranit. Tato akce by měla odstranit chybný uzel počítače.

      Snímek obrazovky zobrazuje odstranění vadného uzlu počítače Azure Arc

  2. Nainstalujte operační systém a požadované ovladače na uzel, který chcete opravit. Postupujte podle kroků v části Instalace operačního systému Azure Stack HCI verze 23H2.

    Poznámka:

    Pokud jste místní instanci Azure nasadili pomocí vlastních IP adres úložiště, musíte po opravě uzlu ručně přiřadit IP adresy síťovým adaptérům úložiště.

  3. Zaregistrujte uzel ve službě Arc. Postupujte podle kroků v části Registrace ve službě Arc a nastavte oprávnění.

    Poznámka:

    K registraci ve službě Arc musíte použít stejné parametry jako existující uzly. Příklad: Název skupiny prostředků, oblast, předplatné a tenant.

  4. Opravovanýmu uzlu přiřaďte následující oprávnění:

Postupujte podle těchto kroků na jiném uzlu, který je členem stejné místní instance Azure.

  1. Pokud používáte verzi starší než 2405.3, musíte spustit následující příkaz, který vyčistí konfliktní soubory:

    Get-ChildItem -Path "$env:SystemDrive\NugetStore" -Exclude Microsoft.AzureStack.Solution.LCMControllerWinService*,Microsoft.AzureStack.Role.Deployment.Service* | Remove-Item -Recurse -Force
    
  2. Přihlaste se k uzlu, který je již členem systému, pomocí přihlašovacích údajů uživatele domény, které jste zadali během nasazení systému. Spuštěním následujícího příkazu opravte příchozí uzel:

    $Cred = Get-Credential 
    Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
    

    Poznámka:

    Název uzlu musí být NetBIOS name. Parametr LocalAdminCredential je ve výchozím nastavení předdefinovaný účet Administrator vytvořený instalací operačního systému Windows.

  3. Poznamenejte si ID operace, jak je výsledkem příkazu Repair-Server. Tento postup použijete později ke sledování průběhu Repair-Server operace.

Monitorování průběhu operace

Pokud chcete monitorovat průběh operace přidání uzlu, postupujte takto:

  1. Spusťte následující rutinu a zadejte ID operace z předchozího kroku.

    $ID = "<Operation ID>" 
    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID 
    
  2. Po dokončení operace se úloha vyrovnávání úložiště na pozadí bude dál spouštět. Počkejte na dokončení úlohy vyrovnávání úložiště. Pokud chcete ověřit průběh této úlohy vyrovnávání úložiště, použijte následující cmdlet:

    Get-VirtualDisk|Get-StorageJob
    

    Pokud je úloha vyrovnávání úložiště dokončená, rutina nevrátí výstup.

Scénáře obnovení

Při opravě uzlu jsou uvedeny následující scénáře obnovení a doporučené kroky pro zmírnění rizik:

Popis scénáře Zmírnění Podporováno?
Operace opravy uzlu se nezdařila. Pro dokončení operace prozkoumejte selhání.
Znovu spusťte neúspěšnou operaci pomocí Repair-Server -Rerun.
Ano
Operace opravy uzlu byla částečně úspěšná, ale vyžadovala novou instalaci operačního systému. V tomto scénáři orchestrátor (označovaný také jako Správce životního cyklu) už aktualizoval své úložiště znalostí o nový uzel. Použijte scénář pro opravu uzlu. Ano

Řešení problému

Pokud při opravě uzlu dojde k selháním nebo chybám, můžete zaznamenat výstup chyb v souboru protokolu.

  • Přihlaste se pomocí přihlašovacích údajů uživatele domény, které jste zadali během nasazování systému. Zachyťte problém v souborech protokolu.

    Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
    
  • Pokud chcete neúspěšnou operaci spustit znovu, použijte následující cmdlet:

    Repair-Server -Rerun
    

Další kroky

Přečtěte si další informace o tom, jak přidat uzel.