Oprava uzlu v Azure Local
Platí pro: Azure Local 2311.2 a novější
Tento článek popisuje, jak opravit uzel v místní instanci Azure. V tomto článku se každý server označuje jako uzel.
O opravách uzlů
Azure Local je hyperkonvergovaný systém, který umožňuje opravit uzly z existujících systémů. Pokud dojde k selhání hardwaru, možná budete muset opravit uzel v systému.
Před opravou uzlu se ujistěte, že u poskytovatele řešení zkontrolujete, které komponenty v uzlu jsou náhradní jednotky (FRU), které můžete nahradit sami sobě a které komponenty by vyžadovaly nahrazení technikem.
Části, které podporují horkou výměnu, obvykle nevyžadují, abyste znovu vytvořili uzel, na rozdíl od komponent, které nepodporují horkou výměnu, jako například základní deska. Obraťte se na výrobce hardwaru a zjistěte, které součásti by vyžadovaly opětovné vytvoření image uzlu. Další informace naleznete v tématu Nahrazení komponent.
Pracovní postup opravy uzlu
Následující vývojový diagram znázorňuje celkový proces opravy uzlu.
*Uzel nemusí být ve stavu, kdy je možné vypnout nebo je to nutné*
Pokud chcete opravit existující uzel, postupujte podle těchto kroků vysoké úrovně:
Pokud je to možné, vypněte uzel, který chcete opravit. V závislosti na stavu uzlu nemusí být vypnutí možné nebo nezbytné.
Znovu naimažte uzel, který je potřeba opravit.
Spusťte operaci opravy uzlu. V rámci operace opravy se aktualizuje operační systém, ovladače a firmware Azure Stack HCI.
Úložiště se automaticky vyrovnává na přeinstalovaném uzlu. Vyvážení úložiště je úloha s nízkou prioritou, která může běžet několik dnů v závislosti na počtu uzlů a použitém úložišti.
Podporované scénáře
Oprava uzlu znovu vytvoří obrázek uzlu a vrátí ho do systému s předchozím názvem a konfigurací.
Oprava jednoho uzlu způsobí opětovné nasazení s možností zachování datových svazků. Během nasazení se odstraní a nově zřídí jenom systémový svazek.
Důležité
Ujistěte se, že vždy máte zálohy pro vaše úlohy a nespoléhejte pouze na odolnost systému. To je zvlášť důležité ve scénářích s jedním uzlem.
Nastavení odolnosti
V této verzi se pro operaci opravy uzlu neprovádějí konkrétní úlohy na pracovních svazcích, které jste vytvořili po nasazení. V případě operace uzlu opravy se obnoví a zobrazí se pouze požadované svazky infrastruktury a svazky úloh jako sdílené svazky clusteru (CSV).
Ostatní svazky úloh, které jste vytvořili po nasazení, zůstanou zachovány a tyto svazky můžete zjistit spuštěním rutiny Get-VirtualDisk
. Budete muset ručně odemknout svazek (pokud má svazek povolený BitLocker) a v případě potřeby vytvořit soubor CSV (pokud je to potřeba).
Požadavky na hardware
Při opravě uzlu systém ověří hardware nového, příchozího uzlu a zajistí, aby uzel splňoval hardwarové požadavky, než se přidá do systému.
Součást | Kontrola dodržování předpisů |
---|---|
Procesor | Ověřte, že nový uzel má stejný počet nebo více jader procesoru. Pokud jádra procesoru na příchozím uzlu nesplňují tento požadavek, zobrazí se upozornění. Operace je však povolená. |
Memory (Paměť) | Ověřte, že má nový uzel nainstalovaný stejný počet nebo více paměti. Pokud paměť na příchozím uzlu nesplňuje tento požadavek, zobrazí se upozornění. Operace je však povolená. |
Jednotky | Ověřte, že nový uzel má stejný počet datových jednotek dostupných pro Storage Spaces Direct. Pokud počet jednotek na příchozím uzlu nesplňuje tento požadavek, zobrazí se chyba a operace se zablokuje. |
Nahrazení uzlu
Můžete nahradit celý uzel:
- S novým uzlem, který má jiné sériové číslo v porovnání se starým uzlem.
- Jakmile ho znovu vytvoříte, s aktuálním uzlem.
Při nahrazování uzlů se podporují následující scénáře:
Node | Disk | Podporuje se |
---|---|---|
Nový uzel | Nové disky | Ano |
Nový uzel | Aktuální disky | Ano |
Aktuální uzel (zmage) | Aktuální disky přeformátované ** | Ne |
Aktuální uzel (přeobrazený) | Nové disky | Ano |
Aktuální uzel (zmage) | Aktuální disky | Ano |
Disky, které byly použity ve Storage Spaces Direct, vyžadují správné vyčištění. Přeformátování nestačí. Podívejte se, jak vyčistit jednotky.
Důležité
Pokud komponentu nahradíte během opravy uzlu, nemusíte nahradit ani resetovat datové jednotky. Pokud jednotku nahradíte nebo ji resetujete, jednotka se po připojení k systému nerozpozná.
Výměna komponent
Na vaší místní instanci Azure komponenty, které se nedají vyměnit za provozu, zahrnují následující položky:
- Základní deska / řadič pro správu základní desky (BMC) / grafická karta
- Diskový řadič / adaptér hostitelské sběrnice (HBA) / zpětná deska
- Síťový adaptér
- Grafická procesorová jednotka
- Datové jednotky (jednotky, které nepodporují výměnu za provozu, například přídavné karty PCI-e)
Skutečný postup nahrazení nehořitelných komponent se liší podle výrobce hardwaru výrobce OEM (Original Equipment Manufacturer). Pokud je pro komponenty, které nejsou vyměnitelné za provozu, nutná oprava uzlu, podívejte se do dokumentace svého dodavatele OEM.
Požadavky
Před opravou uzlu je nutné zajistit, aby:
-
AzureStackLCMUser
je aktivní ve službě Active Directory. Další informace najdete v tématu Příprava služby Active Directory. - Přihlášení jako
AzureStackLCMUser
nebo jiný uživatel s ekvivalentními oprávněními - Přihlašovací údaje se
AzureStackLCMUser
nezměnily.
V případě potřeby převezměte uzel, který jste identifikovali pro opravu, offline. Postupujte podle následujících kroků:
- Před tím, než ho přeberete do offline režimu, ověřte, že je uzel v pořádku.
- Pozastavte a vyprázdněte uzel.
- Vypněte uzel.
Oprava uzlu
Tato část popisuje, jak opravit uzel pomocí PowerShellu, monitorovat stav Repair-Server
operace a řešit případné problémy.
Ujistěte se, že jste si prošli požadavky.
Postupujte podle těchto kroků na uzlu, který se pokoušíte opravit.
Přihlaste se k webu Azure Portal pomocí oprávnění role správce Azure Stack HCI.
Přejděte do skupiny prostředků použité k nasazení místní instance Azure. Ve skupině prostředků identifikujte prostředek virtuálního počítače Azure Arc, který odpovídá vadnému uzlu, jejž chcete opravit.
V prostředku Azure Arc přejděte na Nastavení > Zámky. V pravém panelu zobrazíte zámek prostředku.
Vyberte zámek a pak výběrem ikony koše zámek odstraňte.
Na stránce Přehled prostředku počítače Azure Arc v pravém podokně vyberte Odstranit. Tato akce by měla odstranit chybný uzel počítače.
Nainstalujte operační systém a požadované ovladače na uzel, který chcete opravit. Postupujte podle kroků v části Instalace operačního systému Azure Stack HCI verze 23H2.
Poznámka:
Pokud jste místní instanci Azure nasadili pomocí vlastních IP adres úložiště, musíte po opravě uzlu ručně přiřadit IP adresy síťovým adaptérům úložiště.
Zaregistrujte uzel ve službě Arc. Postupujte podle kroků v části Registrace ve službě Arc a nastavte oprávnění.
Poznámka:
K registraci ve službě Arc musíte použít stejné parametry jako existující uzly. Příklad: Název skupiny prostředků, oblast, předplatné a tenant.
Opravovanýmu uzlu přiřaďte následující oprávnění:
- Role místního Správa zařízení Azure
- Uživatel tajných kódů služby Key Vault Další informace najdete v tématu Přiřazení oprávnění k uzlu.
Postupujte podle těchto kroků na jiném uzlu, který je členem stejné místní instance Azure.
Pokud používáte verzi starší než 2405.3, musíte spustit následující příkaz, který vyčistí konfliktní soubory:
Get-ChildItem -Path "$env:SystemDrive\NugetStore" -Exclude Microsoft.AzureStack.Solution.LCMControllerWinService*,Microsoft.AzureStack.Role.Deployment.Service* | Remove-Item -Recurse -Force
Přihlaste se k uzlu, který je již členem systému, pomocí přihlašovacích údajů uživatele domény, které jste zadali během nasazení systému. Spuštěním následujícího příkazu opravte příchozí uzel:
$Cred = Get-Credential Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
Poznámka:
Název uzlu musí být NetBIOS name. Parametr
LocalAdminCredential
je ve výchozím nastavení předdefinovaný účet Administrator vytvořený instalací operačního systému Windows.Poznamenejte si ID operace, jak je výsledkem příkazu
Repair-Server
. Tento postup použijete později ke sledování průběhuRepair-Server
operace.
Monitorování průběhu operace
Pokud chcete monitorovat průběh operace přidání uzlu, postupujte takto:
Spusťte následující rutinu a zadejte ID operace z předchozího kroku.
$ID = "<Operation ID>" Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID
Po dokončení operace se úloha vyrovnávání úložiště na pozadí bude dál spouštět. Počkejte na dokončení úlohy vyrovnávání úložiště. Pokud chcete ověřit průběh této úlohy vyrovnávání úložiště, použijte následující cmdlet:
Get-VirtualDisk|Get-StorageJob
Pokud je úloha vyrovnávání úložiště dokončená, rutina nevrátí výstup.
Scénáře obnovení
Při opravě uzlu jsou uvedeny následující scénáře obnovení a doporučené kroky pro zmírnění rizik:
Popis scénáře | Zmírnění | Podporováno? |
---|---|---|
Operace opravy uzlu se nezdařila. | Pro dokončení operace prozkoumejte selhání. Znovu spusťte neúspěšnou operaci pomocí Repair-Server -Rerun . |
Ano |
Operace opravy uzlu byla částečně úspěšná, ale vyžadovala novou instalaci operačního systému. | V tomto scénáři orchestrátor (označovaný také jako Správce životního cyklu) už aktualizoval své úložiště znalostí o nový uzel. Použijte scénář pro opravu uzlu. | Ano |
Řešení problému
Pokud při opravě uzlu dojde k selháním nebo chybám, můžete zaznamenat výstup chyb v souboru protokolu.
Přihlaste se pomocí přihlašovacích údajů uživatele domény, které jste zadali během nasazování systému. Zachyťte problém v souborech protokolu.
Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
Pokud chcete neúspěšnou operaci spustit znovu, použijte následující cmdlet:
Repair-Server -Rerun
Další kroky
Přečtěte si další informace o tom, jak přidat uzel.