De levenscyclus van bare-metalmachines beheren
In dit artikel wordt beschreven hoe u levenscyclusbeheerbewerkingen uitvoert op bare-metalmachines (BMM). Deze stappen moeten worden gebruikt voor het oplossen van problemen om te herstellen van fouten of bij het uitvoeren van onderhoudsacties. De opdrachten voor het beheren van de levenscyclus van de BMM zijn:
Let op
Voer geen actie uit op beheerservers zonder eerst contact op te nemen met het ondersteuningspersoneel van Microsoft. Dit kan van invloed zijn op de integriteit van het Operator Nexus-cluster.
- Een BMM uitschakelen
- Een BMM starten
- Een BMM opnieuw starten
- Maak een BMM niet-gepland (cordon zonder evacuate)
- Maak een BMM niet-gepland (cordon met evacuaat)
- Maak een BMM schedulable (uncordon)
- Een BMM-installatiekopie opnieuw maken
- Een BMM vervangen
Belangrijk
Storende opdrachtaanvragen voor een KCP-knooppunt (Kubernetes Control Plane) worden geweigerd als er een andere verstorende actieopdracht wordt uitgevoerd op een ander KCP-knooppunt of als het volledige KCP niet beschikbaar is. Deze controle wordt uitgevoerd om de integriteit van het Nexus-exemplaar te behouden en ervoor te zorgen dat meerdere KCP-knooppunten niet tegelijk operationeel worden vanwege gelijktijdige verstorende acties. Als meerdere knooppunten niet operationeel worden, wordt de drempelwaarde voor het in orde quorum van het Kubernetes-besturingsvlak verbroken.
De vetgedrukte acties in de bovenstaande lijst worden beschouwd als verstorend (Uitschakelen, Opnieuw opstarten, Opnieuw opstarten, Vervangen). Cordon zonder evacuaat wordt niet beschouwd als storend. Cordon met evacuaat wordt beschouwd als verstorend.
Zoals vermeld in de waarschuwingsverklaring, mogen het uitvoeren van acties op beheerservers, met name KCP-knooppunten, alleen worden uitgevoerd in overleg met het ondersteuningspersoneel van Microsoft.
Vereisten
- Installeer de nieuwste versie van de juiste CLI-extensies.
- Haal de naam van de resourcegroep op voor de naam van de beheerde BMM- clusterresourcegroep (cluster_MRG).
- Haal de naam op van de bare-metalcomputer waarvoor een levenscyclusbeheerbewerking is vereist.
- Zorg ervoor dat de doel-bare-metalmachine
poweredState
is ingesteld opOn
enreadyState
ingesteld opTrue
.- Deze vereiste is niet van toepassing op de
start
opdracht.
- Deze vereiste is niet van toepassing op de
Een BMM uitschakelen
Met deze opdracht wordt power-off
de opgegeven bareMetalMachineName
.
az networkcloud baremetalmachine power-off \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een BMM starten
Met deze opdracht wordt start
de opgegeven bareMetalMachineName
.
az networkcloud baremetalmachine start \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een BMM opnieuw starten
Met deze opdracht wordt restart
de opgegeven bareMetalMachineName
.
az networkcloud baremetalmachine restart \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Maak een BMM niet-gepland (cordon)
Voer de volgende opdracht uit om te bepalen of er momenteel workloads worden uitgevoerd op een BMM:
Voor virtuele machines:
az networkcloud baremetalmachine show -n <nodeName> /
--resource-group <resourceGroup> /
--subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'
Voor Nexus Kubernetes-clusterknooppunten: (hiervoor moet u zich aanmelden bij het Nexus Kubernetes-cluster)
kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'
U kunt een BMM niet plannen door de cordon
opdracht uit te voeren.
Bij de uitvoering van de cordon
opdracht worden Operator Nexus-workloads niet gepland op de BMM wanneer cordon is ingesteld. Elke poging om een workload op een cordoned
BMM te maken, resulteert in de werkbelasting die wordt ingesteld op pending
status. Bestaande workloads blijven actief.
De cordon-opdracht ondersteunt een evacuate
parameter met de standaardwaarde False
.
Het is een best practice om dit in te stellen op True
. Bij het uitvoeren van de cordon
opdracht, met de waarde True
voor de evacuate
parameter, zijn de werkbelastingen die op de BMM worden stopped
uitgevoerd en de BMM is ingesteld op pending
status.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Hiermee evacuate "True"
worden workloads van dat knooppunt verwijderd, terwijl evacuate "False"
alleen de planning van nieuwe workloads wordt voorkomen.
Maak een BMM "schedulable" (uncordon)
U kunt een BMM 'schedulable' (bruikbaar) maken door de uncordon
opdracht uit te voeren. Alle workloads in een pending
status op de BMM zijn restarted
wanneer de BMM is uncordoned
.
az networkcloud baremetalmachine uncordon \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een BMM-installatiekopie opnieuw maken
U kunt de runtimeversie op een BMM herstellen door de opdracht uit te reimage
voeren. Met dit proces wordt de runtime-installatiekopie op de doel-BMM opnieuw geïmplementeerd en worden de stappen uitgevoerd om het cluster opnieuw te koppelen met dezelfde id's. Deze actie heeft geen invloed op de workloadbestanden van de tenant op deze BMM. In het geval van een schrijf- of bewerkingsactie die wordt uitgevoerd op het knooppunt via BMM-toegang, is deze actie 'reimage' vereist om Microsoft-ondersteuning te herstellen en gaan de wijzigingen verloren, waarbij het knooppunt naar de verwachte status wordt hersteld.
Als best practice moet u ervoor zorgen dat de werkbelastingen van de BMM worden leeggemaakt met behulp van de cordon
opdracht, met , voordat evacuate "True"
u de reimage
opdracht uitvoert.
Waarschuwing
Als u meer dan één baremetalmachine replace
opdracht reimage
tegelijk uitvoert, of een replace
gelijktijdige uitvoering uitvoert als een reimage
server, blijft de status Niet werkend. Zorg ervoor dat de replace
/reimage
ene volledig is voltooid voordat u een andere start.
az networkcloud baremetalmachine reimage \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een BMM vervangen
Gebruik de replace
opdracht wanneer een server hardwareproblemen ondervindt waarvoor een volledige of gedeeltelijke hardwarevervanging is vereist. Na vervanging van onderdelen zoals moederbord- of NIC-vervanging (Network Interface Card), verandert het MAC-adres van BMM, maar het iDRAC-IP-adres en de hostnaam blijven hetzelfde.
Waarschuwing
Als u meer dan één baremetalmachine replace
opdracht reimage
tegelijk uitvoert, of een replace
gelijktijdige uitvoering uitvoert als een reimage
server, blijft de status Niet werkend. Zorg ervoor dat de replace
/reimage
ene volledig is voltooid voordat u een andere start.
az networkcloud baremetalmachine replace \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--bmc-credentials password=<IDRAC_PASSWORD> username=<IDRAC_USER> \
--bmc-mac-address <IDRAC_MAC> \
--boot-mac-address <PXE_MAC> \
--machine-name <OS_HOSTNAME> \
--serial-number <SERIAL_NUMBER> \
--subscription <subscriptionID>