Hantera livscykeln för datorer utan operativsystem
Den här artikeln beskriver hur du utför livscykelhanteringsåtgärder på datorer utan operativsystem (BMM). De här stegen bör användas för felsökning för att återställa från fel eller vid underhållsåtgärder. Kommandona för att hantera livscykeln för BMM är:
Varning
Utför inga åtgärder mot hanteringsservrar utan att först kontakta Microsofts supportpersonal. Detta kan påverka operatörens Nexus-klusters integritet.
- Stäng av en BMM
- Starta en BMM
- Starta om en BMM
- Gör en BMM oplanerad (avspärrning utan evakuering)
- Gör en BMM oplanerad (avspärrning med evakuering)
- Gör en BMM-schemaläggningsbar (uncordon)
- Återskapa en BMM
- Ersätt en BMM
Viktigt!
Störande kommandobegäranden mot en Kubernetes Control Plane-nod (KCP) avvisas om det finns ett annat störande åtgärdskommando som redan körs mot en annan KCP-nod eller om den fullständiga KCP-filen inte är tillgänglig. Den här kontrollen görs för att upprätthålla Nexus-instansens integritet och se till att flera KCP-noder inte blir icke-operativa samtidigt på grund av samtidiga störande åtgärder. Om flera noder inte används bryter det tröskelvärdet för kvorum för Kubernetes-kontrollplanet.
De fetstilta åtgärderna i listan ovan anses vara störande (avstängning, omstart, återstart, ersätt). Avspärrning utan evakuering anses inte vara störande. Avspärrning med evakuering anses vara störande.
Som anges i varningen bör åtgärder mot hanteringsservrar, särskilt KCP-noder, endast utföras i samråd med Microsofts supportpersonal.
Förutsättningar
- Installera den senaste versionen av lämpliga CLI-tillägg.
- Hämta namnet på resursgruppen för namnet på den hanterade resursgruppen BMM – Kluster (cluster_MRG) .
- Hämta namnet på den dator utan operativsystem som kräver en livscykelhanteringsåtgärd.
- Se till att målmaskinen
poweredState
utan operativsystem är inställdOn
på ochreadyState
inställd påTrue
.- Den här förutsättningen
start
gäller inte för kommandot.
- Den här förutsättningen
Stäng av en BMM
Det här kommandot kommer att power-off
angiven bareMetalMachineName
.
az networkcloud baremetalmachine power-off \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Starta en BMM
Det här kommandot kommer att start
angiven bareMetalMachineName
.
az networkcloud baremetalmachine start \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Starta om en BMM
Det här kommandot kommer att restart
angiven bareMetalMachineName
.
az networkcloud baremetalmachine restart \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Gör en BMM oplanerad (avspärrning)
Kör följande kommando för att identifiera om några arbetsbelastningar för närvarande körs på en BMM:
För virtuella datorer:
az networkcloud baremetalmachine show -n <nodeName> /
--resource-group <resourceGroup> /
--subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'
För Nexus Kubernetes-klusternoder: (kräver inloggning i Nexus Kubernetes-klustret)
kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'
Du kan göra en BMM oplanerad genom att cordon
köra kommandot .
Vid körningen cordon
av kommandot schemaläggs inte Operator Nexus-arbetsbelastningar på BMM när avspärrning har angetts. Alla försök att skapa en arbetsbelastning på en cordoned
BMM resulterar i att arbetsbelastningen anges till pending
tillstånd. Befintliga arbetsbelastningar fortsätter att köras.
Cordon-kommandot stöder en evacuate
parameter med standardvärdet False
.
Det är en bra idé att ange detta till True
. Vid körning av cordon
kommandot, med värdet True
för parametern evacuate
, är stopped
de arbetsbelastningar som körs på BMM och BMM är inställt på pending
tillstånd.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Tar evacuate "True"
bort arbetsbelastningar från den noden samtidigt evacuate "False"
som endast förhindrar schemaläggning av nya arbetsbelastningar.
Gör en BMM "schemaläggningsbar" (uncordon)
Du kan göra en BMM "schemaläggningsbar" (användbar) genom att uncordon
köra kommandot . Alla arbetsbelastningar i ett pending
tillstånd på BMM är restarted
när BMM är uncordoned
.
az networkcloud baremetalmachine uncordon \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Återskapa en BMM
Du kan återställa körningsversionen på en BMM genom att reimage
köra kommandot . Den här processen distribuerar om körningsavbildningen på mål-BMM:n och kör stegen för att återansluta till klustret med samma identifierare. Den här åtgärden påverkar inte klientorganisationens arbetsbelastningsfiler på denna BMM. Om en skriv- eller redigeringsåtgärd utförs på noden via BMM-åtkomst krävs den här åtgärden för att återställa Microsoft-supporten och ändringarna går förlorade, vilket återställer noden till det förväntade tillståndet.
Vi rekommenderar att du ser till att BMM:s arbetsbelastningar töms med kommandot cordon
med evacuate "True"
, innan du reimage
kör kommandot.
Varning
Om du kör mer än ett baremetalmachine replace
eller reimage
ett kommando samtidigt, eller om du kör ett replace
samtidigt som ett reimage
, lämnar servrarna i ett icke-fungerande tillstånd. Kontrollera att en replace
/reimage
har slutförts helt innan du startar en annan.
az networkcloud baremetalmachine reimage \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Ersätt en BMM
replace
Använd kommandot när en server stöter på maskinvaruproblem som kräver en fullständig eller partiell maskinvaruersättning. Efter byte av komponenter som moderkort eller nätverkskort (NIC) kommer MAC-adressen för BMM att ändras, men iDRAC IP-adressen och värdnamnet förblir desamma.
Varning
Om du kör mer än ett baremetalmachine replace
eller reimage
ett kommando samtidigt, eller om du kör ett replace
samtidigt som ett reimage
, lämnar servrarna i ett icke-fungerande tillstånd. Kontrollera att en replace
/reimage
har slutförts helt innan du startar en annan.
az networkcloud baremetalmachine replace \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--bmc-credentials password=<IDRAC_PASSWORD> username=<IDRAC_USER> \
--bmc-mac-address <IDRAC_MAC> \
--boot-mac-address <PXE_MAC> \
--machine-name <OS_HOSTNAME> \
--serial-number <SERIAL_NUMBER> \
--subscription <subscriptionID>