Dela via


Hantera livscykeln för datorer utan operativsystem

Den här artikeln beskriver hur du utför livscykelhanteringsåtgärder på datorer utan operativsystem (BMM). De här stegen bör användas för felsökning för att återställa från fel eller vid underhållsåtgärder. Kommandona för att hantera livscykeln för BMM är:

Varning

Utför inga åtgärder mot hanteringsservrar utan att först kontakta Microsofts supportpersonal. Detta kan påverka operatörens Nexus-klusters integritet.

  • Stäng av en BMM
  • Starta en BMM
  • Starta om en BMM
  • Gör en BMM oplanerad (avspärrning utan evakuering)
  • Gör en BMM oplanerad (avspärrning med evakuering)
  • Gör en BMM-schemaläggningsbar (uncordon)
  • Återskapa en BMM
  • Ersätt en BMM

Viktigt!

Störande kommandobegäranden mot en Kubernetes Control Plane-nod (KCP) avvisas om det finns ett annat störande åtgärdskommando som redan körs mot en annan KCP-nod eller om den fullständiga KCP-filen inte är tillgänglig. Den här kontrollen görs för att upprätthålla Nexus-instansens integritet och se till att flera KCP-noder inte blir icke-operativa samtidigt på grund av samtidiga störande åtgärder. Om flera noder inte används bryter det tröskelvärdet för kvorum för Kubernetes-kontrollplanet.

De fetstilta åtgärderna i listan ovan anses vara störande (avstängning, omstart, återstart, ersätt). Avspärrning utan evakuering anses inte vara störande. Avspärrning med evakuering anses vara störande.

Som anges i varningen bör åtgärder mot hanteringsservrar, särskilt KCP-noder, endast utföras i samråd med Microsofts supportpersonal.

Förutsättningar

  1. Installera den senaste versionen av lämpliga CLI-tillägg.
  2. Hämta namnet på resursgruppen för namnet på den hanterade resursgruppen BMM – Kluster (cluster_MRG) .
  3. Hämta namnet på den dator utan operativsystem som kräver en livscykelhanteringsåtgärd.
  4. Se till att målmaskinen poweredState utan operativsystem är inställd On på och readyState inställd på True.
    1. Den här förutsättningen start gäller inte för kommandot.

Stäng av en BMM

Det här kommandot kommer att power-off angiven bareMetalMachineName.

az networkcloud baremetalmachine power-off \
  --name <BareMetalMachineName>  \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Starta en BMM

Det här kommandot kommer att start angiven bareMetalMachineName.

az networkcloud baremetalmachine start \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Starta om en BMM

Det här kommandot kommer att restart angiven bareMetalMachineName.

az networkcloud baremetalmachine restart \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Gör en BMM oplanerad (avspärrning)

Kör följande kommando för att identifiera om några arbetsbelastningar för närvarande körs på en BMM:

För virtuella datorer:

az networkcloud baremetalmachine show -n <nodeName> /
--resource-group <resourceGroup> /
--subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'

För Nexus Kubernetes-klusternoder: (kräver inloggning i Nexus Kubernetes-klustret)

kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'

Du kan göra en BMM oplanerad genom att cordon köra kommandot . Vid körningen cordon av kommandot schemaläggs inte Operator Nexus-arbetsbelastningar på BMM när avspärrning har angetts. Alla försök att skapa en arbetsbelastning på en cordoned BMM resulterar i att arbetsbelastningen anges till pending tillstånd. Befintliga arbetsbelastningar fortsätter att köras. Cordon-kommandot stöder en evacuate parameter med standardvärdet False . Det är en bra idé att ange detta till True. Vid körning av cordon kommandot, med värdet True för parametern evacuate , är stopped de arbetsbelastningar som körs på BMM och BMM är inställt på pending tillstånd.

az networkcloud baremetalmachine cordon \
  --evacuate "True" \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Tar evacuate "True" bort arbetsbelastningar från den noden samtidigt evacuate "False" som endast förhindrar schemaläggning av nya arbetsbelastningar.

Gör en BMM "schemaläggningsbar" (uncordon)

Du kan göra en BMM "schemaläggningsbar" (användbar) genom att uncordon köra kommandot . Alla arbetsbelastningar i ett pending tillstånd på BMM är restarted när BMM är uncordoned.

az networkcloud baremetalmachine uncordon \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Återskapa en BMM

Du kan återställa körningsversionen på en BMM genom att reimage köra kommandot . Den här processen distribuerar om körningsavbildningen på mål-BMM:n och kör stegen för att återansluta till klustret med samma identifierare. Den här åtgärden påverkar inte klientorganisationens arbetsbelastningsfiler på denna BMM. Om en skriv- eller redigeringsåtgärd utförs på noden via BMM-åtkomst krävs den här åtgärden för att återställa Microsoft-supporten och ändringarna går förlorade, vilket återställer noden till det förväntade tillståndet. Vi rekommenderar att du ser till att BMM:s arbetsbelastningar töms med kommandot cordon med evacuate "True", innan du reimage kör kommandot.

Varning

Om du kör mer än ett baremetalmachine replace eller reimage ett kommando samtidigt, eller om du kör ett replace samtidigt som ett reimage , lämnar servrarna i ett icke-fungerande tillstånd. Kontrollera att en replace/reimage har slutförts helt innan du startar en annan.

az networkcloud baremetalmachine reimage \
  --name <BareMetalMachineName>  \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Ersätt en BMM

replace Använd kommandot när en server stöter på maskinvaruproblem som kräver en fullständig eller partiell maskinvaruersättning. Efter byte av komponenter som moderkort eller nätverkskort (NIC) kommer MAC-adressen för BMM att ändras, men iDRAC IP-adressen och värdnamnet förblir desamma.

Varning

Om du kör mer än ett baremetalmachine replace eller reimage ett kommando samtidigt, eller om du kör ett replace samtidigt som ett reimage , lämnar servrarna i ett icke-fungerande tillstånd. Kontrollera att en replace/reimage har slutförts helt innan du startar en annan.

az networkcloud baremetalmachine replace \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --bmc-credentials password=<IDRAC_PASSWORD> username=<IDRAC_USER> \
  --bmc-mac-address <IDRAC_MAC> \
  --boot-mac-address <PXE_MAC> \
  --machine-name <OS_HOSTNAME> \
  --serial-number <SERIAL_NUMBER> \
  --subscription <subscriptionID>