Ridimensionare i pool di nodi nel servizio Azure Kubernetes
A causa di un numero crescente di distribuzioni o all'esecuzione di un carico di lavoro più grande, è possibile che si voglia modificare il piano del set di scalabilità di macchine virtuali o ridimensionare le istanze del servizio Azure Kubernetes. Tuttavia, in base ai criteri di supporto per il servizio Azure Kubernetes:
I nodi dell'agente del servizio Azure Kubernetes vengono visualizzati nel portale di Azure come normali risorse IaaS di Azure. Tuttavia, queste macchine virtuali vengono distribuite in un gruppo di risorse di Azure personalizzato (in genere preceduto da MC_*). Non è possibile eseguire personalizzazioni dirette a questi nodi usando le API O le risorse IaaS. Tutte le modifiche personalizzate che non vengono eseguite tramite l'API del servizio Azure Kubernetes non verranno mantenute se si esegue un aggiornamento, si cambia il piano o si esegue un riavvio.
Questa mancanza di persistenza si applica anche all'operazione di ridimensionamento, pertanto il ridimensionamento delle istanze del servizio Azure Kubernetes in questo modo non è supportato. In questa guida pratica si apprenderà il metodo consigliato per risolvere questo scenario.
Importante
Questo metodo è specifico per i cluster del servizio Azure Kubernetes basati su set di scalabilità di macchine virtuali. Quando si usano set di disponibilità di macchine virtuali, si è limitati a un solo pool di nodi per ogni cluster.
Risorse di esempio
Si supponga di voler ridimensionare un pool di nodi esistente, denominato nodepool1
, dalle dimensioni dello SKU Standard_DS2_v2 a quelle Standard_DS3_v2. Per eseguire questa attività, è necessario creare un nuovo pool di nodi usando Standard_DS3_v2, spostare i carichi di lavoro da nodepool1
al nuovo pool di nodi e rimuovere nodepool1
. In questo esempio questo nuovo pool di nodi verrà chiamato mynodepool
.
kubectl get nodes
NAME STATUS ROLES AGE VERSION
aks-nodepool1-31721111-vmss000000 Ready agent 10d v1.21.9
aks-nodepool1-31721111-vmss000001 Ready agent 10d v1.21.9
aks-nodepool1-31721111-vmss000002 Ready agent 10d v1.21.9
kubectl get pods -o wide -A
NAMESPACE NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
default sampleapp2-74b4b974ff-676sz 1/1 Running 0 93m 10.244.1.6 aks-nodepool1-31721111-vmss000002 <none> <none>
default sampleapp2-76b6c4c59b-pfgbh 1/1 Running 0 94m 10.244.1.5 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system azure-ip-masq-agent-4n66k 1/1 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system azure-ip-masq-agent-9p4c8 1/1 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system azure-ip-masq-agent-nb7mx 1/1 Running 0 10d 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system coredns-845757d86-dtvvs 1/1 Running 0 10d 10.244.0.2 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system coredns-845757d86-x27pp 1/1 Running 0 10d 10.244.2.3 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system coredns-autoscaler-5f85dc856b-nfrmh 1/1 Running 0 10d 10.244.2.4 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system csi-azuredisk-node-9nfzt 3/3 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system csi-azuredisk-node-bblsb 3/3 Running 0 10d 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system csi-azuredisk-node-tjhj4 3/3 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system csi-azurefile-node-9pcr8 3/3 Running 0 3d10h 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system csi-azurefile-node-bh2pc 3/3 Running 0 3d10h 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system csi-azurefile-node-h75gq 3/3 Running 0 3d10h 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system konnectivity-agent-6cd55c69cf-ngdlb 1/1 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system konnectivity-agent-6cd55c69cf-rvvqt 1/1 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system kube-proxy-4wzx7 1/1 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system kube-proxy-g5tvr 1/1 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system kube-proxy-mrv54 1/1 Running 0 10d 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system metrics-server-774f99dbf4-h52hn 1/1 Running 1 3d10h 10.244.1.3 aks-nodepool1-31721111-vmss000002 <none> <none>
Creare un nuovo pool di nodi con lo SKU desiderato
Quando si ridimensiona, assicurarsi di considerare tutti i requisiti del carico di lavoro, ad esempio le zone di disponibilità, e configurare di conseguenza il pool di nodi. Potrebbe essere necessario modificare il comando seguente in base alle proprie esigenze. Per un elenco completo delle opzioni di configurazione, vedere la az aks nodepool add
pagina di riferimento.
Usare il az aks nodepool add
comando per creare un nuovo pool di nodi denominato mynodepool
con tre nodi usando lo SKU della Standard_DS3_v2
macchina virtuale:
az aks nodepool add \
--resource-group myResourceGroup \
--cluster-name myAKSCluster \
--name mynodepool \
--node-count 3 \
--node-vm-size Standard_DS3_v2 \
--mode System \
--no-wait
Nota
Ogni cluster del servizio Azure Kubernetes deve contenere almeno un pool di nodi di sistema con almeno un nodo. Nell'esempio precedente viene usato un --mode
di System
, poiché si presuppone che il cluster disponga di un solo pool di nodi, richiedendo un pool di nodi System
per sostituirlo. La modalità di un pool di nodi può essere aggiornata in qualsiasi momento.
Dopo alcuni minuti, il nuovo pool di nodi è stato creato:
kubectl get nodes
NAME STATUS ROLES AGE VERSION
aks-mynodepool-20823458-vmss000000 Ready agent 23m v1.21.9
aks-mynodepool-20823458-vmss000001 Ready agent 23m v1.21.9
aks-mynodepool-20823458-vmss000002 Ready agent 23m v1.21.9
aks-nodepool1-31721111-vmss000000 Ready agent 10d v1.21.9
aks-nodepool1-31721111-vmss000001 Ready agent 10d v1.21.9
aks-nodepool1-31721111-vmss000002 Ready agent 10d v1.21.9
Blocco dei nodi esistenti
Il blocco contrassegna i nodi specificati come non pianificabili e impedisce l'aggiunta di altri pod ai nodi.
Ottenere prima di tutto i nomi dei nodi che si desidera eseguire con kubectl get nodes
. L'output dovrebbe essere simile al seguente:
NAME STATUS ROLES AGE VERSION
aks-nodepool1-31721111-vmss000000 Ready agent 7d21h v1.21.9
aks-nodepool1-31721111-vmss000001 Ready agent 7d21h v1.21.9
aks-nodepool1-31721111-vmss000002 Ready agent 7d21h v1.21.9
Successivamente, usando kubectl cordon <node-names>
, specificare i nodi desiderati in un elenco separato da spazi:
kubectl cordon aks-nodepool1-31721111-vmss000000 aks-nodepool1-31721111-vmss000001 aks-nodepool1-31721111-vmss000002
node/aks-nodepool1-31721111-vmss000000 cordoned
node/aks-nodepool1-31721111-vmss000001 cordoned
node/aks-nodepool1-31721111-vmss000002 cordoned
Svuotare i nodi esistenti
Importante
Per svuotare correttamente i nodi e rimuovere i pod in esecuzione, assicurarsi che qualsiasi PodDisruptionBudgets (PDB) consenta lo spostamento di almeno una replica pod alla volta. In caso contrario, l'operazione di svuotamento/rimozione avrà esito negativo. Per verificarlo, è possibile eseguire kubectl get pdb -A
e verificare che ALLOWED DISRUPTIONS
sia almeno uno o superiore.
Lo svuotamento dei nodi causerà la rimozione e la ricreazione dei pod negli altri nodi pianificabili.
Per svuotare i nodi, usare di nuovo kubectl drain <node-names> --ignore-daemonsets --delete-emptydir-data
, usando un elenco di nomi di nodi separati da spazi:
Importante
L'uso di --delete-emptydir-data
è necessario per rimuovere il coredns
creato dal servizio Azure Kubernetes e i pod metrics-server
. Se questo flag non viene usato, è previsto un errore. Per altre informazioni, vedere la documentazione su emptydir.
kubectl drain aks-nodepool1-31721111-vmss000000 aks-nodepool1-31721111-vmss000001 aks-nodepool1-31721111-vmss000002 --ignore-daemonsets --delete-emptydir-data
Al termine dell'operazione di svuotamento, tutti i pod diversi da quelli controllati dai set di daemon vengono eseguiti nel nuovo pool di nodi:
kubectl get pods -o wide -A
NAMESPACE NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
default sampleapp2-74b4b974ff-676sz 1/1 Running 0 15m 10.244.4.5 aks-mynodepool-20823458-vmss000002 <none> <none>
default sampleapp2-76b6c4c59b-rhmzq 1/1 Running 0 16m 10.244.4.3 aks-mynodepool-20823458-vmss000002 <none> <none>
kube-system azure-ip-masq-agent-4n66k 1/1 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system azure-ip-masq-agent-9p4c8 1/1 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system azure-ip-masq-agent-nb7mx 1/1 Running 0 10d 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system azure-ip-masq-agent-sxn96 1/1 Running 0 49m 10.240.0.9 aks-mynodepool-20823458-vmss000002 <none> <none>
kube-system azure-ip-masq-agent-tsq98 1/1 Running 0 49m 10.240.0.8 aks-mynodepool-20823458-vmss000001 <none> <none>
kube-system azure-ip-masq-agent-xzrdl 1/1 Running 0 49m 10.240.0.7 aks-mynodepool-20823458-vmss000000 <none> <none>
kube-system coredns-845757d86-d2pkc 1/1 Running 0 17m 10.244.3.2 aks-mynodepool-20823458-vmss000000 <none> <none>
kube-system coredns-845757d86-f8g9s 1/1 Running 0 17m 10.244.5.2 aks-mynodepool-20823458-vmss000001 <none> <none>
kube-system coredns-autoscaler-5f85dc856b-f8xh2 1/1 Running 0 17m 10.244.4.2 aks-mynodepool-20823458-vmss000002 <none> <none>
kube-system csi-azuredisk-node-7md2w 3/3 Running 0 49m 10.240.0.7 aks-mynodepool-20823458-vmss000000 <none> <none>
kube-system csi-azuredisk-node-9nfzt 3/3 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system csi-azuredisk-node-bblsb 3/3 Running 0 10d 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system csi-azuredisk-node-lcmtz 3/3 Running 0 49m 10.240.0.9 aks-mynodepool-20823458-vmss000002 <none> <none>
kube-system csi-azuredisk-node-mmncr 3/3 Running 0 49m 10.240.0.8 aks-mynodepool-20823458-vmss000001 <none> <none>
kube-system csi-azuredisk-node-tjhj4 3/3 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system csi-azurefile-node-29w6z 3/3 Running 0 49m 10.240.0.9 aks-mynodepool-20823458-vmss000002 <none> <none>
kube-system csi-azurefile-node-4nrx7 3/3 Running 0 49m 10.240.0.7 aks-mynodepool-20823458-vmss000000 <none> <none>
kube-system csi-azurefile-node-9pcr8 3/3 Running 0 3d11h 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system csi-azurefile-node-bh2pc 3/3 Running 0 3d11h 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system csi-azurefile-node-gqqnv 3/3 Running 0 49m 10.240.0.8 aks-mynodepool-20823458-vmss000001 <none> <none>
kube-system csi-azurefile-node-h75gq 3/3 Running 0 3d11h 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system konnectivity-agent-6cd55c69cf-2bbp5 1/1 Running 0 17m 10.240.0.7 aks-mynodepool-20823458-vmss000000 <none> <none>
kube-system konnectivity-agent-6cd55c69cf-7xzxj 1/1 Running 0 16m 10.240.0.8 aks-mynodepool-20823458-vmss000001 <none> <none>
kube-system kube-proxy-4wzx7 1/1 Running 0 10d 10.240.0.4 aks-nodepool1-31721111-vmss000000 <none> <none>
kube-system kube-proxy-7h8r5 1/1 Running 0 49m 10.240.0.7 aks-mynodepool-20823458-vmss000000 <none> <none>
kube-system kube-proxy-g5tvr 1/1 Running 0 10d 10.240.0.6 aks-nodepool1-31721111-vmss000002 <none> <none>
kube-system kube-proxy-mrv54 1/1 Running 0 10d 10.240.0.5 aks-nodepool1-31721111-vmss000001 <none> <none>
kube-system kube-proxy-nqmnj 1/1 Running 0 49m 10.240.0.9 aks-mynodepool-20823458-vmss000002 <none> <none>
kube-system kube-proxy-zn77s 1/1 Running 0 49m 10.240.0.8 aks-mynodepool-20823458-vmss000001 <none> <none>
kube-system metrics-server-774f99dbf4-2x6x8 1/1 Running 0 16m 10.244.4.4 aks-mynodepool-20823458-vmss000002 <none> <none>
Risoluzione dei problemi
È possibile che venga visualizzato un errore simile al seguente:
Errore durante la rimozione di pods/[podname] -n [spazio dei nomi] (riprova dopo 5s): impossibile rimuovere il pod perché viola il budget di interruzione del pod.
Per impostazione predefinita, il cluster ha AKS_managed budget di interruzione dei pod (ad esempio coredns-pdb
o konnectivity-agent
) con MinAvailable
pari a 1. Se, ad esempio, sono in esecuzione due pod coredns
, mentre uno di essi viene ricreato e non è disponibile, l'altro non può essere interessato a causa del budget di interruzione del pod. Questo si risolve dopo la pianificazione e l'esecuzione del pod coredns
iniziale, consentendo al secondo pod di essere rimosso e ricreato correttamente.
Suggerimento
Valutare la possibilità di svuotare i nodi uno per uno per un'esperienza di rimozione più fluida ed evitare limitazioni. Per altre informazioni, vedi:
Rimuovere il pool di nodi esistente
Per eliminare il pool di nodi esistente, usare il portale di Azure o il az aks nodepool delete
comando :
az aks nodepool delete \
--resource-group myResourceGroup \
--cluster-name myAKSCluster \
--name nodepool1
Al termine, il risultato finale è il cluster del servizio Azure Kubernetes con un singolo pool di nodi con le nuove dimensioni di SKU desiderate e tutte le applicazioni e i pod che eseguono correttamente:
kubectl get nodes
NAME STATUS ROLES AGE VERSION
aks-mynodepool-20823458-vmss000000 Ready agent 63m v1.21.9
aks-mynodepool-20823458-vmss000001 Ready agent 63m v1.21.9
aks-mynodepool-20823458-vmss000002 Ready agent 63m v1.21.9
Passaggi successivi
Dopo il ridimensionamento di un pool di nodi tramite il blocco e lo svuotamento, vedere altre informazioni sull’uso di più pool di nodi.
Azure Kubernetes Service