Reinicio del nodo del clúster nexus de Kubernetes del operador de Azure
En ocasiones, un nodo nexus de Kubernetes podría dejar de ser accesible. En este artículo se explica cómo reiniciar el nodo mediante el comando de la az networkcloud kubernetescluster restart-node
CLI.
El reinicio de un nodo nexus de Kubernetes puede tardar hasta 5 minutos en completarse. Sin embargo, si la máquina virtual está en mal estado, la acción de reinicio agotará el tiempo de espera. Abra un vale de Soporte técnico de Azure para estas instancias.
Antes de empezar
Nota:
El enfoque descrito en este artículo representa un método agresivo para recuperar una máquina virtual de clúster inaccesible. Se finalizarán las cargas de trabajo que se ejecutan en la máquina virtual; por lo tanto, esta acción de reinicio debe considerarse un último recurso. Antes de realizar un reinicio en una máquina virtual, considere la posibilidad de acordonar y purgar el nodo y, después, apagar correctamente la máquina virtual y volverla a poner en marcha.
Asegúrese de que tiene la versión más reciente de las extensiones de la CLI de Azure necesarias.
Reinicio del nodo de clúster
Obtener el nombre del nodo
Para reiniciar la máquina virtual del clúster, se requiere el nombre del nodo, que se puede obtener mediante
- El comando
az networkcloud kubernetescluster show --name "kubernetesClusterName" --resource-group "resourceGroupName" --subscription "subscriptionName
az CLI muestra los detalles del nodo. - Como alternativa,
kubectl get node
enumera los nodos.
Ejecute el comando de la CLI para reiniciar el nodo del clúster de Nexus Kubernetes.
Para reiniciar un nodo de clúster, ejecute el comando de la manera siguiente:
az networkcloud kubernetescluster restart-node --node-name "nodeName" --kubernetes-cluster-name "kubernetesClusterName" --resource-group "resourceGroupName" --subscription "subscriptionName"
Para usar este comando, debe comprender las distintas opciones para especificar el nodo, el clúster de Kubernetes Nexus y el grupo de recursos. Estas son las opciones disponibles:
--node-name
: es un argumento obligatorio que especifica el nombre del nodo que desea reiniciar en el clúster de Nexus Kubernetes. Debe proporcionar el nombre exacto del nodo que desea reiniciar.--kubernetes-cluster-name
: es un argumento obligatorio que especifica el nombre del clúster de Kubernetes nexus del que forma parte el nodo. Debe proporcionar el nombre exacto del clúster.--resource-group
: es un argumento obligatorio que especifica el nombre del grupo de recursos en el que se encuentra el clúster de Kubernetes nexus. Debe proporcionar el nombre exacto del grupo de recursos.--subscription
: es un argumento opcional que especifica la suscripción en la que se encuentra el grupo de recursos. Si tiene varias suscripciones, debe especificar cuál se va a usar.
Este es un ejemplo de lo que genera el restart-node
comando,
{
"endTime": "2023-10-20T19:28:31.972299Z",
"id": "/subscriptions/000000000-0000-0000-0000-000000000000/providers/Microsoft.NetworkCloud/locations/<location>/operationStatuses/000000000-0000-0000-0000-000000000000",
"name":"7f835f51-9b85-4607-9be1-41f09c11bc24*B684BCD26460AF4CD9525D5F4FFABA73B623C6A465E9C1E26D7B12EDB3D3EA78",
"resourceId": "/subscriptions/000000000-0000-0000-0000-000000000000/resourceGroups/myResourceGroup/providers/Microsoft.NetworkCloud/kubernetesClusters/myNexusK8sCluster",
"startTime": "2023-10-20T19:27:52.561479Z",
"status": "succeeded"
}