Copia de seguridad y recuperación para AKS
La copia de seguridad y la recuperación son una parte esencial de la estrategia operativa y de recuperación ante desastres de cualquier organización. Normalmente, un plan de copia de seguridad y recuperación consiste en un conjunto diverso de tecnologías y prácticas que se basan en tomar copias periódicas de datos y aplicaciones en un dispositivo o servicio independiente o secundario. Si se produce un error de sistema, una pérdida de datos o un desastre, estas copias se usan para recuperar los datos y las aplicaciones y las operaciones empresariales que dependen de ellas.
En esta sección de la guía de operaciones del día 2 de Azure Kubernetes Service (AKS) se describen los procedimientos de copia de seguridad y recuperación para AKS.
¿Por qué es importante realizar una copia de seguridad del clúster de AKS?
A medida que las implementaciones nativas de la nube y Kubernetes siguen creciendo en la adopción, resulta cada vez más esencial que las organizaciones incluyan clústeres y cargas de trabajo de Kubernetes en una estrategia completa de copia de seguridad y recuperación.
La implementación de copias de seguridad y recuperación en AKS le permite:
- Crear una copia secundaria de la configuración y los datos del clúster de AKS para usarlos si se produce un error irreversible del sistema, una pérdida de datos o un desastre.
- Copiar los recursos de Kubernetes y los datos de aplicaciones de un clúster de AKS a otro.
- Replicar el clúster de AKS para crear otros entornos.
- Realizar instantáneas de carga de trabajo antes de las operaciones de mantenimiento, como las actualizaciones de la versión de AKS.
- Cumplir los requisitos de protección de datos para mantener el cumplimiento normativo o organizativo.
- Volver rápidamente a una implementación anterior si se detecta un problema con una implementación o un cambio reciente.
Aunque las copias de seguridad le ayudan a restaurar la carga de trabajo si se produce un problema, no brindan alta disponibilidad (HA).
En lo que respecta a la alta disponibilidad dentro de la región y la recuperación ante desastres entre regiones en AKS, puede considerar otras opciones, como:
- Zonas de disponibilidad: AKS es compatible con el uso de zonas de disponibilidad, que son centros de datos separados físicamente dentro de una región de Azure. Al implementar clústeres de AKS en varias zonas de disponibilidad, puede garantizar una mayor resistencia y tolerancia frente a errores dentro de una región. Esto permite que las aplicaciones permanezcan operativas incluso si una zona experimenta una interrupción.
- Opciones de redundancia para volúmenes persistentes: AKS proporciona varias opciones de redundancia para volúmenes persistentes. El driver CSI de Disco de Azure para Kubernetes admite clases de almacenamiento integradas y clases de almacenamiento personalizadas que usan el almacenamiento con redundancia local (LRS) o el almacenamiento con redundancia de zona (ZRS) para mejorar la resistencia dentro de la región. Para obtener más información, consulte Parámetros del driver.
- Azure Kubernetes Fleet Manager: Azure Kubernetes Fleet Manager permite escenarios a escala y de varios clústeres para clústeres dentro y entre regiones para clústeres de AKS.
- Opciones de redundancia geográfica para Azure Container Registry (ACR): Azure Container Registry (ACR) ofrece funcionalidades de replicación geográfica. Con redundancia geográfica, las imágenes de contenedor se replican en diferentes regiones de Azure. Por lo tanto, incluso si una región determinada experimenta una interrupción, las imágenes están disponibles, lo que proporciona una mayor disponibilidad para el registro de contenedor.
También puede usar metodologías del tipo Infraestructura como código (IaC), Azure Pipelines, GitOps y Flux para volver a implementar rápidamente las cargas de trabajo si se produce un desastre.
Para obtener más información sobre estas metodologías, puede revisar estos artículos:
- Compilación e implementación en Azure Kubernetes Service con Azure Pipelines
- Tutorial: Implementación de aplicaciones mediante GitOps con Flux v2
- Descripción de la estructura y la sintaxis de las plantillas de ARM
- ¿Qué es Bicep?
- Introducción a Terraform en Azure: ¿Qué es Terraform?
De qué debe realizarse copia de seguridad
Al considerar la posibilidad de realizar copias de seguridad y recuperación para clústeres de AKS y Kubernetes en general, es fundamental identificar exactamente qué componentes deben incluirse en una copia de seguridad para garantizar una restauración correcta. Principalmente, estos componentes críticos constan de:
Estado del clúster: hace referencia a la configuración o estado actual y deseado de todos los objetos de Kubernetes dentro del clúster. Abarca varios objetos, como implementaciones, pods, servicios, etc. El estado del clúster se almacena en una base de datos de pares clave-valor de alta disponibilidad, que a menudo solo es accesible desde el servidor de API, como es el caso de clústeres administrados como AKS. El estado del clúster se define de forma declarativa y es el resultado de todos los archivos de configuración de Kubernetes aplicados al clúster, como los manifiestos YAML.
Datos de aplicaciones: hace referencia a los datos creados, administrados o a los que acceden las cargas de trabajo en contenedor que se ejecutan en el clúster. Para garantizar la persistencia de datos entre pods o reinicios de contenedor, Kubernetes recomienda almacenar los datos de aplicaciones en volúmenes persistentes. Estos volúmenes se pueden crear estática o dinámicamente y pueden ser respaldados por varios tipos de almacenamiento persistente, lo que ofrece flexibilidad y escalabilidad para los requisitos de almacenamiento y administración de datos.
Aunque una copia de seguridad completa del clúster requeriría que tanto el estado del clúster como los datos de aplicaciones se incluyan como una sola unidad, determinar el ámbito óptimo de cada copia de seguridad depende de varios factores. Por ejemplo, la presencia de orígenes alternativos, como las canalizaciones de integración continua y entrega continua (CI/CD), podría permitir una recuperación más sencilla del estado del clúster. Además, el tamaño de los datos de aplicaciones desempeña un papel en los costos de almacenamiento y el tiempo necesario para las operaciones de copia de seguridad y recuperación.
La estrategia ideal de copia de seguridad y recuperación depende en gran medida de la aplicación y el entorno particular. Por lo tanto, el ámbito de la copia de seguridad debe evaluarse en cada caso. También debe tener en cuenta factores como la importancia del estado del clúster y el volumen de datos de aplicaciones.
El destino de otros componentes, como nodos de clúster individuales (VM) o sistemas de archivos y volúmenes locales, que normalmente se incluyen en los planes tradicionales de copia de seguridad y recuperación para sistemas basados en servidor, no es relevante en Kubernetes. El estado y los datos pertinentes no se conservan en nodos individuales o sistemas de archivos locales de la misma manera que los sistemas tradicionales.
Introducción a las opciones de copia de seguridad y recuperación para AKS
Hay diferencias importantes entre las aplicaciones monolíticas tradicionales y las cargas de trabajo que se ejecutan en un clúster de Kubernetes, que presentan varios desafíos para la copia de seguridad y la recuperación. Las cargas de trabajo de Kubernetes están diseñadas intencionadamente para ser altamente dinámicas y distribuidas, con datos persistentes en volúmenes persistentes externos compatibles con varios recursos y servicios subyacentes.
Para admitir eficazmente entornos de Kubernetes, las soluciones de copia de seguridad y recuperación deben poseer Kubernetes y reconocimiento de aplicaciones. Deben ofrecer un grado de automatización, confiabilidad e integración, que a menudo no se encuentra en herramientas de copia de seguridad y recuperación heredadas o más convencionales.
Hay varias soluciones de copia de seguridad y recuperación nativas de Kubernetes disponibles, con opciones que van desde el código abierto al código cerrado y ofrecen diferentes modelos de licencias.
A continuación se muestran algunos ejemplos de soluciones de copia de seguridad y recuperación que puede usar con AKS. Un ejemplo notable es la solución de primera entidad totalmente administrada de Microsoft denominada Azure Kubernetes Service (AKS) Backup, que proporciona un servicio integrado de Azure diseñado para la copia de seguridad y recuperación de clústeres de AKS y sus cargas de trabajo. Esta lista no es exhaustiva y solo proporciona algunas opciones disponibles.
AKS Backup
AKS Backup es la oferta de Azure para realizar copias de seguridad y restaurar los clústeres de AKS. Es un proceso sencillo y nativo de Azure, que le permite realizar copias de seguridad y restaurar las aplicaciones contenedorizadas y los datos que se ejecutan en los clústeres de AKS.
AKS Backup permite realizar copias de seguridad a petición o programadas de estado completo o específico del clúster y los datos de aplicaciones almacenados en volúmenes persistentes basados en disco de Azure. Se integra con el Centro de Azure Backup para proporcionar un único área en Azure Portal que puede ayudarle a controlar, supervisar, operar y analizar copias de seguridad a escala.
Consulte Acerca de AKS Backup mediante Azure Backup para obtener una descripción detallada de cómo funciona AKS Backup y sus funcionalidades.
Kasten
Kasten es un producto comercial, que proporciona a los equipos de operaciones un sistema fácil de usar y seguro para la copia de seguridad y recuperación de aplicaciones de Kubernetes. Está disponible en una versión gratuita con funcionalidad limitada y sin asistencia técnico, y una versión de pago que incluye más características y asistencia técnica al cliente.
Cuando Kasten se implementa como un operador de Kubernetes dentro del clúster, proporciona una solución de copia de seguridad completa. Ofrece un panel de administración para el control y la visibilidad centralizados. Con Kasten, los usuarios pueden beneficiarse de copias de seguridad incrementales y compatibles con la aplicación, lo que permite una protección de datos eficaz. Además, Kasten ofrece funcionalidades de recuperación ante desastres. Estas funcionalidades incluyen la conmutación por error automatizada y la conmutación por recuperación, así como características para la migración de datos y garantizar la seguridad.
Para obtener más información sobre el conjunto de características de Kasten, consulte la documentación de Kasten K10. Para obtener información sobre cómo usar Kasten eficazmente con clústeres de AKS, consulte Instalación de K10 en Azure.
Velero
Velero es una herramienta de copia de seguridad y recuperación de código abierto ampliamente utilizada para Kubernetes. Ofrece una versión gratuita y sin restricciones disponible para todos los usuarios, con soporte técnico y mantenimiento proporcionado por una comunidad de colaboradores del proyecto.
Velero se ejecuta como una implementación en el clúster y proporciona un conjunto completo de características para la copia de seguridad, recuperación y migración de datos de aplicaciones. Aunque los paneles no están disponibles de forma predeterminada, se pueden agregar a través de integraciones externas.
Para obtener más información sobre su conjunto de características y aprender a integrarlo con clústeres de AKS, consulte la Documentación de Velero.
Instalación y configuración de AKS Backup
Para instalar y configurar AKS Backup, siga estos pasos:
- Consulte Requisitos previos para AKS Backup mediante Azure Backup para obtener una descripción detallada de los requisitos previos para usar la copia de seguridad de AKS con el clúster de AKS.
- Revise la Matriz de compatibilidad de AKS Backup para obtener una descripción detallada de la disponibilidad de la región de AKS Backup, los escenarios admitidos y las limitaciones.
- Consulte Administración de copias de seguridad de AKS mediante Azure Backup para obtener instrucciones sobre cómo registrar a los proveedores de recursos necesarios en sus suscripciones y administrar estos registros.
- Revise Copia de seguridad de AKS mediante Azure Backup para obtener instrucciones detalladas sobre cómo configurar la copia de seguridad y la recuperación del clúster de AKS mediante AKS Backup. Las instrucciones incluyen la creación y configuración de todos los recursos de Azure necesarios, como el almacén de copia de seguridad, las directivas de copia de seguridad y las instancias de copia de seguridad.
- Consulte Restauración de AKS mediante Azure Backup para obtener instrucciones detalladas sobre cómo realizar restauraciones completas o de nivel de elemento del clúster de AKS desde una instancia de Backup existente.
Frecuencia de copia de seguridad y retención en AKS: definición de una directiva de copia de seguridad
Determinar la frecuencia de copia de seguridad y el período de retención es un aspecto fundamental de las soluciones de copia de seguridad y recuperación. Estos parámetros definen la frecuencia con la que se realizan las copias de seguridad y cuánto tiempo se conservan antes de la eliminación. La selección de la frecuencia de copia de seguridad y el período de retención de un clúster de AKS y sus cargas de trabajo deben alinearse con los objetivos predefinidos del objetivo de punto de recuperación (RPO) y el objetivo de tiempo de recuperación (RTO).
En un escenario de Kubernetes, el RPO representa la cantidad máxima aceptable de estado del clúster o pérdida de datos que se puede tolerar. El RTO especifica el tiempo máximo permitido entre el estado del clúster o la pérdida de datos y la reanudación de las operaciones del clúster.
La frecuencia de copia de seguridad elegida y el período de retención son un equilibrio entre los objetivos de RPO/RTO deseados, los costos de almacenamiento y la sobrecarga de administración de copias de seguridad. Esto significa que no hay ninguna configuración única para todos los clústeres y cargas de trabajo de AKS, y la configuración óptima para cada clúster o carga de trabajo debe definirse según cada caso para satisfacer los requisitos de la empresa, siguiendo una planeación y evaluación cuidadosas. Entre los factores relevantes que se deben tener en cuenta al definir la frecuencia de copia de seguridad y el período de retención de un clúster de AKS se incluyen:
- Importancia crítica: el nivel de importancia crítica asociado al clúster y sus datos de aplicaciones de carga de trabajo en términos de continuidad empresarial.
- Patrones de acceso y frecuencia de cambio: la cantidad de datos y estado del clúster que se agregan, modifican y eliminan en un período de tiempo determinado.
- Volumen de datos: el volumen de datos que afecta a los costos de almacenamiento y el tiempo necesario para completar las operaciones de copia de seguridad y recuperación.
- Cumplimiento: los requisitos para la retención de datos y la soberanía de datos en función de las reglas de cumplimiento interno y las regulaciones del sector.
En el servicio de AKS Backup, la frecuencia de copia de seguridad y el período de retención se almacenan como una directiva de copia de seguridad, que se aplica tanto al estado del clúster como a los datos de aplicaciones de volúmenes persistentes.
Las directivas de AKS Backup admiten copias de seguridad diarias y por hora, con períodos de retención de hasta 360 días, mientras que se pueden definir y aplicar varias directivas al mismo clúster.
Consulte Creación de una directiva de copia de seguridad para obtener más información sobre cómo configurar directivas de copia de seguridad en AKS Backup.
Otras consideraciones sobre copias de seguridad
Para asegurarse de que la solución de copia de seguridad y recuperación cumple los requisitos y directivas de su organización, tenga en cuenta los siguientes puntos:
- Objetivo de punto de recuperación (RPO) y Objetivo de tiempo de recuperación (RTO): determine si tiene destinos específicos de RPO y RTO que deben cumplirse para las copias de seguridad y las operaciones de recuperación.
- Volúmenes persistentes (PV): compruebe si usa volúmenes persistentes y asegúrese de que la solución de AKS Backup admita los tipos de PV. Consulte la matriz de compatibilidad de AKS Backup para obtener detalles de compatibilidad.
- Ámbito de copia de seguridad: defina los elementos que deben tener una copia de seguridad, como espacios de nombres específicos, tipos de recursos o datos particulares dentro del clúster. Para más información, consulte Configuración del trabajo copias de seguridad.
- Frecuencia de copia de seguridad y retención: determine la frecuencia con la que necesita realizar copias de seguridad y el tiempo durante el cual necesita conservarlas. Esta configuración se puede definir directivas de copia de seguridad. Para más información, consulte Definición de una directiva de copia de seguridad.
- Selección del clúster: decida si necesita realizar una copia de seguridad de todos los clústeres o solo clústeres de producción específicos en función de sus requisitos.
- Procedimiento de restauración de pruebas: realice restauraciones periódicas de pruebas para validar la confiabilidad y facilidad de uso de la estrategia de copia de seguridad. Este paso es fundamental para garantizar la eficacia de la solución de copia de seguridad y recuperación. Para más información, consulte Restauración de un clúster de AKS.
- Escenarios admitidos: compruebe que la solución de AKS Backup admite su escenario específico. Consulte la matriz de compatibilidad de AKS Backup para obtener información de compatibilidad.
- Asignaciones presupuestarias: considere si tiene asignaciones presupuestarias específicas para las operaciones de copia de seguridad y restauración. Revise la información de precios proporcionada por la solución de AKS Backup para alinearse con sus requisitos presupuestarios.
Al tener en cuenta estas otras consideraciones, puede asegurarse de que la solución de copia de seguridad y recuperación para AKS satisface las necesidades y preferencias de su organización de forma correcta y eficaz.
Ubicación y almacenamiento de AKS Backup
AKS Backup usa un almacén de copias de seguridad y una cuenta de almacenamiento para almacenar los distintos tipos de datos capturados desde un clúster durante una copia de seguridad.
En el caso de los volúmenes persistentes basados en disco, AKS Backup usa instantáneas incrementales del disco de Azure subyacente, que se almacenan en la suscripción de Azure.
Un almacén de copia de seguridad es una entidad de almacenamiento segura dentro de Azure, que se usa para almacenar los datos de copia de seguridad de las cargas de trabajo compatibles con Azure Backup, como los clústeres de AKS. El propio almacén de copia de seguridad contiene las directivas de copia de seguridad y los puntos de recuperación y copias de seguridad creados por los trabajos de copia de seguridad.
Azure administra automáticamente el almacenamiento para el almacén de copia de seguridad. Puede elegir entre varias opciones de redundancia para los datos almacenados en él, que se pueden configurar en el punto de creación del almacén de copia de seguridad.
Una cuenta de almacenamiento es un área de almacenamiento para los objetos de datos dentro de Azure y es altamente configurable. Proporciona varias opciones de redundancia dentro y entre regiones para garantizar la durabilidad de los datos. AKS Backup usa un contenedor de objetos binarios dentro de una cuenta de almacenamiento designada para realizar copias de seguridad de algunos componentes del clúster de AKS.
Las instantáneas incrementales son copias de seguridad en un momento dado de los discos administrados que, cuando se realizan, solo constan de los cambios desde la última instantánea. La primera instantánea incremental es una copia completa del disco. Las instantáneas incrementales posteriores solo capturan cambios diferenciales en los discos desde la última instantánea.
Uso de AKS Backup para migrar cargas de trabajo entre clústeres de AKS
Puede usar AKS Backup como mecanismo para la copia de seguridad y la recuperación de clústeres específicos. AKS Backup también admite escenarios de migración, ya que le permite realizar una copia de seguridad de un clúster y restaurarlo en otro, como:
- Restauración de un clúster de desarrollo en un clúster de almacenamiento provisional
- Replicación de contenido en varios clústeres
Para asegurarse de que se admite el escenario, consulte la siguiente documentación:
Colaboradores
Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.
Autor principal:
- Adam Fabric | Asesor técnico
- Joao Tavares | Ingeniero de escalación sénior
Otros colaboradores:
- Paolo Salvatori | Ingeniero de clientes principal, FastTrack for Azure
- Sonia Cuff | Principal promotora de la nube
Pasos siguientes
Más información sobre AKS Backup
- Información general de AKS Backup
- Matrices compatibles con AKS Backup
- Requisitos previos de AKS Backup
- Configuración de AKS Backup
- Creación de un almacén de copia de seguridad
- Creación de una directiva de copia de seguridad
- Configuración de copias de seguridad
- Restauración en un clúster de AKS
- Procedimientos recomendados para la continuidad empresarial y recuperación ante desastres en AKS
- Patrones de confiabilidad: patrones de diseño en la nube