Confiabilidad en Microsoft Community Training
Microsoft Community Training es una solución basada en la nube con tecnología de Azure que puede ofrecer programas de entrenamiento a gran escala y de gran difusión con alta calidad y eficiencia. Con Community Training, las organizaciones de todos los tamaños y tipos pueden ejecutar programas de entrenamiento a gran escala para sus comunidades internas y externas. Las comunidades pueden incluir trabajadores de primera línea, trabajadores extendidos, un ecosistema asociado, una red de voluntarios y beneficiarios del programa.
En este artículo se describe la compatibilidad con la confiabilidad de Community Training y trata la resistencia regional con zonas de disponibilidad y recuperación ante desastres y continuidad empresarial. Para obtener información general más detallada sobre un principio de confiabilidad en Azure, consulte Confiabilidad de Azure.
Compatibilidad de zonas de disponibilidad
Las zonas de disponibilidad son grupos físicamente separados de centros de datos dentro de cada región de Azure. Cuando se produce un error en una zona, los servicios pueden conmutar por error a una de las zonas restantes.
Para más información sobre las zonas de disponibilidad en Azure, consulte ¿Qué son las zonas de disponibilidad?.
Community Training usa las zonas de disponibilidad de Azure para proporcionar alta disponibilidad y tolerancia a errores en una región de Azure. Community Training ofrece compatibilidad con la zona de disponibilidad del plano de datos y el control:
El plano de control tiene redundancia de zona en las regiones primarias de disponibilidad.
El plano de datos puede ser zonal o con redundancia de zona, en función de lo que elija para sus necesidades. Sin embargo, se recomienda encarecidamente elegir una implementación con redundancia de zona para evitar la pérdida de datos y mantener la disponibilidad del servicio durante una interrupción de zona.
Requisitos previos
Las zonas de disponibilidad son compatibles con las siguientes SKU de aprendizaje de la comunidad:
- Estándar (menor escala de usuarios)
- Premium (gran escala de usuarios)
Community Trainning solo es compatible en regiones emparejadas. Cada región secundaria se implementa con una configuración zonal. La siguiente tabla muestra todas las regiones que admiten zonas de disponibilidad para Community Training, junto con su región emparejada.
Región principal | Región emparejada |
---|---|
UKSouth | UKWest |
AustraliaEast | Sudeste de Australia |
EastUS | WestUS |
EastUS2 | CentralUS |
Norte de Europa | Oeste de Europa |
WestUS3 | EastUS |
SwedenCentral | SwedenSouth |
Compatibilidad con la conmutación por error zonal
Community Training usa muchos servicios de Azure de dependencia, como App Service y Azure SQL. Al elegir una implementación con redundancia de zona, Community Training también crea ofertas con redundancia zonal de esos recursos de servicio de Azure subyacentes. Si se produce un error en una zona, todos los recursos, incluidos los recursos de dependencia, conmutan por error a una de las zonas correctas.
Creación de un recurso con la zona de disponibilidad habilitada
Community Training proporciona configuración para zonas de disponibilidad solo en el momento de la creación de la instancia. Si desea cambiar la configuración de la zona de disponibilidad después de la creación de la instancia, deberá crear una nueva instancia. Para obtener información sobre cómo crear la instancia de Community Training, consulte Crear Community Training.
Experiencia a nivel de zona
Zonales. Durante una interrupción del servicio en toda la zona, Community Training puede sufrir una interrupción total o parcial del servicio. El grado de disponibilidad depende de varios factores, como si todo el centro de datos está inactivo o si un servicio de dependencia específico ya no está disponible en esa zona.
Redundancia de zona. Durante una interrupción en toda la zona, no debería experimentar ningún impacto en los recursos aprovisionados. Sin embargo, debe estar preparado para una breve interrupción en la comunicación con esos recursos. En una situación de bajada de zona, los clientes suelen recibir códigos de error 409, así como los intentos de lógica de reintento para volver a establecer conexiones a intervalos adecuados. Las nuevas solicitudes se dirigen a nodos correctos con un impacto cero en el usuario. Durante las interrupciones de toda la zona, los usuarios pueden crear nuevos recursos y escalar correctamente los existentes.
Recuperación ante desastres y continuidad empresarial
La recuperación ante desastres (DR) consiste en recuperarse de eventos de alto impacto, como desastres naturales o implementaciones con errores, lo que produce tiempo de inactividad y pérdida de datos. Independientemente de la causa, el mejor remedio para un desastre es un plan de recuperación ante desastres bien definido y probado y un diseño de aplicaciones que apoye activamente la recuperación ante desastres. Antes de empezar a pensar en la creación del plan de recuperación ante desastres, vea Recomendaciones para diseñar una estrategia de recuperación ante desastres.
En lo que respecta a la recuperación ante desastres, Microsoft usa el modelo de responsabilidad compartida. En un modelo de responsabilidad compartida, Microsoft garantiza que la infraestructura de línea base y los servicios de plataforma estén disponibles. Al mismo tiempo, muchos servicios de Azure no replican automáticamente datos ni se revierten desde una región con errores para realizar la replicación cruzada en otra región habilitada. Para esos servicios, usted es el responsable de configurar un plan de recuperación ante desastres que funcione para la carga de trabajo. La mayoría de los servicios que se ejecutan en ofertas de plataforma como servicio (PaaS) de Azure proporcionan características e instrucciones para admitir la recuperación ante desastres y puede usar características específicas del servicio para admitir la recuperación rápida para ayudar a desarrollar el plan de recuperación ante desastres.
El equipo de Microsoft Community Training gestiona todo el procedimiento de recuperación ante desastres para Community Training. La recuperación ante desastres no es activa-activa o pasiva activa, pero se basa en la recuperación de la copia de seguridad disponible más reciente de los servicios de Azure. El equipo de Community Training crea manualmente todos los recursos en la región emparejada a partir de la copia de seguridad de datos.
Nota:
La recuperación ante desastres de Community Training solo es compatible en regiones emparejadas.
Recuperación ante desastres en la geografía de varias regiones
En un desastre regional, el plano de control se conmuta manualmente por error a la región emparejada. Debe esperar alguna degradación del servicio en el tiempo antes de que se complete la conmutación por error. Después de la conmutación por error, solo se admiten las operaciones de solo lectura hasta que la región de desastre vuelva a estar en línea. El servicio se conmuta manualmente por recuperación a la región original una vez que vuelve a estar en línea y se reanudan todas las operaciones. Se espera que el objetivo de punto de recuperación (RPO) sea de 10 minutos; Objetivo de tiempo de recuperación (RTO), 24 horas.
Para el plano de datos, Community Training ofrece recuperación ante desastres administrada por Microsoft. Para usar la recuperación ante desastres administrada, debe habilitar la recuperación ante desastres durante la creación de la instancia de Community Training en Azure. Una vez que habilite la recuperación ante desastres, Microsoft mantiene la copia de seguridad del almacenamiento y la base de datos en la región emparejada. Se espera que el objetivo de punto de recuperación (RPO) sea de 12 horas; Objetivo de tiempo de recuperación (RTO), 48 horas.
Nota:
RTO depende del tamaño de la base de datos y del almacenamiento, la latencia entre la región emparejada. Capacidad de la máquina virtual de almacenamiento o base de datos (SKU). El RPO depende de los recursos subyacentes de Azure, como Azure SQL y Azure Storage. Para obtener más información sobre RTO y RPO, consulte Introducción a la recuperación ante desastres.
Detección, notificación y administración de interrupciones
Cuando una verificación de estado de Community Training detecta una interrupción de cualquier servicio y en cualquier región, Microsoft solicita su consentimiento para la conmutación por error a la región emparejada. Microsoft le informa de qué características están disponibles durante el procedimiento de recuperación ante desastres. Una vez que Microsoft reciba su consentimiento, el equipo de Community Training podrá iniciar el procedimiento de recuperación ante desastres.
Importante
Los alumnos no podrán consumir características de audio/vídeo hasta que la región primaria esté operativa. Se recomienda evitar operaciones de carga de medios hasta que el sitio primario esté operativo.
Capacidad y resistencia proactiva de la recuperación ante desastres
Microsoft y sus clientes operan bajo el modelo de responsabilidad compartida. Una vez que cualquier región está inactiva, no solo es la instancia de Community Training migrada a la región emparejada, sino también todas las cargas de trabajo de productos y clientes también se migran a la región emparejada. Este procedimiento puede provocar una escasez de recursos en la región emparejada o el centro de datos. Como resultado, la disponibilidad de la recuperación ante desastres depende de la capacidad disponible de los recursos subyacentes de Azure.