Consideraciones de operaciones para cargas de trabajo de Azure VMware Solution
En este artículo se describe el área de diseño de operaciones para Azure VMware Solution. El objetivo de este artículo es crear un modelo operativo para Azure VMware Solution y las aplicaciones dentro del centro de datos definido por software (SDDC) de VMware. Los procedimientos operativos estándar (SOP) son procesos documentados para administrar una carga de trabajo. Cada carga de trabajo de Azure VMware Solution debe tener SOP para controlar las operaciones. Para mantenerse alineado con los objetivos empresariales y ayudar a evitar el desfase de los procedimientos recomendados, use los SOP en un ciclo continuo de evaluaciones y comprobaciones de estado que ejecute en la carga de trabajo de Azure VMware Solution.
Seguimiento de las dependencias de la aplicación
Impacto: Excelencia operativa
Los equipos de TI buscan continuamente optimizar la implementación, administración y mantenimiento de aplicaciones, sitios y servicios. Esta práctica ayuda a garantizar un alto rendimiento, confiabilidad, escalabilidad y seguridad. La optimización implica comprender cómo fluyen las aplicaciones dentro de la plataforma de Azure VMware Solution. También implica examinar las dependencias externas y las relaciones que están fuera de la nube privada. Un mapa de dependencias es una herramienta valiosa para desarrolladores, arquitectos de aplicaciones y equipos de TI a medida que buscan comprender la estructura y el comportamiento de las aplicaciones. Tener información sobre los componentes de la aplicación, como software e infraestructura, servicios y dependencias externas, proporciona una manera visual de comprender los flujos de datos, la funcionalidad y las llamadas API.
Recomendaciones
- Use Application Insights para realizar un seguimiento de las dependencias, como bases de datos, llamadas API y servicios externos.
- Use la característica de mapa de servicio de Azure Monitor para detectar y visualizar automáticamente diferentes componentes de la aplicación e infraestructura.
- Use herramientas de terceros como New Relic y Datadog para detectar y asignar dependencias.
- Use scripts personalizados o herramientas de administración de configuración de terceros que realicen un seguimiento de la automatización e implementación de dependencias.
Uso de la automatización, los sistemas de control de versiones y las implementaciones azul-verde
Impacto: Excelencia operativa
Las organizaciones pueden reducir el tiempo de comercialización y beneficiarse de una mejor colaboración y calidad de software mediante la adopción de prácticas de DevOps. Por ejemplo, la automatización puede acelerar la implementación y el mantenimiento de las aplicaciones.
Cuando se usa la infraestructura como código (IaC) para organizar las implementaciones de infraestructura, puede beneficiarse de una mejor eficacia en el aprovisionamiento de infraestructura. IaC también puede facilitar la adopción de principios de DevOps en la administración de la infraestructura.
- Puede usar IaC para crear varios recursos en Azure VMware Solution. Entre los ejemplos se incluyen la nube privada completa o componentes individuales, como clústeres, dispositivos de red y almacenamiento. Herramientas como Azure Resource Manager, Bicep, Terraform, la CLI de Azure y PowerShell automatizan el aprovisionamiento y la configuración de recursos en Azure VMware Solution.
- Al usar IaC, puede actualizar la infraestructura modificando el código. Este enfoque reduce el tiempo y el esfuerzo necesarios para la configuración y el aprovisionamiento manuales.
- La salida que se devuelve de la implementación de IaC puede servir como documentación para ayudar a mantener y proporcionar visibilidad adicional sobre el estado y la configuración de los recursos aprovisionados.
Los sistemas de control de versiones proporcionan una manera de administrar el código y usar el control de versiones para realizar un seguimiento y revertir los cambios según sea necesario.
Cuando necesite actualizar el código de aplicación entre servidores, las implementaciones azul-verde pueden resultar útiles de muchas maneras:
- Ayudan a administrar el ciclo de vida de una aplicación de desarrollo a producción.
- Ayudan a proporcionar a los clientes una experiencia web coherente cuando se aplican actualizaciones y revisiones.
- Usan algoritmos ponderados para distribuir el tráfico solo a servidores correctos durante el mantenimiento.
Azure VMware Solution no ofrece métodos que ofrece una aplicación nativa de nube para lograr implementaciones azules y verdes. Sin embargo, estas implementaciones siguen siendo posibles en Azure VMware Solution:
- Antes de realizar cambios en la configuración de la aplicación, tome instantáneas del entorno.
- Use el control de versiones para asegurarse de que puede volver a un estado correcto conocido por última vez.
- Considere la posibilidad de crear un entorno de ensayo que refleje la producción e implemente actualizaciones antes de que se produzca.
- Desde el entorno de ensayo, realice actualizaciones graduales en un subconjunto de servidores y pruebe la aplicación.
Puede reducir el esfuerzo manual, minimizar los errores y mejorar el uso de recursos mediante la automatización de tareas rutinarias como el aprovisionamiento, el escalado y la aplicación de revisiones. Las metodologías de DevOps son un elemento importante de una solución bien diseñada para simplificar las operaciones, ahorrar tiempo y ayudar a los equipos a centrarse en actividades de valor añadido.
Recomendaciones
- Use IaC para implementar y aprovisionar la infraestructura de una manera repetible, auditable y coherente.
- Automatice la expansión y la contracción mediante IaC.
- Use sistemas de control de versiones para realizar un seguimiento de los cambios, colaborar y revertir el código a versiones anteriores según sea necesario.
- Aproveche el concepto azul-verde mediante la creación de un entorno de ensayo que refleje los entornos de producción y prueba antes de continuar.
- Mantenga el último buen estado de la aplicación mediante instantáneas, clonación de discos y código controlado por versiones.
Definición de roles y procesos
Impacto: Excelencia operativa
Los roles y responsabilidades bien definidos ayudan a garantizar la claridad, la responsabilidad y la administración eficaz de una carga de trabajo de Azure VMware Solution bien diseñada. Tener un conjunto definido de estándares y procesos estructurados y saber quién los ejecuta conduce a operaciones eficaces y ayuda a las organizaciones de TI a alinear sus ofertas técnicas con objetivos empresariales y estrategias. A medida que el entorno de Azure VMware Solution crece y evoluciona, los roles y responsabilidades bien definidos conducen a una delegación de tareas más sencilla y al potencial de escalar la solución sin interrupciones. El resultado es una mejor experiencia para los usuarios de la aplicación.
Es importante tener una cultura de mejora continua que se centra en operaciones diarias eficaces para aplicaciones en la nube privada. Entre los ejemplos de operaciones se incluyen el mantenimiento de acuerdos de nivel de servicio (SLA), el mantenimiento de la disponibilidad, el hecho de tener la capacidad de minimizar las interrupciones del servicio y tener una entrega sin problemas. Por ejemplo, Azure VMware Solution permite expandir un entorno con una entrada de usuario mínima. Si expande manualmente el contrato, debe documentar quién realiza las actividades asociadas y cómo llevarlas a cabo. Los operadores de Azure VMware Solution deben asegurarse de que la reserva de nodos está disponible para expandir el entorno según sea necesario. Por ejemplo, designe individuos responsables de identificar recursos infrautilizados o inactivos. Proporcione a esas personas un proceso para cambiar el tamaño correcto de las máquinas virtuales (VM) para reducir los costos innecesarios.
Los equipos de aplicaciones y los desarrolladores deben definir directrices de codificación para la estructura de código, las excepciones y el control de errores. También debe tener métodos para realizar un seguimiento de los cambios, como revisiones de código normales, documentación de API y refactorización de código normal. Al usar el control de versiones, aplique los procedimientos recomendados, como la bifurcación, los mensajes de confirmación y los flujos de trabajo de aprobación. Estas prácticas pueden ayudar a que el código sea coherente, fácil de depurar y mantener.
Recomendaciones
- Trabaje con el equipo de centro de excelencia en la nube (CCoE) para comprender los estándares y directrices de cumplimiento, seguridad, arquitectura de aplicaciones y procesos operativos.
- Tenga un equipo de seguridad y cumplimiento centrado en las directivas de seguridad específicas de Azure VMware Solution. Además, el equipo realiza evaluaciones de riesgos y garantiza el cumplimiento de los requisitos normativos.
- Adopte un marco como la Biblioteca de infraestructuras de tecnología de la información (ITIL). O bien, use prácticas de la Organización Internacional de Normalización (ISO) para asignar operaciones, procesos y actividades diarias. Estas prácticas pueden dar lugar a transferencias de conocimiento más rápidas, mejoras continuas y administración mejorada de cambios.
- Defina estándares de codificación e implemente prácticas de seguridad durante el desarrollo de aplicaciones.
Uso de estrategias de etiquetado y procedimientos recomendados
Impacto: Excelencia operativa
Puede usar una estrategia de etiquetado para el contracargo y el seguimiento de recursos. Las etiquetas son valores de par de claves que se definen en el nivel de recurso y se aplican durante el aprovisionamiento. Puede usar IaC para crear, actualizar y destruir máquinas virtuales invitadas. Etiquetas e IaC funcionan junto con herramientas de administración de configuración. Puede usar etiquetas en las siguientes áreas:
- Entornos. Puede aplicar etiquetas como producción, control de calidad o pruebas de desarrollo para identificar los recursos.
- Centros de costos, para realizar un seguimiento de los costos y los gastos de los recursos.
- Acuerdos de Nivel de Servicio para priorizar los requisitos del Acuerdo de Nivel de Servicio de los recursos.
- Ciclos de vida. Puede etiquetar las aplicaciones como activas, archivadas o retiradas.
- Importancia, etiquetando los recursos en función de su impacto empresarial y importancia.
Como parte de la estrategia de gobernanza y cumplimiento, un grupo debe ser responsable de identificar recursos sin etiquetas. Ese grupo puede combinar la automatización, la auditoría y los procesos para ayudar a identificar y corregir recursos que no cumplen las directivas de cumplimiento de etiquetado.
Estas consideraciones de etiquetado son generales. Es importante que la estrategia de etiquetado admita la categorización de recursos eficaz, la administración del ciclo de vida de los recursos y los informes en Azure VMware Solution.
Recomendaciones
- Aplique etiquetas para la administración de recursos mediante una taxonomía organizativa para identificar las cargas de trabajo y la infraestructura. La taxonomía debe incluir el host, la empresa, el propietario y el entorno.
- Use las herramientas adecuadas para mantener y aplicar etiquetas mediante programación durante el aprovisionamiento.
- Use etiquetas que se alineen con las iniciativas de cumplimiento y gobernanza de su organización, como acuerdos de nivel de servicio, directivas de contracargo y prácticas de administración del ciclo de vida.
- Tener procesos implementados para identificar y solucionar los recursos que no cumplen los requisitos de etiquetado.
Establecimiento de equipos de respuesta a incidentes
Impacto: Excelencia operativa
Para realizar un seguimiento del estado de la carga de trabajo en una nube privada, es esencial supervisar métricas como el uso de CPU, los registros del sistema operativo y las alertas de seguridad. Para garantizar la eficacia del sistema de alertas, debe evaluar varios aspectos operativos clave. En concreto, compruebe que:
- Todos los componentes críticos se identifican, como bases de datos, dispositivos de red y almacenamiento.
- Los umbrales se establecen correctamente.
- Las alertas son específicas y accionables.
- Las personas adecuadas reciben alertas.
- No hay una cantidad considerable de ruido y falsos positivos.
- Se aplican procedimientos de escalación adecuados.
Antes de un incidente o una interrupción, es fundamental establecer un proceso de notificación bien definido para garantizar la comunicación oportuna. La identificación del personal pertinente responsable de la resolución es fundamental. Un equipo de corrección dedicado puede incluir personal de operaciones, propietarios de aplicaciones y expertos de DevOps que poseen la experiencia necesaria para resolver problemas rápidamente. El equipo de operaciones debe tener en cuenta las personas adecuadas que impliquen la evaluación de cada problema.
Un equipo de respuesta a incidentes puede coordinar eficazmente las respuestas manteniendo una lista de distribución completa. Esta lista debe incluir las partes interesadas clave de los departamentos críticos para la empresa y los contactos de escalación designados. Las partes interesadas de la empresa deben informarse de cualquier posible impacto en las operaciones resultantes de un incidente. Los contactos de escalación asignados deben ser personas capaces de tomar decisiones o escalar problemas a niveles superiores para obtener instrucciones.
Revisar periódicamente la lista de distribución es esencial para garantizar su precisión y alineación con los roles y responsabilidades actuales. Las revisiones garantizan que las partes interesadas clave se informen rápidamente sobre eventos significativos que se producen en Azure VMware Solution.
Una solución de administración de servicios de TI (ITSM) puede asignar eventos a tareas. Por ejemplo, un ITSM nativo de Azure podría usar Azure DevOps para administrar tareas. Puede usar Azure Automation para automatizar procesos de TI y Azure Logic Apps para crear flujos de trabajo. El resultado es una solución personalizada para la administración de problemas en Azure VMware Solution.
Recomendaciones
- Defina los destinatarios adecuados para las alertas e incidentes de Azure VMware Solution.
- Defina claramente los contactos de escalación que deben ser accesibles y autorizados para tomar decisiones o escalar problemas.
- Identifique las principales partes interesadas o representantes empresariales para garantizar la visibilidad de cualquier impacto potencial y proporcionar instrucciones.
- Tener un equipo de corrección en su lugar que consta de administradores, ingenieros de infraestructura y personal que tienen la experiencia necesaria para abordar y resolver problemas.
- Integre alertas con un ITSM como Azure DevOps, JIRA o ServiceNow.
Procedimientos de documento
Impacto: Confiabilidad
Es importante tener un conocimiento claro de la infraestructura de copia de seguridad y recuperación que existe en su entorno. Para configurar una solución de copia de seguridad, primero debe definir destinos de copia de seguridad para la infraestructura. Debe realizar una copia de seguridad de las aplicaciones, las bases de datos y los recursos en Blob Storage o en un almacén de Azure Backup. También debe designar propietarios responsables de realizar copias de seguridad y restaurar la aplicación.
Recomendaciones
- Documente claramente la infraestructura de copia de seguridad y recuperación.
- Documente claramente los procedimientos de copia de seguridad y recuperación.
Implementación de soluciones de copia de seguridad y restauración
Impacto: Confiabilidad
La nube privada debe protegerse contra la pérdida de datos, minimizar el tiempo de inactividad y mantener la continuidad de las operaciones cuando hay interrupciones inesperadas o desastres.
Para la continuidad empresarial, debe implementar una protección de datos sólida para ayudar a garantizar la disponibilidad, integridad y capacidad de recuperación de las máquinas virtuales y los datos críticos dentro del entorno de Azure VMware Solution. Las herramientas de copia de seguridad deben estar en vigor y también debe confirmar que funcionan. Un principio clave de Azure VMware Solution es proporcionar compatibilidad con tecnología de proveedor de software independiente (ISV) que se valida con Azure VMware Solution. Comprender los asociados y las opciones que están disponibles es fundamental para el éxito de la copia de seguridad.
Recomendaciones
- Use soluciones de copia de seguridad compatibles con Microsoft, como Microsoft Azure Backup Server o proveedores de terceros aprobados.
Precaución
Asegúrese de que las máquinas virtuales del entorno de copia de seguridad ejecutan sistemas operativos que tienen compatibilidad. Obtenga información sobre los sistemas operativos admitidos.
Uso de Azure Site Recovery
Impacto: Confiabilidad
Azure Site Recovery es una solución de recuperación ante desastres diseñada para minimizar el tiempo de inactividad de las máquinas virtuales en un entorno de Azure VMware Solution cuando se produce un desastre. Azure Site Recovery automatiza y organiza la conmutación por error y la conmutación por recuperación. Las pruebas no disruptivas integradas ayudan a garantizar que se cumplen los objetivos de tiempo de recuperación (RTO). Azure Site Recovery simplifica la administración a través de la automatización y ayuda a garantizar tiempos de recuperación rápidos y altamente predecibles.
Recomendaciones
- En caso de una interrupción regional prolongada, proteja sus cargas de trabajo replicándolas en una región alternativa de Azure.
- Configure Azure Site Recovery para enviar copias de seguridad a una región alternativa.
Girar secretos
Impacto: Seguridad
Es más difícil que los atacantes accedan o usen datos cifrados incorrectamente si no tienen acceso a las claves de cifrado. Debe almacenar de forma segura las claves, los secretos y los certificados, y debe rotarlos con frecuencia. Los pasos completos para proteger y mantener la integridad de los datos incluyen:
- Cifrado de datos.
- Almacenar claves de forma segura.
- Cifrado de datos en el nivel de aplicación antes de transmitir datos.
Recomendaciones
- Use Azure Key Vault para almacenar claves de cifrado.
Pasos siguientes
Ahora que ha examinado los procedimientos de administración operativa, consulte cómo integrar una carga de trabajo de Azure VMware Solution con zonas de aterrizaje de Azure.
Use la herramienta de evaluación para evaluar las opciones de diseño.