Сводка

Завершено

Планирование действий в случае аварии — важнейший элемент ИТ вне зависимости от того, где располагаются системы организации: в локальной среде, облаке или обеих средах. Общедоступные облачные платформы предлагают службы для резервного копирования критически важных данных, их восстановления в случае потери, отработки отказа в дополнительные системы при отказе основных, а также устранения последствий сбоев. Ниже приводятся некоторые ключевые моменты, рассмотренные в этом модуле.

  • По мере возможности ИТ-системы должны быть отказоустойчивыми. Отказоустойчивая система — это такая система, которая работает правильно или в соответствии с соглашением об уровне обслуживания в случае сбоев.

  • Одним из способов обеспечения отказоустойчивости является использование реактивных методов, таких как репликация задач и точки восстановления.

  • Проактивные методы, такие как репликация ресурсов и балансировка нагрузки, также могут вносить свой вклад в отказоустойчивость.

  • Основные облачные платформы предлагают службы резервного копирования, обеспечивающие защиту от потери данных. Примерами облачных служб резервного копирования могут служить Azure Backup и AWS Backup.

  • Аварийное восстановление призвано обеспечить непрерывность бизнес-процессов путем перенаправления трафика в дополнительные системы при необходимости. Поставщики облачных служб, такие как Amazon и Майкрософт, предлагают решения типа "аварийное восстановление как услуга" (DRaaS) в виде таких служб, как AWS CloudEndure и Azure Site Recovery.

  • К основным целям уровня обслуживания, применяемым для составления планов аварийного восстановления, относятся целевая точка восстановления (RPO), целевое время восстановления (RTO) и период хранения.

  • Непрерывность — это результат успешного применения рекомендаций по противостоянию авариям. Ключевым фактором для непрерывности является устойчивость.

  • Устойчивость можно измерять количественно с помощью таких метрик, как отказоустойчивость, устойчивость к перебоям и устойчивость к условиям. Модель ResiliNets предлагает один из способов формализации понятия устойчивости.

  • Международным стандартом в отношении стратегии обеспечения непрерывности бизнес-процессов является ISO 22301. Для соблюдения требований ISO 22301 в Azure используются стандарты устойчивости Azure.

Чтобы информационная система была устойчивой, ответственные за нее лица должны стремиться к идеалу: система должна эволюционировать как живое существо благодаря непрерывному усовершенствованию и мониторингу, осуществляемому реальными людьми, а не автоматизированными средствами. Автоматизированные процессы полезны, но они не могут заменить активные усилия.