Устойчивость данных в Microsoft 365
Учитывая сложный характер облачных вычислений, корпорация Майкрософт не относится к тому, что ситуация пойдет не так, а когда. Мы разрабатываем наши облачные службы таким образом, чтобы обеспечить максимальную надежность и минимизировать негативные последствия для клиентов, когда что-то пойдет не так. Мы вышли за рамки традиционной стратегии использования сложной физической инфраструктуры и создали избыточность непосредственно в наших облачных службах. Мы используем сочетание менее сложной физической инфраструктуры и более интеллектуального программного обеспечения, которое обеспечивает устойчивость данных в наших службах и обеспечивает высокую доступность для наших клиентов.
Устойчивость и возможность восстановления встроены
Создание устойчивости и восстановления начинается с предположения, что базовая инфраструктура и процессы в какой-то момент завершаются сбоем: оборудование (инфраструктура) завершается сбоем, люди делают ошибки, а программное обеспечение будет иметь ошибки. Хотя было бы неправильно говорить, что разработчики программного обеспечения не думали об этих вещах до облака, то, как эти проблемы были обработаны в типичной ИТ-реализации, отличались до облака:
- Во-первых, защита оборудования и инфраструктуры была значительной. Такая структура означает, что для центров обработки данных с надежностью 99,99 % требуется значительная избыточность питания и сети, а серверы были реализованы с помощью аппаратной кластеризации, двойного источника питания, двойных сетевых интерфейсов и т. д.
- Во-вторых, процесс имеет первостепенное значение. Операционные группы поддерживали строгие процедуры, использовались окна изменений, и часто возникали значительные издержки на управление проектами.
- В-третьих, развертывание проходило в ледниковых темпах. Развертывание кода без владения источником означало ожидание выпусков исправлений, а основные выпуски версий включали замену оборудования и значительные капитальные затраты. Кроме того, единственный способ исправить проблему — откат. Таким образом, большинство ИТ-организаций развертывают только крупные выпуски, чтобы избежать работы по поддержанию в актуальном состоянии.
- Наконец, масштаб развернутых систем и уровень их взаимосвязи исторически были гораздо меньше, чем сейчас.
Сегодня клиенты ожидают от Корпорации Майкрософт непрерывных инноваций без ущерба для качества, и это одна из причин, почему службы и программное обеспечение Майкрософт создаются с учетом устойчивости и возможности восстановления.
Принципы устойчивости данных Microsoft 365
Устойчивость — это способность облачной службы выдерживать определенные типы сбоев и при этом оставаться полностью функциональной с точки зрения клиентов. Устойчивость данных означает, что независимо от того, какие сбои происходят в Microsoft 365, критически важные данные клиентов остаются неизменными и не затрагиваются. С этой целью службы Microsoft 365 были разработаны на основе пяти конкретных принципов устойчивости:
- Есть критические и некритические данные. Некритические данные (например, было ли прочитано сообщение) могут быть удалены в редких сценариях сбоя. Критически важные данные (например, данные клиентов, такие как сообщения электронной почты) должны быть защищены с экстремальными затратами. В качестве цели проектирования доставленные почтовые сообщения всегда имеют решающее значение, а такие вещи, как прочитанное сообщение, некритичны.
- Чтобы обеспечить изоляцию сбоя, копии данных клиента должны быть разделены на разные зоны сбоя или как можно больше доменов сбоя (например, центры обработки данных, доступные по отдельным учетным данным (процесс, сервер или оператор)).
- Критически важные данные клиента должны отслеживаться на наличие сбоя любой части атомарности, согласованности, изоляции, устойчивости (ACID).
- Данные клиента должны быть защищены от повреждения. Она должна быть активно сканирована или отслеживаема, исправляться и восстанавливаться.
- Большая часть данных происходит из-за действий клиента, поэтому клиенты могут восстанавливаться самостоятельно с помощью графического пользовательского интерфейса, который позволяет им восстанавливать случайно удаленные элементы.
Благодаря построению наших облачных служб на основе этих принципов в сочетании с надежным тестированием и проверкой Microsoft 365 может удовлетворить требования клиентов и превысить их, обеспечивая при этом платформу для непрерывных инноваций и совершенствования.