Работа с повреждением данных в Microsoft 365
Одним из сложных аспектов работы крупномасштабной облачной службы является обработка повреждения данных с учетом большого объема данных и независимых систем. Повреждение данных может быть вызвано следующими причинами:
- Ошибки приложения или инфраструктуры, повредив некоторые или все состояния приложения
- Проблемы с оборудованием, которые приводят к потере данных или невозможности чтения данных
- Рабочие ошибки человека
- Вредоносные хакеры и участники программы предварительной оценки
- Инциденты во внешних службах, которые приводят к потере данных
Так как более высокая устойчивость целостности данных означает меньше инцидентов повреждения данных, корпорация Майкрософт встроена в механизмы защиты Microsoft 365 для предотвращения повреждения, а также системы и процессы, которые позволяют нам восстанавливать данные, если это происходит. Проверки и процессы существуют на различных этапах процесса технического выпуска для повышения устойчивости к повреждению данных, в том числе:
- Проектирование системы
- Организация и структура кода
- Проверка кода
- Модульные тесты, интеграционные тесты и системные тесты
- Тесты проводов и шлюзы
В рабочих средах Microsoft 365 одноранговая репликация между центрами обработки данных гарантирует наличие нескольких динамических копий любых данных. Стандартные образы и скрипты используются для восстановления потерянных серверов, а реплицированные данные — для восстановления данных клиентов. В Exchange Online каждый почтовый ящик размещается в группах доступности баз данных (DAG) и реплицируется в географически отдельные центры обработки данных в одном регионе. Каждая база данных почтовых ящиков имеет четыре копии, распределенные между центрами обработки данных в DAG: одна активная копия, две последние копии и одна 7-дневная копия с отстающей копией, используемая в редких случаях катастрофического логического повреждения. В SharePoint и OneDrive файлы записываются одновременно в основной и дополнительный регион центра обработки данных. Несколько типов контрольных сумм хранятся в метаданных в отдельном расположении, чем соответствующие файлы, и используются для обеспечения целостности данных на всех этапах жизненного цикла данных.
Благодаря встроенным проверкам устойчивости данных и процессам, корпорация Майкрософт поддерживает резервные копии только документации по информационной системе Microsoft 365 (включая документацию по безопасности), используя встроенную репликацию в SharePoint и наше внутреннее средство репозитория кода, Хранилище источников. Системная документация хранится в SharePoint, а исходное хранилище содержит образы систем и приложений. SharePoint и Source Depot используют управление версиями и реплицируются практически в режиме реального времени.