Ciągłość działania i odzyskiwanie po awarii
Platforma Business Application Platform (BAP) firmy Microsoft zapewnia funkcje Business Continuity and Disaster Recovery (BCDR) dla wszystkich typ produkcji środowisk w aplikacjach Dynamics 365 i Power Platform SAAS. W tym artykule opisano szczegóły i praktyki stosowane przez firmę Microsoft w celu zapewnienia odporności danych produkcyjnych podczas awarii regionalnej.
Tworzenie kopii zapasowych środowisk produkcyjnych
Microsoft dokłada wszelkich starań, aby zapewnić najwyższy poziom dostępności usług dla krytycznych aplikacji i danych. Microsoft zapewnia dostępność podstawowej infrastruktury i usług platformy dzięki ciągłości biznesowej i architekturze odzyskiwanie po awarii, umożliwiając redundancję geograficzną, w której wszystkie dane ze środowisk produkcyjnych - z wyłączeniem środowisk domyślnych - są archiwizowane w sparowanym, drugorzędnym regionie. Te kopie zapasowe są określane jako Geo-dodatkowe kopie zapasowe, które są konfigurowane w czasie, gdy wdrażane jest środowisko podstawowe.
Powyższa ilustracja pokazuje, że gdy region podstawowy A zostanie dotknięty awarią, środowiska typu produkcyjnego z regionu A przełączają się awaryjnie do regionu dodatkowego B, który jest zdrowy. Żadne działania nie są podejmowane w przypadku innych typów środowisk, takich jak domyślne, próbne, piaskownica, zespoły lub deweloper.
Aby dowiedzieć się więcej na temat ochrony danych w środowiskach nieprodukcyjnych, zobacz Tworzenie kopii zapasowych i przywracanie środowisk.
W jaki sposób zostaniesz powiadomiony o awarii?
Podstawowym kanałem komunikacji jest Pulpit nawigacyjny kondycji usługi (SHD) w centrach administracyjnych Microsoft i Power Platform. Zespół ds. komunikacji Microsoft inicjuje proces, publikując wstępne komunikaty w celu powiadomienia użytkownika o przerwie w dostawie i w razie potrzeby publikując niezbędne aktualizacje w SHD. Aby uzyskać więcej informacji na temat przeglądania wiadomości w centrum administracyjnym, zobacz Panel strony głównej. Aby lepiej się przygotować, odwiedź stronę gotowości.
Procesy Przełączania awaryjnego i przywracania po awarii oraz kryteria ciągłości działania
Przełączanie awaryjne (failover) i przywracanie po awarii (failback) to dwa główne zadania wykonywane podczas procesu ciągłości działania i odzyskiwania po awarii (BCDR), których celem jest zminimalizowanie wpływu awarii na dostępność i wydajność krytycznych funkcji biznesowych i aplikacji.
Tryb failover to proces przełączania się do wyznaczonej pomocniczej geograficznie kopii zapasowej wszystkich systemów i danych z podstawowej lokacji produkcyjnej. Po zakończeniu operacji przełączania awaryjnego środowisko produkcyjne jest dostępne z lokalizacji geograficznej.
Ważne
Mimo że aplikacje finansowe i operacyjne działają w regionie pomocniczym po konserwacji pracy awaryjnej, wdrożenia pakietów, Financial Reporting i raportowanie Power BI nie są dostępne.
Przywrócenie po awarii to proces przywracania produkcji do jej pierwotnej lokalizacji po katastrofie lub zaplanowanym okresie konserwacji.
W ramach standardu Microsoft Business Continuity and Disaster Recovery (BCDR) klienci mogą być pewni, że każda usługa online w ramach Microsoft corocznie przegląda, testuje i aktualizuje swój plan BCDR. Microsoft Cloud Ciągłość działania i odzyskiwanie po awarii Plan Validation Report jest udostępniany klientom na Service Trust Portal.
Jeśli wystąpi nieprzewidziana awaria w całym regionie, taka jak klęska żywiołowa, która ma wpływ na cały region Azure, zostaną wykonane następujące kroki i procesy.
Zakres odpowiedzialności firmy Microsoft | Zakres odpowiedzialności klienta |
---|---|
Jeśli Microsoft wykryje awarię i zauważy, że ma ona wpływ na klientów, zespół ds. komunikacji Microsoftu wysyła niezbędne komunikaty i aktualizuje Pulpit nawigacyjny kondycji usługi o niezbędne informacje. | None |
Jeśli wystąpi awaria, Microsoft wykona automatyczne przełączenie awaryjne instancji produkcyjnej do regionu pomocniczego, jeśli klient NIE utraci danych. | None |
Jeśli wystąpi awaria, Microsoft ustali, że nastąpiła UTRATA DANYCH, a następnie awaria środowiska nie zostanie zainicjowana bez zgody/zatwierdzenia klienta. | Gdy klient jest świadomy trwającej awarii i widzi WPŁYW, to na nim spoczywa odpowiedzialność: - Aby skontaktować się z firmą Microsoft za pośrednictwem pomocy technicznej i dowiedzieć się, jaki poziom utraty danych wystąpi w przypadku zainicjowania przełączania awaryjnego. - Jeśli utrata danych jest na akceptowalnym poziomie zgodnie ze standardami organizacji, klienci powinni przekazać zgodę za pośrednictwem pomocy technicznej, aby Microsoft zainicjował przełączenie awaryjne. |
Gdy Microsoft ustali, że region podstawowy jest z powrotem online i jest w pełni operacyjny, na instancjach produkcyjnych wykonywane jest PRZYWRACANIE PO AWARII. Podczas planowanego procesu przywracania po awarii nie dochodzi do utraty danych, ale użytkownicy mogą doświadczyć krótkich przerw lub rozłączeń w tym okresie. | None |