Efter en incident
Azures teknikteam utför interna retrospektiv för tjänstincidenter som påverkar kunder, för att lära sig av vad som hände – i slutändan för att göra incidenter mindre sannolika eller minst mindre effektfulla. Insikter från dessa interna undersökningar tillhandahålls till berörda kunder och partner i form av PIR (Post Incident Reviews) (PIRs).
För våra största effektfulla tjänsteincidenter (särskilt incidenter med påverkan på flera tjänster och flera regioner) bjuder vi också in berörda kunder till en Live-livestream för Azure Incident Retrospektiv – för att höra våra teknikledare sammanfatta vad som hände och vad vi har lärt oss, så att kunder och partner kan få frågor om incidenten som besvaras av våra ämnesexperter.
Slutligen, om vi till följd av en eller flera tjänstincidenter inte uppnår eller upprätthåller våra serviceavtal (SLA), kan berörda kunder vara berättigade att kräva en kredit mot en del av sina månatliga serviceavgifter.
Efter incidentgranskningar (PIR)
För varje Azure-tjänstincident som påverkar kunder tillhandahåller vi en åtgärdsöversikt som sammanfattar vad som hände, med vilka tjänster i vilka regioner och när effekten startade och slutligen mildrades.
För mindre, mindre effektfulla tjänstproblem där utlösaren och bidragande faktorer redan är väl förstådda är den här åtgärdssatsen den slutliga sammanfattningen. (Om problem till exempel bara påverkar en delmängd av en enskild tjänst inom en enda region med en relativt kort varaktighet för påverkan.)
För tjänstproblem som har åtgärdats men som fortfarande kräver mer undersökning för att förstå fullständigt följs åtgärdsöversikten av en efterincidentgranskning (PIR) när våra interna undersökningar har slutförts, vanligtvis inom 14 dagar efter åtgärd. PIR:er omfattar alla lärdomar eller förbättringar som Microsoft gör till följd av incidenten och eventuella relevanta motståndskraftsrekommendationer för hur kunder och partner kan göra liknande incidenter mindre effektfulla.
För våra största och mest effektfulla tjänstproblem följs åtgärdsmeddelandet av en preliminär granskning efter incident (PIR) i allmänhet inom 72 timmar efter åtgärd, för att sammanfatta vad vi har lärt oss hittills från den pågående undersökningen. (Till exempel när problem påverkar flera tjänster, flera regioner eller med en längre varaktighet för påverkan.) När vår interna retrospektiv har slutförts, vanligtvis inom 14 dagar efter åtgärd, publiceras en slutlig granskning efter incident (PIR) för att ge ytterligare information eller lärdomar.
Alla efterincidentgranskningar (PIR) skickas till prenumerationer som påverkas via Azure Service Health och hamnar på bladet "Hälsohistorik". Dessa utlöser också kundkonfigurerade Service Health-aviseringar där aviseringsvillkoren innehåller händelsetypen "Serviceproblem" och anges med attributet "Stage" inställt på "RCA". För incidenter som uppfyller våra kriterier för offentliggörande ("Scenario 1"-incidenter, enligt beskrivningen i vår offentliga dokumentation) kommer den senaste granskningen efter incident också att vara tillgänglig på sidan Azures statushistorik.
Kommentar
Vi håller på att övergå från "Rotorsaksanalyser (RCA)" till "Efter incidentgranskningar (PIR)", så du kan tillfälligt se båda termerna som används omväxlande i Azure Portal och i Service Health-aviseringar.
Azure Incident Retrospektiv (kund-livestream-händelser)
För våra största effektfulla tjänsteincidenter (särskilt de som uppfyllde våra kriterier för offentlig information, "Scenario 1"-incidenter enligt beskrivningen i vår offentliga dokumentation) bjuder vi in berörda kunder att delta i en Livestream-händelse för Azure Incident Retrospektiv .
Dessa webcast-liknande forum gör det möjligt för kunder och partner som påverkades av incidenten att titta på en diskussion med teknikledarna för våra relevanta tjänstteam – sammanfatta vad som hände, hur vi svarade, vad vi lärde oss och vad vi kommer att göra (eller redan gör) för att göra "incidenter som detta" mindre sannolika eller åtminstone mindre effektfulla.
Förutom att bara titta på den här diskussionen med teknikledare ger Azure Incident Retrospektiva livestreams även kunder och partner möjlighet att få frågor om incidenten som besvaras av våra ämnesexperter - genom en modererad fråge- och svarspanel (Q&A), bemannad av representanter från våra relevanta tekniska team.
Se till att du har konfigurerat Azure Service Health-aviseringar för att säkerställa att du bjuds in till en Azure Incident Retrospektiv (om dina tjänster påverkas av en kvalificerande "scenario 1"-incident. Inbjudningar till Azure Incident Retrospektiv livestreams distribueras till Service Health och via Service Health-aviseringar, precis som EFTER incidentgranskningar (PIR).
Efter varje livestream publicerar vi en inspelning av sessionen till den här YouTube-spellistan och, i förekommande fall, uppdaterar PIR:en på sidan Statushistorik med en länk till den.
Serviceavtal (serviceavtal) och tjänstkreditprocess
Serviceavtal (SLA) beskriver Microsofts åtaganden för drifttid och anslutning för Microsoft Online Services. De aktuella och arkiverade utgåvorna av serviceavtalet är tillgängliga för nedladdning och omfattar Azure, samt Dynamics 365, Office 365 och Intune. Om vi inte uppnår och underhåller tjänstnivåerna för varje tjänst enligt beskrivningen i det här serviceavtalet (av någon anledning, inklusive till följd av en eller flera tjänstincidenter) kan kunderna vara berättigade till en kredit mot en del av sina månatliga serviceavgifter.
För att Microsoft ska kunna överväga en SLA-kreditbegäran måste du skicka ett anspråk till kundsupporten inom två månader från slutet av faktureringsmånaden då incidenten som är föremål för anspråket inträffade. Om du vill skicka ett anspråk loggar du in på Azure Portal, skapar en ny supportbegäran, väljer problemtypen "Fakturering", väljer problemtypen "Återbetalningsbegäran" och anger sedan så mycket information som möjligt – inklusive incidentspårnings-ID:t från Azure Service Health och information om vilka tjänster och resurser som du tror påverkades till följd av detta.
Våra faktureringssupportteam verifierar vilka resurser, tjänster och prenumerationer som har påverkats och beräknar och tillämpar sedan relevanta SLA-krediter. Vi kommer att använda kommersiellt rimliga ansträngningar för att bearbeta anspråk under den efterföljande månaden och inom 45 dagar efter mottagandet. Om vi bedömer att en tjänstkredit är skyldig dig tillämpar vi tjänstkrediten på dina tillämpliga månatliga serviceavgifter.
Tjänstkrediter är din enda och exklusiva åtgärd för eventuella prestanda- eller tillgänglighetsproblem för någon tjänst enligt avtalet SLA. Förhandsversioner och onlinetjänster eller tjänstnivåer som tillhandahålls kostnadsfritt ingår inte eller är berättigade till SLA-anspråk eller krediter. Observera slutligen att de tjänstkrediter som tilldelas under en faktureringsmånad för en viss tjänst eller tjänstresurs inte under några omständigheter kommer att överskrida dina månatliga serviceavgifter för den tjänsten eller tjänstresursen, i förekommande fall, under faktureringsmånaden.