Dela via


Förstå en systemomstart för en virtuell Azure-dator

Gäller för: ✔️ Virtuella Linux-datorer ✔️, virtuella Windows-datorer

Virtuella Azure-datorer (VM) kan ibland startas om utan någon uppenbar anledning, utan bevis för att du har initierat omstartsåtgärden. Den här artikeln innehåller en lista över åtgärder och händelser som kan orsaka att virtuella datorer startas om och ger insikter om hur du undviker oväntade omstartsproblem eller minskar effekten av sådana problem.

Konfigurera de virtuella datorerna för hög tillgänglighet

Det bästa sättet att skydda ett program som körs på Azure mot omstarter av virtuella datorer och driftstopp är att konfigurera de virtuella datorerna för hög tillgänglighet.

För att tillhandahålla den här redundansnivån till ditt program rekommenderar vi att du grupperar två eller flera virtuella datorer i en tillgänglighetsuppsättning. Den här konfigurationen säkerställer att minst en virtuell dator är tillgänglig under en planerad eller oplanerad underhållshändelse och uppfyller azure-serviceavtalet på 99,95 procent.

Mer information om tillgänglighetsuppsättningar finns i Hantera tillgängligheten för virtuella datorer

Information om resurshälsa

Azure Resource Health är en tjänst som exponerar hälsotillståndet för enskilda Azure-resurser och ger användbar vägledning för felsökning av problem. I en molnmiljö där det inte går att komma åt servrar eller infrastrukturelement direkt är målet med Resource Health att minska den tid som du lägger på felsökning. I synnerhet är syftet att minska den tid som du lägger ner på att avgöra om roten till problemet ligger i programmet eller i en händelse i Azure-plattformen. Mer information finns i Förstå och använda Resource Health.

Om Azure har ytterligare information om rotorsaken till en plattformsinitierad otillgänglighet för en virtuell dator kan den informationen publiceras i resurshälsa upp till 72 timmar efter den första otillgängligheten.

Saknade driftstopp för virtuella datorer i aktivitetsloggen

Resource Health-aviseringar skickas baserat på aktivitetslogginformationen. I vissa fall kan det hända att driftstopp för virtuella datorer inte visas i aktivitetsloggen. Om stilleståndstiden inte visas i aktivitetsloggen skickas inte Resource Health-aviseringar för stilleståndstiden. Stilleståndstiden visas fortfarande i Resource Health.

Här är de fall där driftstopp för virtuella datorer inte visas i aktivitetsloggen:

  • När en virtuell dator skapas eller migreras till en ny värd visas inte tillståndet för den virtuella datorn korrekt i Azure-plattformen och tillståndet ändras till Okänt. Först när alla nätverksanslutnings- och nodprocesser har upprättats ändras den virtuella datorns tillstånd till Tillgänglig. Den långa perioden för tillståndet Okänt filtreras bort från aktivitetsloggen.
  • När den virtuella datorns tillgänglighetstillstånd ändras från Tillgänglig till otillgänglig och sedan återgår till Tillgänglig inom 35 sekunder visas inte stilleståndstiden i aktivitetsloggen. Det här fallet inträffar inte om en korrelerad stilleståndstid skickas inom 15 minuter innan den första övergången inträffar.
  • Om den virtuella datorns hälsotillstånd ändras från ett tillstånd till Okänt och sedan återgår till det ursprungliga tillståndet filtreras det tillfälliga okända tillståndet och relaterade övergångar bort från aktivitetsloggen.

De driftstopp för virtuella datorer som inte visas i aktivitetsloggen filtreras på Azure-plattformssidan för att förhindra att tillfälliga fel visar felaktiga driftstopp för kunder. Med pågående investeringar i hälsokvalitet för virtuella datorer är filtren kanske inte längre nödvändiga och kan leda till att snabba ändringar i den virtuella datorns hälsa förblir orapporterade. Microsoft arbetar med en utfasningsplan för att leverera den bästa kundupplevelsen.

Åtgärder och händelser som kan göra att den virtuella datorn startas om

Planerat underhåll

Microsoft Azure utför regelbundet uppdateringar över hela världen för att förbättra tillförlitligheten, prestandan och säkerheten för värdinfrastrukturen som ligger till grund för virtuella datorer. Många av dessa uppdateringar, inklusive minnesbevarande uppdateringar, utförs utan någon inverkan på dina virtuella datorer eller molntjänster.

Vissa uppdateringar kräver dock en omstart. I sådana fall stängs de virtuella datorerna av medan vi korrigerar infrastrukturen och sedan startas de virtuella datorerna om.

Information om vad planerat underhåll i Azure är och hur det kan påverka tillgängligheten för dina virtuella Linux-datorer finns i artiklarna här. Artiklarna innehåller information om processen för planerat underhåll av Azure och hur du schemalägger planerat underhåll för att minska påverkan ytterligare.

Minnesbevarande uppdateringar

För den här klassen med uppdateringar i Microsoft Azure påverkas inte de virtuella datorer som körs. Många av de här uppdateringarna är till komponenter eller tjänster som kan uppdateras utan att störa den instans som körs. Vissa är uppdateringar av plattformsinfrastrukturen på värdoperativsystemet som kan tillämpas utan omstart av de virtuella datorerna.

De här minnesbevarande uppdateringarna möjliggörs med teknik som aktiverar livemigrering på plats. När den uppdateras placeras den virtuella datorn i ett pausat tillstånd. Det här tillståndet bevarar minnet i RAM medan det underliggande värdoperativsystemet får nödvändiga uppdateringar och korrigeringar. Den virtuella datorn återupptas vanligtvis inom 30 sekunder efter att den har pausats. När det virtuella datorn har återupptagits synkroniseras klockan automatiskt.

På grund av den korta pausperioden minskar distributionen av uppdateringar via den här mekanismen avsevärt effekten på de virtuella datorerna. Alla uppdateringar kan dock inte distribueras på det här sättet.

Uppdateringar med flera instanser (för virtuella datorer i en tillgänglighetsuppsättning) tillämpas med en uppdateringsdomän i taget.

Kommentar

Linux-datorer som har gamla kernelversioner påverkas av en kernel-panik under den här uppdateringsmetoden. Undvik det här problemet genom att uppdatera till kernelversion 3.10.0-327.10.1 eller senare. Mer information finns i En virtuell Azure Linux-dator på en 3.10-baserad kernel-panik efter en uppgradering av värdnoden.

Användarinitierade åtgärder för omstart eller avstängning

Om du startar om från Azure Portal, Azure PowerShell, kommandoradsgränssnittet eller REST-API:et kan du hitta händelsen i Azure-aktivitetsloggen.

Om du utför åtgärden från den virtuella datorns operativsystem kan du hitta händelsen i systemloggarna.

Andra scenarier som vanligtvis gör att den virtuella datorn startas om inkluderar flera åtgärder för konfigurationsändring. Normalt visas ett varningsmeddelande som anger att körning av en viss åtgärd resulterar i en omstart av den virtuella datorn. Exempel är eventuella åtgärder för storleksändring av virtuella datorer, ändring av lösenordet för det administrativa kontot och inställning av en statisk IP-adress.

Microsoft Defender för molnet och Windows Update

Microsoft Defender för molnet övervakar dagliga virtuella Windows- och Linux-datorer för saknade operativsystemuppdateringar. Defender för molnet hämtar en lista över tillgängliga säkerhetsuppdateringar och viktiga uppdateringar från Windows Update eller Windows Server Update Services (WSUS), beroende på vilken tjänst som har konfigurerats på en virtuell Windows-dator. Defender för molnet söker även efter de senaste uppdateringarna för Linux-system. Om den virtuella datorn saknar en systemuppdatering rekommenderar Defender för molnet att du tillämpar systemuppdateringar. Tillämpningen av dessa systemuppdateringar styrs via Defender för molnet i Azure Portal. När du har tillämpat vissa uppdateringar kan omstarter av virtuella datorer krävas. Mer information finns i Tillämpa systemuppdateringar i Microsoft Defender för molnet.

Precis som lokala servrar skickar Azure inte uppdateringar från Windows Update till virtuella Windows-datorer eftersom dessa datorer är avsedda att hanteras av användarna. Du uppmanas dock att låta den automatiska Windows Update-inställningen vara aktiverad. Automatisk installation av uppdateringar från Windows Update kan också orsaka omstarter när uppdateringarna har tillämpats. Mer information finns i Vanliga frågor och svar om Windows Update.

Andra situationer som påverkar tillgängligheten för den virtuella datorn

Det finns andra fall där Azure aktivt kan pausa användningen av en virtuell dator. Du får e-postaviseringar innan den här åtgärden vidtas, så du kan lösa de underliggande problemen. Exempel på problem som påverkar tillgängligheten för virtuella datorer är säkerhetsöverträdelser och upphörande av betalningsmetoder.

Värdserverfel

Den virtuella datorn finns på en fysisk server som körs i ett Azure-datacenter. Den fysiska servern kör en agent som kallas värdagenten utöver några andra Azure-komponenter. När dessa Azure-programvarukomponenter på den fysiska servern inte svarar utlöser övervakningssystemet en omstart av värdservern för att försöka återställa. I många fall är den virtuella datorn tillgänglig igen inom 10–15 minuter och fortsätter att finnas på samma värd som tidigare.

Serverfel orsakas vanligtvis av maskinvarufel, till exempel fel på en hårddisk eller solid state-enhet. Azure övervakar kontinuerligt dessa förekomster, identifierar underliggande buggar och distribuerar uppdateringar efter att åtgärden har implementerats och testats.

Eftersom vissa värdserverfel kan vara specifika för den servern kan en upprepad omstart av virtuell dator förbättras genom att den virtuella datorn distribueras manuellt till en annan värdserver. Den här åtgärden kan utlösas med hjälp av omdistributionsalternativet på informationssidan för den virtuella datorn eller genom att stoppa och starta om den virtuella datorn i Azure Portal.

Automatisk återställning

Azure-plattformen är utformad för att hantera problem med värdnoder med minimal påverkan på den virtuella datorns prestanda. När en värdnod stöter på ett problem försöker Azure först med den minst störande återställningsmetoden, som är att starta om värden. Om det inte går att starta om värden eller om det ursprungliga problemet är maskinvarurelaterat, återställer plattformstjänsten alla virtuella datorer på den berörda värden till en felfri nod. Även om omstart av en värd i allmänhet har en lägre inverkan kan tjänståterställning av virtuella datorer vara mer komplexa och tidskrävande, beroende på antalet virtuella datorer, deras distributionsbegränsningar och lokal resurstillgänglighet. Tjänståterställning används vanligtvis som en sista utväg för maskinvarufel eftersom det säkerställer att virtuella datorer fortsätter att fungera utan betydande stilleståndstid.

Om en värdserver inte kan startas om initierar Azure en automatisk återställningsåtgärd för att ta den felaktiga värden ur rotation för vidare undersökning. Under den här automatiska återställningsprocessen flyttas alla virtuella datorer på värden automatiskt till en annan felfri värdserver. Även om den här processen vanligtvis slutförs inom 15 minuter kan återställningstiden variera beroende på faktorer som värdens minnesstorlek och de återställningsmetoder som används. Mer information om hur Azure hanterar dessa scenarier finns i Tjänståterställning – automatisk återställning av virtuella datorer.

Oplanerat underhåll

I sällsynta fall kan Azure-driftteamet behöva utföra underhållsaktiviteter för att säkerställa azure-plattformens övergripande hälsa. Det här beteendet kan påverka tillgängligheten för virtuella datorer och resulterar vanligtvis i samma åtgärd för automatisk återställning som beskrevs tidigare.

Oplanerat underhåll omfattar följande:

  • Brådskande noddefragmentering
  • Brådskande uppdateringar av nätverksväxel

Vm-krascher

Virtuella datorer kan startas om på grund av problem på den virtuella datorn. Arbetsbelastningen eller rollen som körs på den virtuella datorn kan utlösa en buggkontroll i gästoperativsystemet. Om du vill ha hjälp med att fastställa orsaken till kraschen kan du visa system- och programloggarna för virtuella Windows-datorer och de seriella loggarna för virtuella Linux-datorer.

Virtuella datorer i Azure förlitar sig på virtuella diskar för operativsystem och datalagring som finns i Azure Storage-infrastrukturen. När tillgängligheten eller anslutningen mellan den virtuella datorn och de associerade virtuella diskarna påverkas i mer än 120 sekunder, utför Azure-plattformen en tvingad avstängning av de virtuella datorerna för att undvika skadade data. De virtuella datorerna aktiveras automatiskt när lagringsanslutningen har återställts. Avstängningen kan vara så kort som fem minuter men kan vara betydligt längre.

Andra incidenter

I sällsynta fall kan ett utbrett problem påverka flera servrar i ett Azure-datacenter. Om det här problemet uppstår skickar Azure-teamet e-postaviseringar till de berörda prenumerationerna. Du kan kontrollera Azure Service Health-instrumentpanelen och Azure Portal för status för pågående avbrott och tidigare incidenter.

Diagnostisera omstarter av virtuell dator

Du kan använda bladet Diagnostisera och lösa på bladet för den virtuella datorn för att köra ytterligare diagnostik. Det kan bero på mer specifika orsaker till den senaste omstarten av den virtuella datorn. Om det finns problem med gästoperativsystemet samlar du in minnesdumpar och kontaktar supporten.

Kontakta oss för att få hjälp

Om du har frågor eller behöver hjälp skapar du en supportförfrågan eller frågar Azure community support. Du kan också skicka produktfeedback till Azure-feedbackcommunityn.