Få en bredare förståelse av tillförlitligheten
För att vi effektivt ska kunna konfigurera övervakning för att förbättra vår tillförlitlighet behöver vi en god förståelse för vilken typ av saker vi kan tänka oss att mäta. I den här lektionen hoppas vi kunna föreslå några möjligheter som kan öka din förståelse för tillförlitlighet.
Nu tar vi en titt på några av dessa tillförlitlighetsaspekter:
Tillgänglighet
När tillförlitlighet diskuteras börjar man oftast med tillgänglighet. Är systemet "upp" eller är det "nere?" Kan andra nå din webbplats eller din tjänst? Kan de använda produkten när de förväntar sig att kunna göra det? Det är viktigt ur både externa kunders och interna användares perspektiv som är beroende av din tjänst. Tillgänglighet är förmodligen den aspekt av tillförlitlighet som du kommer att ägna mest tid åt att arbeta med. Det är en bra utgångspunkt för att diskutera tillförlitlighet, men det är bara en aspekt.
Svarstid
Svarstiden avser fördröjningen mellan en begäran och ett svar. Du kanske har hört slagordet "slow is the new down". Personer kräver snabba prestanda, och de förlorar tålamodet med en webbplats eller tjänst som gör att de väntar. Vi har bra forskning som visar att om en webbplats inte uppfyller deras förväntningar på svarstid, kommer kunderna sannolikt att gå till en konkurrent.
Genomflöde
Dataflödet är ett mått på den hastighet som något bearbetas, eller antalet transaktioner som en webbplats, ett program eller en tjänst kan hantera under en viss tidsperiod. Detta är särskilt viktigt när du kör pipelines eller batchbearbetningssystem. Om en pipeline eller ett batchbearbetningssystem inte bearbetar saker tillräckligt snabbt uppfyller det inte våra förväntningar och anses inte vara tillförlitligt.
Disponering
Täckning avser hur mycket av de data som du förväntade dig att bearbeta faktiskt bearbetades. Återigen kommer vi tillbaka till idén att mäta hur bra vi uppfyller förväntningarna som en del av att avgöra om något är tillförlitligt.
Korrekthet
Korrekthet är en aspekt av tillförlitlighet som ofta förbises. Gav den process som du körde på data det korrekta eller förväntade resultatet? Det här är en viktig faktor för övervakning med syfte att förbättra tillförlitligheten. Oavsett hur snabb eller "alltid tillgänglig" din tjänst eller webbplats är, om den returnerar felaktiga resultat, är det inte tillförlitligt i dina kunders ögon. Övervakning av resultatens korrekthet är en viktig del av tillförlitlighetsövervakning.
Fullständighet
Fullständighet i den här kontexten beskrivs bäst med hjälp av ett exempel. Anta att du besöker startsidan för en videoströmningswebbplats. Den sidan består av separata avsnitt: nya versioner, anpassade rekommendationer, de 10 bästa filmerna som visas och så vidare. Vart och ett av dessa avsnitt genereras sannolikt av en separat serverdelstjänst. Om någon av dessa tjänster slutar fungera, till exempel anpassningsmotorn, får besökare på webbplatsen inte meddelandet "Tyvärr är den här webbplatsen nere" eller en tom sida. I stället ser de en startsida med det avsnittet antingen borttaget eller ersatt med statiskt innehåll. Tekniskt sett skulle vi säga att de fick en "degraderad" upplevelse i stället för den fullständiga avsedda sidan.
Om vi skulle mäta återgivning skulle vi mäta hur ofta användaren av en tjänst fick en "degraderad" upplevelse jämfört med den fullständiga upplevelsen (fullständig återgivning). Det här måttet är användbart för alla feltoleranta tjänster som kan fortsätta att köras i ett degraderat läge när något går fel.
Aktualitet
Färskhet avser hur uppdaterad informationen är i situationer där aktualitet är viktig för kunden (till exempel tjänster som tillhandahåller idrottsresultat eller valresultat). Dessa tjänster anses vara tillförlitliga om de data som de tillhandahåller är aktuella.
Varaktighet
Varaktighet är en annan lite mer nischad tillförlitlighetsaspekt. Om du kör en tjänst som tillhandahåller lagring vet du hur viktigt det är att data som en kund skriver till din tjänst kan läsas senare. Det här är en förväntning på varaktigheten.
Även om detta inte är en fullständig lista över möjligheter, fanns det förhoppningsvis några du inte hade övervägt, och du har utökat din förståelse för tillförlitlighet i processen. Vi tar med oss den här förståelsen till nästa enhet där vi börjar ställa några viktiga frågor om vad exakt vi ska mäta när de kommer till tillförlitlighet.