Erweitertes Verständnis der Zuverlässigkeit
Damit wir die Überwachung zum Optimieren der Zuverlässigkeit effektiv einrichten können, benötigen wir ein wirklich gutes Verständnis davon, was gemessen werden könnte. Wir hoffen in dieser Einheit einige Möglichkeiten vorzustellen, die das Verständnis der Zuverlässigkeit erweitern können.
Sehen wir uns nun einige Aspekte der Zuverlässigkeit an:
Verfügbarkeit
Wenn Menschen über Zuverlässigkeit sprechen, tendieren Sie dazu, mit der Verfügbarkeit zu beginnen. Ist das System „aktiv“ oder „inaktiv“? Können andere Ihre Website oder Ihren Dienst erreichen? Können sie das Produkt verwenden, wenn sie es erwarten? Dies ist aus der Perspektive externer Kunden und interner Benutzer, die von Ihrem Dienst abhängig sind, wichtig. Die Verfügbarkeit ist wahrscheinlich der Aspekt der Zuverlässigkeit, an dem Sie die meiste Zeit arbeiten werden. Dies ist ein guter Ausgangspunkt für die Erörterung der Zuverlässigkeit, aber es ist nur einer der Aspekte.
Latency
Die Wartezeit (Latenz) bezieht sich auf die Dauer der Verzögerung zwischen einer Anforderung und einer Antwort. Möglicherweise haben Sie die Catchphrase „slow is the new down“ gehört. Personen verlangen schnelle Leistung, und sie verlieren die Geduld mit einer Website oder einem Dienst, der sie warten lässt. Sie verfügen über gute Untersuchungsergebnisse, die zeigen, dass sich die Kunden mit hoher Wahrscheinlichkeit für die Konkurrenz entscheiden, wenn eine Website ihren Erwartungen an die Antwortzeit nicht gerecht wird.
Throughput
Der Durchsatz ist ein Maß für Verarbeitungsfrequenz, beispielsweise die Anzahl Transaktionen, die von einer Website, einer Anwendung oder einem Dienst innerhalb eines bestimmten Zeitraums erfolgreich verarbeitet werden. Dies ist besonders wichtig, wenn Pipelines oder Batchverarbeitungssysteme ausgeführt werden. Wenn eine Pipeline oder ein Batchverarbeitungssystem nicht schnell genug verarbeitet und unsere Erwartungen nicht erfüllt werden, gilt dieser Prozess nicht als zuverlässig.
Coverage
Die Abdeckung bezieht sich darauf, wie viele der zu verarbeitenden Daten tatsächlich verarbeitet wurden. Dies ist wiederum auf den Gedanken rückführbar, dass wir auf diese Weise im Rahmen der Bestimmung unserer Zuverlässigkeit messen, inwiefern wir den Erwartungen gerecht werden.
Richtigkeit
Ein Aspekt der Zuverlässigkeit, der häufig übersehen wird, ist die „Richtigkeit“. Hat der für die Daten ausgeführte Prozess das richtige oder erwartete Ergebnis zur Folge? Dies ist ein wichtiger Faktor bei der Überwachung der Zuverlässigkeit. Ganz gleich, wie schnell oder „ständig verfügbar“ Ihr Dienst oder Ihre Website ist: Wenn falsche Ergebnisse zurückgegeben werden, macht dies in den Augen Ihrer Kunden keinen zuverlässigen Eindruck. Die Überwachung der Richtigkeit von Ergebnissen ist ein wichtiger Bestandteil der Überwachung der Zuverlässigkeit.
Genauigkeit
Die Genauigkeit wird in diesem Kontext am besten anhand eines Beispiels verdeutlicht. Nehmen wir an, Sie besuchen die Homepage einer Video Streaming Site. Diese Seite besteht aus separaten Abschnitten: Neue Releases, Personalisierte Empfehlungen, die 10 meistgesehenen Filme usw. Jeder dieser Abschnitte wird wahrscheinlich von einem separaten Backend-Dienst generiert. Wenn einer dieser Dienste ausfällt, z. B. die Personalisierungs-Engine, erhalten Besucher der Website nicht die Meldung „Diese Site ist leider inaktiv“ und keine leere Seite. Stattdessen wird eine Homepage angezeigt, auf der dieser Abschnitt entfernt oder durch statischen Inhalt ersetzt ist. Aus technischer Sicht würden wir sagen, dass sie anstelle der vorgesehenen vollständigen Seite eine „herabgestufte“ oder reduzierte Benutzererfahrung erhalten.
Bei der Messung der Genauigkeit würden wir messen, wie oft der Benutzer eines Dienstes eine „herabgestufte“ Benutzererfahrung im Verhältnis zur vollständigen Erfahrung (vollständige Genauigkeit) erhalten hat. Diese Messung ist für alle fehlertoleranten Dienste nützlich, die in einem herabgestuften Modus weiter ausgeführt werden können, wenn etwas schiefgeht.
Aktualität
„Freshness“ (Aktualität) bezieht sich darauf, wie aktuell die Informationen in Situationen sind, in denen Aktualität für den Kunden wichtig sind (z. B. Dienste, die über Sportergebnisse oder Wahlergebnisse informieren). Diese Dienste gelten als zuverlässig, wenn die von ihnen bereitgestellten Daten auf dem neuesten Stand gehalten werden.
Dauerhaftigkeit
Die Dauerhaftigkeit ist ein weiterer Nischenaspekt der Zuverlässigkeit. Wenn Sie einen Dienst ausführen, der Speicher bereitstellt, wissen Sie, wie wichtig es ist, dass Daten, die ein Kunde in Ihren Dienst schreibt, später gelesen werden können. Dies beschreibt eine Erwartung an die Dauerhaftigkeit.
Obwohl es sich hierbei nicht um eine vollständige Liste an Möglichkeiten handelt, waren hoffentlich einige für Sie neu und konnten Ihr Verständnis in Bezug auf Zuverlässigkeit im Prozess erweitern. Wir werden dieses Verständnis in die nächste Einheit einfließen lassen, in der wir einige wichtige Fragen bezüglich der zu messenden Größen hinsichtlich der Zuverlässigkeit stellen möchten.