Zusammenfassung
Hier finden Sie die wichtigsten Punkte zur Elastizität, die in diesem Modul behandelt wurden:
- VMs und andere Cloudressourcen haben nur selten eine konstante Auslastung. Die Auslastung schwankt – manchmal sogar um mehr als eine Größenordnung im Lauf der Zeit.
- Durch die Anpassung der Computekapazität an Auslastungsspitzen wird die Servicequalität verbessert, aber die Kosten und der Energieverbrauch steigen.
- Als Elastizität wird die Möglichkeit bezeichnet, Ressourcen hinzuzufügen, um größere Auslastungen zu bewältigen, und Ressourcen zu entfernen, wenn die Auslastung sinkt.
- In der Cloud wird Elastizität erreicht, indem Ressourcen wie VMs und Datenbanken skaliert werden.
- Durch das horizontale Skalieren wird die Ressourcenanzahl für einen Task erhöht oder reduziert. Beispielsweise könnte die Anzahl der VMs, die die Benutzer einer Website verarbeiten, von 10 auf 15 erhöht werden.
- Durch das vertikale Skalieren werden vorhandene Ressourcen durch leistungsstärkere oder -schwächere Ressourcen ersetzt. Beispielsweise könnte eine Webserver-VM mit 2 Kernen und 4 GB RAM durch eine VM mit 4 Kernen und 8 GB RAM ersetzt werden.
- Durch das Skalieren von Ressourcen gemäß der Nachfrage bleibt die Ressourcenauslastung relativ konstant, während die Kosten gesenkt werden und der Energieverbrauch effizienter wird.
- Durch die automatische Skalierung können Ressourcen anhand von Regeln oder Richtlinien eines Cloudadministrators skaliert werden. Diese Regeln und Richtlinien können zeitbasiert, metrikbasiert oder beides sein. Ein Beispiel für eine metrikbasierte automatische Skalierung ist die Onlineschaltung zusätzlicher Instanzen, wenn die durchschnittliche CPU-Auslastung einen festgelegten Schwellenwert wie 70 % erreicht.
- Die zeitbasierte automatische Skalierung, die auch als geplante automatische Skalierung bezeichnet wird, ist besonders für zyklische und vorhersagbare Auslastungen geeignet.
- Die metrikbasierte automatische Skalierung kann vorhersagbare und nicht vorhersagbare Auslastungen verarbeiten.
- Ein effektiver Lastenausgleich ist für die Implementierung skalierbarer Clouddienste entscheidend.
- Beim Lastenausgleich werden unterschiedliche Algorithmen (z. B. Roundrobinalgorithmen und hashbasierte Algorithmen) für die Verteilung der Auslastung verwendet.
- Manche Lastenausgleiche versuchen, Anforderungen mithilfe von Metriken wie der Anforderungsausführungsdauer und der CPU-Auslastung intelligenter zu verteilen.
- Ein Lastenausgleich kann auch die Verfügbarkeit erhöhen, indem die Integrität der Back-End-Ressourcen überwacht und so erkannt wird, wann diese Ressourcen nicht verfügbar sind.
- Da ein einzelner Lastenausgleich auch einen Single Point of Failure darstellt, werden häufig mindestens zwei Lastenausgleiche bereitgestellt.
- Das serverlose Computing bietet Vorteile wie nutzungsbasierte Preise, automatische Skalierbarkeit und geringere Verwaltungskosten.
- Serverlose Funktionen sind ein Beispiel für serverloses Computing. Mit diesen können Sie Code in die Cloud hochladen und festlegen, wann diese ausgeführt wird.
- Ein weiteres Beispiel sind serverlose Workflows, mit denen Sie Geschäftsworkflows (in der Regel über codefreie grafische Designer) und deren Ausführungszeitpunkt festlegen können.
- Das serverlose Computing kann auch auf Datenbanken angewendet werden, die dann gemäß der Anforderungen skaliert werden.