Leistungseffizienz für das Data Lakehouse
In diesem Artikel werden die Architekturprinzipien der Leistungseffizienz Säule behandelt, die sich auf die Fähigkeit eines Systems beziehen, sich an Laständerungen anzupassen.
Prinzipien der Leistungseffizienz
Verwenden von serverlosen Architekturen
Serverlose Architekturen erfordern keine Kunden, computerbasierte Infrastruktur in der Cloud zu betreiben und aufrechtzuerhalten. Dadurch wird der Betriebsaufwand für die Verwaltung der Cloudinfrastruktur beseitigt und die Transaktionskosten reduziert, da verwaltete Dienste im Cloudmaßstab funktionieren. Sie bieten auch sofortige Verfügbarkeit, sofort einsatzbereite Sicherheit und erfordern minimale Konfiguration oder Verwaltung.
Entwerfen von Workloads für die Leistung
Bei wiederkehrenden Workloads, z. B. bei datentechnischen Pipelines, sollte die Leistung kein Randthema sein. Daten müssen folgendes sein:
- Effizientes Lesen aus dem Objektspeicher.
- effizient transformiert werden.
- effizient für die Nutzung veröffentlicht werden.
Darüber hinaus verwenden die meisten Pipelines oder Verbrauchsmuster eine Kette von Systemen. Um die bestmögliche Leistung zu erzielen, muss die gesamte Kette berücksichtigt und für die beste Leistung ausgewählt werden.
Ausführen von Leistungstests im Rahmen der Entwicklung
Jeder Entwicklungsworkload muss kontinuierlichen Leistungstests unterzogen werden. Die Tests stellen sicher, dass sich änderungen an der Codebasis nicht negativ auf die Leistung der Workload auswirken. Richten Sie einen regelmäßigen Zeitplan für die Ausführung von Tests ein. Führen Sie den Test als Teil eines geplanten Ereignisses oder als Teil einer fortlaufenden Integrationsbuildpipeline aus.
Richten Sie Leistungsbaselines ein und bestimmen Sie die aktuelle Effizienz der Workloads und die unterstützende Infrastruktur. Das Messen der Leistung anhand von Basiswerten kann Strategien zur Verbesserung bieten und bestimmen, ob die Anwendung geschäftsziele erfüllt.
Identifizieren Sie Engpässe, die sich auf die Leistung auswirken können. Diese Engpässe können durch Codefehler oder Fehlkonfigurationen eines Diensts verursacht werden. In der Regel werden Engpässe schlechter, da die Last steigt.
Überwachen der Leistung
Stellen Sie sicher, dass Ressourcen und Dienste barrierefrei bleiben und dass die Leistung den Anforderungen der Benutzer oder der Arbeitsauslastung entspricht. Mithilfe der Überwachung können Sie Engpässe oder unzureichende Ressourcen identifizieren, Konfigurationen optimieren und Pipeline-/Workload-Fehler erkennen.