Spickzettel für Terminplanung von Produktionsaufträgen
Dieser Artikel soll eine klare und fundierte Anleitung für die Terminplanung von Produktionsaufträgen bieten. Die Verwendung bewährter Methoden kann dazu beitragen, Kosten zu senken, die Leistung zu verbessern und die Sicherheit zu erhöhen.
Bewährte Methode | Auswirkung | Docs |
---|---|---|
Verwenden von Auftragsclustern für automatisierte Workflows | Kosten: Auftragscluster werden zu niedrigeren Tarifen als interaktive Cluster abgerechnet. | - Erstellen eines Clusters - Allzweck- und Auftragscluster. |
Neu starten von lange ausgeführten Clustern | Sicherheit: Starten Sie Cluster neu, um Patches und Fehlerbehebungen für die Databricks Runtime zu nutzen. | - Einen Cluster neu starten, um ihn mit den neuesten Images zu aktualisieren |
Verwenden von Dienstprinzipalen anstelle von Benutzerkonten zum Ausführen von Produktionsaufträgen | Sicherheit: Wenn Aufträge im Besitz einzelner Benutzer sind, können diese Aufträge nicht mehr ausgeführt werden, wenn diese Benutzer die Organisation verlassen. | - Verwalten von Dienstprinzipalen |
Verwenden von Databricks-Aufträgen für die Orchestrierung wenn möglich | Kosten: Es ist nicht erforderlich, externe Tools zu koordinieren, wenn Sie nur Workloads in Azure Databricks koordinieren. | - Planen und Koordinieren von Workflows |
Verwenden der neuesten LTS-Version von Databricks Runtime | Leistung und Kosten: Azure Databricks verbessert Databricks Runtime immer in Bezug auf Benutzerfreundlichkeit, Leistung und Sicherheit. | - Compute - Databricks-Supportlebenszyklen |
Produktionsdaten nicht im DBFS-Stamm speichern | Sicherheit: Wenn Daten im DBFS-Stamm gespeichert werden, können alle Benutzer darauf zugreifen. | - Was ist DBFS? - Empfehlungen zum Arbeiten mit dem DBFS-Stamm |