Stručná nápověda k plánování produkčních úloh
Cílem tohoto článku je poskytnout jasné a názorné pokyny pro plánování pracovních míst v produkčním prostředí. Použití osvědčených postupů může pomoct snížit náklady, zlepšit výkon a zvýšit zabezpečení.
Osvědčený postup | Dopad | Dokumenty |
---|---|---|
Použití clusterů úloh pro automatizované pracovní postupy | Náklady: Clustery úloh se účtují nižším tempem než interaktivní clustery. | - Vytvoření clusteru - Clustery pro všechny účely a úlohy. |
Restartování dlouhotrvajících clusterů | Zabezpečení: Restartujte clustery, abyste mohli využívat opravy a opravy chyb v Databricks Runtime. | - Restartujte cluster a aktualizujte ho nejnovějšími imagemi. |
Použití instančních objektů místo uživatelských účtů ke spouštění produkčních úloh | Zabezpečení: Pokud jsou úlohy vlastněné jednotlivými uživateli, když tito uživatelé opustí organizaci, mohou tyto úlohy přestat běžet. | - Správa instančních objektů |
Použití úloh Databricks pro orchestraci, kdykoli je to možné | Náklady: K orchestraci úloh v Azure Databricks nemusíte používat externí nástroje. | - Plánování a orchestrace pracovních postupů |
Použití nejnovější verze LTS databricks Runtime | Výkon a náklady: Azure Databricks neustále vylepšuje Databricks Runtime kvůli použitelnosti, výkonu a zabezpečení. | - Výpočetní služby - Životní cyklus podpory Databricks |
Neukládejte produkční data v kořenovém adresáři DBFS | Zabezpečení: Když jsou data uložená v kořenovém adresáři DBFS, mají k němu přístup všichni uživatelé. | - Co je DBFS? - Doporučení pro práci s kořenovým adresářem DBFS |