Sdílet prostřednictvím


Stručná nápověda k plánování produkčních úloh

Cílem tohoto článku je poskytnout jasné a názorné pokyny pro plánování pracovních míst v produkčním prostředí. Použití osvědčených postupů může pomoct snížit náklady, zlepšit výkon a zvýšit zabezpečení.

Osvědčený postup Dopad Dokumenty
Použití clusterů úloh pro automatizované pracovní postupy Náklady: Clustery úloh se účtují nižším tempem než interaktivní clustery. - Vytvoření clusteru
- Clustery pro všechny účely a úlohy.
Restartování dlouhotrvajících clusterů Zabezpečení: Restartujte clustery, abyste mohli využívat opravy a opravy chyb v Databricks Runtime. - Restartujte cluster a aktualizujte ho nejnovějšími imagemi.
Použití instančních objektů místo uživatelských účtů ke spouštění produkčních úloh Zabezpečení: Pokud jsou úlohy vlastněné jednotlivými uživateli, když tito uživatelé opustí organizaci, mohou tyto úlohy přestat běžet. - Správa instančních objektů
Použití úloh Databricks pro orchestraci, kdykoli je to možné Náklady: K orchestraci úloh v Azure Databricks nemusíte používat externí nástroje. - Plánování a orchestrace pracovních postupů
Použití nejnovější verze LTS databricks Runtime Výkon a náklady: Azure Databricks neustále vylepšuje Databricks Runtime kvůli použitelnosti, výkonu a zabezpečení. - Výpočetní služby
- Životní cyklus podpory Databricks
Neukládejte produkční data v kořenovém adresáři DBFS Zabezpečení: Když jsou data uložená v kořenovém adresáři DBFS, mají k němu přístup všichni uživatelé. - Co je DBFS?
- Doporučení pro práci s kořenovým adresářem DBFS