Guida rapida alla schedulazione della produzione
Questo articolo mira a fornire indicazioni chiare e autorevoli per la pianificazione della produzione. L'uso delle procedure consigliate consente di ridurre i costi, migliorare le prestazioni e rafforzare la sicurezza.
Procedure consigliate | Impatto | Documenti |
---|---|---|
Usare cluster di processi per flussi di lavoro automatizzati | Costo: i cluster di processi vengono fatturati a tariffe inferiori rispetto ai cluster interattivi. | |
Riavviare i cluster a lungo termine | Sicurezza: riavviare i cluster per sfruttare le patch e le correzioni di bug in Databricks Runtime. | |
Usare le entità servizio anziché gli account utente per eseguire processi di produzione | Sicurezza: se i processi sono di proprietà di singoli utenti, quando gli utenti lasciano l'organizzazione, questi processi potrebbero interrompere l'esecuzione. | |
Usare i Jobs di Databricks per l'orchestrazione quando possibile | Costo: non è necessario usare strumenti esterni per orchestrare se si orchestrano solo i carichi di lavoro in Azure Databricks. | |
Usare la versione LTS più recente di Databricks Runtime | Prestazioni e costi: Azure Databricks migliora sempre Databricks Runtime per l'usabilità, le prestazioni e la sicurezza. | |
Non archiviare i dati di produzione nella radice DBFS | Sicurezza: quando i dati vengono archiviati nella radice DBFS, tutti gli utenti possono accedervi. |