共用方式為


許多小型Spark作業

如果您看到許多小型作業,您可能會對相對較小的數據執行許多作業(<10GB)。 小型作業只需要幾秒鐘的時間,但是它們加起來,而每個作業所花費的額外負荷時間也會加起來。

加速小型作業的最佳方法是平行執行多個作業。 Delta Live Tables 自動為您執行此動作。

其他選項包括:

  • 使用 多重工作作業,將作業分成多個筆記本,並在相同的叢集上平行執行。
  • 如果您的所有查詢都是以 SQL 撰寫,請使用 SQL 倉儲。 SQL 倉儲針對並行執行許多查詢的擴展能力很好,因為它們是為了這種類型的工作負載而設計的。
  • 參數化 筆記本,並使用每個工作 平行執行筆記本。 使用 並行 來設定平行處理層級。 這非常適合用於無伺服器計算