共用方式為


計算建立速查表

本文旨在為計算建立提供明確且有主見的指導。 透過為工作流程使用正確的計算類型,您可以提高效能並節省成本。

最佳做法 影響 文件
如果您不熟悉 Azure Databricks,請從使用所有一般用途的執行個體類型開始 為工作負載選取適當的執行個體類型可以提高效率。 - 建立叢集
除非不支援所需的功能,否則請使用共用存取模式 多個使用者可以使用 [以共用存取模式計算],並在使用者之間隔離資料。 - 存取模式
如果有足夠的可用性,請使用最新一代執行個體類型 最新一代執行個體類型提供最佳效能和最新功能。 - Azure 執行個體類型
根據您需要工作負載運行的速度,設定隨需和臨時實例的平衡 現成執行個體可節省成本,但如果回收現成執行個體,可能會影響作業的整體執行階段。 - 計算組態建議
根據工作負載執行的作業類型,選擇節點大小和背景工作角色數目 例如,如果預期會有大量隨機作業,則使用大型單一節點而不是多個較小的節點可能更有效率。 - 計算調整大小考量
在具有自動調整設定為 1-4 個工作節點的叢集上執行真空操作,其中每個工作節點有 8 個核心。

選取 8 到 32 個核心之間的驅動程式。 如果您發生記憶體不足 (OOM) 錯誤,請增加驅動程式的大小。
真空語句會在兩個階段發生,第二個階段是驅動程式重。 如果不使用大小合適的叢集,作業可能會導致速度變慢,並且可能不會成功。 - 真空需要的叢集大小為何?
- VACUUM 最佳做法
評估您的批次工作流程是否會受益於 Photon Photon 可加快查詢速度並降低每個工作負載的總成本。 - Photon 優點