共用方式為


計算建立速查表

本文旨在為計算建立提供明確且有主見的指導。 透過為工作流程使用正確的計算類型,您可以提高效能並節省成本。

最佳做法 影響 文件
如果您不熟悉 Azure Databricks,請從使用所有一般用途的執行個體類型開始 為工作負載選取適當的執行個體類型可以提高效率。 - 建立叢集
除非不支援所需的功能,否則請使用共用存取模式 多個使用者可以使用 [以共用存取模式計算],並在使用者之間隔離資料。 - 存取模式
如果有足夠的可用性,請使用最新一代執行個體類型 最新一代執行個體類型提供最佳效能和最新功能。 - Azure 執行個體類型
根據所需的工作負載執行速度,設定隨需執行個體和現成執行個體的平衡 現成執行個體可節省成本,但如果回收現成執行個體,可能會影響作業的整體執行階段。 - 計算組態建議
根據工作負載執行的作業類型,選擇節點大小和背景工作角色數目 例如,如果預期會有大量隨機作業,則使用大型單一節點而不是多個較小的節點可能更有效率。 - 計算調整大小考量
在為其中 1-4 個背景工作角色 (每個背景工作角色有 8 個核心) 設定了自動縮放的叢集上執行 vacuum。

選擇核心數為 8 至 32 的驅動程式。 如果出現記憶體不足 (OOM) 錯誤,請增加驅動程式的大小。
Vacuum 陳述式分兩個階段進行,第二個階段需要大量驅動程式。 如果不使用大小合適的叢集,作業可能會導致速度變慢,並且可能不會成功。 - vacuum 需要多大的叢集?
- VACUUM 最佳做法
評估您的批次工作流程是否會受益於 Photon Photon 可加快查詢速度並降低每個工作負載的總成本。 - Photon 優點