DatabricksCluster 類別
定義 Databricks 叢集資訊以用於 DatabricksSection 。
初始 化。
- 繼承
-
azureml._base_sdk_common.abstract_run_config_element._AbstractRunConfigElementDatabricksCluster
建構函式
DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)
參數
名稱 | Description |
---|---|
existing_cluster_id
|
Databricks 工作區上現有互動式叢集的叢集識別碼。 如果指定此參數,則不應該指定其他任何參數。 預設值: None
|
spark_version
|
Databricks 執行叢集的 Spark 版本。 範例:「10.4.x-scala2.12」。 預設值: None
|
node_type
|
Databricks 執行叢集的 Azure VM 節點類型。 範例:「Standard_D3_v2」。 預設值: None
|
instance_pool_id
|
叢集必須連結至的實例集區識別碼。 預設值: None
|
num_workers
|
Databricks 執行叢集的背景工作角色數目。 如果指定此參數, 預設值: None
|
min_workers
|
自動調整 Databricks 叢集的背景工作角色數目下限。 預設值: None
|
max_workers
|
自動調整 Databricks 執行叢集的背景工作角色數目。 預設值: None
|
spark_env_variables
|
dict(<xref:{str:str}>)
Databricks 執行叢集的 Spark 環境變數。 預設值: None
|
spark_conf
|
dict(<xref:{str:str}>)
Databricks 執行的叢集的 Spark 組態。 預設值: None
|
init_scripts
|
已取代。 Databricks 宣佈儲存在 DBFS 中的 init 腳本將在 2023 年 12 月 1 日後停止運作。 若要減輕此問題,請 1) 在 databricks 中使用全域 init 腳本,下列 https://learn.microsoft.com/azure/databricks/init-scripts/global 2) 批註化 AzureML databricks 步驟中的init_scripts行。 預設值: None
|
cluster_log_dbfs_path
|
需要傳遞叢集記錄的 DBFS 路徑。 預設值: None
|
permit_cluster_restart
|
如果指定existing_cluster_id,此參數會指出是否可以代表使用者重新開機叢集。 預設值: None
|
方法
validate |
驗證指定的 Databricks 叢集詳細資料。 驗證會檢查提供的參數類型,以及是否提供正確的參數組合。 例如,您必須指定 |
validate
驗證指定的 Databricks 叢集詳細資料。
驗證會檢查提供的參數類型,以及是否提供正確的參數組合。 例如,您必須指定 existing_cluster_id
或指定叢集參數的其餘部分。 如需詳細資訊,請參閱建構函式參數定義。
validate()
例外狀況
類型 | Description |
---|---|
class:azureml.exceptions.UserErrorException
|