SKLearn 類別
在 Scikit-learn 實驗中建立定型的估算器。
已淘汰。 使用 ScriptRunConfig 物件搭配您自己的已定義環境或AzureML-Tutorial策劃的環境。 如需使用 ScriptRunConfig 設定 SKLearn 實驗執行的簡介,請參閱 使用 Azure Machine Learning 大規模定型 scikit-learn 模型。
此估算器僅支援單一節點 CPU 定型。
支援的版本:0.20.3
初始化 Scikit-learn 估算器。
- 繼承
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
建構函式
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
參數
名稱 | Description |
---|---|
source_directory
必要
|
包含實驗設定檔的本機目錄。 |
compute_target
必要
|
將進行定型的計算目標。 這可以是 物件或字串 「local」。 |
vm_size
必要
|
將針對定型建立之計算目標的 VM 大小。 支援的值:任何 Azure VM 大小。 |
vm_priority
必要
|
將針對定型建立之計算目標的 VM 優先順序。 如果未指定,則會使用 'dedicated'。 支援的值:'dedicated' 和 'lowpriority'。 只有在輸入中指定 時 |
entry_script
必要
|
字串,表示用來開始定型之檔案的相對路徑。 |
script_params
必要
|
命令列引數的字典,用來傳遞至 中指定的 |
custom_docker_image
必要
|
要用來定型之映射的 Docker 映射名稱。 如果未設定,則會使用預設 CPU 型映射作為基底映射。 |
image_registry_details
必要
|
Docker 映射登錄的詳細資料。 |
user_managed
必要
|
指定 Azure ML 是否重複使用現有的 Python 環境。 False 表示 AzureML 會根據 conda 相依性規格建立 Python 環境。 |
conda_packages
必要
|
字串清單,表示要新增至實驗 Python 環境的 conda 套件。 |
pip_packages
必要
|
字串清單,表示要新增至實驗 Python 環境的 pip 套件。 |
conda_dependencies_file_path
必要
|
字串,表示 conda 相依性 yaml 檔案的相對路徑。
如果指定,Azure ML 將不會安裝任何架構相關套件。
這可與 參數搭配 |
pip_requirements_file_path
必要
|
字串,表示 pip 需求文字檔的相對路徑。
這可與 參數搭配 |
conda_dependencies_file
必要
|
字串,表示 conda 相依性 yaml 檔案的相對路徑。
如果指定,Azure ML 將不會安裝任何架構相關套件。
這可與 參數搭配 |
pip_requirements_file
必要
|
字串,表示 pip 需求文字檔的相對路徑。
這可與 參數搭配 |
environment_variables
必要
|
環境變數名稱和值的字典。 這些環境變數會在執行使用者指令碼的程序上設定。 |
environment_definition
必要
|
實驗的環境定義包括 PythonSection、DockerSection 和環境變數。 任何未透過其他參數直接公開至估算器建構的環境選項,都可以使用 |
inputs
必要
|
做為輸入的 或 DatasetConsumptionConfig 物件清單 DataReference 。 |
shm_size
必要
|
Docker 容器的共用記憶體區塊大小。 如果未設定,則會使用預設azureml.core.environment._DEFAULT_SHM_SIZE。 |
resume_from
必要
|
包含要繼續實驗之檢查點或模型檔案的資料路徑。 |
max_run_duration_seconds
必要
|
執行所允許的最大時間。 如果執行時間超過此值,Azure ML 會嘗試自動取消執行。 |
framework_version
必要
|
要用來執行定型程式碼的 Scikit-learn 版本。
|
source_directory
必要
|
包含實驗設定檔的本機目錄。 |
compute_target
必要
|
將進行定型的計算目標。 這可以是 物件或字串 「local」。 |
vm_size
必要
|
將針對定型建立之計算目標的 VM 大小。 支援的值:任何 Azure VM 大小。 |
vm_priority
必要
|
將針對定型建立之計算目標的 VM 優先順序。 如果未指定,則會使用 'dedicated'。 支援的值:'dedicated' 和 'lowpriority'。 只有在輸入中指定 時 |
entry_script
必要
|
字串,表示用來開始定型之檔案的相對路徑。 |
script_params
必要
|
命令列引數的字典,用來傳遞至 中指定的 |
use_docker
必要
|
布林值,指出執行實驗的環境是否應該以 Docker 為基礎。 |
custom_docker_image
必要
|
要用來定型之映射的 Docker 映射名稱。 如果未設定,則會使用預設 CPU 型映射作為基底映射。 |
image_registry_details
必要
|
Docker 映射登錄的詳細資料。 |
user_managed
必要
|
指定 Azure ML 是否重複使用現有的 Python 環境。 False 表示 AzureML 會根據 conda 相依性規格建立 Python 環境。 |
conda_packages
必要
|
字串清單,表示要新增至實驗 Python 環境的 conda 套件。 |
pip_packages
必要
|
字串清單,表示要新增至實驗 Python 環境的 pip 套件。 |
conda_dependencies_file_path
必要
|
字串,表示 conda 相依性 yaml 檔案的相對路徑。 如果指定,Azure ML 將不會安裝任何架構相關套件。
這可與 參數搭配 |
pip_requirements_file_path
必要
|
字串,表示 pip 需求文字檔的相對路徑。
這可與 參數搭配 |
conda_dependencies_file
必要
|
字串,表示 conda 相依性 yaml 檔案的相對路徑。 如果指定,Azure ML 將不會安裝任何架構相關套件。
這可與 參數搭配 |
pip_requirements_file
必要
|
字串,表示 pip 需求文字檔的相對路徑。
這可與 參數搭配 |
environment_variables
必要
|
環境變數名稱和值的字典。 這些環境變數會在執行使用者指令碼的程序上設定。 |
environment_definition
必要
|
實驗的環境定義包括 PythonSection、DockerSection 和環境變數。 任何未透過其他參數直接公開至估算器建構的環境選項,都可以使用 |
inputs
必要
|
azureml.data.data_reference的清單。要做為輸入的 DataReference 物件。 |
shm_size
必要
|
Docker 容器的共用記憶體區塊大小。 如果未設定,則會使用預設azureml.core.environment._DEFAULT_SHM_SIZE。 |
resume_from
必要
|
包含要繼續實驗之檢查點或模型檔案的資料路徑。 |
max_run_duration_seconds
必要
|
執行的最大允許時間。 如果執行時間超過此值,Azure ML 將會嘗試自動取消執行。 |
framework_version
必要
|
要用於執行定型程式碼的 Scikit-learn 版本。
|
_enable_optimized_mode
必要
|
使用預先建置的架構映射啟用累加環境建置,以加快環境準備速度。 預先建置的架構映射是以預先安裝架構相依性的 Azure ML 預設 CPU/GPU 基底映射為基礎所建置。 |
_disable_validation
必要
|
在執行提交之前停用腳本驗證。 預設值為 True。 |
_show_lint_warnings
必要
|
顯示腳本 linting 警告。 預設值是 False。 |
_show_package_warnings
必要
|
顯示套件驗證警告。 預設值是 False。 |
備註
提交定型作業時,Azure ML 會在 Docker 容器內的 conda 環境中執行腳本。 SKLearn 容器已安裝下列相依性。
相依性 |Scikit-learn 0.20.3 |———————- |—————– |Python |3.6.2 |azureml-defaults |最新 |IntelMpi |2018.3.222 |scikit-learn |0.20.3 |numpy |1.16.2 |miniconda |4.5.11 |scipy |1.2.1 |joblib |0.13.2 |git |2.7.4 |
Docker 映射會擴充 Ubuntu 16.04。
如果您需要安裝其他相依性,您可以使用 pip_packages
或 conda_packages
參數,也可以提供 pip_requirements_file
或 conda_dependencies_file
檔案。 或者,您可以建置自己的映射,並將 參數傳遞 custom_docker_image
至估算器建構函式。
屬性
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'