共用方式為


AksEndpoint 類別

注意

這是實驗性類別,隨時可能會變更。 請參閱 https://aka.ms/azuremlexperimental 以取得詳細資訊。

表示在Azure Kubernetes Service上執行之相同端點後方的 Web 服務版本集合。

而 部署 AksWebservice 具有單一評分端點的單一服務,AksEndpoint 類別可讓您在相同的評分端點後方部署多個 Web 服務版本。 每個 Web 服務版本都可以設定為提供流量百分比,讓您可以以受控制的方式部署模型,例如 A/B 測試。 AksEndpoint 允許從類似 AksWebservice 的模型物件進行部署。

初始化 Webservice 實例。

Webservice 建構函式會擷取與所提供工作區相關聯之 Webservice 物件的雲端標記法。 它會傳回對應至所擷取之 Webservice 物件之特定類型的子類別實例。

繼承
AksEndpoint

建構函式

AksEndpoint(workspace, name)

參數

名稱 Description
workspace
必要

包含要擷取之 Webservice 物件的工作區物件。

name
必要
str

要擷取之 Webservice 物件的 名稱。

變數

名稱 Description
versions

版本名稱至 version 物件的字典。 包含部署為此端點一部分的所有版本。

方法

create_version

在端點中新增具有所提供屬性的新版本。

delete_version

刪除端點中的版本。

deploy_configuration

建立組態物件以部署至 AKS 計算目標。

serialize

將此 Webservice 轉換成 JSON 序列化字典。

update

使用所提供的屬性更新端點。

保留為 [無] 的值將會在此端點中保持不變

update_version

使用所提供的屬性更新端點中的現有版本。

保留為 None 的值將會在此版本中保持不變。

create_version

在端點中新增具有所提供屬性的新版本。

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

參數

名稱 Description
version_name
必要
str

要新增至端點的版本名稱。

autoscale_enabled

是否要在端點中啟用此版本的自動調整。 如果 num_replicas 為 None,則預設為 True。

預設值: None
autoscale_min_replicas
int

在端點中自動調整此版本時要使用的容器數目下限。 預設值為 1

預設值: None
autoscale_max_replicas
int

在端點中自動調整此版本時要使用的容器數目上限。 預設為 10

預設值: None
autoscale_refresh_seconds
int

自動調整程式應該嘗試在端點中調整此版本的頻率。 預設值為 1

預設值: None
autoscale_target_utilization
int

自動調整程式應該嘗試在端點中維護此版本的目標使用率 (百分比為 100) 。 預設值為 70

預設值: None
collect_model_data

是否要在端點中啟用此版本的模型資料收集。 預設為 False

預設值: None
cpu_cores

要配置給端點中此版本的 CPU 核心數目。 可以是十進位。 預設值為 0.1

預設值: None
memory_gb

要配置給端點中此版本的記憶體 (以 GB 為單位) 。 可以是十進位。 預設值為 0.5

預設值: None
scoring_timeout_ms
int

在端點中強制對這個版本的呼叫進行評分的逾時。 預設值為 60000。

預設值: None
replica_max_concurrent_requests
int

每個複本允許此版本的端點並行要求數目上限。 預設值為 1。 除非 Microsoft 技術支援或 Azure Machine Learning 小組的成員指示,否則請勿從預設值 1 變更此設定。

預設值: None
max_request_wait_time
int

要求在傳回 503 錯誤之前,要求會停留在佇列 (以毫秒為單位) 的最大時間量。 預設值為 500。

預設值: None
num_replicas
int

要配置給端點中此版本的容器數目。 沒有預設值,如果未設定此參數,則預設會啟用自動調整程式。

預設值: None
tags

索引鍵值標籤的字典,以提供此端點。

預設值: None
properties

索引鍵值屬性的字典,以提供此端點。 部署之後無法變更這些屬性,不過可以新增新的索引鍵值組。

預設值: None
description
str

提供此端點的描述。

預設值: None
models

要與更新服務一起封裝的 Model 物件清單。

預設值: None
inference_config

InferenceConfig 物件,用來提供所需的模型部署屬性。

預設值: None
gpu_cores
int

要配置給端點中此版本的 GPU 核心數目。 預設為 0。

預設值: None
period_seconds
int

執行活躍度探查的頻率 (以秒為單位)。 預設值為 10 秒。 最小值為 1。

預設值: None
initial_delay_seconds
int

啟動容器之後的秒數,才會起始活躍度探查。 預設值為 310。

預設值: None
timeout_seconds
int

存留時間探查逾時的秒數。預設值為 2 秒。 最小值為 1。

預設值: None
success_threshold
int

在失敗之後,將活躍度探查視為成功的最小連續成功。 預設值為 1。 最小值為 1。

預設值: None
failure_threshold
int

當 Pod 啟動且活躍度探查失敗時,Kubernetes 會在放棄之前先嘗試使用 failureThreshold 時間。 預設值為 3。 最小值為 1。

預設值: None
traffic_percentile

版本在端點中採用的流量。

預設值: None
is_default

是否要在端點中將此版本設為預設版本。 預設為 False。

預設值: None
is_control_version_type

是否要在端點中將此版本設為控制版本。 預設為 False。

預設值: None
cpu_cores_limit

允許此 Webservice 使用的 CPU 核心數目上限。 可以是十進位。

預設值: None
memory_gb_limit

允許使用此 Web 服務) 以 GB 為單位的最大記憶體 (量。 可以是十進位。

預設值: None

例外狀況

類型 Description

delete_version

刪除端點中的版本。

delete_version(version_name)

參數

名稱 Description
version_name
必要
str

要刪除之端點中的版本名稱。

例外狀況

類型 Description

deploy_configuration

建立組態物件以部署至 AKS 計算目標。

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

參數

名稱 Description
autoscale_enabled

是否要在端點中啟用此版本的自動調整。 如果 num_replicas 為 None,則預設值為 True。

預設值: None
autoscale_min_replicas
int

在端點中自動調整此版本時要使用的容器數目下限。 預設值為 1。

預設值: None
autoscale_max_replicas
int

在端點中自動調整此版本時要使用的容器數目上限。 預設值為 10。

預設值: None
autoscale_refresh_seconds
int

自動調整程式應該嘗試在端點中調整此版本的頻率。 預設值為 1。

預設值: None
autoscale_target_utilization
int

自動調整程式應該嘗試在端點中維護此版本的目標使用率 (百分比為 100) 。 預設值為 70。

預設值: None
collect_model_data

是否要在端點中啟用此版本的模型資料收集。 預設為 False。

預設值: None
auth_enabled

是否要在端點中啟用此版本的金鑰驗證。 預設值為 True。

預設值: None
cpu_cores

在端點中配置此版本的 CPU 核心數目。 可以是十進位。 預設值為 0.1

預設值: None
memory_gb

以 GB 為單位的記憶體 (量,) 在端點中配置此版本。 可以是十進位。 預設值為 0.5

預設值: None
enable_app_insights

是否要在端點中啟用此版本的 ApplicationInsights 記錄。 預設為 False。

預設值: None
scoring_timeout_ms
int

在端點中強制執行此版本的評分呼叫逾時。 預設值為 60000

預設值: None
replica_max_concurrent_requests
int

每個複本允許此版本在端點中的最大並行要求數目。 預設值為 1。 除非 Microsoft 技術支援或 Azure Machine Learning 小組的成員指示,否則請勿從預設值 1 變更此設定。

預設值: None
max_request_wait_time
int

要求在傳回 503 錯誤之前,要求在佇列中 (以毫秒為單位的時間上限) 。 預設值為 500。

預設值: None
num_replicas
int

在端點中配置此版本的容器數目。 如果未設定此參數,則預設會啟用自動調整程式。

預設值: None
primary_key
str

要用於此端點的主要驗證金鑰。

預設值: None
secondary_key
str

要用於此端點的次要驗證金鑰。

預設值: None
tags

索引鍵值標籤的字典,以提供此端點。

預設值: None
properties

索引鍵值屬性的字典,以提供此端點。 部署之後無法變更這些屬性,但是可以新增新的索引鍵值組

預設值: None
description
str

提供此端點的描述。

預設值: None
gpu_cores
int

在端點中配置此版本的 GPU 核心數目。 預設為 0。

預設值: None
period_seconds
int

執行活躍度探查的頻率 (以秒為單位)。 預設值為 10 秒。 最小值為 1。

預設值: None
initial_delay_seconds
int

在起始活躍度探查之前,容器啟動後的秒數。 預設值為 310。

預設值: None
timeout_seconds
int

存留時間探查逾時的秒數。預設值為 2 秒。 最小值為 1。

預設值: None
success_threshold
int

失敗之後,會將活躍度探查的最小連續成功次數視為成功。 預設值為 1。 最小值為 1。

預設值: None
failure_threshold
int

當 Pod 啟動時,且即時探查失敗時,Kubernetes 會先嘗試 failureThreshold 時間再放棄。 預設值為 3。 最小值為 1。

預設值: None
namespace
str

要在其中部署此端點的 Kubernetes 命名空間:最多 63 個小寫英數位元 ('a'-'z'、'0'-'9') 和連字號 ('-') 字元。 第一個字元和最後一個字元不能是連字號。

預設值: None
token_auth_enabled

是否要為此端點啟用權杖驗證。 如果啟用此功能,使用者可以使用其 Azure Active Directory 認證來擷取存取權杖,以存取此端點。 預設為 False。

預設值: None
version_name
str

端點中版本的名稱。

預設值: None
traffic_percentile

版本在端點中採用的流量。

預設值: None
compute_target_name
str

要部署的目標計算目標名稱

預設值: None
cpu_cores_limit

允許使用此 Webservice 的最大 CPU 核心數目。 可以是十進位。

預設值: None
memory_gb_limit

允許使用此 Webservice) 以 GB 為單位的最大記憶體 (量。 可以是十進位。

預設值: None

傳回

類型 Description

例外狀況

類型 Description

serialize

將此 Webservice 轉換成 JSON 序列化字典。

serialize()

傳回

類型 Description

此 Webservice 的 JSON 標記法。

例外狀況

類型 Description

update

使用所提供的屬性更新端點。

保留為 [無] 的值將會在此端點中保持不變

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

參數

名稱 Description
auth_enabled

是否要在端點中啟用此版本的金鑰驗證。 預設值為 True。

預設值: None
token_auth_enabled

是否要為此端點啟用權杖驗證。 如果啟用此功能,使用者可以使用其 Azure Active Directory 認證來擷取存取權杖,以存取此端點。 預設為 False。

預設值: None
enable_app_insights

是否要在端點中啟用此版本的 Application Insights 記錄。 預設為 False。

預設值: None
description
str

提供此端點的描述。

預設值: None
tags

索引鍵值標籤的字典,以提供此端點。

預設值: None
properties

索引鍵值屬性的字典,以提供此端點。 部署之後,就無法變更這些屬性,但是可以新增新的索引鍵值組。

預設值: None

例外狀況

類型 Description

update_version

使用所提供的屬性更新端點中的現有版本。

保留為 None 的值將會在此版本中保持不變。

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

參數

名稱 Description
version_name
必要
str

端點中版本的名稱。

autoscale_enabled

是否要在端點中啟用此版本的自動調整。 如果 num_replicas 為 None,則預設值為 True。

預設值: None
autoscale_min_replicas
int

在端點中自動調整此版本時要使用的容器數目下限。 預設值為 1。

預設值: None
autoscale_max_replicas
int

在端點中自動調整此版本時要使用的容器數目上限。 預設值為 10。

預設值: None
autoscale_refresh_seconds
int

自動調整程式應該嘗試在端點中調整此版本的頻率。 預設值為 1

預設值: None
autoscale_target_utilization
int

自動調整程式應該嘗試在端點中維護此版本的目標使用率 (百分比為 100) 。 預設值為 70。

預設值: None
collect_model_data

是否要在端點中啟用此版本的模型資料收集。 預設為 False。

預設值: None
cpu_cores

在端點中配置此版本的 CPU 核心數目。 可以是十進位。 預設值為 0.1

預設值: None
memory_gb

以 GB 為單位的記憶體 (量,) 在端點中配置此版本。 可以是十進位。 預設值為 0.5

預設值: None
scoring_timeout_ms
int

在端點中強制執行對這個版本的呼叫進行評分的逾時。 預設值為 60000。

預設值: None
replica_max_concurrent_requests
int

每個複本允許此版本在端點中的最大並行要求數目。 預設值為 1。 除非 Microsoft 技術支援或 Azure Machine Learning 小組的成員指示,否則請勿從預設值 1 變更此設定。

預設值: None
max_request_wait_time
int

要求在傳回 503 錯誤之前,要求在佇列中 (以毫秒為單位的時間上限) 。 預設值為 500。

預設值: None
num_replicas
int

在端點中配置此版本的容器數目。 如果未設定此參數,則預設會啟用自動調整程式。

預設值: None
tags

索引鍵值標籤的字典,以提供此端點。

預設值: None
properties

索引鍵值屬性的字典,以提供此端點。 部署之後,就無法變更這些屬性,但是可以新增新的索引鍵值組。

預設值: None
description
str

提供此端點的描述

預設值: None
models

使用更新的服務封裝的 Model 物件清單

預設值: None
inference_config

用來提供必要模型部署屬性的 InferenceConfig 物件。

預設值: None
gpu_cores
int

在端點中配置此版本的 GPU 核心數目。 預設為 0。

預設值: None
period_seconds
int

執行活躍度探查的頻率 (以秒為單位)。 預設值為 10 秒。 最小值為 1。

預設值: None
initial_delay_seconds
int

在起始即時探查之前,容器啟動後的秒數。 預設值為 310。

預設值: None
timeout_seconds
int

存留時間探查逾時的秒數。預設值為 2 秒。 最小值為 1。

預設值: None
success_threshold
int

存留時間探查在失敗之後視為成功的最小連續成功。 預設值為 1。 最小值為 1。

預設值: None
failure_threshold
int

當 Pod 啟動且活躍度探查失敗時,Kubernetes 會在放棄之前先嘗試使用 failureThreshold 時間。 預設值為 3。 最小值為 1。

預設值: None
traffic_percentile

版本採用端點的流量。

預設值: None
is_default

是否要在端點中將此版本設為預設版本。 預設為 False。

預設值: None
is_control_version_type

是否要在端點中將此版本設為控制版本。 預設為 False。

預設值: None
cpu_cores_limit

允許使用此 Webservice 的最大 CPU 核心數目。 可以是十進位。

預設值: None
memory_gb_limit

允許使用此 Webservice) 以 GB 為單位的最大記憶體 (量。 可以是十進位。

預設值: None

例外狀況

類型 Description