Freigeben über


AksEndpointDeploymentConfiguration Klasse

Hinweis

Dies ist eine experimentelle Klasse, die jederzeit geändert werden kann. Unter https://aka.ms/azuremlexperimental finden Sie weitere Informationen.

Stellt Informationen zur Bereitstellungskonfiguration für einen Dienst dar, der auf Azure Kubernetes Service bereitgestellt wird

Erstellt ein AksEndpointDeploymentConfiguration-Objekt mithilfe der deploy_configuration-Methode der AksEndpoint-Klasse

Initialisieren Sie ein Konfigurationsobjekt für die Bereitstellung eines Endpunkts in einem AKS-Computeziel.

Vererbung
AksEndpointDeploymentConfiguration

Konstruktor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parameter

Name Beschreibung
autoscale_enabled
Erforderlich

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ (Keine) ist.

autoscale_min_replicas
Erforderlich
int

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
Erforderlich
int

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10.

autoscale_refresh_seconds
Erforderlich
int

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
Erforderlich
int

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

collect_model_data
Erforderlich

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
Erforderlich

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
Erforderlich

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1

memory_gb
Erforderlich

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.

enable_app_insights
Erforderlich

Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert lautet „False“.

scoring_timeout_ms
Erforderlich
int

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

replica_max_concurrent_requests
Erforderlich
int

Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.

max_request_wait_time
Erforderlich
int

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

num_replicas
Erforderlich
int

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

primary_key
Erforderlich
str

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

secondary_key
Erforderlich
str

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

tags
Erforderlich

Wörterbuch der Schlüsselwerttags für diesen Webdienst

properties
Erforderlich

Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.

description
Erforderlich
str

Eine Beschreibung für diesen Webdienst

gpu_cores
Erforderlich
int

Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.

period_seconds
Erforderlich
int

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
Erforderlich
int

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden Der Standardwert ist 310.

timeout_seconds
Erforderlich
int

Die Anzahl der Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

success_threshold
Erforderlich
int

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
Erforderlich
int

Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.

namespace
Erforderlich
str

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.

token_auth_enabled
Erforderlich

Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

version_name
Erforderlich
str

Der Name der Version in einem Endpunkt.

traffic_percentile
Erforderlich

Die Menge des Datenverkehrs, den die Version in einem Endpunkt empfängt.

cpu_cores_limit
Erforderlich

Die maximale Anzahl der CPU-Kerne, die dieser Webdienst verwenden darf. Kann eine Dezimalzahl sein.

memory_gb_limit
Erforderlich

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

autoscale_enabled
Erforderlich

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ (Keine) ist.

autoscale_min_replicas
Erforderlich
int

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

autoscale_max_replicas
Erforderlich
int

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10.

autoscale_refresh_seconds
Erforderlich
int

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

autoscale_target_utilization
Erforderlich
int

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

collect_model_data
Erforderlich

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

auth_enabled
Erforderlich

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

cpu_cores
Erforderlich

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1

memory_gb
Erforderlich

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.

enable_app_insights
Erforderlich

Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert lautet „False“.

scoring_timeout_ms
Erforderlich
int

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

replica_max_concurrent_requests
Erforderlich
int

Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.

max_request_wait_time
Erforderlich
int

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

num_replicas
Erforderlich
int

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

primary_key
Erforderlich
str

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

secondary_key
Erforderlich
str

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

tags
Erforderlich

Wörterbuch der Schlüsselwerttags für diesen Webdienst

properties
Erforderlich

Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.

description
Erforderlich
str

Eine Beschreibung für diesen Webdienst

gpu_cores
Erforderlich
int

Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.

period_seconds
Erforderlich
int

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

initial_delay_seconds
Erforderlich
int

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden Der Standardwert ist 310.

timeout_seconds
Erforderlich
int

Die Anzahl der Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

success_threshold
Erforderlich
int

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird Der Standardwert lautet 1. Der Mindestwert ist 1.

failure_threshold
Erforderlich
int

Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.

namespace
Erforderlich
str

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.

token_auth_enabled
Erforderlich

Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

version_name
Erforderlich
str

Der Name der Version in einem Endpunkt.

traffic_percentile
Erforderlich

Die Menge des Datenverkehrs, den die Version in einem Endpunkt empfängt.

compute_target_name
Erforderlich
str

Der Name des Computeziels, in dem die Bereitstellung erfolgen soll

cpu_cores_limit
Erforderlich

Die maximale Anzahl von CPU-Kernen, die von diesem Webdienst verwendet werden dürfen. Kann eine Dezimalzahl sein.

memory_gb_limit
Erforderlich

Die maximale Arbeitsspeichermenge (in GB), die von diesem Webdienst verwendet werden darf. Kann eine Dezimalzahl sein.

Variablen

Name Beschreibung
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Gibt an, ob die automatische Skalierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“, wenn num_replicas „None“ (Keine) ist.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Die Mindestanzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert lautet 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Die maximale Anzahl von Containern, die bei der automatischen Skalierung dieses Webdiensts verwendet werden sollen. Der Standardwert ist 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Gibt an, wie oft die Autoskalierung versuchen soll, diesen Webdienst zu skalieren. Der Standardwert lautet 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

Die Zielauslastung (in Prozent bis 100), die die Autoskalierung für den Webdienst nach Möglichkeit aufrechterhalten soll. Der Standardwert ist 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Gibt an, ob die Modelldatensammlung für diesen Webdienst aktiviert werden soll. Der Standardwert lautet „False“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Gibt an, ob die Authentifizierung für diesen Webdienst aktiviert werden soll. Der Standardwert ist „True“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Die Anzahl von CPU-Kernen, die für diesen Webdienst zugeordnet werden sollen. Kann eine Dezimalzahl sein. Der Standardwert ist 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Menge an Arbeitsspeicher (in GB), die für diesen Webdienst zugeordnet werden soll. Kann eine Dezimalzahl sein. Der Standardwert ist „0.5“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Gibt an, ob für den Webdienst die Application Insights-Protokollierung aktiviert werden soll. Der Standardwert lautet „False“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Eine Zeitüberschreitung, die für Bewertungsaufrufe an diesen Webdienst erzwungen wird. Der Standardwert ist 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Die maximal zulässige Anzahl gleichzeitiger Anforderungen pro Replikat für diesen Webdienst. Der Standardwert lautet 1. Ändern Sie diese Einstellung nicht vom Standardwert 1, es sei denn, dies wird vom technischen Support von Microsoft oder einem Mitglied Azure Machine Learning angeordnet.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Die maximale Zeitspanne, die eine Anforderung in der Warteschlange verbleibt (in Millisekunden), bevor der Fehler 503 zurückgegeben wird. Standardwerte auf 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Die Anzahl von Containern, die für diesen Webdienst zugeordnet werden sollen. Für diese gibt es keinen Standardwert. Wenn dieser Parameter nicht festgelegt wird, wird die Autoskalierung automatisch aktiviert.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Ein primärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Ein sekundärer Authentifizierungsschlüssel, der für diesen Webdienst verwendet werden soll.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Wörterbuch der Schlüsselwerttags für diesen Webdienst

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Wörterbuch mit Schlüsselwerteigenschaften für diesen Webdienst Diese Eigenschaften können nach der Bereitstellung nicht mehr geändert werden. Es können jedoch neue Schlüssel-Wert-Paare hinzugefügt werden.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Eine Beschreibung für diesen Webdienst

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Die Anzahl der GPU-Kerne, die für diesen Webdienst zuzuordnen sind. Der Standardwert ist 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Gibt an, wie häufig (in Sekunden) ein Livetest durchgeführt werden soll. Der Standardwert ist 10 Sekunden. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Die Anzahl der Sekunden, die nach dem Start des Containers vergehen, bevor Livetests initiiert werden Der Standardwert ist 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Die Anzahl der Sekunden, nach denen das Zeitlimit für den Livetest überschritten ist. Der Standardwert ist 2 Sekunden. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Die Anzahl der Erfolge, die mindestens aufeinander folgen müssen, damit ein Livetest nach einem Fehler wieder als erfolgreich betrachtet wird Der Standardwert lautet 1. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Wenn ein Pod startet und der Livetest nicht erfolgreich ist, führt Kubernetes ihn so oft aus, wie von failureThreshold angegeben, bevor der Vorgang abgebrochen wird. Der Standardwert ist 3. Der Mindestwert ist 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Der Kubernetes-Namespace, in dem dieser Webdienst bereitgestellt werden soll: bis zu 63 alphanumerische Kleinbuchstaben (a–z, 0–9) und Bindestriche (-). Als erstes und letztes Zeichen dürfen keine Bindestriche verwendet werden.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Gibt an, ob für diesen Webdienst die Azure Active Directory-Authentifizierung aktiviert werden soll. Ist diese Option aktiviert, können Benutzer auf diesen Webdienst zugreifen, indem sie ein Zugriffstoken mit ihren Azure Active Directory-Anmeldeinformationen abrufen. Der Standardwert lautet „False“.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Der Name der Version in einem Endpunkt.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Die Menge des Datenverkehrs, den die Version in einem Endpunkt empfängt.

Methoden

validate_endpoint_configuration

Überprüfen, ob die angegebenen Konfigurationswerte gültig sind.

Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.

validate_endpoint_configuration

Überprüfen, ob die angegebenen Konfigurationswerte gültig sind.

Löst eine Ausnahme vom Typ „WebserviceException“ aus, wenn die Überprüfung nicht erfolgreich war.

validate_endpoint_configuration()

Ausnahmen

Typ Beschreibung