Freigeben über


Microsoft.MachineLearningServices-Arbeitsbereiche/onlineEndpoints/deployments 2023-04-01-preview

Bicep-Ressourcendefinition

Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage die folgende Bicep hinzu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties-Objekte

Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.

Verwenden Sie für Kubernetes:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Verwenden Sie für verwaltete:

  endpointComputeType: 'Managed'

OnlineScaleSettings-Objekte

Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für Standard-:

  scaleType: 'Default'

Verwenden Sie für TargetUtilization-Folgendes:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Eigenschaftswerte

workspaces/onlineEndpoints/deployments

Name Beschreibung Wert
Name Der Ressourcenname

Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in Bicep-festlegen.
Zeichenfolge (erforderlich)
Ort Der geografische Standort, an dem sich die Ressource befindet Zeichenfolge (erforderlich)
Schilder Ressourcentags. Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen
Sku Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. Sku-
Art Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. Schnur
Elternteil In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird.

Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource.
Symbolischer Name für Ressource des Typs: onlineEndpoints
Identität Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) ManagedServiceIdentity-
Eigenschaften [Erforderlich] Zusätzliche Attribute der Entität. OnlineDeploymentProperties (erforderlich)

ManagedServiceIdentity

Name Beschreibung Wert
Art Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). 'None'
'SystemAssigned'
"SystemAssigned,UserAssigned"
"UserAssigned" (erforderlich)
userAssignedIdentities Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. UserAssignedIdentities-

UserAssignedIdentities

Name Beschreibung Wert
{angepasste Eigenschaft} UserAssignedIdentity-

UserAssignedIdentity

Dieses Objekt enthält keine Eigenschaften, die während der Bereitstellung festgelegt werden sollen. Alle Eigenschaften sind ReadOnly.

OnlineDeploymentProperties

Name Beschreibung Wert
appInsightsEnabled Wenn wahr, aktiviert die Application Insights-Protokollierung. Bool
codeConfiguration Codekonfiguration für die Endpunktbereitstellung. CodeConfiguration-
dataCollector Die mdc-Konfiguration wird mdc deaktiviert, wenn er null ist. DataCollector-
Beschreibung Beschreibung der Endpunktbereitstellung. Schnur
egressPublicNetworkAccess Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. "Deaktiviert"
"Aktiviert"
environmentId ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. Schnur
environmentVariables Umgebungsvariablenkonfiguration für die Bereitstellung. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Computeinstanztyp. Schnur
livenessProbe Liveness-Probe überwacht die Integrität des Containers regelmäßig. ProbeSettings
Modell Der URI-Pfad zum Modell. Schnur
modelMountPath Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. Schnur
Eigenschaften Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. EndpointDeploymentPropertiesBaseProperties
readinessProbe Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. ProbeSettings
requestSettings Fordern Sie Einstellungen für die Bereitstellung an. OnlineRequestSettings
scaleSettings Skalierungseinstellungen für die Bereitstellung.
Wenn er null ist oder nicht angegeben wird,
standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment
und in DefaultScaleSettings für ManagedOnlineDeployment.
OnlineScaleSettings-
endpointComputeType Festlegen des Objekttyps Kubernetes
Verwaltete (erforderlich)

CodeConfiguration

Name Beschreibung Wert
codeId ARM-Ressourcen-ID der Coderessource. Schnur
scoringScript [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" Zeichenfolge (erforderlich)

Zwänge:
Min. Länge = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Name Beschreibung Wert
Sammlungen [Erforderlich] Die Sammlungskonfiguration. Jede Auflistung verfügt über eine eigene Konfiguration zum Sammeln von Modelldaten, und der Name der Auflistung kann eine beliebige Zeichenfolge sein.
Der Modelldatensammler kann entweder für die Nutzlastprotokollierung oder für die benutzerdefinierte Protokollierung oder beides verwendet werden. Sammlungsanforderung und -antwort sind für die Nutzlastprotokollierung reserviert, andere sind für die benutzerdefinierte Protokollierung vorgesehen.
DataCollectorCollections- (erforderlich)
requestLogging Die Anforderungsprotokollierungskonfiguration für mdc enthält erweiterte Protokollierungseinstellungen für alle Sammlungen. Es ist optional. RequestLogging-
rollingRate Wenn Modelldaten im Blob-Speicher gesammelt werden, müssen wir die Daten auf einen anderen Pfad anwenden, um zu vermeiden, dass alle Daten in einer einzigen BLOB-Datei protokolliert werden.
Wenn die Rollrate stunde ist, werden alle Daten im BLOB-Pfad /yyyy/MM/dd/HH/erfasst.
Wenn es tag ist, werden alle Daten im BLOB-Pfad /yyyy/MM/dd/erfasst.
Der andere Vorteil des Rollpfads besteht darin, dass die Benutzeroberfläche zur Modellüberwachung sehr schnell einen Zeitraum von Daten auswählen kann.
"Tag"
"Stunde"
"Minute"
"Monat"
"Jahr"

DataCollectorCollections

Name Beschreibung Wert
{angepasste Eigenschaft} Sammlungs-

Sammlung

Name Beschreibung Wert
clientId Die MSI-Client-ID, die zum Sammeln der Protokollierung für blob-Speicher verwendet wird. Wenn es null ist, wählt Back-End eine registrierte Endpunktidentität für die Authentifizierung aus. Schnur
dataCollectionMode Aktivieren oder Deaktivieren der Datensammlung. "Deaktiviert"
"Aktiviert"
dataId Die Ressourcen-ID des Datenobjekts. Clientseitig wird sichergestellt, dass datenressource auf den BLOB-Speicher verweist, und das Back-End sammelt Daten an den BLOB-Speicher. Schnur
SamplingRate Die Samplingrate für die Sammlung. Samplingrate 1,0 bedeutet, dass wir standardmäßig 100% von Daten sammeln. Int

RequestLogging

Name Beschreibung Wert
captureHeaders Bei der Nutzlastprotokollierung erfassen wir standardmäßig nur Nutzlast. Wenn Kunden auch die angegebenen Header sammeln möchten, können sie sie in captureHeaders festlegen, damit das Back-End diese Header zusammen mit Nutzlast sammelt. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Name Beschreibung Wert
{angepasste Eigenschaft} Schnur

ProbeSettings

Name Beschreibung Wert
failureThreshold Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. Int
initialDelay Die Verzögerung vor der ersten Probe im ISO 8601-Format. Schnur
Periode Die Dauer zwischen Probes im ISO 8601-Format. Schnur
successThreshold Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. Int
Zeitüberschreitung Das Timeout der Probe im ISO 8601-Format. Schnur

EndpointDeploymentPropertiesBaseProperties

Name Beschreibung Wert
{angepasste Eigenschaft} Schnur

OnlineRequestSettings

Name Beschreibung Wert
maxConcurrentRequestsPerInstance Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. Int
maxQueueWait Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt.
Der Standardwert ist 500 ms.
Schnur
requestTimeout Das Bewertungstimeout im ISO 8601-Format.
Der Standardwert ist 5000 ms.
Schnur

OnlineScaleSettings

Name Beschreibung Wert
scaleType Festlegen des Objekttyps Standard-
TargetUtilization- (erforderlich)

DefaultScaleSettings

Name Beschreibung Wert
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus 'Standard' (erforderlich)

TargetUtilizationScaleSettings

Name Beschreibung Wert
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus 'TargetUtilization' (erforderlich)
maxInstances Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. Int
minInstances Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. Int
pollingInterval Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. Schnur
targetUtilizationPercentage Die CPU-Zielauslastung für die Autoscaler. Int

KubernetesOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. 'Kubernetes' (erforderlich)
containerResourceRequirements Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). ContainerResourceRequirements

ContainerResourceRequirements

Name Beschreibung Wert
containerResourceLimits Informationen zum Containerressourcengrenzwert: ContainerResourceSettings-
containerResourceRequests Informationen zur Containerressourcenanforderung: ContainerResourceSettings-

ContainerResourceSettings

Name Beschreibung Wert
CPU Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur
gpu Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur
Gedächtnis Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur

ManagedOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Verwaltet" (erforderlich)

Sku

Name Beschreibung Wert
Fassungsvermögen Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. Int
Familie Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. Schnur
Name Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. Zeichenfolge (erforderlich)
Größe Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. Schnur
Rang Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. "Einfach"
"Kostenlos"
"Premium"
"Standard"

ARM-Vorlagenressourcendefinition

Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage den folgenden JSON-Code hinzu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-04-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties-Objekte

Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.

Verwenden Sie für Kubernetes:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Verwenden Sie für verwaltete:

  "endpointComputeType": "Managed"

OnlineScaleSettings-Objekte

Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für Standard-:

  "scaleType": "Default"

Verwenden Sie für TargetUtilization-Folgendes:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Eigenschaftswerte

workspaces/onlineEndpoints/deployments

Name Beschreibung Wert
Art Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Die Ressourcen-API-Version "2023-04-01-preview"
Name Der Ressourcenname

Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in JSON ARM-Vorlagenfestlegen.
Zeichenfolge (erforderlich)
Ort Der geografische Standort, an dem sich die Ressource befindet Zeichenfolge (erforderlich)
Schilder Ressourcentags. Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen
Sku Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. Sku-
Art Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. Schnur
Identität Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) ManagedServiceIdentity-
Eigenschaften [Erforderlich] Zusätzliche Attribute der Entität. OnlineDeploymentProperties (erforderlich)

ManagedServiceIdentity

Name Beschreibung Wert
Art Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). 'None'
'SystemAssigned'
"SystemAssigned,UserAssigned"
"UserAssigned" (erforderlich)
userAssignedIdentities Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. UserAssignedIdentities-

UserAssignedIdentities

Name Beschreibung Wert
{angepasste Eigenschaft} UserAssignedIdentity-

UserAssignedIdentity

Dieses Objekt enthält keine Eigenschaften, die während der Bereitstellung festgelegt werden sollen. Alle Eigenschaften sind ReadOnly.

OnlineDeploymentProperties

Name Beschreibung Wert
appInsightsEnabled Wenn wahr, aktiviert die Application Insights-Protokollierung. Bool
codeConfiguration Codekonfiguration für die Endpunktbereitstellung. CodeConfiguration-
dataCollector Die mdc-Konfiguration wird mdc deaktiviert, wenn er null ist. DataCollector-
Beschreibung Beschreibung der Endpunktbereitstellung. Schnur
egressPublicNetworkAccess Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. "Deaktiviert"
"Aktiviert"
environmentId ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. Schnur
environmentVariables Umgebungsvariablenkonfiguration für die Bereitstellung. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Computeinstanztyp. Schnur
livenessProbe Liveness-Probe überwacht die Integrität des Containers regelmäßig. ProbeSettings
Modell Der URI-Pfad zum Modell. Schnur
modelMountPath Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. Schnur
Eigenschaften Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. EndpointDeploymentPropertiesBaseProperties
readinessProbe Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. ProbeSettings
requestSettings Fordern Sie Einstellungen für die Bereitstellung an. OnlineRequestSettings
scaleSettings Skalierungseinstellungen für die Bereitstellung.
Wenn er null ist oder nicht angegeben wird,
standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment
und in DefaultScaleSettings für ManagedOnlineDeployment.
OnlineScaleSettings-
endpointComputeType Festlegen des Objekttyps Kubernetes
Verwaltete (erforderlich)

CodeConfiguration

Name Beschreibung Wert
codeId ARM-Ressourcen-ID der Coderessource. Schnur
scoringScript [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" Zeichenfolge (erforderlich)

Zwänge:
Min. Länge = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Name Beschreibung Wert
Sammlungen [Erforderlich] Die Sammlungskonfiguration. Jede Auflistung verfügt über eine eigene Konfiguration zum Sammeln von Modelldaten, und der Name der Auflistung kann eine beliebige Zeichenfolge sein.
Der Modelldatensammler kann entweder für die Nutzlastprotokollierung oder für die benutzerdefinierte Protokollierung oder beides verwendet werden. Sammlungsanforderung und -antwort sind für die Nutzlastprotokollierung reserviert, andere sind für die benutzerdefinierte Protokollierung vorgesehen.
DataCollectorCollections- (erforderlich)
requestLogging Die Anforderungsprotokollierungskonfiguration für mdc enthält erweiterte Protokollierungseinstellungen für alle Sammlungen. Es ist optional. RequestLogging-
rollingRate Wenn Modelldaten im Blob-Speicher gesammelt werden, müssen wir die Daten auf einen anderen Pfad anwenden, um zu vermeiden, dass alle Daten in einer einzigen BLOB-Datei protokolliert werden.
Wenn die Rollrate stunde ist, werden alle Daten im BLOB-Pfad /yyyy/MM/dd/HH/erfasst.
Wenn es tag ist, werden alle Daten im BLOB-Pfad /yyyy/MM/dd/erfasst.
Der andere Vorteil des Rollpfads besteht darin, dass die Benutzeroberfläche zur Modellüberwachung sehr schnell einen Zeitraum von Daten auswählen kann.
"Tag"
"Stunde"
"Minute"
"Monat"
"Jahr"

DataCollectorCollections

Name Beschreibung Wert
{angepasste Eigenschaft} Sammlungs-

Sammlung

Name Beschreibung Wert
clientId Die MSI-Client-ID, die zum Sammeln der Protokollierung für blob-Speicher verwendet wird. Wenn es null ist, wählt Back-End eine registrierte Endpunktidentität für die Authentifizierung aus. Schnur
dataCollectionMode Aktivieren oder Deaktivieren der Datensammlung. "Deaktiviert"
"Aktiviert"
dataId Die Ressourcen-ID des Datenobjekts. Clientseitig wird sichergestellt, dass datenressource auf den BLOB-Speicher verweist, und das Back-End sammelt Daten an den BLOB-Speicher. Schnur
SamplingRate Die Samplingrate für die Sammlung. Samplingrate 1,0 bedeutet, dass wir standardmäßig 100% von Daten sammeln. Int

RequestLogging

Name Beschreibung Wert
captureHeaders Bei der Nutzlastprotokollierung erfassen wir standardmäßig nur Nutzlast. Wenn Kunden auch die angegebenen Header sammeln möchten, können sie sie in captureHeaders festlegen, damit das Back-End diese Header zusammen mit Nutzlast sammelt. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Name Beschreibung Wert
{angepasste Eigenschaft} Schnur

ProbeSettings

Name Beschreibung Wert
failureThreshold Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. Int
initialDelay Die Verzögerung vor der ersten Probe im ISO 8601-Format. Schnur
Periode Die Dauer zwischen Probes im ISO 8601-Format. Schnur
successThreshold Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. Int
Zeitüberschreitung Das Timeout der Probe im ISO 8601-Format. Schnur

EndpointDeploymentPropertiesBaseProperties

Name Beschreibung Wert
{angepasste Eigenschaft} Schnur

OnlineRequestSettings

Name Beschreibung Wert
maxConcurrentRequestsPerInstance Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. Int
maxQueueWait Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt.
Der Standardwert ist 500 ms.
Schnur
requestTimeout Das Bewertungstimeout im ISO 8601-Format.
Der Standardwert ist 5000 ms.
Schnur

OnlineScaleSettings

Name Beschreibung Wert
scaleType Festlegen des Objekttyps Standard-
TargetUtilization- (erforderlich)

DefaultScaleSettings

Name Beschreibung Wert
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus 'Standard' (erforderlich)

TargetUtilizationScaleSettings

Name Beschreibung Wert
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus 'TargetUtilization' (erforderlich)
maxInstances Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. Int
minInstances Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. Int
pollingInterval Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. Schnur
targetUtilizationPercentage Die CPU-Zielauslastung für die Autoscaler. Int

KubernetesOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. 'Kubernetes' (erforderlich)
containerResourceRequirements Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). ContainerResourceRequirements

ContainerResourceRequirements

Name Beschreibung Wert
containerResourceLimits Informationen zum Containerressourcengrenzwert: ContainerResourceSettings-
containerResourceRequests Informationen zur Containerressourcenanforderung: ContainerResourceSettings-

ContainerResourceSettings

Name Beschreibung Wert
CPU Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur
gpu Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur
Gedächtnis Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur

ManagedOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Verwaltet" (erforderlich)

Sku

Name Beschreibung Wert
Fassungsvermögen Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. Int
Familie Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. Schnur
Name Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. Zeichenfolge (erforderlich)
Größe Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. Schnur
Rang Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. "Einfach"
"Kostenlos"
"Premium"
"Standard"

Terraform -Ressourcendefinition (AzAPI-Anbieter)

Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

  • Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties-Objekte

Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.

Verwenden Sie für Kubernetes:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Verwenden Sie für verwaltete:

  endpointComputeType = "Managed"

OnlineScaleSettings-Objekte

Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für Standard-:

  scaleType = "Default"

Verwenden Sie für TargetUtilization-Folgendes:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Eigenschaftswerte

workspaces/onlineEndpoints/deployments

Name Beschreibung Wert
Art Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview"
Name Der Ressourcenname Zeichenfolge (erforderlich)
Ort Der geografische Standort, an dem sich die Ressource befindet Zeichenfolge (erforderlich)
parent_id Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. ID für Ressource vom Typ: onlineEndpoints
Schilder Ressourcentags. Wörterbuch der Tagnamen und -werte.
Sku Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. Sku-
Art Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. Schnur
Identität Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) ManagedServiceIdentity-
Eigenschaften [Erforderlich] Zusätzliche Attribute der Entität. OnlineDeploymentProperties (erforderlich)

ManagedServiceIdentity

Name Beschreibung Wert
Art Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (erforderlich)
identity_ids Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. Array von Benutzeridentitäts-IDs.

UserAssignedIdentities

Name Beschreibung Wert
{angepasste Eigenschaft} UserAssignedIdentity-

UserAssignedIdentity

Dieses Objekt enthält keine Eigenschaften, die während der Bereitstellung festgelegt werden sollen. Alle Eigenschaften sind ReadOnly.

OnlineDeploymentProperties

Name Beschreibung Wert
appInsightsEnabled Wenn wahr, aktiviert die Application Insights-Protokollierung. Bool
codeConfiguration Codekonfiguration für die Endpunktbereitstellung. CodeConfiguration-
dataCollector Die mdc-Konfiguration wird mdc deaktiviert, wenn er null ist. DataCollector-
Beschreibung Beschreibung der Endpunktbereitstellung. Schnur
egressPublicNetworkAccess Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. "Deaktiviert"
"Aktiviert"
environmentId ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. Schnur
environmentVariables Umgebungsvariablenkonfiguration für die Bereitstellung. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Computeinstanztyp. Schnur
livenessProbe Liveness-Probe überwacht die Integrität des Containers regelmäßig. ProbeSettings
Modell Der URI-Pfad zum Modell. Schnur
modelMountPath Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. Schnur
Eigenschaften Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. EndpointDeploymentPropertiesBaseProperties
readinessProbe Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. ProbeSettings
requestSettings Fordern Sie Einstellungen für die Bereitstellung an. OnlineRequestSettings
scaleSettings Skalierungseinstellungen für die Bereitstellung.
Wenn er null ist oder nicht angegeben wird,
standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment
und in DefaultScaleSettings für ManagedOnlineDeployment.
OnlineScaleSettings-
endpointComputeType Festlegen des Objekttyps Kubernetes
Verwaltete (erforderlich)

CodeConfiguration

Name Beschreibung Wert
codeId ARM-Ressourcen-ID der Coderessource. Schnur
scoringScript [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" Zeichenfolge (erforderlich)

Zwänge:
Min. Länge = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Name Beschreibung Wert
Sammlungen [Erforderlich] Die Sammlungskonfiguration. Jede Auflistung verfügt über eine eigene Konfiguration zum Sammeln von Modelldaten, und der Name der Auflistung kann eine beliebige Zeichenfolge sein.
Der Modelldatensammler kann entweder für die Nutzlastprotokollierung oder für die benutzerdefinierte Protokollierung oder beides verwendet werden. Sammlungsanforderung und -antwort sind für die Nutzlastprotokollierung reserviert, andere sind für die benutzerdefinierte Protokollierung vorgesehen.
DataCollectorCollections- (erforderlich)
requestLogging Die Anforderungsprotokollierungskonfiguration für mdc enthält erweiterte Protokollierungseinstellungen für alle Sammlungen. Es ist optional. RequestLogging-
rollingRate Wenn Modelldaten im Blob-Speicher gesammelt werden, müssen wir die Daten auf einen anderen Pfad anwenden, um zu vermeiden, dass alle Daten in einer einzigen BLOB-Datei protokolliert werden.
Wenn die Rollrate stunde ist, werden alle Daten im BLOB-Pfad /yyyy/MM/dd/HH/erfasst.
Wenn es tag ist, werden alle Daten im BLOB-Pfad /yyyy/MM/dd/erfasst.
Der andere Vorteil des Rollpfads besteht darin, dass die Benutzeroberfläche zur Modellüberwachung sehr schnell einen Zeitraum von Daten auswählen kann.
"Tag"
"Stunde"
"Minute"
"Monat"
"Jahr"

DataCollectorCollections

Name Beschreibung Wert
{angepasste Eigenschaft} Sammlungs-

Sammlung

Name Beschreibung Wert
clientId Die MSI-Client-ID, die zum Sammeln der Protokollierung für blob-Speicher verwendet wird. Wenn es null ist, wählt Back-End eine registrierte Endpunktidentität für die Authentifizierung aus. Schnur
dataCollectionMode Aktivieren oder Deaktivieren der Datensammlung. "Deaktiviert"
"Aktiviert"
dataId Die Ressourcen-ID des Datenobjekts. Clientseitig wird sichergestellt, dass datenressource auf den BLOB-Speicher verweist, und das Back-End sammelt Daten an den BLOB-Speicher. Schnur
SamplingRate Die Samplingrate für die Sammlung. Samplingrate 1,0 bedeutet, dass wir standardmäßig 100% von Daten sammeln. Int

RequestLogging

Name Beschreibung Wert
captureHeaders Bei der Nutzlastprotokollierung erfassen wir standardmäßig nur Nutzlast. Wenn Kunden auch die angegebenen Header sammeln möchten, können sie sie in captureHeaders festlegen, damit das Back-End diese Header zusammen mit Nutzlast sammelt. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Name Beschreibung Wert
{angepasste Eigenschaft} Schnur

ProbeSettings

Name Beschreibung Wert
failureThreshold Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. Int
initialDelay Die Verzögerung vor der ersten Probe im ISO 8601-Format. Schnur
Periode Die Dauer zwischen Probes im ISO 8601-Format. Schnur
successThreshold Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. Int
Zeitüberschreitung Das Timeout der Probe im ISO 8601-Format. Schnur

EndpointDeploymentPropertiesBaseProperties

Name Beschreibung Wert
{angepasste Eigenschaft} Schnur

OnlineRequestSettings

Name Beschreibung Wert
maxConcurrentRequestsPerInstance Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. Int
maxQueueWait Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt.
Der Standardwert ist 500 ms.
Schnur
requestTimeout Das Bewertungstimeout im ISO 8601-Format.
Der Standardwert ist 5000 ms.
Schnur

OnlineScaleSettings

Name Beschreibung Wert
scaleType Festlegen des Objekttyps Standard-
TargetUtilization- (erforderlich)

DefaultScaleSettings

Name Beschreibung Wert
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Standard" (erforderlich)

TargetUtilizationScaleSettings

Name Beschreibung Wert
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "TargetUtilization" (erforderlich)
maxInstances Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. Int
minInstances Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. Int
pollingInterval Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. Schnur
targetUtilizationPercentage Die CPU-Zielauslastung für die Autoscaler. Int

KubernetesOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Kubernetes" (erforderlich)
containerResourceRequirements Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). ContainerResourceRequirements

ContainerResourceRequirements

Name Beschreibung Wert
containerResourceLimits Informationen zum Containerressourcengrenzwert: ContainerResourceSettings-
containerResourceRequests Informationen zur Containerressourcenanforderung: ContainerResourceSettings-

ContainerResourceSettings

Name Beschreibung Wert
CPU Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur
gpu Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur
Gedächtnis Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Schnur

ManagedOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Verwaltet" (erforderlich)

Sku

Name Beschreibung Wert
Fassungsvermögen Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. Int
Familie Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. Schnur
Name Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. Zeichenfolge (erforderlich)
Größe Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. Schnur
Rang Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. "Einfach"
"Kostenlos"
"Premium"
"Standard"