Compartilhar via


Workspaces do Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-10-01

Definição de recurso do Bicep

O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:

Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Bicep a seguir ao seu modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Padrão, use:

{
  scaleType: 'Default'
}

Para TargetUtilization, use:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para do Kubernetes, use:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

Para managed, use:

{
  endpointComputeType: 'Managed'
}

Valores de propriedade

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso ARM do ativo de código. corda
scoreScript [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" corda

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_] (obrigatório)

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos de contêiner: ContainerResourceSettings
containerResourceRequests Informações de solicitação de recurso de contêiner: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
CPU Número de solicitações/limite de vCPUs para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
Gpu Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
memória Solicitação/limite de tamanho de memória para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'Default' (obrigatório)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor

KubernetesOnlineDeployment

Nome Descrição Valor
containerResourceRequirements Os requisitos de recurso para o contêiner (cpu e memória). ContainerResourceRequirements
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Kubernetes' (obrigatório)

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Gerenciado' (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nome Descrição Valor
identidade Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) ManagedServiceIdentity
tipo Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. corda
localização A localização geográfica onde o recurso reside cadeia de caracteres (obrigatório)
nome O nome do recurso corda

Restrições:
Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório)
pai No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai.

Para obter mais informações, consulte recurso filho fora do recurso pai.
Nome simbólico para recurso do tipo: workspaces/onlineEndpoints
Propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)
Sku Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. de SKU
Tags Marcações de recursos Dicionário de nomes e valores de marca. Consulte Marcas em modelos

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for true, habilitará o registro em log do Application Insights. Bool
codeConfiguration Configuração de código para a implantação do ponto de extremidade. CodeConfiguration
descrição Descrição da implantação do ponto de extremidade. corda
egressPublicNetworkAccess Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. 'Desabilitado'
'Habilitado'
endpointComputeType Defina como 'Kubernetes' para o tipo KubernetesOnlineDeployment. Defina como 'Gerenciado' para o tipo ManagedOnlineDeployment. 'Kubernetes'
'Gerenciado' (obrigatório)
environmentId ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. corda
environmentVariables Configuração de variáveis de ambiente para a implantação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. corda
livenessProbe A investigação de atividade monitora a integridade do contêiner regularmente. ProbeSettings
modelo O caminho de URI para o modelo. corda
modelMountPath O caminho para montar o modelo no contêiner personalizado. corda
Propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. ProbeSettings
requestSettings Solicitar configurações para a implantação. OnlineRequestSettings
scaleSettings Configurações de escala para a implantação.
Se for nulo ou não for fornecido,
ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. int
maxQueueWait O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601.
O padrão é 500ms.
corda
requestTimeout O tempo limite de pontuação no formato ISO 8601.
O padrão é 5000ms.
corda

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir como 'Padrão' para o tipo DefaultScaleSettings. Defina como 'TargetUtilization' para o tipo TargetUtilizationScaleSettings. 'Padrão'
'TargetUtilization' (obrigatório)

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a serem permitidos antes de retornar um status não íntegro. int
initialDelay O atraso antes da primeira investigação no formato ISO 8601. corda
período O período de tempo entre investigações no formato ISO 8601. corda
successThreshold O número de investigações bem-sucedidas antes de retornar um status íntegro. int
timeout O tempo limite da investigação no formato ISO 8601. corda

Sku

Nome Descrição Valor
capacidade Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. corda
nome O nome da SKU. Ex - P3. Normalmente, é um código letter+number cadeia de caracteres (obrigatório)
tamanho O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. corda
camada Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. 'Básico'
'Gratuito'
'Premium'
'Standard'

TargetUtilizationScaleSettings

Nome Descrição Valor
maxInstances O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. int
minInstances O número mínimo de instâncias a serem sempre presentes. int
pollingInterval O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. corda
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'TargetUtilization' (obrigatório)
targetUtilizationPercentage Uso de CPU de destino para o dimensionador automático. int

TrackedResourceTags

Nome Descrição Valor

UserAssignedIdentities

Nome Descrição Valor

UserAssignedIdentity

Nome Descrição Valor

Definição de recurso de modelo do ARM

O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:

Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o JSON a seguir ao seu modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-10-01",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Padrão, use:

{
  "scaleType": "Default"
}

Para TargetUtilization, use:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para do Kubernetes, use:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

Para managed, use:

{
  "endpointComputeType": "Managed"
}

Valores de propriedade

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso ARM do ativo de código. corda
scoreScript [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" corda

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_] (obrigatório)

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos de contêiner: ContainerResourceSettings
containerResourceRequests Informações de solicitação de recurso de contêiner: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
CPU Número de solicitações/limite de vCPUs para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
Gpu Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
memória Solicitação/limite de tamanho de memória para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'Default' (obrigatório)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor

KubernetesOnlineDeployment

Nome Descrição Valor
containerResourceRequirements Os requisitos de recurso para o contêiner (cpu e memória). ContainerResourceRequirements
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Kubernetes' (obrigatório)

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Gerenciado' (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nome Descrição Valor
apiVersion A versão da API '2022-10-01'
identidade Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) ManagedServiceIdentity
tipo Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. corda
localização A localização geográfica onde o recurso reside cadeia de caracteres (obrigatório)
nome O nome do recurso corda

Restrições:
Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório)
Propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)
Sku Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. de SKU
Tags Marcações de recursos Dicionário de nomes e valores de marca. Consulte Marcas em modelos
tipo O tipo de recurso 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for true, habilitará o registro em log do Application Insights. Bool
codeConfiguration Configuração de código para a implantação do ponto de extremidade. CodeConfiguration
descrição Descrição da implantação do ponto de extremidade. corda
egressPublicNetworkAccess Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. 'Desabilitado'
'Habilitado'
endpointComputeType Defina como 'Kubernetes' para o tipo KubernetesOnlineDeployment. Defina como 'Gerenciado' para o tipo ManagedOnlineDeployment. 'Kubernetes'
'Gerenciado' (obrigatório)
environmentId ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. corda
environmentVariables Configuração de variáveis de ambiente para a implantação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. corda
livenessProbe A investigação de atividade monitora a integridade do contêiner regularmente. ProbeSettings
modelo O caminho de URI para o modelo. corda
modelMountPath O caminho para montar o modelo no contêiner personalizado. corda
Propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. ProbeSettings
requestSettings Solicitar configurações para a implantação. OnlineRequestSettings
scaleSettings Configurações de escala para a implantação.
Se for nulo ou não for fornecido,
ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. int
maxQueueWait O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601.
O padrão é 500ms.
corda
requestTimeout O tempo limite de pontuação no formato ISO 8601.
O padrão é 5000ms.
corda

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir como 'Padrão' para o tipo DefaultScaleSettings. Defina como 'TargetUtilization' para o tipo TargetUtilizationScaleSettings. 'Padrão'
'TargetUtilization' (obrigatório)

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a serem permitidos antes de retornar um status não íntegro. int
initialDelay O atraso antes da primeira investigação no formato ISO 8601. corda
período O período de tempo entre investigações no formato ISO 8601. corda
successThreshold O número de investigações bem-sucedidas antes de retornar um status íntegro. int
timeout O tempo limite da investigação no formato ISO 8601. corda

Sku

Nome Descrição Valor
capacidade Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. corda
nome O nome da SKU. Ex - P3. Normalmente, é um código letter+number cadeia de caracteres (obrigatório)
tamanho O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. corda
camada Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. 'Básico'
'Gratuito'
'Premium'
'Standard'

TargetUtilizationScaleSettings

Nome Descrição Valor
maxInstances O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. int
minInstances O número mínimo de instâncias a serem sempre presentes. int
pollingInterval O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. corda
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'TargetUtilization' (obrigatório)
targetUtilizationPercentage Uso de CPU de destino para o dimensionador automático. int

TrackedResourceTags

Nome Descrição Valor

UserAssignedIdentities

Nome Descrição Valor

UserAssignedIdentity

Nome Descrição Valor

Definição de recurso do Terraform (provedor de AzAPI)

O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:

  • grupos de recursos

Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Terraform a seguir ao seu modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
}

Objetos OnlineScaleSettings

Defina a propriedade scaleType para especificar o tipo de objeto.

Para Padrão, use:

{
  scaleType = "Default"
}

Para TargetUtilization, use:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Objetos OnlineDeploymentProperties

Defina a propriedade endpointComputeType para especificar o tipo de objeto.

Para do Kubernetes, use:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

Para managed, use:

{
  endpointComputeType = "Managed"
}

Valores de propriedade

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso ARM do ativo de código. corda
scoreScript [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" corda

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_] (obrigatório)

ContainerResourceRequirements

Nome Descrição Valor
containerResourceLimits Informações de limite de recursos de contêiner: ContainerResourceSettings
containerResourceRequests Informações de solicitação de recurso de contêiner: ContainerResourceSettings

ContainerResourceSettings

Nome Descrição Valor
CPU Número de solicitações/limite de vCPUs para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
Gpu Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
memória Solicitação/limite de tamanho de memória para contêiner. Mais informações:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda

DefaultScaleSettings

Nome Descrição Valor
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'Default' (obrigatório)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrição Valor

EndpointDeploymentPropertiesBaseProperties

Nome Descrição Valor

KubernetesOnlineDeployment

Nome Descrição Valor
containerResourceRequirements Os requisitos de recurso para o contêiner (cpu e memória). ContainerResourceRequirements
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Kubernetes' (obrigatório)

ManagedOnlineDeployment

Nome Descrição Valor
endpointComputeType [Obrigatório] O tipo de computação do ponto de extremidade. 'Gerenciado' (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nome Descrição Valor
identidade Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) ManagedServiceIdentity
tipo Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. corda
localização A localização geográfica onde o recurso reside cadeia de caracteres (obrigatório)
nome O nome do recurso corda

Restrições:
Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório)
parent_id A ID do recurso que é o pai desse recurso. ID do recurso do tipo: workspaces/onlineEndpoints
Propriedades [Obrigatório] Atributos adicionais da entidade. OnlineDeploymentProperties (obrigatório)
Sku Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. de SKU
Tags Marcações de recursos Dicionário de nomes e valores de marca.
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01"

OnlineDeploymentProperties

Nome Descrição Valor
appInsightsEnabled Se for true, habilitará o registro em log do Application Insights. Bool
codeConfiguration Configuração de código para a implantação do ponto de extremidade. CodeConfiguration
descrição Descrição da implantação do ponto de extremidade. corda
egressPublicNetworkAccess Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. 'Desabilitado'
'Habilitado'
endpointComputeType Defina como 'Kubernetes' para o tipo KubernetesOnlineDeployment. Defina como 'Gerenciado' para o tipo ManagedOnlineDeployment. 'Kubernetes'
'Gerenciado' (obrigatório)
environmentId ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. corda
environmentVariables Configuração de variáveis de ambiente para a implantação. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo de instância de computação. corda
livenessProbe A investigação de atividade monitora a integridade do contêiner regularmente. ProbeSettings
modelo O caminho de URI para o modelo. corda
modelMountPath O caminho para montar o modelo no contêiner personalizado. corda
Propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. EndpointDeploymentPropertiesBaseProperties
readinessProbe A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. ProbeSettings
requestSettings Solicitar configurações para a implantação. OnlineRequestSettings
scaleSettings Configurações de escala para a implantação.
Se for nulo ou não for fornecido,
ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment
e para DefaultScaleSettings para ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. int
maxQueueWait O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601.
O padrão é 500ms.
corda
requestTimeout O tempo limite de pontuação no formato ISO 8601.
O padrão é 5000ms.
corda

OnlineScaleSettings

Nome Descrição Valor
scaleType Definir como 'Padrão' para o tipo DefaultScaleSettings. Defina como 'TargetUtilization' para o tipo TargetUtilizationScaleSettings. 'Padrão'
'TargetUtilization' (obrigatório)

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a serem permitidos antes de retornar um status não íntegro. int
initialDelay O atraso antes da primeira investigação no formato ISO 8601. corda
período O período de tempo entre investigações no formato ISO 8601. corda
successThreshold O número de investigações bem-sucedidas antes de retornar um status íntegro. int
timeout O tempo limite da investigação no formato ISO 8601. corda

Sku

Nome Descrição Valor
capacidade Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. corda
nome O nome da SKU. Ex - P3. Normalmente, é um código letter+number cadeia de caracteres (obrigatório)
tamanho O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. corda
camada Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. 'Básico'
'Gratuito'
'Premium'
'Standard'

TargetUtilizationScaleSettings

Nome Descrição Valor
maxInstances O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. int
minInstances O número mínimo de instâncias a serem sempre presentes. int
pollingInterval O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. corda
scaleType [Obrigatório] Tipo de algoritmo de dimensionamento de implantação 'TargetUtilization' (obrigatório)
targetUtilizationPercentage Uso de CPU de destino para o dimensionador automático. int

TrackedResourceTags

Nome Descrição Valor

UserAssignedIdentities

Nome Descrição Valor

UserAssignedIdentity

Nome Descrição Valor