Workspaces do Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-04-01
- Mais recente
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
- 2023-08-01-preview
- 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Definição de recurso do Bicep
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos - Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Bicep a seguir ao seu modelo.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
{
scaleType: 'Default'
}
Para TargetUtilization, use:
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para do Kubernetes, use:
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
Para managed, use:
{
endpointComputeType: 'Managed'
}
Valores de propriedade
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | corda Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] (obrigatório) |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
CPU | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
Gpu | Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Gerenciado' (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
nome | O nome do recurso | corda Restrições: Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório) |
pai | No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai. Para obter mais informações, consulte recurso filho fora do recurso pai. |
Nome simbólico para recurso do tipo: workspaces/onlineEndpoints |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
Tags | Marcações de recursos | Dicionário de nomes e valores de marca. Consulte Marcas em modelos |
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | Bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | corda |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. | 'Desabilitado' 'Habilitado' |
endpointComputeType | Defina como 'Kubernetes' para o tipo KubernetesOnlineDeployment. Defina como 'Gerenciado' para o tipo ManagedOnlineDeployment. | 'Kubernetes' 'Gerenciado' (obrigatório) |
environmentId | ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. | corda |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | corda |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho de URI para o modelo. | corda |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | corda |
Propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
maxQueueWait | O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
corda |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir como 'Padrão' para o tipo DefaultScaleSettings. Defina como 'TargetUtilization' para o tipo TargetUtilizationScaleSettings. | 'Padrão' 'TargetUtilization' (obrigatório) |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
maxInstances | O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a serem sempre presentes. | int |
pollingInterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. | corda |
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | int |
TrackedResourceTags
Nome | Descrição | Valor |
---|
UserAssignedIdentities
Nome | Descrição | Valor |
---|
UserAssignedIdentity
Nome | Descrição | Valor |
---|
Definição de recurso de modelo do ARM
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- Grupos de recursos - Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o JSON a seguir ao seu modelo.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-04-01",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
{
"scaleType": "Default"
}
Para TargetUtilization, use:
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para do Kubernetes, use:
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
Para managed, use:
{
"endpointComputeType": "Managed"
}
Valores de propriedade
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | corda Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] (obrigatório) |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
CPU | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
Gpu | Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Gerenciado' (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
apiVersion | A versão da API | '2023-04-01' |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
nome | O nome do recurso | corda Restrições: Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório) |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
Tags | Marcações de recursos | Dicionário de nomes e valores de marca. Consulte Marcas em modelos |
tipo | O tipo de recurso | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | Bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | corda |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. | 'Desabilitado' 'Habilitado' |
endpointComputeType | Defina como 'Kubernetes' para o tipo KubernetesOnlineDeployment. Defina como 'Gerenciado' para o tipo ManagedOnlineDeployment. | 'Kubernetes' 'Gerenciado' (obrigatório) |
environmentId | ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. | corda |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | corda |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho de URI para o modelo. | corda |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | corda |
Propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
maxQueueWait | O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
corda |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir como 'Padrão' para o tipo DefaultScaleSettings. Defina como 'TargetUtilization' para o tipo TargetUtilizationScaleSettings. | 'Padrão' 'TargetUtilization' (obrigatório) |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
maxInstances | O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a serem sempre presentes. | int |
pollingInterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. | corda |
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | int |
TrackedResourceTags
Nome | Descrição | Valor |
---|
UserAssignedIdentities
Nome | Descrição | Valor |
---|
UserAssignedIdentity
Nome | Descrição | Valor |
---|
Definição de recurso do Terraform (provedor de AzAPI)
O tipo de recurso workspaces/onlineEndpoints/deployments pode ser implantado com operações direcionadas:
- grupos de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, adicione o Terraform a seguir ao seu modelo.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
}
Objetos OnlineScaleSettings
Defina a propriedade scaleType para especificar o tipo de objeto.
Para Padrão, use:
{
scaleType = "Default"
}
Para TargetUtilization, use:
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
Objetos OnlineDeploymentProperties
Defina a propriedade endpointComputeType para especificar o tipo de objeto.
Para do Kubernetes, use:
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
Para managed, use:
{
endpointComputeType = "Managed"
}
Valores de propriedade
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | corda Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] (obrigatório) |
ContainerResourceRequirements
Nome | Descrição | Valor |
---|---|---|
containerResourceLimits | Informações de limite de recursos de contêiner: | |
containerResourceRequests | Informações de solicitação de recurso de contêiner: | |
ContainerResourceSettings
Nome | Descrição | Valor |
---|---|---|
CPU | Número de solicitações/limite de vCPUs para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
Gpu | Número de solicitações/limite de cartões GPU Nvidia para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
memória | Solicitação/limite de tamanho de memória para contêiner. Mais informações: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corda |
DefaultScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'Default' (obrigatório) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nome | Descrição | Valor |
---|
EndpointDeploymentPropertiesBaseProperties
Nome | Descrição | Valor |
---|
KubernetesOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
containerResourceRequirements | Os requisitos de recurso para o contêiner (cpu e memória). | ContainerResourceRequirements |
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Kubernetes' (obrigatório) |
ManagedOnlineDeployment
Nome | Descrição | Valor |
---|---|---|
endpointComputeType | [Obrigatório] O tipo de computação do ponto de extremidade. | 'Gerenciado' (obrigatório) |
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nome | Descrição | Valor |
---|---|---|
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
nome | O nome do recurso | corda Restrições: Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório) |
parent_id | A ID do recurso que é o pai desse recurso. | ID do recurso do tipo: workspaces/onlineEndpoints |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | OnlineDeploymentProperties (obrigatório) |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
Tags | Marcações de recursos | Dicionário de nomes e valores de marca. |
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01" |
OnlineDeploymentProperties
Nome | Descrição | Valor |
---|---|---|
appInsightsEnabled | Se for true, habilitará o registro em log do Application Insights. | Bool |
codeConfiguration | Configuração de código para a implantação do ponto de extremidade. | CodeConfiguration |
descrição | Descrição da implantação do ponto de extremidade. | corda |
egressPublicNetworkAccess | Se habilitado, permita o acesso à rede pública de saída. Se estiver desabilitado, isso criará saída segura. Padrão: Habilitado. | 'Desabilitado' 'Habilitado' |
endpointComputeType | Defina como 'Kubernetes' para o tipo KubernetesOnlineDeployment. Defina como 'Gerenciado' para o tipo ManagedOnlineDeployment. | 'Kubernetes' 'Gerenciado' (obrigatório) |
environmentId | ID de recurso do ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. | corda |
environmentVariables | Configuração de variáveis de ambiente para a implantação. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Tipo de instância de computação. | corda |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
modelo | O caminho de URI para o modelo. | corda |
modelMountPath | O caminho para montar o modelo no contêiner personalizado. | corda |
Propriedades | Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
requestSettings | Solicitar configurações para a implantação. | OnlineRequestSettings |
scaleSettings | Configurações de escala para a implantação. Se for nulo ou não for fornecido, ele usa como padrão TargetUtilizationScaleSettings para KubernetesOnlineDeployment e para DefaultScaleSettings para ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
maxQueueWait | O tempo máximo que uma solicitação permanecerá na fila no formato ISO 8601. O padrão é 500ms. |
corda |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
OnlineScaleSettings
Nome | Descrição | Valor |
---|---|---|
scaleType | Definir como 'Padrão' para o tipo DefaultScaleSettings. Defina como 'TargetUtilization' para o tipo TargetUtilizationScaleSettings. | 'Padrão' 'TargetUtilization' (obrigatório) |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
TargetUtilizationScaleSettings
Nome | Descrição | Valor |
---|---|---|
maxInstances | O número máximo de instâncias para as quais a implantação pode ser dimensionada. A cota será reservada para max_instances. | int |
minInstances | O número mínimo de instâncias a serem sempre presentes. | int |
pollingInterval | O intervalo de sondagem no formato ISO 8691. Só dá suporte à duração com precisão tão baixa quanto Segundos. | corda |
scaleType | [Obrigatório] Tipo de algoritmo de dimensionamento de implantação | 'TargetUtilization' (obrigatório) |
targetUtilizationPercentage | Uso de CPU de destino para o dimensionador automático. | int |
TrackedResourceTags
Nome | Descrição | Valor |
---|
UserAssignedIdentities
Nome | Descrição | Valor |
---|
UserAssignedIdentity
Nome | Descrição | Valor |
---|