Workspaces/inferencePools 2024-01-01-preview do Microsoft.MachineLearningServices
Definição de recurso do Bicep
O tipo de recurso workspaces/inferencePools pode ser implantado com operações direcionadas:
- Grupos de recursos - Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/inferencePools, adicione o seguinte Bicep ao modelo.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/inferencePools@2024-01-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentConfiguration: {
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
startupProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
modelConfiguration: {
modelId: 'string'
}
nodeSkuType: 'string'
properties: {
{customized property}: 'string'
}
requestConfiguration: {
maxConcurrentRequestsPerInstance: int
requestTimeout: 'string'
}
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
Valores de propriedade
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | corda Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] (obrigatório) |
InferencePoolProperties
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/inferencePools
Nome | Descrição | Valor |
---|---|---|
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
nome | O nome do recurso | corda Restrições: Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório) |
pai | No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai. Para obter mais informações, consulte recurso filho fora do recurso pai. |
Nome simbólico para o recurso do tipo: workspaces |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | InferencePoolProperties (obrigatório) |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
Tags | Marcações de recursos | Dicionário de nomes e valores de marca. Consulte Marcas em modelos |
PoolEnvironmentConfiguration
Nome | Descrição | Valor |
---|---|---|
environmentId | ID do recurso ARM da especificação de ambiente para o pool de inferência. | corda |
environmentVariables | Configuração de variáveis de ambiente para o pool de inferência. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
startupProbe | Isso verifica se o aplicativo em um contêiner foi iniciado. As investigações de inicialização são executadas antes de qualquer outra investigação e, a menos que ela seja concluída com êxito, desabilita outras investigações. | ProbeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nome | Descrição | Valor |
---|
PoolModelConfiguration
Nome | Descrição | Valor |
---|---|---|
modelId | O caminho de URI para o modelo. | corda |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
PropertiesBaseProperties
Nome | Descrição | Valor |
---|
RequestConfiguration
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
TrackedResourceTags
Nome | Descrição | Valor |
---|
UserAssignedIdentities
Nome | Descrição | Valor |
---|
UserAssignedIdentity
Nome | Descrição | Valor |
---|
Definição de recurso de modelo do ARM
O tipo de recurso workspaces/inferencePools pode ser implantado com operações direcionadas:
- Grupos de recursos - Consulte comandos de implantação do grupo de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/inferencePools, adicione o JSON a seguir ao modelo.
{
"type": "Microsoft.MachineLearningServices/workspaces/inferencePools",
"apiVersion": "2024-01-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentConfiguration": {
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"startupProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
},
"modelConfiguration": {
"modelId": "string"
},
"nodeSkuType": "string",
"properties": {
"{customized property}": "string"
},
"requestConfiguration": {
"maxConcurrentRequestsPerInstance": "int",
"requestTimeout": "string"
}
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
Valores de propriedade
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | corda Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] (obrigatório) |
InferencePoolProperties
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/inferencePools
Nome | Descrição | Valor |
---|---|---|
apiVersion | A versão da API | '2024-01-01-preview' |
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
nome | O nome do recurso | corda Restrições: Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório) |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | InferencePoolProperties (obrigatório) |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
Tags | Marcações de recursos | Dicionário de nomes e valores de marca. Consulte Marcas em modelos |
tipo | O tipo de recurso | 'Microsoft.MachineLearningServices/workspaces/inferencePools' |
PoolEnvironmentConfiguration
Nome | Descrição | Valor |
---|---|---|
environmentId | ID do recurso ARM da especificação de ambiente para o pool de inferência. | corda |
environmentVariables | Configuração de variáveis de ambiente para o pool de inferência. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
startupProbe | Isso verifica se o aplicativo em um contêiner foi iniciado. As investigações de inicialização são executadas antes de qualquer outra investigação e, a menos que ela seja concluída com êxito, desabilita outras investigações. | ProbeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nome | Descrição | Valor |
---|
PoolModelConfiguration
Nome | Descrição | Valor |
---|---|---|
modelId | O caminho de URI para o modelo. | corda |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
PropertiesBaseProperties
Nome | Descrição | Valor |
---|
RequestConfiguration
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
TrackedResourceTags
Nome | Descrição | Valor |
---|
UserAssignedIdentities
Nome | Descrição | Valor |
---|
UserAssignedIdentity
Nome | Descrição | Valor |
---|
Definição de recurso do Terraform (provedor de AzAPI)
O tipo de recurso workspaces/inferencePools pode ser implantado com operações direcionadas:
- grupos de recursos
Para obter uma lista de propriedades alteradas em cada versão da API, consulte de log de alterações.
Formato de recurso
Para criar um recurso Microsoft.MachineLearningServices/workspaces/inferencePools, adicione o Terraform a seguir ao seu modelo.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/inferencePools@2024-01-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentConfiguration = {
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
startupProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
modelConfiguration = {
modelId = "string"
}
nodeSkuType = "string"
properties = {
{customized property} = "string"
}
requestConfiguration = {
maxConcurrentRequestsPerInstance = int
requestTimeout = "string"
}
}
})
}
Valores de propriedade
CodeConfiguration
Nome | Descrição | Valor |
---|---|---|
codeId | ID do recurso ARM do ativo de código. | corda |
scoreScript | [Obrigatório] O script a ser executado na inicialização. Eg. "score.py" | corda Restrições: Comprimento mínimo = 1 Padrão = [a-zA-Z0-9_] (obrigatório) |
InferencePoolProperties
ManagedServiceIdentity
Nome | Descrição | Valor |
---|---|---|
tipo | Tipo de identidade de serviço gerenciado (em que os tipos SystemAssigned e UserAssigned são permitidos). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obrigatório) |
userAssignedIdentities | O conjunto de identidades atribuídas pelo usuário associadas ao recurso. As chaves do dicionário userAssignedIdentities serão IDs de recurso do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) em solicitações. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/inferencePools
Nome | Descrição | Valor |
---|---|---|
identidade | Identidade de serviço gerenciada (identidades atribuídas pelo sistema e/ou pelo usuário) | ManagedServiceIdentity |
tipo | Metadados usados pelo portal/ferramentas/etc para renderizar diferentes experiências de experiência de experiência de usuário para recursos do mesmo tipo. | corda |
localização | A localização geográfica onde o recurso reside | cadeia de caracteres (obrigatório) |
nome | O nome do recurso | corda Restrições: Padrão = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obrigatório) |
parent_id | A ID do recurso que é o pai desse recurso. | ID do recurso do tipo: workspaces |
Propriedades | [Obrigatório] Atributos adicionais da entidade. | InferencePoolProperties (obrigatório) |
Sku | Detalhes de SKU necessários para o contrato do ARM para dimensionamento automático. | de SKU |
Tags | Marcações de recursos | Dicionário de nomes e valores de marca. |
tipo | O tipo de recurso | "Microsoft.MachineLearningServices/workspaces/inferencePools@2024-01-01-preview" |
PoolEnvironmentConfiguration
Nome | Descrição | Valor |
---|---|---|
environmentId | ID do recurso ARM da especificação de ambiente para o pool de inferência. | corda |
environmentVariables | Configuração de variáveis de ambiente para o pool de inferência. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | A investigação de atividade monitora a integridade do contêiner regularmente. | ProbeSettings |
readinessProbe | A investigação de preparação valida se o contêiner está pronto para atender ao tráfego. As propriedades e os padrões são os mesmos que a investigação de atividade. | ProbeSettings |
startupProbe | Isso verifica se o aplicativo em um contêiner foi iniciado. As investigações de inicialização são executadas antes de qualquer outra investigação e, a menos que ela seja concluída com êxito, desabilita outras investigações. | ProbeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nome | Descrição | Valor |
---|
PoolModelConfiguration
Nome | Descrição | Valor |
---|---|---|
modelId | O caminho de URI para o modelo. | corda |
ProbeSettings
Nome | Descrição | Valor |
---|---|---|
failureThreshold | O número de falhas a serem permitidos antes de retornar um status não íntegro. | int |
initialDelay | O atraso antes da primeira investigação no formato ISO 8601. | corda |
período | O período de tempo entre investigações no formato ISO 8601. | corda |
successThreshold | O número de investigações bem-sucedidas antes de retornar um status íntegro. | int |
timeout | O tempo limite da investigação no formato ISO 8601. | corda |
PropertiesBaseProperties
Nome | Descrição | Valor |
---|
RequestConfiguration
Nome | Descrição | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | O número máximo de solicitações simultâneas por nó permitido por implantação. O padrão é 1. | int |
requestTimeout | O tempo limite de pontuação no formato ISO 8601. O padrão é 5000ms. |
corda |
Sku
Nome | Descrição | Valor |
---|---|---|
capacidade | Se o SKU der suporte a expansão/entrada, o inteiro de capacidade deverá ser incluído. Se a escala horizontal/in não for possível para o recurso, isso poderá ser omitido. | int |
família | Se o serviço tiver diferentes gerações de hardware, para a mesma SKU, isso poderá ser capturado aqui. | corda |
nome | O nome da SKU. Ex - P3. Normalmente, é um código letter+number | cadeia de caracteres (obrigatório) |
tamanho | O tamanho da SKU. Quando o campo de nome é a combinação de camada e algum outro valor, esse seria o código autônomo. | corda |
camada | Esse campo deverá ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não for necessário em um PUT. | 'Básico' 'Gratuito' 'Premium' 'Standard' |
TrackedResourceTags
Nome | Descrição | Valor |
---|
UserAssignedIdentities
Nome | Descrição | Valor |
---|
UserAssignedIdentity
Nome | Descrição | Valor |
---|