Espaces de travail Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-06-01-preview
- Dernier
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
- 2023-08-01-preview
- 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Définition de ressource Bicep
Le type de ressource espaces de travail/onlineEndpoints/déploiements peut être déployé avec des opérations qui ciblent :
- groupes de ressources - Consultez commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format de ressource
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le bicep suivant à votre modèle.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour par défaut, utilisez :
{
scaleType: 'Default'
}
Pour TargetUtilization, utilisez :
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
Objets OnlineDeploymentProperties
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour Kubernetes, utilisez :
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
Pour managé, utilisez :
{
endpointComputeType: 'Managed'
}
Valeurs de propriété
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | corde |
scoringScript | [Obligatoire] Script à exécuter au démarrage. Eg. « score.py » | corde Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] (obligatoire) |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
containerResourceLimits | Informations sur la limite des ressources de conteneur : | ContainerResourceSettings |
containerResourceRequests | Informations sur la demande de ressource de conteneur : | ContainerResourceSettings |
ContainerResourceSettings
Nom | Description | Valeur |
---|---|---|
CPU | Nombre de demandes/limites de processeurs virtuels pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
GPU | Nombre de cartes GPU Nvidia demande/limite pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
mémoire | Demande/limite de taille de mémoire pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
DefaultScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Default' (obligatoire) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nom | Description | Valeur |
---|
EndpointDeploymentPropertiesBasePropertiesBaseProperties
Nom | Description | Valeur |
---|
KubernetesOnlineDeployment
Nom | Description | Valeur |
---|---|---|
containerResourceRequirements | Configuration requise pour le conteneur (processeur et mémoire). | ContainerResourceRequirements |
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Kubernetes' (obligatoire) |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM sous la forme : « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs de dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
identité | Identité de service managée (identités affectées par le système et/ou identités affectées par l’utilisateur) | ManagedServiceIdentity |
gentil | Métadonnées utilisées par le portail/l’outil/etc pour afficher différentes expériences d’expérience utilisateur pour les ressources du même type. | corde |
emplacement | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
nom | Nom de la ressource | corde Contraintes: Modèle = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatoire) |
parent | Dans Bicep, vous pouvez spécifier la ressource parente d’une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez ressource enfant en dehors de la ressource parente. |
Nom symbolique de la ressource de type : espaces de travail /onlineEndpoints |
Propriétés | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeploymentProperties (obligatoire) |
Sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | référence SKU |
étiquettes | Balises de ressource | Dictionnaire de noms et de valeurs d’étiquettes. Consultez les balises dans les modèles |
OnlineDeploymentProperties
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | Bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | codeConfiguration |
description | Description du déploiement du point de terminaison. | corde |
egressPublicNetworkAccess | Si cette option est activée, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Valeur par défaut : activée. | 'Désactivé' 'Activé' |
endpointComputeType | Défini sur « Kubernetes » pour le type KubernetesOnlineDeployment. Défini sur « Managed » pour le type ManagedOnlineDeployment. | 'Kubernetes' 'Managed' (obligatoire) |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | corde |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type d’instance de calcul. | corde |
livenessProbe | La sonde Liveness surveille régulièrement l’intégrité du conteneur. | probeSettings |
modèle | Chemin d’ACCÈS DE l’URI au modèle. | corde |
modelMountPath | Chemin d’accès pour monter le modèle dans un conteneur personnalisé. | corde |
Propriétés | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | La sonde Readiness valide si le conteneur est prêt à servir le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la sonde liveness. | probeSettings |
requestSettings | Demander des paramètres pour le déploiement. | OnlineRequestSettings |
scaleSettings | Mettre à l’échelle les paramètres du déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisé par déploiement. La valeur par défaut est 1. | Int |
maxQueueWait | Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms. |
corde |
requestTimeout | Délai d’expiration du score au format ISO 8601. La valeur par défaut est 5 000 ms. |
corde |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | Défini sur « Default » pour le type DefaultScaleSettings. Défini sur « TargetUtilization » pour le type TargetUtilizationScaleSettings. | 'Default' 'TargetUtilization' (obligatoire) |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un état défectueux. | Int |
initialDelay | Délai avant la première sonde au format ISO 8601. | corde |
période | Durée entre les sondes au format ISO 8601. | corde |
successThreshold | Nombre de sondes réussies avant de retourner un état sain. | Int |
Timeout | Délai d’expiration de la sonde au format ISO 8601. | corde |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | Int |
Famille | Si le service a différentes générations de matériel, pour la même référence SKU, vous pouvez le capturer ici. | corde |
nom | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’une lettre+code numérique | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison de niveau et d’une autre valeur, il s’agit du code autonome. | corde |
niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Free' 'Premium' 'Standard' |
TargetUtilizationScaleSettings
Nom | Description | Valeur |
---|---|---|
maxInstances | Nombre maximal d’instances auxquelles le déploiement peut être mis à l’échelle. Le quota sera réservé à max_instances. | Int |
minInstances | Nombre minimal d’instances à toujours présenter. | Int |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | corde |
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'TargetUtilization' (obligatoire) |
targetUtilizationPercentage | Ciblez l’utilisation du processeur pour le générateur de mise à l’échelle automatique. | Int |
TrackedResourceTags
Nom | Description | Valeur |
---|
UserAssignedIdentities
Nom | Description | Valeur |
---|
UserAssignedIdentity
Nom | Description | Valeur |
---|
Définition de ressource de modèle ARM
Le type de ressource espaces de travail/onlineEndpoints/déploiements peut être déployé avec des opérations qui ciblent :
- groupes de ressources - Consultez commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format de ressource
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le code JSON suivant à votre modèle.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-06-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour par défaut, utilisez :
{
"scaleType": "Default"
}
Pour TargetUtilization, utilisez :
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
Objets OnlineDeploymentProperties
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour Kubernetes, utilisez :
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
Pour managé, utilisez :
{
"endpointComputeType": "Managed"
}
Valeurs de propriété
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | corde |
scoringScript | [Obligatoire] Script à exécuter au démarrage. Eg. « score.py » | corde Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] (obligatoire) |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
containerResourceLimits | Informations sur la limite des ressources de conteneur : | ContainerResourceSettings |
containerResourceRequests | Informations sur la demande de ressource de conteneur : | ContainerResourceSettings |
ContainerResourceSettings
Nom | Description | Valeur |
---|---|---|
CPU | Nombre de demandes/limites de processeurs virtuels pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
GPU | Nombre de cartes GPU Nvidia demande/limite pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
mémoire | Demande/limite de taille de mémoire pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
DefaultScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Default' (obligatoire) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nom | Description | Valeur |
---|
EndpointDeploymentPropertiesBasePropertiesBaseProperties
Nom | Description | Valeur |
---|
KubernetesOnlineDeployment
Nom | Description | Valeur |
---|---|---|
containerResourceRequirements | Configuration requise pour le conteneur (processeur et mémoire). | ContainerResourceRequirements |
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Kubernetes' (obligatoire) |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM sous la forme : « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs de dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
apiVersion | Version de l’API | '2022-06-01-preview' |
identité | Identité de service managée (identités affectées par le système et/ou identités affectées par l’utilisateur) | ManagedServiceIdentity |
gentil | Métadonnées utilisées par le portail/l’outil/etc pour afficher différentes expériences d’expérience utilisateur pour les ressources du même type. | corde |
emplacement | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
nom | Nom de la ressource | corde Contraintes: Modèle = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatoire) |
Propriétés | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeploymentProperties (obligatoire) |
Sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | référence SKU |
étiquettes | Balises de ressource | Dictionnaire de noms et de valeurs d’étiquettes. Consultez les balises dans les modèles |
type | Type de ressource | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeploymentProperties
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | Bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | codeConfiguration |
description | Description du déploiement du point de terminaison. | corde |
egressPublicNetworkAccess | Si cette option est activée, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Valeur par défaut : activée. | 'Désactivé' 'Activé' |
endpointComputeType | Défini sur « Kubernetes » pour le type KubernetesOnlineDeployment. Défini sur « Managed » pour le type ManagedOnlineDeployment. | 'Kubernetes' 'Managed' (obligatoire) |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | corde |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type d’instance de calcul. | corde |
livenessProbe | La sonde Liveness surveille régulièrement l’intégrité du conteneur. | probeSettings |
modèle | Chemin d’ACCÈS DE l’URI au modèle. | corde |
modelMountPath | Chemin d’accès pour monter le modèle dans un conteneur personnalisé. | corde |
Propriétés | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | La sonde Readiness valide si le conteneur est prêt à servir le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la sonde liveness. | probeSettings |
requestSettings | Demander des paramètres pour le déploiement. | OnlineRequestSettings |
scaleSettings | Mettre à l’échelle les paramètres du déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisé par déploiement. La valeur par défaut est 1. | Int |
maxQueueWait | Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms. |
corde |
requestTimeout | Délai d’expiration du score au format ISO 8601. La valeur par défaut est 5 000 ms. |
corde |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | Défini sur « Default » pour le type DefaultScaleSettings. Défini sur « TargetUtilization » pour le type TargetUtilizationScaleSettings. | 'Default' 'TargetUtilization' (obligatoire) |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un état défectueux. | Int |
initialDelay | Délai avant la première sonde au format ISO 8601. | corde |
période | Durée entre les sondes au format ISO 8601. | corde |
successThreshold | Nombre de sondes réussies avant de retourner un état sain. | Int |
Timeout | Délai d’expiration de la sonde au format ISO 8601. | corde |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | Int |
Famille | Si le service a différentes générations de matériel, pour la même référence SKU, vous pouvez le capturer ici. | corde |
nom | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’une lettre+code numérique | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison de niveau et d’une autre valeur, il s’agit du code autonome. | corde |
niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Free' 'Premium' 'Standard' |
TargetUtilizationScaleSettings
Nom | Description | Valeur |
---|---|---|
maxInstances | Nombre maximal d’instances auxquelles le déploiement peut être mis à l’échelle. Le quota sera réservé à max_instances. | Int |
minInstances | Nombre minimal d’instances à toujours présenter. | Int |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | corde |
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'TargetUtilization' (obligatoire) |
targetUtilizationPercentage | Ciblez l’utilisation du processeur pour le générateur de mise à l’échelle automatique. | Int |
TrackedResourceTags
Nom | Description | Valeur |
---|
UserAssignedIdentities
Nom | Description | Valeur |
---|
UserAssignedIdentity
Nom | Description | Valeur |
---|
Définition de ressource Terraform (fournisseur AzAPI)
Le type de ressource espaces de travail/onlineEndpoints/déploiements peut être déployé avec des opérations qui ciblent :
- groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format de ressource
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le terraform suivant à votre modèle.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
}
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour par défaut, utilisez :
{
scaleType = "Default"
}
Pour TargetUtilization, utilisez :
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
Objets OnlineDeploymentProperties
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour Kubernetes, utilisez :
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
Pour managé, utilisez :
{
endpointComputeType = "Managed"
}
Valeurs de propriété
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | corde |
scoringScript | [Obligatoire] Script à exécuter au démarrage. Eg. « score.py » | corde Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] (obligatoire) |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
containerResourceLimits | Informations sur la limite des ressources de conteneur : | ContainerResourceSettings |
containerResourceRequests | Informations sur la demande de ressource de conteneur : | ContainerResourceSettings |
ContainerResourceSettings
Nom | Description | Valeur |
---|---|---|
CPU | Nombre de demandes/limites de processeurs virtuels pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
GPU | Nombre de cartes GPU Nvidia demande/limite pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
mémoire | Demande/limite de taille de mémoire pour le conteneur. Plus d’informations : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
corde |
DefaultScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Default' (obligatoire) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nom | Description | Valeur |
---|
EndpointDeploymentPropertiesBasePropertiesBaseProperties
Nom | Description | Valeur |
---|
KubernetesOnlineDeployment
Nom | Description | Valeur |
---|---|---|
containerResourceRequirements | Configuration requise pour le conteneur (processeur et mémoire). | ContainerResourceRequirements |
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Kubernetes' (obligatoire) |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM sous la forme : « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs de dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
identité | Identité de service managée (identités affectées par le système et/ou identités affectées par l’utilisateur) | ManagedServiceIdentity |
gentil | Métadonnées utilisées par le portail/l’outil/etc pour afficher différentes expériences d’expérience utilisateur pour les ressources du même type. | corde |
emplacement | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
nom | Nom de la ressource | corde Contraintes: Modèle = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatoire) |
parent_id | ID de la ressource qui est le parent de cette ressource. | ID de ressource de type : espaces de travail /onlineEndpoints |
Propriétés | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeploymentProperties (obligatoire) |
Sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | référence SKU |
étiquettes | Balises de ressource | Dictionnaire de noms et de valeurs d’étiquettes. |
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview » |
OnlineDeploymentProperties
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | Bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | codeConfiguration |
description | Description du déploiement du point de terminaison. | corde |
egressPublicNetworkAccess | Si cette option est activée, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Valeur par défaut : activée. | 'Désactivé' 'Activé' |
endpointComputeType | Défini sur « Kubernetes » pour le type KubernetesOnlineDeployment. Défini sur « Managed » pour le type ManagedOnlineDeployment. | 'Kubernetes' 'Managed' (obligatoire) |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | corde |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type d’instance de calcul. | corde |
livenessProbe | La sonde Liveness surveille régulièrement l’intégrité du conteneur. | probeSettings |
modèle | Chemin d’ACCÈS DE l’URI au modèle. | corde |
modelMountPath | Chemin d’accès pour monter le modèle dans un conteneur personnalisé. | corde |
Propriétés | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | La sonde Readiness valide si le conteneur est prêt à servir le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la sonde liveness. | probeSettings |
requestSettings | Demander des paramètres pour le déploiement. | OnlineRequestSettings |
scaleSettings | Mettre à l’échelle les paramètres du déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisé par déploiement. La valeur par défaut est 1. | Int |
maxQueueWait | Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms. |
corde |
requestTimeout | Délai d’expiration du score au format ISO 8601. La valeur par défaut est 5 000 ms. |
corde |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | Défini sur « Default » pour le type DefaultScaleSettings. Défini sur « TargetUtilization » pour le type TargetUtilizationScaleSettings. | 'Default' 'TargetUtilization' (obligatoire) |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un état défectueux. | Int |
initialDelay | Délai avant la première sonde au format ISO 8601. | corde |
période | Durée entre les sondes au format ISO 8601. | corde |
successThreshold | Nombre de sondes réussies avant de retourner un état sain. | Int |
Timeout | Délai d’expiration de la sonde au format ISO 8601. | corde |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | Int |
Famille | Si le service a différentes générations de matériel, pour la même référence SKU, vous pouvez le capturer ici. | corde |
nom | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’une lettre+code numérique | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison de niveau et d’une autre valeur, il s’agit du code autonome. | corde |
niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Free' 'Premium' 'Standard' |
TargetUtilizationScaleSettings
Nom | Description | Valeur |
---|---|---|
maxInstances | Nombre maximal d’instances auxquelles le déploiement peut être mis à l’échelle. Le quota sera réservé à max_instances. | Int |
minInstances | Nombre minimal d’instances à toujours présenter. | Int |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | corde |
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'TargetUtilization' (obligatoire) |
targetUtilizationPercentage | Ciblez l’utilisation du processeur pour le générateur de mise à l’échelle automatique. | Int |
TrackedResourceTags
Nom | Description | Valeur |
---|
UserAssignedIdentities
Nom | Description | Valeur |
---|
UserAssignedIdentity
Nom | Description | Valeur |
---|