Mise à jour d’août 2024 d’Azure OpenAI Provisioned
À la mi-août 2024, Microsoft a initié des améliorations à son offre Débit approvisionné en répondant aux commentaires des clients sur la facilité d’utilisation et l’agilité opérationnelle qui inaugurent de nouvelles options de paiement et des scénarios de déploiement.
Cet article est destiné aux utilisateurs existants de l’offre de débit approvisionné. Les nouveaux clients devraient consulter le Guide d’intégration d’Azure OpenAI Provisioned.
Ce qui a changé
Les fonctionnalités ci-dessous sont déployées pour l’offre Approvisionné managé.
Important
Les changements dans cet article ne s’appliquent pas à l’offre « Approvisionné classique (PTU-C) » classique. Ils affectent uniquement l’offre Approvisionné (également appelée Approvisionné managé).
Améliorations de la convivialité
Fonctionnalité | Avantage |
---|---|
Quota indépendant du modèle | Une limite de quota unique couvrant tous les modèles/toutes les versions réduit l’administration des quotas et accélère l’expérimentation des nouveaux modèles. |
Demandes de quota en libre-service | Demander des augmentations de quota sans contacter l’équipe commerciale, beaucoup peuvent être approuvées automatiquement. |
Quota approvisionné-approuvé par défaut dans de nombreuses régions | Démarrez rapidement sans avoir à demander d’abord un quota. |
Des informations transparentes sur la disponibilité de capacité en temps réel + nouveau flux de déploiement | Une négociation réduite de la disponibilité accélère le délai de commercialisation. |
Nouveau modèle commercial horaire/réservation
Fonctionnalité | Avantage |
---|---|
Utilisation mensuelle sans engagement | L’option de paiement horaire sans engagement exigé rend possible des scénarios de déploiement à court terme. |
Remises à terme via des réservations Azure | Les réservations Azure offrent des remises importantes sur le taux horaire, pour les termes sur un mois et sur un an, et fournissent des étendues flexibles réduisant l’administration et qui sont associées aux engagements liés à la ressource d’aujourd’hui. |
Quota approvisionné-approuvé par défaut dans de nombreuses régions | Démarrez rapidement dans de nouvelles régions sans avoir à demander d’abord un quota. |
Choix flexible du modèle de paiement pour les clients approvisionnés existants | Les clients ayant des engagements peuvent rester sur le modèle d’engagement au moins jusqu’à la fin de 2024 et peuvent choisir de migrer des engagements existants vers des réservations/option horaire via un processus managé ou en self-service. |
Prise en charge des dernières générations de modèles | Le modèle horaire/réservation est tenu de déployer les modèles mis en production après le 1er août 2024. |
Détails sur l’amélioration de la facilité d’utilisation
La granularité de quota approvisionnée change du mode spécifique au modèle vers celui indépendant du modèle. Plutôt que chaque modèle et chaque version au sein d’un abonnement et d’une région aient leur propre limite de quota, il existe un élément de quota unique par abonnement et par région qui limite le nombre total de PTU pouvant être déployées sur tous les modèles et toutes les versions pris en charge.
Quota indépendant du modèle
À compter du 12 août 2024, le quota spécifique au modèle actuel des clients existants est converti en quota indépendant du modèle. Cela se fait automatiquement. Aucun quota n’est perdu lors de la transition. Les limites de quota existantes sont additionnées et affectées à un nouvel élément de quota indépendant du modèle.
Le nouveau quota indépendant du modèle s’affiche en tant qu’élément de quota nommé Unité de débit managée provisionnée, le modèle et la version n’étant plus inclus dans le nom. Dans le volet Quota Studio, le développement de l’élément de quota affiche toujours tous les déploiements contribuant à l’élément de quota.
Quota par défaut
Une petite quantité de quota approvisionné est affectée à des abonnements nouveaux et existants dans plusieurs régions. Cela permet aux clients de commencer à utiliser ces régions sans avoir à demander d’abord un quota.
Pour les clients existants, si la région contient déjà une affectation de quota, la limite de quota n’est pas changée pour la région. Par exemple, elle n’est pas automatiquement augmentée par la nouvelle quantité par défaut.
Demandes de quota en libre-service
Les clients n’obtiennent plus un quota en contactant leur équipe commerciale. Ils utilisent à la place le formulaire de demande de quota en libre-service et spécifient le type de quota managé par la PTU. Le formulaire est accessible à partir d’un lien à droite de l’élément de quota. La cible doit répondre à toutes les demandes de quota dans les deux jours ouvrables.
La capture d’écran de quota suivante montre un quota indépendant du modèle utilisé par des déploiements de plusieurs types, ainsi que le lien pour une demande de quota supplémentaire.
Quota en tant que limite
Avant la mise à jour du mois d’août, Azure OpenAI Provisioned était uniquement à la disposition de quelques utilisateurs et le quota était alloué pour maximiser leur capacité à déployer et à l’utiliser. Grâce à ces modifications, le processus d’acquisition de quota est simplifié pour tous les utilisateurs et il existe une probabilité plus élevée de rencontrer des limitations de capacité de service lorsque des déploiements sont tentés. Une nouvelle expérience Studio et une nouvelle API sont disponibles pour aider les utilisateurs à trouver les régions dans lesquelles l’abonnement a un quota et où le service peut prendre en charge les déploiements d’un modèle souhaité.
Nous recommandons également aux clients utilisant actuellement des engagements de créer leurs déploiements avant de créer ou d’étendre les engagements destinés à les couvrir. Cette opération veille à ce que la capacité soit disponible avant de créer un engagement et empêche un achat superflu d’engagement. Pour la prendre en charge, la restriction ayant empêché la création de déploiements plus grands que leurs engagements a été supprimée. Cette nouvelle approche vers le quota, la disponibilité de capacité et les engagements correspond à ce qui est fourni dans le cadre du modèle horaire/réservation. L’aide au déploiement avant d’acheter un engagement (ou une réservation pour le modèle horaire) est la même pour les deux.
Pour plus d'informations, consultez les liens suivants. L’aide en matière de réservations et d’engagements est la même :
Nouveau modèle de paiement de la réservation horaire
Remarque
La description suivante des modèles de paiement ne s’applique pas à l’ancienne offre « Approvisionné classique (PTU-C) ». Ils affectent uniquement l’offre Approvisionné (aussi appelée Approvisionné managé). La gestion de l’option Approvisionné classique par le modèle de paiement d’abonnement mensuel se poursuit.
Microsoft a lancé un nouveau modèle de paiement « Horaire/réservation » pour les déploiements approvisionnés. Elle vient s’ajouter au modèle de paiement Engagement actuel qui va continuer à être pris en charge au moins jusqu’à la fin de 2024.
Modèle de paiement d’engagement
Un abonnement mensuel régional est requis pour utiliser l’option Approvisionné (des termes plus longs sont disponibles par voie contractuelle).
Les engagements sont liés aux ressources Azure OpenAI, ce qui rend difficile le déplacement de déploiements entre les ressources.
Les engagements ne peuvent pas être annulés ou modifiés pendant leur terme, excepté pour ajouter de nouvelles PTU.
Prend en charge les modèles mis en production avant le 1er août 2024.
Modèle de paiement de la réservation horaire
Le modèle de paiement s’aligne sur les normes Azure d’autres produits.
L’utilisation horaire est prise en charge sans engagement.
Des remises sur les termes d’un mois et d’un an peuvent être acquises comme réservations Azure régionales.
Les réservations peuvent être étendues de manière flexible pour couvrir plusieurs abonnements et l’étendue peut être modifiée à mi-terme.
Prend en charge tous les modèles, anciens et nouveaux.
Important
Les modèles mis en production après le 1er août 2024 nécessitent l’utilisation du modèle de paiement Horaire/Réservation. Ils ne sont pas déployables sur des ressources Azure OpenAI ayant des engagements actifs. Pour déployer des modèles mis en production après le 1er août, les clients existants doivent :
- Créez des déploiements sur des ressources Azure OpenAI sans engagements.
- Migrer une ressource existante hors de ses engagements.
Infrastructure des modèles de paiement
Avec la publication du modèle de paiement horaire/réservé, les options de paiement sont plus flexibles et le modèle autour des paiements approvisionnés a changé. Lorsque les engagements d’un mois étaient le seul moyen d’achat approvisionné, le modèle était :
- Obtenez un quota de PTU auprès de l’équipe de votre compte Microsoft.
- « Achetez » un quota à partir d’un engagement sur la ressource dans laquelle vous souhaitez effectuer le déploiement.
- Créez des déploiements sur la ressource jusqu’à la limite de l’engagement.
La principale différence entre ce modèle et le nouveau modèle est qu’auparavant la seule façon d’effectuer un paiement approvisionné était par le biais d’une remise sur la durée d’un mois. À présent, vous pouvez déployer et effectuer un paiement horaire des déploiements si vous le souhaitez et prendre une décision distincte quant à leur remise par le biais soit d’un engagement d’un mois (comme avant), soit d’une réservation Azure.
Avec cette idée, la nouvelle façon de réfléchir aux modèles de paiement est la suivante :
- Obtenez un quota de PTU à l’aide du formulaire libre-service.
- Créez des déploiements à l’aide de votre quota.
- Si vous le souhaitez, achetez ou étendez un engagement ou une réservation pour appliquer une remise sur la durée de vos déploiements.
Les étapes 1 et 2 sont les mêmes dans tous les cas. La différence est de savoir si un engagement ou une réservation Azure est utilisé comme véhicule pour fournir la remise. Dans les deux modèles :
Il est possible de déployer davantage de PTU que les PTU à prix réduit. (par exemple, la création d’un déploiement à court terme pour essayer un nouveau modèle est activée en effectuant un déploiement sans acheter de remise)
La méthode de remise (engagement ou réservation) applique le prix réduit à un nombre fixe de PTU et a une étendue qui définit les déploiements qui sont comptabilisés par rapport à la remise.
Type de remise Étendues disponibles (dans une région) Avec engagement Ressource Azure OpenAI Ligne2 Groupe de ressources, abonnement unique, groupe d’administration (groupe d’abonnements), partagé (tous les abonnements dans un compte de facturation) Le prix réduit est appliqué aux PTU déployées jusqu’au nombre d’unités de PTU à prix réduit dans la remise.
Les PTU déployées en plus des PTU à prix réduit (ou non couvertes par une remise) sont facturées au tarif horaire.
La meilleure pratique consiste à créer d’abord des déploiements, puis à appliquer des remises. Cela sert à garantir ce service. la capacité est disponible pour prendre en charge vos déploiements avant la création d’un engagement sur la durée pour les PTU que vous ne pouvez pas utiliser.
Remarque
Lorsque vous suivez les meilleures pratiques, vous pouvez recevoir des frais horaires entre la création du déploiement et l’augmentation de votre remise (engagement ou réservation).
Pour cette raison, nous vous recommandons d’être prêt à augmenter votre remise immédiatement après le déploiement. Les conditions préalables à l’achat d’une réservation Azure sont différentes des engagements, et nous vous recommandons de les valider avant le déploiement si vous envisagez de les utiliser pour obtenir une remise sur votre déploiement. Pour plus d’informations, consultez Autorisations pour afficher et gérer les réservations Azure
Mappage de déploiements à la méthode de remise
Les clients qui utilisent Azure OpenAI Approvisionné avant août 2024 peuvent utiliser l’un des modèles de paiement, ou les deux, simultanément au sein d’un abonnement. Le modèle de paiement utilisé pour chaque déploiement est déterminé en fonction de sa ressource Azure OpenAI :
La ressource a un engagement actif
- L’engagement réduit tous les déploiements sur la ressource jusqu’au nombre de PTU sur l’engagement. Tous les PTU excédentaires bénéficieront d’une facturation horaire.
La ressource n’a pas d’engagement actif
- Les déploiements sous la ressource peuvent être réduits par le biais d’une réservation Azure. Pour que ces déploiements soient réduits, ils doivent se trouver dans l’étendue d’une réservation active. Tous les déploiements dans l’étendue de la réservation (y compris éventuellement les déploiements sur d’autres ressources dans le même abonnement ou d’autres abonnements) seront réduits en tant que groupe jusqu’au nombre de PTU sur la réservation. Tous les PTU excédentaires bénéficieront d’une facturation horaire.
Modifications apportées au mode de paiement existant
Les clients ayant aujourd’hui des engagements peuvent continuer à les utiliser au moins jusqu’à la fin de l’année 2024. Cela inclut l’achat de nouvelles PTU sur des engagements nouveaux ou existants et la gestion des comportements de renouvellement d’engagements. Cependant, la mise à jour du mois d’août a changé certains aspects de l’opération d’engagement.
Seuls les modèles mis en production comme étant approvisionnés avant le 1er août 2024 peuvent être déployés sur une ressource avec un engagement.
Si les PTU déployées selon un engagement dépassent les PTU engagées, les frais de dépassement horaires sont émis sur le même compteur horaire utilisé pour le modèle de paiement horaire/réservation. Cela permet aux frais de dépassement d’être remisés via une réservation Azure.
Il est possible de déployer davantage de PTU que celles engagées sur la ressource. Cela offre la possibilité de garantir la disponibilité de la capacité avant d’augmenter la taille d’engagement pour la couvrir.
Migration de ressources existantes hors engagements
Les clients existants peuvent choisir de migrer leurs ressources existantes du modèle Engagement vers le modèle Horaire/Réservation pour profiter de la possibilité de déployer les modèles les plus récents, ou pour consolider la remise pour divers déploiements sous une réservation unique.
Deux approches sont disponibles pour les clients afin de migrer des ressources utilisant le modèle Engagement vers le modèle Horaire/Réservation.
Migration en self-service
L’approche de migration en self-service permet à un client d’extraire des ressources de ses engagements de manière organique en leur permettant d’expirer. Le processus de migration d’une ressource est le suivant :
Définissez un engagement existant ne faisant pas l’objet d’un renouvellement automatique et notez la date d’expiration.
Avant la date d’expiration, un client doit acheter une réservation Azure couvrant le nombre total de PTU engagées par abonnement. Si une réservation existante a déjà l’abonnement dans son étendue, elle peut être augmentée en taille pour couvrir les nouvelles PTU.
Lorsque l’engagement expire, les déploiements sous la ressource basculent automatiquement vers le mode Horaire/Réservation ayant l’utilisation remisée par la réservation.
L’approche de migration en self-service entraîne un chevauchement où la réservation et l’engagement sont actifs. Il s’agit d’une caractéristique de ce mode de migration. Le temps de réservation ou d’engagement pour ce chevauchement n’est pas remboursé au client.
Une autre approche à la migration en self-service consiste à basculer l’achat de réservation pour qu’il se produise après l’expiration de l’engagement. Dans cette approche, les déploiements génèrent une utilisation horaire pour la période comprise entre l’expiration de l’engagement et l’achat de la réservation. Comme pour le modèle précédent, il s’agit d’une caractéristique de cette approche et cette utilisation horaire n’est pas remboursée.
Avantages de la migration en self-service :
- Les ressources individuelles peuvent être migrées à différents moments.
- Les clients gèrent la migration sans aucune dépendance sur Microsoft.
Inconvénients de la migration en self-service :
- Il existe une courte période de double facturation ou de frais horaires pendant le basculement de la facturation engagée à la facturation horaire/réservation.
Important
Les deux approches en self-service génèrent des frais supplémentaires, car le mode de paiement est basculé d’Engagé vers le mode Horaire/Réservation. Ce sont les caractéristiques des approches de migration et les clients ne sont pas remboursés pour ces frais. Les clients peuvent choisir d’utiliser l’approche de migration managée décrite ci-dessous pour les éviter.
Migration managée
L’approche de migration managée implique le partenariat du client avec Microsoft pour migrer en bloc tous les engagements de PTU d’un abonnement/d’une région en même temps. Il fonctionne comme ceci :
- Le client implique l’équipe en charge de son compte et demande une migration managée. Un propriétaire de migration de l’équipe Microsoft est affecté pour contribuer au processus de migration du client.
- Une date sera sélectionnée lorsque toutes les ressources au sein de chacune des régions et de chacun des abonnements des clients contenant les engagements de PTU actuels seront migrées du modèle de facturation Engagé vers le modèle horaire/réservation. Plusieurs abonnements et régions peuvent être migrés à la même date.
- À la date convenue :
- Le client achète des réservations régionales pour couvrir les PTU engagées à convertir et transmet les informations sur la réservation à son contact migration au sein de Microsoft.
- Dans les 2 à 3 jours ouvrables, tous les engagements seront proactivement annulés et les déploiements précédemment sous les engagements commenceront à utiliser le modèle de paiement horaire/réservation.
- Au cours de la période de facturation après celle avec l’achat de réservation, le client reçoit un crédit pour l’achat de réservation couvrant les portions des engagements annulés, à compter de l’achat de la réservation.
Les clients doivent contacter les équipes en charge de leur compte pour planifier une migration managée.
Avantages de la migration managée :
- La migration en bloc de tous les engagements d’un abonnement/d’une région est avantageuse pour les clients ayant plusieurs engagements.
- Migration au coût transparent : aucune possibilité de facturation en double ou de frais horaires supplémentaires.
Inconvénients de la migration managée :
- Tous les engagements d’un abonnement/d’une région doivent être migrés en même temps.
- Nécessité de coordonner une heure pour la migration avec l’équipe de Microsoft.
Gestion des engagements de débit approvisionnés
Les engagements de débit approvisionné sont créés et gérés à partir du menu Gérer les engagements dans Azure OpenAI Studio. Vous pouvez accéder à cet affichage en sélectionnant Gérer les engagements dans le volet Quota :
Dans la vue Gérer les engagements, vous pouvez effectuer plusieurs opérations :
- Acheter de nouveaux engagements ou modifiez les engagements existants.
- Superviser tous les engagements dans votre abonnement.
- Identifier et prendre des mesures sur les engagements susceptibles de provoquer une facturation inattendue.
Les sections suivantes vous aideront à effectuer ces tâches.
Achat d’un engagement de débit approvisionné
Avec votre plan d’engagement prêt, l’étape suivante consiste à créer les engagements. Les engagements sont créés manuellement via Azure OpenAI Studio et nécessitent que l’utilisateur qui crée l’engagement ait le rôle Contributeur ou Contributeur Cognitive Services au niveau de l’abonnement.
Pour chaque nouvel engagement que vous devez créer, procédez comme suit :
- Lancez la boîte de dialogue Achat de débit approvisionné en sélectionnant Quota>Azure OpenAI Provisioned>Gérer les plans d’engagement.
Sélectionnez Acheter un engagement.
Sélectionnez la ressource Azure OpenAI et achetez l’engagement. Vous verrez vos ressources divisées en ressources avec des engagements existants, que vous pouvez modifier et les ressources qui n’ont pas actuellement d’engagement.
Setting | Notes |
---|---|
Sélectionner une ressource | Choisissez la ressource dans laquelle vous allez créer le déploiement approvisionné. Une fois que vous avez acheté l’engagement, vous ne pourrez pas utiliser les PTU sur une autre ressource jusqu’à l’expiration de l’engagement actuel. |
Sélectionner un type d’engagement | Sélectionnez Provisionné. (Approvisionné équivaut à Approvisionné managé) |
Quota approvisionné non validé actuel | Nombre de PTU actuellement disponibles pour vous permettre de valider cette ressource. |
Montant à valider (PTU) | Choisissez le nombre de PTU que vous engagez. Vous pouvez augmenter ce nombre pendant la période d’engagement, mais pas le diminuer. Entrez les valeurs par incréments de 50 pour le type d’engagement Approvisionné. |
Niveau d’engagement pour la période actuelle | La période d’engagement est définie sur un mois. |
Paramètres de renouvellement | Renouveler automatiquement aux PTU actuelles Renouveler automatiquement à des PTU inférieures Ne pas renouveler automatiquement |
- Sélectionnez Achat. Une boîte de dialogue de confirmation s’affiche. Une fois que vous avez confirmé, vos PTU sont validées et vous pouvez les utiliser pour créer un déploiement approvisionné. |
Important
Un nouvel engagement est facturé à l’avance pour toute la durée. Si les paramètres de renouvellement sont définis sur renouvellement automatique, vous serez facturé à nouveau à chaque date de renouvellement en fonction des paramètres de renouvellement.
Modifier un engagement de débit approvisionné existant
Dans la vue Gérer les engagements, vous pouvez également modifier un engagement existant. Il existe deux types de modifications que vous pouvez apporter à un engagement existant :
- Vous pouvez ajouter des PTU à l’engagement.
- Vous pouvez modifier les paramètres de renouvellement.
Pour modifier un engagement, sélectionnez-le, puis sélectionnez Modifier l’engagement.
Ajout d’unités de débit approvisionnées à des engagements existants
L’ajout de PTU à un engagement existant vous permet de créer des déploiements plus volumineux ou plus nombreux au sein de la ressource. Vous pouvez le faire à tout moment pendant la durée de votre engagement.
Important
Lorsque vous ajoutez des PTU à un engagement, elles sont facturées immédiatement, à un montant calculé au prorata de la date actuelle jusqu’à la fin de la période d’engagement existante. L’ajout de PTU ne réinitialise pas le terme d’engagement.
Modification des paramètres de renouvellement
Vous pouvez modifier les paramètres de renouvellement de l’engagement à tout moment avant la date d’expiration de votre engagement. Les raisons pour lesquelles vous souhaiterez peut-être modifier les paramètres de renouvellement incluent la fin de votre utilisation du débit approvisionné en définissant l’engagement sur ne pas renouveler automatiquement, ou la réduction de l’utilisation du débit approvisionné en réduisant le nombre de PTU qui seront validées au cours de la prochaine période.
Important
Si vous autorisez un engagement à expirer ou à diminuer la taille de telle sorte que les déploiements sous la ressource nécessitent plus de PTU que vous n’en avez dans votre engagement de ressource, vous ferez l’objet de frais de dépassement horaires pour toute PTU excédentaire. Par exemple, une ressource qui a des déploiements qui totalisent 500 PTU et un engagement pour 300 PTU généreront des frais de dépassement horaire pour 200 PTU.
Superviser les engagements et empêcher les facturations inattendues
Le volet Gérer les engagements fournit une vue d’ensemble de l’abonnement de toutes les ressources avec les engagements et l’utilisation de PTU dans un abonnement Azure donné. D’une importance particulière sont les suivantes :
- PTU validées, déployées et utilisées : ces chiffres représentent la taille de vos engagements et la quantité utilisée par les déploiements. Optimisez votre investissement en utilisant l’ensemble de vos PTU validées.
- Stratégie d’expiration et date : la date d’expiration et la stratégie vous indiquent quand un engagement expire et ce qui se passe quand il le fait. Un engagement défini pour le renouvellement automatique génère un événement de facturation à la date de renouvellement. Pour les engagements arrivant à expiration, veillez à supprimer les déploiements de ces ressources avant la date d’expiration pour empêcher la facturation de dépassement horaire. Les paramètres de renouvellement actuels d’un engagement.
- Notifications : alertes concernant des conditions importantes telles que les engagements inutilisés et les configurations susceptibles d’entraîner des dépassements de facturation. Les dépassements de facturation peuvent être causés par des situations telles que le moment où un engagement a expiré et que les déploiements sont toujours présents, mais qu’ils sont passés à la facturation horaire.
Scénarios courants de gestion des engagements
Arrêt de l’utilisation du débit approvisionné
Pour mettre fin à l’utilisation du débit approvisionné et empêcher les frais de dépassement horaire après l’expiration de l’engagement, arrêtez les frais après l’expiration des engagements actuels. Vous devez effectuer deux étapes :
- Définissez la stratégie de renouvellement de tous les engagements sur Ne pas renouveler automatiquement.
- Supprimez les déploiements approvisionnés à l’aide du quota.
Déplacer un engagement/déploiement vers une nouvelle ressource dans le même abonnement/région
Dans Azure OpenAI Studio, il n’est pas possible de déplacer directement un déploiement ou un engagement vers une nouvelle ressource. Au lieu de cela, un nouveau déploiement doit être créé sur la ressource cible et le trafic déplacé vers celui-ci. Pour ce faire, un engagement acheté devra être établi sur la nouvelle ressource. Étant donné que les engagements sont facturés à l’avance pour une période de 30 jours, il est nécessaire d’effectuer ce déplacement avec l’expiration de l’engagement d’origine afin de réduire le chevauchement avec le nouvel engagement et la « double facturation » pendant le chevauchement.
Il existe deux approches pour effectuer cette transition.
Option 1 : basculement sans chevauchement
Cette option nécessite un temps d’arrêt, mais ne nécessite aucun quota supplémentaire et ne génère aucun coût supplémentaire.
Étapes | Notes |
---|---|
Définissez la stratégie de renouvellement pour que l’engagement existant expire | Cela empêchera l’engagement d’être renouveler et de générer d’autres frais |
Avant l’expiration de l’engagement existant, supprimez son déploiement | Le temps d’arrêt commence à ce stade et durera jusqu’à ce que le nouveau déploiement soit créé et que le trafic soit déplacé. Vous réduirez la durée en programmant la suppression le plus près possible de la date/heure d’expiration. |
Après l’expiration de l’engagement existant, créez l’engagement sur la nouvelle ressource | Réduisez le temps d’arrêt en effectuant cette étape et l’étape suivante dès que possible après expiration. |
Créez le déploiement sur la nouvelle ressource et déplacez le trafic vers celui-ci |
Option 2 : basculement superposé
Cette option permet d’éviter les temps d’arrêt grâce à la mise en service simultanée du déploiement existant et du nouveau déploiement. Cela nécessite de disposer d’un quota pour créer le nouveau déploiement et génère des coûts supplémentaires pour la durée des déploiements qui se chevauchent.
Étapes | Notes |
---|---|
Définissez la stratégie de renouvellement pour que l’engagement existant expire | Cela empêche l’engagement d’être renouveler et de générer d’autres frais. |
Avant l’expiration de l’engagement existant : 1. Créez l’engagement sur la nouvelle ressource. 2. Créez le nouveau déploiement. 3. Basculez le trafic 4. Supprimez le déploiement existant |
Veillez à laisser suffisamment de temps pour toutes les étapes avant l’expiration de l’engagement existant, sinon les frais de dépassement seront générés (voir la section suivante) pour les options. |
Si la dernière étape prend plus de temps que prévu et se termine après l’expiration de l’engagement existant, il existe trois options pour réduire les frais de dépassement.
- Effectuez un temps d’arrêt : supprimez le déploiement d’origine, puis effectuez le déplacement.
- Payer le dépassement : conservez le déploiement d’origine et passez à une facturation horaire jusqu’à ce que vous ayez terminé le trafic et supprimé le déploiement.
- Réinitialisez l’engagement d’origine pour le renouveler une fois de plus. Cela vous donnera le temps d’effectuer le déplacement avec un coût connu.
Le paiement d’un dépassement et la réinitialisation de l’engagement d’origine généreront des frais au-delà de la date d’expiration d’origine. Le paiement de frais de dépassement peut être moins cher qu’un nouvel engagement d’un mois si vous n’avez besoin que d’un jour ou deux pour terminer le déplacement. Comparez les coûts des deux options pour trouver l’approche la moins chère.
Déplacer le déploiement vers une nouvelle région ou un nouvel abonnement
Les mêmes approches s’appliquent au déplacement de l’engagement et du déploiement au sein de la région, sauf que le quota disponible dans le nouvel emplacement sera requis dans tous les cas.
Afficher et modifier une ressource existante
Dans Azure OpenAI Studio, sélectionnez Quota>Approvisionné>Gérer les engagements et sélectionnez une ressource avec un engagement existant pour l’afficher/la modifier.