Partager via


Quotas et limites du service

Ce contenu s’applique à : coche v4.0 (GA) | Versions précédentes : coche-bleue v3.1 (GA) coche-bleue v3.0 (GA)

Ce contenu s’applique à : coche v2.1 | Dernière version : coche-bleue v4.0 (GA)

Cet article contient à la fois une référence rapide et une description détaillée des quotas et limites du service Azure AI Intelligence documentaire pour tous les niveaux tarifaires. Il présente également les meilleures pratiques pour éviter la limitation des demandes.

Utilisation du modèle

Types de documents pris en charge Lire Disposition Modèles prédéfinis Modèles personnalisés Fonctionnalités du module complémentaire
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Images : JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office : DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = pris en charge ✖️ = Non pris en charge

Types de documents pris en charge Lire Disposition Modèles prédéfinis Modèles personnalisés
PDF ✔️ ✔️ ✔️ ✔️
Images : JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office : DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = pris en charge ✖️ = Non pris en charge

Billing

La facturation d’Intelligence documentaire est calculée mensuellement selon le type de modèle et le nombre de pages analysées. Vous trouverez les métriques d’utilisation dans le tableau de bord des métriques dans le Portail Azure. Le tableau de bord affiche le nombre de pages qu’Azure AI Intelligence documentaire traite. Vous pouvez obtenir une estimation des coûts de la ressource à l’aide de la Calculatrice de prix Azure. Pour obtenir des instructions détaillées, consultez Vérifier l’utilisation et estimer les coûts. Voici quelques détails :

  • Lorsque vous envoyez un document à des fins d’analyse, le service analyse toutes les pages, sauf si vous spécifiez une plage de pages à l’aide du paramètre pages dans votre demande. Lorsque le service analyse les documents Microsoft Excel et PowerPoint par le biais du modèle de lecture, d’OCR ou de disposition, il compte chaque feuille de calcul Excel et chaque diapositive PowerPoint comme une page.

  • Lorsque le service analyse les fichiers PDF et TIFF, il compte chaque page du fichier PDF ou chaque image du fichier TIFF comme une page sans limites de caractères maximales.

  • Lorsque le service analyse les fichiers Microsoft Word et HTML pris en charge par les modèles de lecture et de disposition, il compte les pages en blocs de 3 000 caractères chacun. Par exemple, si votre document contient 7 000 caractères, trois pages sont comptées : deux pages de 3 000 caractères chacune plus une page de 1 000 caractères.

  • Les modèles Lecture et Disposition ne prennent pas en charge l’analyse des images incorporées ou liées dans les fichiers Microsoft Word, Excel, PowerPoint et HTML. Par conséquent, le service ne les compte pas comme images ajoutées.

  • L’apprentissage d’un modèle personnalisé est toujours gratuit avec Intelligence documentaire. Des frais vous sont facturés uniquement lorsque le service utilise un modèle pour analyser un document.

  • La tarification des conteneurs est identique à celle du service cloud.

  • Intelligence documentaire offre un niveau de tarification gratuit (F0) qui vous permet de tester toutes ses fonctionnalités. Le niveau gratuit limite la réponse d’analyse aux deux premières pages d’une requête.

  • Intelligence documentaire propose un modèle de tarification sur engagement pour les charges de travail volumineuses.

  • Le modèle de disposition est requis afin de générer des étiquettes pour votre jeu de données dans le cadre d’un entraînement personnalisé. Si le jeu de données que vous utilisez pour l’entraînement personnalisé ne dispose pas de fichiers d’étiquettes, le service les génère pour vous et vous facture l’utilisation du modèle de disposition.

Quota Gratuit (F0)1 Standard (S0)
Limite de transactions d’analyse par seconde 1 15 (valeur par défaut)
Réglable Non Oui 2
Limite d’opérations d’obtention par seconde 1 50 (valeur par défaut)
Réglable Non Oui 2
Limite d’opérations de gestion des modèles par seconde 1 5 (valeur par défaut)
Réglable Non Oui 2
Limite d’opérations de liste par seconde 1 10 (valeur par défaut)
Réglable Non Oui 2
Taille maximale de document 4 Mo 500 Mo
Réglable Non Non
Nombre maximal de pages (Analyse) 2 2000
Réglable Non Non
Taille maximale de fichier d’étiquettes 10 Mo 10 Mo
Réglable Non Non
Taille maximale de la réponse json OCR 500 Mo 500 Mo
Réglable Non Non
Nombre maximal de modèles 500 5 000
Réglable Non Non
Nombre maximal de modèles neuronaux 100 500
Réglable Non Non

Utilisation du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Neural et génératif 1 Go 3 1 Go (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Modèle 50 Mo 4 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Modèle 500 500 (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Neural et génératif 50 000 50 000 (valeur par défaut)
Réglable Non Non
Apprentissage du modèle neural personnalisé 10 heures par mois 5 Pas de limite (paiement à l’heure), commencez avec 10 heures gratuites chaque mois
Réglable Non Oui 3
Nombre maximal de pages (entraînement) * Classifieur 10 000 10 000 (valeur par défaut)
Réglable Non No
Nombre maximal de types de documents (classes) * Classifieur 500 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Classifieur 1 Go 2 Go (valeur par défaut)
Réglable Non No
Nombre minimal d’échantillons par classe * Classifieur 5 5 (valeur par défaut)
Réglable Non Non

Utilisation du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 200 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Neural 1 Go 3 1 Go (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Modèle 50 Mo 4 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Modèle 500 500 (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Neural 50 000 50 000 (valeur par défaut)
Réglable Non Non
Apprentissage du modèle neural personnalisé 10 par mois 20 par mois
Réglable Non Oui 3
Nombre maximal de pages (entraînement) * Classifieur 10 000 10 000 (valeur par défaut)
Réglable Non No
Nombre maximal de types de documents (classes) * Classifieur 500 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Classifieur 1 Go 1 Go (valeur par défaut)
Réglable Non No
Nombre minimal d’échantillons par classe * Classifieur 5 5 (valeur par défaut)
Réglable Non Non

Utilisation du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 200 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Neural 1 Go 3 1 Go (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Modèle 50 Mo 4 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Modèle 500 500 (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Neural 50 000 50 000 (valeur par défaut)
Réglable Non Non
Apprentissage du modèle neural personnalisé 10 par mois 20 par mois
Réglable Non Oui 3
Nombre maximal de pages (entraînement) * Classifieur 10 000 10 000 (valeur par défaut)
Réglable Non No
Nombre maximal de types de documents (classes) * Classifieur 500 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Classifieur 1 Go 1 Go (valeur par défaut)
Réglable Non No
Nombre minimal d’échantillons par classe * Classifieur 5 5 (valeur par défaut)
Réglable Non Non

Limites du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 200 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement 50 Mo 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) 500 500 (valeur par défaut)
Réglable Non Non

1 Pour le niveau tarifaire Gratuit (F0), consultez également les limites mensuelles sur la page de tarification.
2 Consultez les bonnes pratiques et les instructions d’ajustement.
3 Le décompte des entraînements de modèles neuraux est réinitialisé tous les premiers du mois. Ouvrez une demande de support pour augmenter la limite d’entraînement mensuelle. À compter de l’API v4.0, les demandes d’apprentissage supérieures à 20 requêtes dans un mois calendrier sont facturées sur le niveau Apprentissage. Pour en savoir plus, voir les tarifs.

4 Cette limite s’applique à tous les documents trouvés dans votre dossier de jeu de données d’apprentissage avant les mises à jour liées à l’étiquetage.

5 Cette limite s’applique uniquement aux modèles neuraux personnalisés v 4.0 (2024-11-30 GA). À partir de v 4.0, nous prenons en charge l’entraînement avec des documents plus volumineux sur des durées plus longues (jusqu’à 10 heures gratuitement, et moyennant des frais par la suite). Pour plus d'informations, veuillez vous référer à la page du modèle neuronal personnalisé.

Description détaillée, ajustement de quota et meilleures pratiques

Les limites par défaut peuvent être étendues en demandant une augmentation via un ticket de support. Avant de demander une augmentation de quota (le cas échéant), assurez-vous qu’elle est nécessaire. Le service Intelligence documentaire utilise la mise à l’échelle automatique pour mettre les ressources de calcul requises on-demand, limiter le coût pour les clients, ainsi que déprovisionner des ressources non utilisées en ne conservant pas une quantité excessive de capacité matérielle.

Si votre application retourne le code de réponse 429 (Trop de requêtes), c’est que vous dépassez le seuil pour une ou plusieurs des limites de transactions par seconde (TPS) :

  • Limites de transactions d’analyse par seconde La limite de TPS pour envoyer des demandes d’analyse (POST)
  • Limite d’opérations d’obtention par seconde La limite de TPS pour interroger des résultats sur les opérations d’analyse (GET)
  • Limites d’opérations de gestion des modèles par seconde Opérations liées à la gestion des modèles, comme la génération/l’apprentissage et la copie.
  • Limite d’opérations de liste par seconde Opérations liées aux listes de modèles, opérations.

Meilleures pratiques générales pour atténuer la limitation lors de la mise à l’échelle automatique

Pour réduire les problèmes liés à la limitation (code de réponse 429), nous vous recommandons d’utiliser les techniques suivantes :

  • Implémentez la logique de nouvelle tentative dans votre application.
  • Évitez les variations nettes de la charge de travail. Augmentez la charge de travail graduellement.
    Exemple. Votre application utilise Intelligence documentaire et votre charge de travail actuelle est de 10 TPS (transactions par seconde). La seconde suivante, vous augmentez la charge à 40 TPS. Le résultat est un code de réponse 429 pour certaines requêtes, car vous dépassez la limite de 15 TPS pour soumettre des opérations d’analyse. Vous pouvez soit réduire le traitement pour rester en dessous des 15 TPS, soit demander une augmentation des TPS pour faire face à vos volumes plus importants.

Les sections suivantes décrivent des cas spécifiques d’ajustement des quotas. Passer à Intelligence documentaire : augmentation de la limite de requêtes simultanées

Augmentation de la mimite de demandes de transactions par seconde

Par défaut, le nombre de transactions par seconde est limité à 15 TPS pour une ressource Intelligence documentaire. Pour le niveau tarifaire standard, vous pouvez augmenter ce nombre. Avant de soumettre la requête, assurez-vous que vous êtes familiarisé avec le contenu de cette section et que vous connaissez ces meilleures pratiques.

La première étape consiste à activer la mise à l’échelle automatique. Suivez ce document pour activer la mise à l’échelle automatique sur votre ressource * activer la mise à l’échelle automatique. Une fois la mise à l’échelle automatique activée, votre ressource peut continuer à accepter des requêtes au-delà des limites de TPS configurées s’il y a une capacité sur le service. Ceci peut néanmoins encore aboutir à une limitation des requêtes.

L’amélioration de la limite de demandes simultanées n’affecte pas directement vos coûts. Le service Intelligence documentaire utilise le modèle « Payez uniquement pour ce que vous utilisez ». La limite définit la hauteur à laquelle le service peut mettre à l’échelle avant de commencer à limiter vos demandes.

La valeur existante pour les différentes catégories de limites de requêtes est disponible via le portail Azure, sous l’onglet Surveillance du panneau Vue d’ensemble des ressources.

Créer et soumettre une demande de support pour l’augmentation des TPS

Initiez l’augmentation de la limite de transactions par seconde (TPS) pour votre ressource en envoyant la demande de support :

  • Connectez-vous au portail Azure
  • Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de TPS
  • Sélectionnez Nouvelle demande de support (groupe Support + résolution des problèmes). Une nouvelle fenêtre s’affiche, avec des informations renseignées automatiquement sur votre abonnement Azure et la ressource Azure
  • Entrez un Résumé (par exemple, « Augmenter la limite de TPS Intelligence documentaire »).
  • Pour le champ Type de problème, sélectionnez Validation du quota ou de l’utilisation.
  • Sélectionnez Suivant : Solutions.
  • Poursuivre avec la création de la demande.
  • Sous l’onglet Détails, entrez les informations suivantes dans le champ Description :
    • notez que la requête concerne le quota Intelligence documentaire.
    • Fournir une prévision TPS pour laquelle vous souhaitez effectuer une mise à l’échelle. Bien que les augmentations de Tps soient gratuites, vous ne devez demander qu’un nombre de TPS raisonnable pour votre charge de travail.
    • Informations sur les ressources Azure
    • Entrez le reste des informations requises et sélectionnez le bouton Créer sous l’onglet Vérifier + créer.
    • notez le numéro de demande de support dans les notifications du portail Azure. Le support vous contactera sous peu pour la suite du traitement.

Exemple de meilleure pratique pour un modèle de charge de travail

Cet exemple présente l’approche que nous recommandons de suivre pour atténuer la limitation possible des demandes en raison d’une mise à l’échelle automatique en cours. Il ne s’agit pas d’une recette exacte, mais d’un modèle que nous invitons à suivre et à ajuster en fonction des besoins.

Supposons qu’une limite par défaut est définie pour la ressource Intelligence documentaire. Démarrez la charge de travail pour soumettre vos demandes d’analyse. Si vous constatez des limitations fréquentes avec le code de réponse 429, commencez par implémenter une réduction exponentielle sur la requête de réponse d’analyse GET. En utilisant un temps d’attente progressivement plus long entre les nouvelles tentatives pour les réponses d’erreur consécutives, par exemple un schéma 2-5-13-34 de retards entre les demandes. En général, nous vous recommandons de ne pas appeler la réponse d’analyse GET plus d’une fois toutes les 2 secondes pour une requête POST correspondante. La réponse analyze contient également un en-tête retry-after qui indique la durée en secondes pendant laquelle vous devez attendre avant de vérifier la fin de cette requête.

Si vous constatez que vous êtes limité sur le nombre de demandes POST pour les documents en cours d’envoi, envisagez d’ajouter un délai entre les demandes. Si votre charge de travail nécessite un niveau de traitement simultané plus élevé, vous devez créer une demande de support pour augmenter vos limites de service sur le nombre de transactions par seconde.

En règle générale, il est recommandé de tester la charge de travail et les modèles de charge de travail avant de passer en production.

Étapes suivantes