Partilhar via


Quotas e limites do serviço

Este conteúdo aplica-se a:marca de verificação v4.0 (GA) | Versões anteriores:Marca de verificação azul v3.1 (GA)Marca de verificação azul v3.0 (GA)

Este conteúdo aplica-se a: marca de verificação v2.1 | Última versão: Marca de verificação azul v4.0 (GA)

Este artigo contém uma referência rápida e uma descrição detalhada das Cotas e Limites do serviço Azure AI Document Intelligence para todos os níveis de preço. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Utilização do modelo

Tipos de documentos suportados Lida Esquema Modelos pré-criados Modelos personalizados Capacidades adicionais
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Imagens: JPEG/JPG, PNG, BMP, TIFF, , HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = suportado ✖️ = Não suportado

Tipos de documentos suportados Lida Esquema Modelos pré-criados Modelos personalizados
PDF ✔️ ✔️ ✔️ ✔️
Imagens: JPEG/JPG, PNG, BMP, TIFF, , HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = suportado ✖️ = Não suportado

Faturação

O faturamento do Document Intelligence é calculado mensalmente com base no tipo de modelo e no número de páginas analisadas. Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure AI Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços do Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo. Aqui estão alguns detalhes:

  • Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o pages parâmetro em sua solicitação. Quando o serviço analisa documentos do Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, ele conta cada planilha do Excel e slide do PowerPoint como uma página.

  • Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página sem limites máximos de caracteres.

  • Quando o serviço analisa arquivos do Microsoft Word e HTML suportados pelos modelos de leitura e layout, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres totalizam três páginas.

  • Os modelos de leitura e layout não oferecem suporte à análise de imagens incorporadas ou vinculadas em arquivos do Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não as conta como imagens adicionadas.

  • Treinar um modelo personalizado é sempre gratuito com Document Intelligence. Os encargos são incorridos apenas quando o serviço usa um modelo para analisar um documento.

  • O preço do contêiner é o mesmo que o preço do serviço de nuvem.

  • O Document Intelligence oferece um nível gratuito (F0) onde você pode testar todos os recursos do Document Intelligence. Os limites de nível gratuito analisam a resposta apenas às duas primeiras páginas de uma solicitação.

  • A Document Intelligence tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.

  • O modelo de layout é necessário para gerar rótulos para seu conjunto de dados para treinamento personalizado. Se o conjunto de dados que você usa para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você e cobrará pelo uso do modelo de layout.

Quota Grátis (F0)1 Padrão (S0)
Analise o limite de transações por segundo 1 15 (valor padrão)
Ajustável Não Sim 2
Obter limite de operações por segundo 1 50 (valor padrão)
Ajustável Não Sim 2
Operações de gerenciamento de modelo Limite por segundo 1 5 (valor padrão)
Ajustável Não Sim 2
Listar operações por segundo limite 1 10 (valor padrão)
Ajustável Não Sim 2
Tamanho máximo do documento 4 MB 500 MB
Ajustável No Não
Número máximo de páginas (Análise) 2 2000
Ajustável No Não
Tamanho máximo do arquivo de etiquetas 10 MB 10 MB
Ajustável No Não
Tamanho máximo da resposta ocr json 500 MB 500 MB
Ajustável No Não
Número máximo de modelos de modelo 500 5000
Ajustável No Não
Número máximo de modelos neurais 100 500
Ajustável No Não

Utilização do modelo personalizado

Quota Grátis (F0) 1 Padrão (S0)
Limite do modelo de composição 5 500 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Neural e Generativo 1 GB 3 1 GB (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável No Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável No Não
Número máximo de páginas (Treinamento) * Neural e Generativo 50 000 50.000 (valor padrão)
Ajustável No Não
Trem de modelo neural personalizado 10 horas por mês 5 sem limite (pagar por hora), comece com 10 horas gratuitas por mês
Ajustável Não Sim 3
Número máximo de páginas (Formação) * Classificador 10.000 10.000 (valor padrão)
Ajustável No Não
Número máximo de tipos de documentos (classes) * Classificador 500 500 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 2GB (valor padrão)
Ajustável No Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável No Não

Utilização do modelo personalizado

Quota Grátis (F0) 1 Padrão (S0)
Limite do modelo de composição 5 200 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Neural 1 GB 3 1 GB (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável No Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável No Não
Número máximo de páginas (Treinamento) * Neural 50 000 50.000 (valor padrão)
Ajustável No Não
Trem de modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Formação) * Classificador 10.000 10.000 (valor padrão)
Ajustável No Não
Número máximo de tipos de documentos (classes) * Classificador 500 500 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 1GB (valor padrão)
Ajustável No Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável No Não

Utilização do modelo personalizado

Quota Grátis (F0) 1 Padrão (S0)
Limite do modelo de composição 5 200 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Neural 1 GB 3 1 GB (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável No Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável No Não
Número máximo de páginas (Treinamento) * Neural 50 000 50.000 (valor padrão)
Ajustável No Não
Trem de modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Formação) * Classificador 10.000 10.000 (valor padrão)
Ajustável No Não
Número máximo de tipos de documentos (classes) * Classificador 500 500 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 1GB (valor padrão)
Ajustável No Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável No Não

Limites de modelo personalizado

Quota Grátis (F0) 1 Padrão (S0)
Limite do modelo de composição 5 200 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento 50 MB 50 MB (valor padrão)
Ajustável No Não
Número máximo de páginas (Formação) 500 500 (valor padrão)
Ajustável No Não

1 Para o nível de preços gratuito (F0), consulte também os subsídios mensais na página de preços.
2 Consulte as práticas recomendadas e as instruções de ajuste.
3 A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal. A partir da API v4.0, as solicitações de treinamento acima de 20 solicitações em um mês são cobradas na camada de treinamento. Consulte os preços para obter detalhes.

4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de qualquer atualização relacionada à rotulagem.

5 Este limite aplica-se apenas a v 4.0 (2024-11-30 GA) modelos neurais personalizados. A partir do , apoiamos o treinamento de v 4.0documentos maiores para durações mais longas (até 10 horas gratuitas e incorrendo em cobranças depois). Para obter mais informações, consulte a página do modelo neural personalizado.

Descrição detalhada, ajuste de cota e práticas recomendadas

Os limites padrão podem ser estendidos solicitando um aumento por meio de um tíquete de suporte. Antes de pedir um aumento de quota (quando aplicável), confirme que é necessário. O serviço de Inteligência Documental usa o dimensionamento automático para trazer os recursos on-demandcomputacionais necessários, manter os custos do cliente baixos e desprovisionar recursos não utilizados por não manter uma quantidade excessiva de capacidade de hardware.

Se o seu aplicativo retornar o Código de resposta 429 (muitas solicitações), você está acima do limite para um ou mais dos limites de transações por segundo (TPS):

  • Analisar transações por segundo limite O TPS para enviar solicitações de análise (POST)
  • Obter operações por segundo limite O TPS para sondagem de resultados em operações de análise (GET)
  • Operações de gerenciamento de modelo Por segundo limitam as operações relacionadas ao gerenciamento de modelos, como compilação/treinamento e cópia.
  • Listar operações por segundo limite Operações relacionadas a modelos de listagem, operações.

Práticas recomendadas gerais para reduzir a limitação durante o dimensionamento automático

Para minimizar problemas relacionados à limitação (Código de resposta 429), recomendamos o uso das seguintes técnicas:

  • Implementar lógica de repetição em seu aplicativo
  • Evite alterações acentuadas na carga de trabalho. Aumente a carga de trabalho gradualmente
    Exemplo. Seu aplicativo está usando Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte, você aumenta a carga para 40 TPS. O resultado é um código de resposta 429 para algumas solicitações, pois você está acima do limite de 15 TPS para enviar operações de análise. Você pode recuar do processamento para ficar abaixo dos 15 TPS ou solicitar um aumento no TPS para suportar seus volumes mais altos.

As secções seguintes descrevem casos específicos de ajustamento de quotas. Ir para o Document Intelligence: aumentando o limite de solicitações simultâneas

Aumentar o limite de transações por segundo de solicitação

Por padrão, o número de transações por segundo é limitado a 15 transações por segundo para um recurso de Document Intelligence. Para o escalão de preço Standard, este valor pode ser aumentado. Antes de enviar a solicitação, verifique se você está familiarizado com o material desta seção e ciente dessas práticas recomendadas.

O primeiro passo seria habilitar o dimensionamento automático. Siga este documento para habilitar o dimensionamento automático em seu recurso * habilitar o dimensionamento automático. Com o dimensionamento automático habilitado, seu recurso pode continuar a aceitar solicitações acima dos limites de TPS configurados se houver capacidade no serviço. Ainda pode resultar em solicitação limitada.

Aumentar o limite de solicitação simultânea não afeta diretamente seus custos. O serviço de Inteligência Documental usa o modelo "Pague apenas pelo que você usa". O limite define o quão alto o Serviço pode ser dimensionado antes de começar a limitar suas solicitações.

O valor existente de diferentes categorias de limite de solicitação está disponível no portal do Azure, na guia monitoramento na folha de visão geral do recurso.

Criar e enviar solicitação de suporte para aumento de TPS

Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso enviando a Solicitação de Suporte:

  • Inicie sessão no portal do Azure
  • Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de TPS
  • Selecione -Nova solicitação de suporte- (-Suporte + solução de problemas- grupo). Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura do Azure e o Recurso do Azure
  • Digite -Summary- (como "Aumentar o limite TPS de Document Intelligence")
  • Selecione "Validação de cota ou uso" para o campo de tipo de problema.
  • Selecione -Next: Soluções-
  • Prossiga com a criação do pedido
  • Insira as seguintes informações no campo -Descrição-, na guia Detalhes:
    • uma nota, que o pedido é sobre cota de Inteligência Documental.
    • Forneça uma expectativa de TPS que você gostaria de escalar para atender. Embora os aumentos de TPS sejam gratuitos, você só deve solicitar um TPS que seja razoável para sua carga de trabalho.
    • Informações de recursos do Azure
    • Conclua inserindo as informações necessárias e selecione o botão -Criar- na guia -Review + create-
    • Anote o número do pedido de suporte nas notificações do portal do Azure. Procure o Suporte para entrar em contato com você em breve para processamento adicional.

Exemplo de uma prática recomendada de padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos seguir para mitigar a possível limitação de solicitações devido ao Autoscaling estar em andamento. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Vamos supor que um recurso de Document Intelligence tenha o limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se você achar que está vendo uma limitação frequente com o código de resposta 429 ao verificar a conclusão, comece implementando um recuo exponencial na solicitação de resposta GET analyze. Usando um tempo de espera progressivamente maior entre novas tentativas para respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente. A analyze resposta também contém um cabeçalho de repetição que indica quanto tempo você deve esperar em segundos antes de verificar a conclusão dessa solicitação.

Se você achar que está sendo limitado no número de solicitações POST para documentos que estão sendo enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau mais alto de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar seus limites de serviço em transações por segundo.

Geralmente, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para a produção.

Próximos passos