Editar

Partilhar via


Perguntas mais frequentes

Este conteúdo aplica-se a:marca de verificação v4.0 (GA) marca de verificação v3.1 (GA) marca de verificação v3.0 (GA) marca de verificação v2.1 (GA)

O Azure AI Document Intelligence é um serviço baseado na nuvem que utiliza modelos de aprendizagem automática para extrair pares chave/valor, texto e tabelas dos seus documentos. O resultado retornado é uma saída JSON estruturada. Os casos de uso do Document Intelligence incluem processamento automatizado de dados, estratégias aprimoradas orientadas por dados e recursos enriquecidos de pesquisa de documentos.

Descrição geral

O Azure AI Document Intelligence e o Azure AI Form Recognizer são o mesmo serviço?

Sim.

O Azure AI Document Intelligence e o Azure AI Form Recognizer são o mesmo serviço. O serviço foi renomeado do Azure AI Form Recognizer para Azure AI Document Intelligence em julho de 2023. O serviço fornece os mesmos recursos e funcionalidades que antes da renomeação.

  • Alterações de preços: Não há alterações nos preços. Os nomes Serviços Cognitivos e Serviços de IA Aplicada continuam a ser usados na faturação do Azure, na análise de custos, nas listas de preços e nas APIs de preços.

  • Alterações de quebra: Não há alterações significativas em APIs ou bibliotecas de clientes.

O Document Intelligence integra-se com outros serviços da Microsoft?

Sim.

O Document Intelligence integra-se com os seguintes serviços:

Capacidades de IA

Posso usar o Document Intelligence com IA generativa para processamento de documentos?

Sim.

Você também pode usar uma solução de IA generativa de documentos para conversar com seus documentos (RAG), gerar conteúdo cativante a partir desses documentos e acessar modelos do Serviço OpenAI do Azure em seus dados.

  • Com o Azure AI Document Intelligence e o Azure OpenAI combinados, você pode criar um aplicativo corporativo para interagir perfeitamente com seus documentos usando linguagem natural. Você pode encontrar respostas facilmente, obter informações valiosas e gerar conteúdo novo e atraente a partir de documentos existentes.

  • Você pode encontrar mais detalhes sobre o padrão de geração aumentada de recuperação aqui.

O Document Intelligence pode ajudar com a fragmentação semântica dentro de documentos para geração aumentada de recuperação?

Sim.

A Inteligência de Documentos pode fornecer os blocos de construção para habilitar a fragmentação semântica. A fragmentação semântica é uma etapa fundamental na geração aumentada de recuperação (RAG) para garantir partes densas de contexto e melhoria de relevância.

  • O Document Intelligence fornece um modelo de layout que fornece uma decomposição visual do documento em linhas, parágrafos, seções, cabeçalhos e rodapés.

  • Em seguida, você pode optar por recuperar os resultados em formato de marcação, para dividir ainda mais o documento nos limites de seção ou parágrafo.

Para obter mais informações, consulte Visão geral do RAG em Document Intelligence

Estúdio de Inteligência de Documentação

Preciso de permissões específicas para acessar o Document Intelligence Studio?

Sim.

Você precisa de uma conta ativa do Azure e uma assinatura com pelo menos uma função de Leitor para acessar o Document Intelligence Studio.

Para análise de documentos e modelos pré-construídos, aqui estão os requisitos de função para cenários de usuário:

  • Básica

  • Avançado

    • Colaborador: você precisa dessa função para criar um grupo de recursos ou um recurso de Inteligência Documental.

Para projetos de modelo personalizado, aqui estão os requisitos de função para cenários de usuário:

  • Básica

    • Usuário de Serviços Cognitivos: você precisa dessa função para um recurso de vários serviços de Inteligência Documental ou Serviços Cognitivos para treinar um modelo personalizado ou analisar com modelos treinados.

    • Contribuidor de dados de Blob de armazenamento: você precisa dessa função para uma conta de armazenamento para criar dados de projeto e rotulagem.

  • Avançado

    • Colaborador da conta de armazenamento: você precisa dessa função para que a conta de armazenamento configure as configurações de compartilhamento de recursos entre origens (CORS). É um esforço único se você reutilizar a mesma conta de armazenamento.

    • Colaborador: você precisa dessa função para criar um grupo de recursos e recursos. A função de Colaborador ou de Colaborador da Conta de Armazenamento não lhe dará acesso para usar seu recurso ou conta de armazenamento do Document Intelligence se a autenticação local (baseada em chave) estiver desabilitada. Você ainda precisa das funções básicas (Usuário de Serviços Cognitivos e Colaborador de Blob de Dados de Armazenamento) para usar as funções no Document Intelligence Studio.

Para obter mais informações, consulte Funções internas do Microsoft Entra e as seções sobre atribuições de função do Azure no Guia de início rápido do Document Intelligence Studio.

Posso processar documentos com mais de duas páginas no Document Intelligence Studio?

Sim, para recursos pagos.

Não, para recursos gratuitos.

  • Para recursos de camada livre (F0), apenas as duas primeiras páginas são analisadas se você estiver usando o Document Intelligence Studio, a API REST ou bibliotecas de cliente.

  • Se quiser analisar todas as páginas de um documento, mude para um recurso pago (S0). No Document Intelligence Studio, selecione o botão Configurações (engrenagem), selecione a guia Recursos e verifique a faixa de preço a ser usada para analisar seus documentos.

Posso alterar diretórios ou assinaturas no Document Intelligence Studio?

Sim.

  • Para alterar um diretório no Document Intelligence Studio, selecione o botão Configurações (engrenagem). Em Diretório, selecione o diretório na lista e, em seguida, selecione Alternar diretório. Entre novamente depois de alternar o diretório.

  • Para alterar uma subscrição ou recurso, aceda ao separador Recurso em Definições.

Posso usar o Document Intelligence Studio com um recurso configurado com um firewall ou rede virtual?

Sim.

Se o recurso Document Intelligence estiver configurado com um firewall ou rede virtual, você precisará adicionar o endereço IP dedicado 20.3.165.95 à lista de permissões do firewall para seu recurso Document Intelligence. Algumas funções em projetos personalizados (por exemplo, autolabel, gerenciamento de projetos e human in the loop) não funcionam se o acesso à rede pública estiver desativado.

Quando carrego um ficheiro no Document Intelligence Studio através da função "Fetch from URL", posso utilizar um URL do meu armazenamento de blobs?

Sim.

Se a URL de armazenamento de blob do Azure incluir um token SAS e estiver acessível a partir de redes públicas. Não é possível usar a função Fetch para contas de armazenamento em que o acesso à chave está desativado ou atrás de um firewall/VNet.

Posso reutilizar ou personalizar a experiência de etiquetagem do Document Intelligence Studio e criá-la em meu próprio aplicativo?

Sim.

A experiência de rotulagem do Document Intelligence Studio é de código aberto no repositório do Toolkit.

Existem pontos de extremidade de URL separados para regiões de nuvem soberana de Inteligência Documental?

Sim.

O Document Intelligence Studio tem pontos de extremidade de URL separados para regiões de nuvem soberana:

Desenvolvimento de aplicações

Posso desenvolver aplicativos usando o Azure AI Document Intelligence usando as opções de desenvolvimento mais recentes?

Sim.

A Document Intelligence oferece as mais recentes opções de desenvolvimento nas seguintes plataformas:

Posso migrar meu aplicativo para a versão mais recente do Document Intelligence?

Sim.

A tabela a seguir fornece links para instruções detalhadas para migrar para a versão mais recente do Document Intelligence:

Idioma/API Guia de migração
API REST v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Posso especificar um intervalo de páginas a analisar num documento?

Sim.

Use o pages parâmetro (suportado nas versões v2.1, v3.0 e posteriores da API REST) e especifique páginas para documentos PDF e TIFF de várias páginas. A entrada aceita inclui os seguintes intervalos:

  • Páginas únicas. Por exemplo, se você especificar 1, 2, as páginas 1 e 2 serão processadas.
  • Intervalos finitos. Por exemplo, se você especificar 2-5, as páginas 2 a 5 serão processadas.
  • Intervalos abertos. Por exemplo, se você especificar 5-, todas as páginas da página 5 serão processadas. Se você especificar -10, as páginas 1 a 10 serão processadas.

Você pode misturar esses parâmetros e os intervalos podem se sobrepor. Por exemplo, se você especificar -5, 1, 3, 5-10, as páginas 1 a 10 serão processadas.

O serviço aceita o pedido se puder processar pelo menos uma página do documento. Por exemplo, usar 5-100 em um documento de cinco páginas é uma entrada válida que significa que a página 5 é processada.

Se você não fornecer um intervalo de páginas, todo o documento será processado.

Você recomenda o uso do Document Intelligence Studio em vez da ferramenta FOTT Sample Labeling para meu projeto?

Sim.

Recomendamos o Document Intelligence Studio na maioria das vezes, pois ele pode reduzir o tempo de configuração de recursos e serviços de armazenamento do Document Intelligence.

Considere usar apenas a ferramenta de teste de formulário (FOTT) para os seguintes cenários:

  • Seus dados devem permanecer em uma única máquina. Use a ferramenta FOTT Sample Labeling e um contêiner Document Intelligence.

  • Seu projeto é altamente dependente do Document Intelligence V2.1 e você deseja continuar usando as APIs v2.1.

Existem práticas recomendadas para mitigar a limitação?

Sim.

A Document Intelligence usa o dimensionamento automático para fornecer os recursos computacionais necessários sob demanda, mantendo os custos do cliente baixos. Para reduzir a limitação durante o dimensionamento automático, recomendamos a seguinte abordagem:

  • Implemente a lógica de repetição na aplicação.

  • Se você achar que está sendo limitado no número de POST solicitações, considere adicionar um atraso entre as solicitações.

  • Aumente a carga de trabalho gradualmente. Evite mudanças bruscas.

  • Crie uma solicitação de suporte para aumentar o limite de transações por segundo (TPS).

Saiba mais sobre as cotas e limites do serviço de Document Intelligence.

Modelos personalizados

Posso melhorar uma pontuação de precisão estimada para um modelo personalizado?

Sim.

Variações na estrutura visual de seus documentos podem influenciar a precisão de um modelo. Aqui ficam algumas dicas:

  • Inclua todas as variações de um documento no conjunto de dados de treinamento. As variações incluem diferentes formatos; por exemplo, PDFs digitais versus digitalizados.

  • Separe tipos de documentos visualmente distintos e treine modelos diferentes.

  • Certifique-se de que não tem rótulos estranhos.

  • Não inclua o texto circundante para etiquetagem da assinatura e região.

Para obter mais informações, consulte Pontuações de precisão e confiança.

Posso treinar novamente um modelo personalizado?

Não.

  • O Document Intelligence não tem uma operação explícita de retreinamento. Cada operação de trem gera um novo modelo.

  • Se você achar que seu modelo precisa ser retreinado, poderá adicionar mais amostras ao seu conjunto de dados de treinamento e treinar um novo modelo.

  • Você também pode criar um novo modelo para compor com seu modelo original da seguinte maneira:

    1. Crie um conjunto de dados para seu novo modelo.

    2. Rotule e treine um novo modelo.

    3. Valide se o novo modelo tem um bom desempenho para seus tipos de documentos específicos.

    4. Componha seu novo modelo com o modelo existente em um único ponto de extremidade. O Document Intelligence pode então determinar o melhor modelo para cada documento a ser analisado.

    Para obter mais informações, consulte modelos compostos.

Posso mover meus modelos treinados de um ambiente (como beta) para outro (como produção)?

Sim.

Você pode usar a API de cópia para copiar modelos personalizados de uma conta do Document Intelligence para outras que existem em qualquer região geográfica suportada. Para obter instruções detalhadas, consulte Recuperação de desastres.

A operação de cópia é limitada à cópia de modelos dentro do ambiente de nuvem específico onde você treinou o modelo. Por exemplo, não há suporte para copiar modelos da nuvem pública para a nuvem do Azure Government.

Sou cobrado ao treinar um modelo personalizado?

Sim.

Para v4.0 11-30-2024 (GA) modelos neurais personalizados pode ser treinado gratuitamente por um máximo de 10 horas. Quer esteja a treinar um único modelo para as 10 horas, ou a treinar vários modelos para o total de 10 horas, não é cobrado pelas primeiras 10 horas. Depois de usar as 10 horas gratuitas, você será automaticamente cobrado pela hora extra de treinamento. Para obter detalhes sobre os preços, consulte a página de preços. Este novo recurso de treinamento pago permite que modelos de treinamento por um período prolongado processem documentos maiores. Para obter mais informações sobre esse recurso de treinamento pago, consulte a seção de faturamento do modelo neural personalizado.

Para v3.0 2022-08-31 ou v3.1 2023-07-31, modelos neurais personalizados podem ser treinados gratuitamente por um máximo de 20 sessões de treinamento, com cada sessão limitada a 30 minutos de duração de treinamento. Depois de usar todas as 20 sessões de treinamento, você pode enviar o tíquete de suporte do Azure para aumentar o limite da sessão de treinamento. Para aumentar o limite, duas sessões de treinamento são consideradas como uma hora de treinamento, e você é cobrado por duas sessões / uma hora de treinamento. Para obter detalhes sobre os preços, consulte a [página de preços]. Para obter mais informações sobre maneiras de aumentar o limite, consulte a seção de faturamento do modelo neural personalizado. Para v3.0 e v3.1, o recurso de treinamento pago não está disponível. O recurso de treinamento pago para modelo neural personalizado só está disponível em v4.0.

Conta de armazenamento

Existe um tempo de expiração para o token de assinatura de acesso compartilhado (SAS) que eu para minha autenticação de conta de armazenamento?

Sim.

Quando você cria uma assinatura de acesso compartilhado (SAS), a duração padrão é de 48 horas. Após 48 horas, você precisa criar um novo token.

Considere definir um período de duração mais longo para o tempo em que você estiver usando sua conta de armazenamento com o Document Intelligence.

O Document Intelligence pode acessar dados em minha conta de armazenamento se estiver atrás de uma rede virtual ou firewall?

Não, não diretamente.

O Document Intelligence não pode acessar sua conta de armazenamento se ela estiver protegida por uma rede virtual ou firewall.

No entanto, o acesso à conta de armazenamento privada do Azure e a autenticação dão suporte a identidades gerenciadas para recursos do Azure. Quando você usa uma identidade gerenciada, o serviço de Inteligência Documental pode acessar sua conta de armazenamento usando uma credencial atribuída.

Se você pretende analisar os dados da sua conta de armazenamento privado usando FOTT, você deve implantar a ferramenta por trás da rede virtual ou firewall.

Saiba como criar e usar uma identidade gerenciada para seu recurso de Document Intelligence.

Contentores

Existe alguma diferença entre contêineres desconectados e conectados?

Sim.

Embora os recursos do modelo sejam os mesmos para contêineres conectados e desconectados, os métodos de cobrança e conectividade diferem:

  • Os contêineres conectados enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Com contêineres conectados, a conectividade com a Internet é necessária para enviar informações de cobrança para o Azure. Os contêineres conectados ao Document Intelligence enviam informações de cobrança para o Azure usando um recurso de Document Intelligence em sua conta do Azure. Os contêineres conectados não enviam dados do cliente, como a imagem ou o texto que está sendo analisado, para a Microsoft. Para obter um exemplo das informações que os contêineres conectados enviam à Microsoft para cobrança, consulte as Perguntas frequentes sobre contêineres do Azure AI.

  • Os contêineres desconectados permitem que você use APIs desconectadas da Internet. As informações de faturação não são enviadas através da Internet. Em vez disso, os Encargos baseiam-se num nível de compromisso adquirido. Atualmente, o uso de contêiner desconectado está disponível para modelos personalizados e de fatura do Document Intelligence.

Posso usar o armazenamento local para o contêiner DOTT (Document Intelligence Sample Labeling Tool)?

Sim.

O FOTT tem uma versão que usa armazenamento local. A versão precisa ser instalada em uma máquina Windows. Você pode instalá-lo a partir deste local.

Na página do projeto, especifique o URI da pasta de rótulo como /shared ou /shared/sub-dir se os arquivos de rotulagem estiverem em um subdiretório. Todos os outros comportamentos da Document Intelligence Sample Labeling Tool são os mesmos do serviço hospedado.

Existe uma prática recomendada para a expansão?

Sim.

Para chamadas assíncronas, você pode executar vários contêineres com armazenamento compartilhado. O contêiner que está processando a POST chamada de análise armazena a saída no armazenamento. Em seguida, qualquer outro contêiner pode buscar os resultados do armazenamento e atender as GET chamadas. O ID da solicitação não está vinculado a um contêiner.

Para chamadas síncronas, você pode executar vários contêineres, mas apenas um contêiner atende a uma solicitação. Como é uma chamada de bloqueio, qualquer contêiner do pool pode atender à solicitação e enviar a resposta. Aqui, apenas um contêiner é vinculado a uma solicitação de cada vez, e nenhuma sondagem é necessária.

Posso configurar contêineres com armazenamento compartilhado?

Sim.

Os contêineres usam a propriedade durante a Mounts: Shared inicialização para especificar o armazenamento compartilhado para armazenar os arquivos de processamento. Para ver o uso dessa propriedade, consulte a documentação de contêineres.

Segurança e privacidade

O Document Intelligence armazena meus dados?

Sim, brevemente.

Para todos os recursos, o Document Intelligence armazena temporariamente dados e resultados no Armazenamento do Azure na mesma região da solicitação. Seus dados são excluídos dentro de 24 horas a partir do momento em que você envia uma solicitação de análise.

Saiba mais sobre dados, privacidade e segurança para Document Intelligence.

Para modelos personalizados treinados, as saídas provisórias após análise e rotulagem são armazenadas no mesmo local de Armazenamento do Azure onde você armazena seus dados de treinamento. Os modelos personalizados treinados são armazenados no Armazenamento do Azure na mesma região e são logicamente isolados com sua assinatura do Azure e credenciais de API.

Mais ajuda e suporte

Existem outros recursos disponíveis para fornecer soluções para perguntas do Azure AI Document Intelligence?

Sim.

Microsoft Q & A é a casa para perguntas e respostas técnicas na Microsoft. Você pode filtrar consultas específicas do Document Intelligence.

Posso fornecer feedback direto se o serviço não reconhecer um texto específico, ou reconhecê-lo incorretamente, quando estou rotulando documentos?

Sim.

Atualizamos e melhoramos continuamente os modelos de Inteligência Documental. Você pode enviar um e-mail para a equipe de Document Intelligence. Se possível, compartilhe um documento de exemplo com o problema realçado.