Ações de OCR

Artigo
03/16/2023

O Power Automate permite a usuários ler, extrair e gerenciar dados em arquivos por meio do OCR (reconhecimento óptico de caracteres).

Para criar um mecanismo de OCR e extrair texto de imagens e documentos, use a ação Extrair texto com OCR. O exemplo a seguir extrai o texto de toda a imagem especificada.

Captura de tela da ação Extrair texto com OCR.

Todas as ações de OCR podem criar uma nova variável de mecanismo de OCR ou usar uma existente. Você pode usar variáveis existentes do mecanismo de OCR em qualquer ação que ofereça recursos de OCR.

O Power Automate oferece suporte aos mecanismos de OCR e Tesseract do Windows. Para configurar o mecanismo de OCR selecionado, navegue até Configurações do mecanismo de OCR da ação apropriada. As opções disponíveis incluem o idioma, a altura da imagem e os multiplicadores de largura.

Observação

Todos os mecanismos de OCR disponíveis são pré-instalados no Power Automate e funcionam localmente sem conexão à nuvem. No entanto, pode ser necessário baixar pacotes de idiomas ou arquivos de dados para extrair textos em idiomas específicos.
Os multiplicadores aumentam o tamanho da imagem para tornar a pesquisa e a extração de texto mais eficazes. A definição de valores maiores que 3 pode levar a resultados errôneos.

Use do mecanismo de OCR do Windows

O mecanismo de OCR padrão no Power Automate é o mecanismo de OCR do Windows. Para extrair textos usando o mecanismo de OCR do Windows, você deve instalar o pacote de idiomas apropriado para o idioma a ser extraído.

Se o pacote de idiomas apropriado não estiver instalado, o Power Automate gerará um erro solicitando que você o instale. Para encontrar mais informações sobre como baixar e instalar pacotes de idiomas, vá para Pacotes de idiomas para o Windows.

Depois de instalar o pacote de idiomas apropriado, estenda as Configurações do mecanismo de OCR da ação de OCR e selecione o idioma desejado. O mecanismo de OCR do Windows dá suporte a 25 idiomas, incluindo: chinês (simplificado e tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico e latim), eslovaco, espanhol, sueco e turco.

Usar o mecanismo de OCR do Tesseract

Observação

Para usar o mecanismo de OCR Tesseract, certifique-se de que a CPU do computador seja compatível com o conjunto de instruções AVX2.

Além do mecanismo de OCR do Windows, o Power Automate dá suporte ao mecanismo Tesseract. Esse mecanismo pode extrair texto em cinco idiomas sem configuração adicional: inglês, alemão, espanhol, francês e italiano.

Para extrair texto em um idioma fora da lista mencionada, habilite a opção Usar outros idiomas nas Configurações do mecanismo de OCR da ação de OCR. Quando esta opção estiver habilitada, a ação exibirá mais dois parâmetros: Abreviação do idioma e Caminho de dados do idioma.

O campo Abreviação do idioma indica para o mecanismo qual idioma procurar durante o OCR. O campo Caminho de dados do idioma contém os arquivos de dados do idioma (.traineddata) usado para treinar o mecanismo de OCR. Você pode encontrar os arquivos de dados de idioma para todos os idiomas disponíveis neste repositório do GitHub.

Você também pode usar o mecanismo Tesseract para extrair texto de documentos multilíngues. Para encontrar mais informações sobre como extrair texto de documentos multilíngues, vá para Executar o OCR em documentos multilíngues.

Se existe texto na tela (OCR)

Marca o início de um bloco condicional de ações, dependendo de um determinado texto aparecer ou não na tela, usando o OCR.

Parâmetros de entrada

Argumento	Opcional	Aceita	Valor padrão	Description
Se for texto	N/D	Existe, Não existe	Existe	Especifica se deve verificar a existência do texto na origem fornecida para ser analisada
Tipo de mecanismo de OCR	Não	Mecanismo de OCR do Windows, mecanismo Tesseract, variável de mecanismo de OCR	Variável de mecanismo de OCR	O tipo de mecanismo de OCR a ser usado. Selecione um mecanismo de OCR pré-configurado ou configure um novo.
Variável de mecanismo de OCR	Não	OCREngineObject		O mecanismo a ser usado para a operação de OCR
Text to find	Não	Valor do texto		O texto a ser pesquisado na origem especificada
Is regular expression	N/D	Valor booliano	False	Especifica se deve ser usada uma expressão regular para localizar o texto especificado
Search for text on	N/D	Tela inteira, Janela em primeiro plano	Tela inteira	Especifica se deve ser pesquisado o texto especificado em toda a tela visível ou apenas na janela de primeiro plano
Search mode	N/A	Toda a fonte especificada, Somente a sub-região específica, Sub-região relativa à imagem	Toda a origem especificada	Especifica se deve verificar toda a tela (ou janela) ou uma sub-região reduzida dela
Imagens	Não	Lista de Imagens		As imagens que especificam a sub-região (em relação ao canto superior esquerdo da imagem) a ser verificada para o texto fornecido
X1	Sim	Valor numérico		A coordenada X inicial da sub-região a ser verificada para o texto fornecido
Tolerance	Sim	Valor numérico	10	Especifica o quanto as imagens pesquisadas podem ser diferentes da imagem escolhida originalmente
Y1	Sim	Valor numérico		A coordenada Y inicial da sub-região a ser verificada para o texto fornecido
X1	Sim	Valor numérico		A coordenada X inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
X2	Sim	Valor numérico		A coordenada X final da sub-região a ser verificada para o texto fornecido
Y1	Sim	Valor numérico		A coordenada Y inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y final da sub-região a ser verificada para o texto fornecido
X2	Sim	Valor numérico		A coordenada X final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Idioma do OCR do Windows	N/A	Chinês (simplificado), chinês (tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico), sérvio (latino), eslovaco, espanhol, sueco, turco	Inglês	O idioma do texto detectado pelo mecanismo de OCR do Windows
Usar outro idioma	N/A	Valor booliano	Falso	Especifica se um idioma que não foi fornecido no campo "Idioma do Tesseract" deve ser usado
Idioma do Tesseract	N/A	Inglês, alemão, espanhol, francês, italiano	Inglês	O idioma do texto que o mecanismo Tesseract detecta
Abreviação do idioma	Não	Valor do texto		A abreviação Tesseract do idioma a ser usado. Por exemplo, se os dados forem "eng.traineddata", defina este parâmetro como "eng"
Caminho de dados do idioma	Não	Valor do texto		O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem	Não	Valor numérico	1	O multiplicador de largura da imagem
Multiplicador de altura da imagem	Não	Valor numérico	1	O multiplicador de altura da imagem
Algoritmo de correspondência de imagens	N/A	Básico, Avançado	Básica	Qual algoritmo de imagem usar ao pesquisar por imagem

Observação

O mecanismo de expressão regular do Power Automate é o .NET. Para encontrar mais informações sobre expressões regulares, vá para Linguagem de Expressões Regulares – Referência Rápida.
A opção Variável do mecanismo de OCR será preterida.

Variáveis produzidas

Argumento	Type	Description
LocationOfTextFoundX	Valor numérico	A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY	Valor numérico	A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela

Exceções

Exceção	Description
Não é possível verificar se existe texto no modo não interativo	Indica que não é possível verificar o texto na tela quando no modo não interativo
Invalid subregion coordinates	Indica que as coordenadas especificadas da sub-região são inválidas
Failed to analyze text with OCR	Indica que ocorreu um erro ao tentar analisar o texto usando OCR
Falha ao criar o mecanismo de OCR	Indica que ocorreu um erro ao tentar criar o mecanismo de OCR
A pasta de caminho de dados não existe	Indica que a pasta especificada para os dados do idioma não existe
O pacote de idiomas do Windows selecionado não está instalado no computador	O pacote de idiomas do Windows selecionado não está instalado no computador
Mecanismo de OCR não ativo	Indica que o mecanismo de OCR não está ativo

Aguardar o texto na tela (OCR)

Aguardar até que um texto específico apareça/desapareça da tela, da janela de primeiro plano ou relativo a uma imagem na tela ou na janela de primeiro plano usando OCR.

Parâmetros de entrada

Argumento	Opcional	Aceita	Valor padrão	Description
Wait for text to	N/D	Aparecer, Desaparecer	Aparecer	Especifica se deve aguardar o texto aparecer ou desaparecer
Tipo de mecanismo de OCR	Não	Mecanismo de OCR do Windows, mecanismo Tesseract, variável de mecanismo de OCR	Variável de mecanismo de OCR	O tipo de mecanismo de OCR a ser usado. Selecione um mecanismo de OCR pré-configurado ou configure um novo.
Variável de mecanismo de OCR	Não	OCREngineObject		O mecanismo a ser usado para a operação de OCR
Text to find	Não	Valor do texto		O texto a ser pesquisado na origem especificada
Is regular expression	N/D	Valor booliano	False	Especifica se deve ser usada uma expressão regular para localizar o texto especificado
Search for text on	N/D	Tela inteira, Janela em primeiro plano	Tela inteira	Especifica se deve ser pesquisado o texto especificado em toda a tela visível ou apenas na janela de primeiro plano
Search mode	N/A	Toda a fonte especificada, Somente a sub-região específica, Sub-região relativa à imagem	Toda a origem especificada	Especifica se deve verificar toda a tela (ou janela) ou uma sub-região reduzida dela
Imagens	Não	Lista de Imagens		As imagens que especificam a sub-região (em relação ao canto superior esquerdo da imagem) a ser verificada para o texto fornecido
X1	Sim	Valor numérico		A coordenada X inicial da sub-região a ser verificada para o texto fornecido
Tolerance	Sim	Valor numérico	10	Especifica o quanto as imagens pesquisadas podem ser diferentes da imagem escolhida originalmente
Y1	Sim	Valor numérico		A coordenada Y inicial da sub-região a ser verificada para o texto fornecido
X1	Sim	Valor numérico		A coordenada X inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
X2	Sim	Valor numérico		A coordenada X final da sub-região a ser verificada para o texto fornecido
Y1	Sim	Valor numérico		A coordenada Y inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y final da sub-região a ser verificada para o texto fornecido
X2	Sim	Valor numérico		A coordenada X final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Idioma do OCR do Windows	N/A	Chinês (simplificado), chinês (tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico), sérvio (latino), eslovaco, espanhol, sueco, turco	Inglês	O idioma do texto detectado pelo mecanismo de OCR do Windows
Usar outro idioma	N/A	Valor booliano	Falso	Especifica se um idioma que não foi fornecido no campo "Idioma do Tesseract" deve ser usado
Idioma do Tesseract	N/A	Inglês, alemão, espanhol, francês, italiano	Inglês	O idioma do texto que o mecanismo Tesseract detecta
Abreviação do idioma	Não	Valor do texto		A abreviação Tesseract do idioma a ser usado. Por exemplo, se os dados forem "eng.traineddata", defina este parâmetro como "eng"
Caminho de dados do idioma	Não	Valor do texto		O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem	Não	Valor numérico	1	O multiplicador de largura da imagem
Multiplicador de altura da imagem	Não	Valor numérico	1	O multiplicador de altura da imagem
Algoritmo de correspondência de imagens	N/A	Básico, Avançado	Básico	Qual algoritmo de imagem usar ao pesquisar por imagem
Falha com erro de tempo limite	N/A	Valor booliano	False	Especificar se você deseja que a ação aguarde indefinidamente ou haja falha após um período definido

Observação

O mecanismo de expressão regular do Power Automate é o .NET. Para encontrar mais informações sobre expressões regulares, vá para Linguagem de Expressões Regulares – Referência Rápida.
A opção Variável do mecanismo de OCR será preterida.

Variáveis produzidas

Argumento	Type	Description
LocationOfTextFoundX	Valor numérico	A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY	Valor numérico	A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela

Exceções

Exceção	Description
Não é possível verificar se existe texto no modo não interativo	Indica que não é possível verificar o texto na tela quando no modo não interativo
Invalid subregion coordinates	Indica que as coordenadas especificadas da sub-região são inválidas
Failed to analyze text with OCR	Indica que ocorreu um erro ao tentar analisar o texto usando OCR
Falha ao criar o mecanismo de OCR	Indica que ocorreu um erro ao tentar criar o mecanismo de OCR
A pasta de caminho de dados não existe	Indica que a pasta especificada para os dados do idioma não existe
O pacote de idiomas do Windows selecionado não está instalado no computador	O pacote de idiomas do Windows selecionado não está instalado no computador
Mecanismo de OCR não ativo	Indica que o mecanismo de OCR não está ativo
Erro de tempo limite	Indica que a ação falhou após um determinado período

Extrair texto com OCR

Extrair texto de uma determinada origem usando o mecanismo de OCR fornecido.

Parâmetros de entrada

Argumento	Opcional	Aceita	Valor padrão	Description
Mecanismo de OCR	Não	Mecanismo de OCR do Windows, mecanismo Tesseract, variável de mecanismo de OCR	Variável de mecanismo de OCR	O tipo de mecanismo de OCR a ser usado. Selecione um mecanismo de OCR pré-configurado ou configure um novo
Variável de mecanismo de OCR	Não	OCREngineObject		O mecanismo a ser usado para a operação de OCR
OCR source	N/D	Tela, Janela em primeiro plano, Imagem no disco	Tela	A origem da imagem na qual executar a operação de OCR
Image file path	Não	Arquivo		O caminho da imagem na qual executar a operação de OCR
Search mode	N/D	Toda a fonte especificada, Somente a sub-região específica, Sub-região relativa à imagem	Toda a origem especificada	O modo selecionado para a operação de OCR
Imagem	Não	Lista de Imagens		A imagem a ser usada para restringir a verificação a uma sub-região em relação à imagem especificada
Tolerância	Sim	Valor numérico	10	Especifica o quanto a imagem pode ser diferente da imagem escolhida originalmente
X1	Sim	Valor numérico		A coordenada X inicial da sub-região para restringir a verificação
X2	Sim	Valor numérico		A coordenada X final da sub-região para restringir a verificação
Y1	Sim	Valor numérico		A coordenada Y inicial da sub-região para restringir a verificação
Y2	Sim	Valor numérico		A coordenada Y final da sub-região para restringir a verificação
Idioma do OCR do Windows	N/A	Chinês (simplificado), chinês (tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico), sérvio (latino), eslovaco, espanhol, sueco, turco	Inglês	O idioma do texto detectado pelo mecanismo de OCR do Windows
Usar outro idioma	N/A	Valor booliano	Falso	Especifica se um idioma que não foi fornecido no campo "Idioma do Tesseract" deve ser usado
Idioma do Tesseract	N/A	Inglês, alemão, espanhol, francês, italiano	Inglês	O idioma do texto que o mecanismo Tesseract detecta
Abreviação do idioma	Não	Valor do texto		A abreviação Tesseract do idioma a ser usado. Por exemplo, se os dados forem "eng.traineddata", defina este parâmetro como "eng"
Caminho de dados do idioma	Não	Valor do texto		O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem	Não	Valor numérico	1	O multiplicador de largura da imagem
Multiplicador de altura da imagem	Não	Valor numérico	1	O multiplicador de altura da imagem
Aguarde a imagem aparecer	N/A	Valor booliano	Verdadeiro	Especifica se é preciso aguardar ou não para que a imagem apareça na tela ou na janela de primeiro plano
Tempo limite	Não	Valor numérico	5	Especifica o tempo de espera para a operação ser concluída antes de considerar que a ação falhou
Algoritmo de correspondência de imagens	N/A	Básico, Avançado	Básica	Qual algoritmo de imagem usar ao pesquisar por imagem

Observação

A opção Variável do mecanismo de OCR será preterida.

Variáveis produzidas

Argumento	Type	Description
OcrText	Valor do texto	O resultado após a extração de texto

Exceções

Exceção	Descrição
Failed to extract text with OCR	Indica que ocorreu um erro ao tentar extrair o texto com OCR da origem fornecida
Arquivo de imagem não encontrado	Indica que o arquivo não existe no caminho fornecido
Imagem de marco não encontrada	Indica que a imagem de marco não existe
Não é possível obter texto da tela no modo não interativo	Indica que não é possível obter o texto da tela quando no modo não interativo
Falha ao criar o mecanismo de OCR	Indica que ocorreu um erro ao tentar criar o mecanismo de OCR
A pasta de caminho de dados não existe	Indica que a pasta especificada para os dados do idioma não existe
O pacote de idiomas do Windows selecionado não está instalado no computador	O pacote de idiomas do Windows selecionado não está instalado no computador
Mecanismo de OCR não ativo	Indica que o mecanismo de OCR não está ativo

Compartilhar via

Ações de OCR

Use do mecanismo de OCR do Windows

Usar o mecanismo de OCR do Tesseract

Se existe texto na tela (OCR)

Parâmetros de entrada

Variáveis produzidas

Exceções

Aguardar o texto na tela (OCR)

Parâmetros de entrada

Variáveis produzidas

Exceções

Extrair texto com OCR

Parâmetros de entrada

Variáveis produzidas

Exceções

Comentários

Recursos adicionais