Ações da OCR

Artigo
03/16/2023

O Power Automate permite que os utilizadores leiam, extraiam e efetuem a gestão de dados dentro de ficheiros através do reconhecimento ótico de carateres (OCR).

Para criar um motor de OCR e extrair texto de imagens e documentos, utilize a ação Extrair texto com OCR. O exemplo que se segue extrai texto de toda a imagem especificada.

Captura de ecrã da ação Extrair texto com OCR.

Todas as ações de OCR podem criar uma nova variável de motor OCR ou utilizar uma existente. Pode utilizar as variáveis do motor de OCR existentes em qualquer ação que ofereça capacidades de OCR.

O Power Automate suporta os motores de OCR do Windows e do Tesseract. Para configurar o motor de OCR selecionado, navegue para as definições do motor de OCR da ação apropriada. As opções disponíveis incluem o idioma e os multiplicadores de largura e de altura da imagem.

Nota

Todos os motores de OCR disponíveis estão pré-instalados no Power Automate e funcionam localmente sem se ligarem à cloud. No entanto, poderá ser necessário transferir language packs ou ficheiros de dados para extrair textos em idiomas específicos.
Multiplicadores de imagem aumentam o tamanho da imagem para tornar a pesquisa e a extração de texto mais eficazes. A definição de valores superiores a três pode levar a resultados incorretos.

Utilizar o motor de OCR do Windows

O motor de OCR predefinido no Power Automate é o motor de OCR do Windows. Para extrair textos utilizando o motor de OCR do Windows, tem de instalar o language pack apropriado para o idioma que pretende extrair.

Se o language pack apropriado não estiver instalado, o Power Automate lança um erro que lhe pedirá que o instale. Para encontrar mais informações sobre a transferência e instalação de language packs, aceda a Language packs para o Windows.

Depois de instalar o language pack apropriado, estenda as Definições de motor de OCR da ação OCR e selecione o idioma que pretende. O motor de OCR do Windows suporta 25 idiomas, incluindo Chinês (Simplificado e Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico e Latim), Eslovaco, Espanhol, Sueco e Turco.

Utilizar o motor de OCR do Tesseract

Nota

Para utilizar o motor de OCR Tesseract, certifique-se de que a CPU da máquina suporta o conjunto de instruções AVX2.

Além do motor de OCR do Windows, o Power Automate suporta o motor de Tesseract. Este motor pode extrair texto em cinco idiomas sem configuração adicional: Inglês, Alemão, Espanhol, Francês e Italiano.

Para extrair texto num idioma fora da lista mencionada, ative a opção Utilizar outros idiomas nas Definições de motor de OCR da ação OCR. Quando esta opção está ativada, a ação apresenta mais dois parâmetros: Abreviatura do idioma e Caminho de dados do idioma.

O campo Abreviatura do idioma indica ao motor qual é o idioma a procurar durante o OCR. O campo Caminho de dados do idioma contém os ficheiros de dados do idioma (.traineddata) utilizados para treinar o motor de OCR. Pode encontrar os ficheiros de dados de idioma de todos os idiomas disponíveis neste repositório do GitHub.

Também pode utilizar o motor do Tesseract para extrair texto de documentos multilingues. Para encontrar mais informações sobre a extração de texto de documentos multilingues, aceda a Efetuar OCR em documentos multilingues.

Se texto no ecrã (OCR)

Marca o início de um bloco condicional de ações consoante um dado texto fornecido aparece ou não no ecrã utilizando OCR.

Parâmetros de entrada

Argumento	Opcional	Aceita	Valor Predefinido	Descrição
If text	N/D	Existe, Não existe	Existe	Especifica se pretende verificar se o texto existe ou não na origem indicada para analisar
Tipo de motor de OCR	Não	Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR	Variável do motor de OCR	O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo.
Variável do motor de OCR	Não	OCREngineObject		O motor a utilizar para a operação de OCR
Text to find	Não	Valor de texto		O texto a procurar na origem especificada
Is regular expression	N/D	Valor booleano	Falso	Especifica se pretende utilizar uma expressão regular para localizar o texto especificado
Search for text on	N/D	Ecrã inteiro, Janela em primeiro plano	Ecrã inteiro	Especifica se pretende procurar o texto especificado na totalidade do ecrã visível ou apenas na janela em primeiro plano
Search mode	N/A	A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica	A totalidade da origem especificada	Especifica se pretende analisar o ecrã (ou janela) inteiro ou uma sub-região deste
Imagem(ns)	Não	Lista de Imagens		As imagens que especificam a sub-região (relativamente ao canto superior esquerdo da imagem) para procurar o texto fornecido
X1	Sim	Valor numérico		A coordenada X de início da sub-região para procurar o texto fornecido
Tolerance	Sim	Valor numérico	10	Especifica quanto as imagens procuradas podem diferir da imagem originalmente escolhida
Y1	Sim	Valor numérico		A coordenada Y de início da sub-região para procurar o texto fornecido
X1	Sim	Valor numérico		A coordenada X de início da sub-região da imagem especificada para procurar o texto fornecido
X2	Sim	Valor numérico		A coordenada X de fim da sub-região para procurar o texto fornecido
Y1	Sim	Valor numérico		A coordenada Y de início da sub-região da imagem especificada para procurar o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y de fim da sub-região para procurar o texto fornecido
X2	Sim	Valor numérico		A coordenada X de fim da sub-região da imagem especificada para procurar o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y de fim da sub-região da imagem especificada para procurar o texto fornecido
Idioma do Windows OCR	N/A	Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco	Português	O idioma do texto detetado pelo motor de OCR do Windows
Utilizar outro idioma	N/A	Valor booleano	Falso	Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract"
Idioma do Tesseract	N/A	Inglês, alemão, espanhol, francês, italiano	Português	O idioma do texto detetado pelo motor Tesseract
Abreviatura de idioma	Não	Valor de texto		A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng"
Caminho de dados do idioma	Não	Valor de texto		O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem	Não	Valor numérico	1	O multiplicador de largura da imagem
Multiplicador de altura da imagem	Não	Valor numérico	1	O multiplicador de altura da imagem
Algoritmo de correspondência de imagens	N/D	Básica, Avançada	Básica	Que algoritmo de imagem a utilizar para procurar a imagem

Nota

O motor de expressão regular do Power Automate é .NET. Para encontrar mais informações sobre expressões regulares, aceda a Linguagem de Expressão Regular – Referência Rápida.
Está previsto que a opção Variável de motor de OCR seja preterida.

Variáveis produzidas

Argumento	Tipo	Descrição
LocationOfTextFoundX	Valor numérico	A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY	Valor numérico	A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela

Exceções

Exceção	Descrição
Não é possível verificar se o texto existe no modo não interativo	Indica que não é possível procurar o texto no ecrã no modo não interativo
Coordenadas de sub-região inválidas	Indica que as coordenadas da sub-região indicada são inválidas
Falha ao analisar texto com OCR	Indica que ocorreu um erro ao tentar analisar o texto utilizando OCR
Falha ao criar o motor de OCR	Indica que ocorreu um erro ao tentar criar o motor de OCR
A pasta do caminho de dados não existe	Indica que a pasta especificada para os dados de idioma não existe
O language pack do Windows selecionado não está instalado no computador	Indica que o language pack do Windows selecionado não foi instalado no computador
Motor de OCR não ativo	Indica que o motor de OCR não está ativo

Esperar por texto no ecrã (OCR)

Esperar até que um texto específico apareça/desapareça do ecrã, na janela em primeiro plano ou relativamente a uma imagem existente no ecrã ou na janela em primeiro plano utilizando OCR.

Parâmetros de entrada

Argumento	Opcional	Aceita	Valor Predefinido	Descrição
Wait for text to	N/D	Aparecer, Desaparecer	Aparecer	Especifica se deve esperar que o texto apareça ou desapareça
Tipo de motor de OCR	Não	Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR	Variável do motor de OCR	O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo.
Variável do motor de OCR	Não	OCREngineObject		O motor a utilizar para a operação de OCR
Text to find	Não	Valor de texto		O texto a procurar na origem especificada
Is regular expression	N/D	Valor booleano	Falso	Especifica se pretende utilizar uma expressão regular para localizar o texto especificado
Search for text on	N/D	Ecrã inteiro, Janela em primeiro plano	Ecrã inteiro	Especifica se pretende procurar o texto especificado na totalidade do ecrã visível ou apenas na janela em primeiro plano
Search mode	N/A	A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica	A totalidade da origem especificada	Especifica se pretende analisar o ecrã (ou janela) inteiro ou uma sub-região deste
Imagem(ns)	Não	Lista de Imagens		As imagens que especificam a sub-região (relativamente ao canto superior esquerdo da imagem) para procurar o texto fornecido
X1	Sim	Valor numérico		A coordenada X de início da sub-região para procurar o texto fornecido
Tolerance	Sim	Valor numérico	10	Especifica quanto as imagens procuradas podem diferir da imagem originalmente escolhida
Y1	Sim	Valor numérico		A coordenada Y de início da sub-região para procurar o texto fornecido
X1	Sim	Valor numérico		A coordenada X de início da sub-região da imagem especificada para procurar o texto fornecido
X2	Sim	Valor numérico		A coordenada X de fim da sub-região para procurar o texto fornecido
Y1	Sim	Valor numérico		A coordenada Y de início da sub-região da imagem especificada para procurar o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y de fim da sub-região para procurar o texto fornecido
X2	Sim	Valor numérico		A coordenada X de fim da sub-região da imagem especificada para procurar o texto fornecido
Y2	Sim	Valor numérico		A coordenada Y de fim da sub-região da imagem especificada para procurar o texto fornecido
Idioma do Windows OCR	N/A	Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco	Português	O idioma do texto detetado pelo motor de OCR do Windows
Utilizar outro idioma	N/A	Valor booleano	Falso	Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract"
Idioma do Tesseract	N/A	Inglês, alemão, espanhol, francês, italiano	Português	O idioma do texto detetado pelo motor Tesseract
Abreviatura de idioma	Não	Valor de texto		A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng"
Caminho de dados do idioma	Não	Valor de texto		O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem	Não	Valor numérico	1	O multiplicador de largura da imagem
Multiplicador de altura da imagem	Não	Valor numérico	1	O multiplicador de altura da imagem
Algoritmo de correspondência de imagens	N/D	Básica, Avançada	Básica	Que algoritmo de imagem a utilizar para procurar a imagem
Falha com erro de tempo limite	N/D	Valor booleano	Falso	Especifique se pretende que a ação aguarde indefinidamente ou falhe após um período de tempo definido

Nota

O motor de expressão regular do Power Automate é .NET. Para encontrar mais informações sobre expressões regulares, aceda a Linguagem de Expressão Regular – Referência Rápida.
Está previsto que a opção Variável de motor de OCR seja preterida.

Variáveis produzidas

Argumento	Tipo	Descrição
LocationOfTextFoundX	Valor numérico	A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY	Valor numérico	A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela

Exceções

Exceção	Descrição
Não é possível verificar se o texto existe no modo não interativo	Indica que não é possível procurar o texto no ecrã no modo não interativo
Coordenadas de sub-região inválidas	Indica que as coordenadas da sub-região indicada são inválidas
Falha ao analisar texto com OCR	Indica que ocorreu um erro ao tentar analisar o texto utilizando OCR
Falha ao criar o motor de OCR	Indica que ocorreu um erro ao tentar criar o motor de OCR
A pasta do caminho de dados não existe	Indica que a pasta especificada para os dados de idioma não existe
O language pack do Windows selecionado não está instalado no computador	Indica que o language pack do Windows selecionado não foi instalado no computador
Motor de OCR não ativo	Indica que o motor de OCR não está ativo
Erro de tempo limite	Indica que a ação falhou após um período de tempo definido

Extrair texto com OCR

Extrair texto de uma determinada origem utilizando o motor de OCR fornecido.

Parâmetros de entrada

Argumento	Opcional	Aceita	Valor Predefinido	Descrição
motor de OCR	Não	Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR	Variável do motor de OCR	O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo
Variável do motor de OCR	Não	OCREngineObject		O motor a utilizar para a operação de OCR
OCR source	N/D	Ecrã, Janela em primeiro plano, Imagem no disco	Ecrã	A origem da imagem na qual a operação de OCR deve ser efetuada
Image file path	Não	Ficheiro		O caminho da imagem na qual a operação de OCR deve ser efetuada
Search mode	N/D	A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica	A totalidade da origem especificada	O modo selecionado para a operação de OCR
Imagem	Não	Lista de Imagens		A imagem a utilizar para limitar a análise a uma sub-região relativa à imagem especificada
Tolerance	Sim	Valor numérico	10	Especifica quanto a imagem pode diferir da imagem originalmente escolhida
X1	Sim	Valor numérico		A coordenada X de início da sub-região para limitar a análise
X2	Sim	Valor numérico		A coordenada X de fim da sub-região para limitar a análise
Y1	Sim	Valor numérico		A coordenada Y de início da sub-região para limitar a análise
Y2	Sim	Valor numérico		A coordenada Y de fim da sub-região para limitar a análise
Idioma do Windows OCR	N/A	Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco	Português	O idioma do texto detetado pelo motor de OCR do Windows
Utilizar outro idioma	N/A	Valor booleano	Falso	Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract"
Idioma do Tesseract	N/A	Inglês, alemão, espanhol, francês, italiano	Português	O idioma do texto detetado pelo motor Tesseract
Abreviatura de idioma	Não	Valor de texto		A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng"
Caminho de dados do idioma	Não	Valor de texto		O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem	Não	Valor numérico	1	O multiplicador de largura da imagem
Multiplicador de altura da imagem	Não	Valor numérico	1	O multiplicador de altura da imagem
Aguardar que a imagem apareça	N/D	Valor booleano	Verdadeiro	Especifica se pretende esperar ou não que a imagem apareça no ecrã ou na janela em primeiro plano
Limite de tempo excedido	Não	Valor numérico	5	Especifica o tempo para esperar que a operação esteja concluída antes que a ação falhe
Algoritmo de correspondência de imagens	N/D	Básica, Avançada	Básica	Que algoritmo de imagem a utilizar para procurar a imagem

Nota

Está previsto que a opção Variável de motor de OCR seja preterida.

Variáveis produzidas

Argumento	Tipo	Descrição
OcrText	Valor de texto	O resultado após a extração de texto

Exceções

Exceção	Descrição
Falha ao extrair texto com OCR	Indica que ocorreu um erro ao tentar extrair texto com OCR a partir da origem indicada
Ficheiro de imagem não encontrado	Indica que o ficheiro não existe no caminho indicado
Imagem do marco não encontrada	Indica que a imagem do marco não existe
Não é possível obter texto a partir do ecrã no modo não interativo	Indica que não é possível obter texto a partir do ecrã no modo não interativo
Falha ao criar o motor de OCR	Indica que ocorreu um erro ao tentar criar o motor de OCR
A pasta do caminho de dados não existe	Indica que a pasta especificada para os dados de idioma não existe
O language pack do Windows selecionado não está instalado no computador	Indica que o language pack do Windows selecionado não foi instalado no computador
Motor de OCR não ativo	Indica que o motor de OCR não está ativo

Partilhar via

Ações da OCR

Utilizar o motor de OCR do Windows

Utilizar o motor de OCR do Tesseract

Se texto no ecrã (OCR)

Parâmetros de entrada

Variáveis produzidas

Exceções

Esperar por texto no ecrã (OCR)

Parâmetros de entrada

Variáveis produzidas

Exceções

Extrair texto com OCR

Parâmetros de entrada

Variáveis produzidas

Exceções

Recursos adicionais