Partilhar via


Ações da OCR

O Power Automate permite que os utilizadores leiam, extraiam e efetuem a gestão de dados dentro de ficheiros através do reconhecimento ótico de carateres (OCR).

Para criar um motor de OCR e extrair texto de imagens e documentos, utilize a ação Extrair texto com OCR. O exemplo que se segue extrai texto de toda a imagem especificada.

Captura de ecrã da ação Extrair texto com OCR.

Todas as ações de OCR podem criar uma nova variável de motor OCR ou utilizar uma existente. Pode utilizar as variáveis do motor de OCR existentes em qualquer ação que ofereça capacidades de OCR.

O Power Automate suporta os motores de OCR do Windows e do Tesseract. Para configurar o motor de OCR selecionado, navegue para as definições do motor de OCR da ação apropriada. As opções disponíveis incluem o idioma e os multiplicadores de largura e de altura da imagem.

Nota

  • Todos os motores de OCR disponíveis estão pré-instalados no Power Automate e funcionam localmente sem se ligarem à cloud. No entanto, poderá ser necessário transferir language packs ou ficheiros de dados para extrair textos em idiomas específicos.
  • Multiplicadores de imagem aumentam o tamanho da imagem para tornar a pesquisa e a extração de texto mais eficazes. A definição de valores superiores a três pode levar a resultados incorretos.

Utilizar o motor de OCR do Windows

O motor de OCR predefinido no Power Automate é o motor de OCR do Windows. Para extrair textos utilizando o motor de OCR do Windows, tem de instalar o language pack apropriado para o idioma que pretende extrair.

Se o language pack apropriado não estiver instalado, o Power Automate lança um erro que lhe pedirá que o instale. Para encontrar mais informações sobre a transferência e instalação de language packs, aceda a Language packs para o Windows.

Depois de instalar o language pack apropriado, estenda as Definições de motor de OCR da ação OCR e selecione o idioma que pretende. O motor de OCR do Windows suporta 25 idiomas, incluindo Chinês (Simplificado e Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico e Latim), Eslovaco, Espanhol, Sueco e Turco.

Utilizar o motor de OCR do Tesseract

Nota

Para utilizar o motor de OCR Tesseract, certifique-se de que a CPU da máquina suporta o conjunto de instruções AVX2.

Além do motor de OCR do Windows, o Power Automate suporta o motor de Tesseract. Este motor pode extrair texto em cinco idiomas sem configuração adicional: Inglês, Alemão, Espanhol, Francês e Italiano.

Para extrair texto num idioma fora da lista mencionada, ative a opção Utilizar outros idiomas nas Definições de motor de OCR da ação OCR. Quando esta opção está ativada, a ação apresenta mais dois parâmetros: Abreviatura do idioma e Caminho de dados do idioma.

O campo Abreviatura do idioma indica ao motor qual é o idioma a procurar durante o OCR. O campo Caminho de dados do idioma contém os ficheiros de dados do idioma (.traineddata) utilizados para treinar o motor de OCR. Pode encontrar os ficheiros de dados de idioma de todos os idiomas disponíveis neste repositório do GitHub.

Também pode utilizar o motor do Tesseract para extrair texto de documentos multilingues. Para encontrar mais informações sobre a extração de texto de documentos multilingues, aceda a Efetuar OCR em documentos multilingues.

Se texto no ecrã (OCR)

Marca o início de um bloco condicional de ações consoante um dado texto fornecido aparece ou não no ecrã utilizando OCR.

Parâmetros de entrada

Argumento Opcional Aceita Valor Predefinido Descrição
If text N/D Existe, Não existe Existe Especifica se pretende verificar se o texto existe ou não na origem indicada para analisar
Tipo de motor de OCR Não Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR Variável do motor de OCR O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo.
Variável do motor de OCR Não OCREngineObject O motor a utilizar para a operação de OCR
Text to find Não Valor de texto O texto a procurar na origem especificada
Is regular expression N/D Valor booleano Falso Especifica se pretende utilizar uma expressão regular para localizar o texto especificado
Search for text on N/D Ecrã inteiro, Janela em primeiro plano Ecrã inteiro Especifica se pretende procurar o texto especificado na totalidade do ecrã visível ou apenas na janela em primeiro plano
Search mode N/A A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica A totalidade da origem especificada Especifica se pretende analisar o ecrã (ou janela) inteiro ou uma sub-região deste
Imagem(ns) Não Lista de Imagens As imagens que especificam a sub-região (relativamente ao canto superior esquerdo da imagem) para procurar o texto fornecido
X1 Sim Valor numérico A coordenada X de início da sub-região para procurar o texto fornecido
Tolerance Sim Valor numérico 10 Especifica quanto as imagens procuradas podem diferir da imagem originalmente escolhida
Y1 Sim Valor numérico A coordenada Y de início da sub-região para procurar o texto fornecido
X1 Sim Valor numérico A coordenada X de início da sub-região da imagem especificada para procurar o texto fornecido
X2 Sim Valor numérico A coordenada X de fim da sub-região para procurar o texto fornecido
Y1 Sim Valor numérico A coordenada Y de início da sub-região da imagem especificada para procurar o texto fornecido
Y2 Sim Valor numérico A coordenada Y de fim da sub-região para procurar o texto fornecido
X2 Sim Valor numérico A coordenada X de fim da sub-região da imagem especificada para procurar o texto fornecido
Y2 Sim Valor numérico A coordenada Y de fim da sub-região da imagem especificada para procurar o texto fornecido
Idioma do Windows OCR N/A Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco Português O idioma do texto detetado pelo motor de OCR do Windows
Utilizar outro idioma N/A Valor booleano Falso Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract"
Idioma do Tesseract N/A Inglês, alemão, espanhol, francês, italiano Português O idioma do texto detetado pelo motor Tesseract
Abreviatura de idioma Não Valor de texto A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng"
Caminho de dados do idioma Não Valor de texto O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem Não Valor numérico 1 O multiplicador de largura da imagem
Multiplicador de altura da imagem Não Valor numérico 1 O multiplicador de altura da imagem
Algoritmo de correspondência de imagens N/D Básica, Avançada Básica Que algoritmo de imagem a utilizar para procurar a imagem

Nota

Variáveis produzidas

Argumento Tipo Descrição
LocationOfTextFoundX Valor numérico A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY Valor numérico A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela

Exceções

Exceção Descrição
Não é possível verificar se o texto existe no modo não interativo Indica que não é possível procurar o texto no ecrã no modo não interativo
Coordenadas de sub-região inválidas Indica que as coordenadas da sub-região indicada são inválidas
Falha ao analisar texto com OCR Indica que ocorreu um erro ao tentar analisar o texto utilizando OCR
Falha ao criar o motor de OCR Indica que ocorreu um erro ao tentar criar o motor de OCR
A pasta do caminho de dados não existe Indica que a pasta especificada para os dados de idioma não existe
O language pack do Windows selecionado não está instalado no computador Indica que o language pack do Windows selecionado não foi instalado no computador
Motor de OCR não ativo Indica que o motor de OCR não está ativo

Esperar por texto no ecrã (OCR)

Esperar até que um texto específico apareça/desapareça do ecrã, na janela em primeiro plano ou relativamente a uma imagem existente no ecrã ou na janela em primeiro plano utilizando OCR.

Parâmetros de entrada

Argumento Opcional Aceita Valor Predefinido Descrição
Wait for text to N/D Aparecer, Desaparecer Aparecer Especifica se deve esperar que o texto apareça ou desapareça
Tipo de motor de OCR Não Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR Variável do motor de OCR O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo.
Variável do motor de OCR Não OCREngineObject O motor a utilizar para a operação de OCR
Text to find Não Valor de texto O texto a procurar na origem especificada
Is regular expression N/D Valor booleano Falso Especifica se pretende utilizar uma expressão regular para localizar o texto especificado
Search for text on N/D Ecrã inteiro, Janela em primeiro plano Ecrã inteiro Especifica se pretende procurar o texto especificado na totalidade do ecrã visível ou apenas na janela em primeiro plano
Search mode N/A A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica A totalidade da origem especificada Especifica se pretende analisar o ecrã (ou janela) inteiro ou uma sub-região deste
Imagem(ns) Não Lista de Imagens As imagens que especificam a sub-região (relativamente ao canto superior esquerdo da imagem) para procurar o texto fornecido
X1 Sim Valor numérico A coordenada X de início da sub-região para procurar o texto fornecido
Tolerance Sim Valor numérico 10 Especifica quanto as imagens procuradas podem diferir da imagem originalmente escolhida
Y1 Sim Valor numérico A coordenada Y de início da sub-região para procurar o texto fornecido
X1 Sim Valor numérico A coordenada X de início da sub-região da imagem especificada para procurar o texto fornecido
X2 Sim Valor numérico A coordenada X de fim da sub-região para procurar o texto fornecido
Y1 Sim Valor numérico A coordenada Y de início da sub-região da imagem especificada para procurar o texto fornecido
Y2 Sim Valor numérico A coordenada Y de fim da sub-região para procurar o texto fornecido
X2 Sim Valor numérico A coordenada X de fim da sub-região da imagem especificada para procurar o texto fornecido
Y2 Sim Valor numérico A coordenada Y de fim da sub-região da imagem especificada para procurar o texto fornecido
Idioma do Windows OCR N/A Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco Português O idioma do texto detetado pelo motor de OCR do Windows
Utilizar outro idioma N/A Valor booleano Falso Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract"
Idioma do Tesseract N/A Inglês, alemão, espanhol, francês, italiano Português O idioma do texto detetado pelo motor Tesseract
Abreviatura de idioma Não Valor de texto A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng"
Caminho de dados do idioma Não Valor de texto O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem Não Valor numérico 1 O multiplicador de largura da imagem
Multiplicador de altura da imagem Não Valor numérico 1 O multiplicador de altura da imagem
Algoritmo de correspondência de imagens N/D Básica, Avançada Básica Que algoritmo de imagem a utilizar para procurar a imagem
Falha com erro de tempo limite N/D Valor booleano Falso Especifique se pretende que a ação aguarde indefinidamente ou falhe após um período de tempo definido

Nota

Variáveis produzidas

Argumento Tipo Descrição
LocationOfTextFoundX Valor numérico A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY Valor numérico A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela

Exceções

Exceção Descrição
Não é possível verificar se o texto existe no modo não interativo Indica que não é possível procurar o texto no ecrã no modo não interativo
Coordenadas de sub-região inválidas Indica que as coordenadas da sub-região indicada são inválidas
Falha ao analisar texto com OCR Indica que ocorreu um erro ao tentar analisar o texto utilizando OCR
Falha ao criar o motor de OCR Indica que ocorreu um erro ao tentar criar o motor de OCR
A pasta do caminho de dados não existe Indica que a pasta especificada para os dados de idioma não existe
O language pack do Windows selecionado não está instalado no computador Indica que o language pack do Windows selecionado não foi instalado no computador
Motor de OCR não ativo Indica que o motor de OCR não está ativo
Erro de tempo limite Indica que a ação falhou após um período de tempo definido

Extrair texto com OCR

Extrair texto de uma determinada origem utilizando o motor de OCR fornecido.

Parâmetros de entrada

Argumento Opcional Aceita Valor Predefinido Descrição
motor de OCR Não Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR Variável do motor de OCR O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo
Variável do motor de OCR Não OCREngineObject O motor a utilizar para a operação de OCR
OCR source N/D Ecrã, Janela em primeiro plano, Imagem no disco Ecrã A origem da imagem na qual a operação de OCR deve ser efetuada
Image file path Não Ficheiro O caminho da imagem na qual a operação de OCR deve ser efetuada
Search mode N/D A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica A totalidade da origem especificada O modo selecionado para a operação de OCR
Imagem Não Lista de Imagens A imagem a utilizar para limitar a análise a uma sub-região relativa à imagem especificada
Tolerance Sim Valor numérico 10 Especifica quanto a imagem pode diferir da imagem originalmente escolhida
X1 Sim Valor numérico A coordenada X de início da sub-região para limitar a análise
X2 Sim Valor numérico A coordenada X de fim da sub-região para limitar a análise
Y1 Sim Valor numérico A coordenada Y de início da sub-região para limitar a análise
Y2 Sim Valor numérico A coordenada Y de fim da sub-região para limitar a análise
Idioma do Windows OCR N/A Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco Português O idioma do texto detetado pelo motor de OCR do Windows
Utilizar outro idioma N/A Valor booleano Falso Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract"
Idioma do Tesseract N/A Inglês, alemão, espanhol, francês, italiano Português O idioma do texto detetado pelo motor Tesseract
Abreviatura de idioma Não Valor de texto A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng"
Caminho de dados do idioma Não Valor de texto O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem Não Valor numérico 1 O multiplicador de largura da imagem
Multiplicador de altura da imagem Não Valor numérico 1 O multiplicador de altura da imagem
Aguardar que a imagem apareça N/D Valor booleano Verdadeiro Especifica se pretende esperar ou não que a imagem apareça no ecrã ou na janela em primeiro plano
Limite de tempo excedido Não Valor numérico 5 Especifica o tempo para esperar que a operação esteja concluída antes que a ação falhe
Algoritmo de correspondência de imagens N/D Básica, Avançada Básica Que algoritmo de imagem a utilizar para procurar a imagem

Nota

Está previsto que a opção Variável de motor de OCR seja preterida.

Variáveis produzidas

Argumento Tipo Descrição
OcrText Valor de texto O resultado após a extração de texto

Exceções

Exceção Descrição
Falha ao extrair texto com OCR Indica que ocorreu um erro ao tentar extrair texto com OCR a partir da origem indicada
Ficheiro de imagem não encontrado Indica que o ficheiro não existe no caminho indicado
Imagem do marco não encontrada Indica que a imagem do marco não existe
Não é possível obter texto a partir do ecrã no modo não interativo Indica que não é possível obter texto a partir do ecrã no modo não interativo
Falha ao criar o motor de OCR Indica que ocorreu um erro ao tentar criar o motor de OCR
A pasta do caminho de dados não existe Indica que a pasta especificada para os dados de idioma não existe
O language pack do Windows selecionado não está instalado no computador Indica que o language pack do Windows selecionado não foi instalado no computador
Motor de OCR não ativo Indica que o motor de OCR não está ativo