Ações da OCR
O Power Automate permite que os utilizadores leiam, extraiam e efetuem a gestão de dados dentro de ficheiros através do reconhecimento ótico de carateres (OCR).
Para criar um motor de OCR e extrair texto de imagens e documentos, utilize a ação Extrair texto com OCR. O exemplo que se segue extrai texto de toda a imagem especificada.
Todas as ações de OCR podem criar uma nova variável de motor OCR ou utilizar uma existente. Pode utilizar as variáveis do motor de OCR existentes em qualquer ação que ofereça capacidades de OCR.
O Power Automate suporta os motores de OCR do Windows e do Tesseract. Para configurar o motor de OCR selecionado, navegue para as definições do motor de OCR da ação apropriada. As opções disponíveis incluem o idioma e os multiplicadores de largura e de altura da imagem.
Nota
- Todos os motores de OCR disponíveis estão pré-instalados no Power Automate e funcionam localmente sem se ligarem à cloud. No entanto, poderá ser necessário transferir language packs ou ficheiros de dados para extrair textos em idiomas específicos.
- Multiplicadores de imagem aumentam o tamanho da imagem para tornar a pesquisa e a extração de texto mais eficazes. A definição de valores superiores a três pode levar a resultados incorretos.
Utilizar o motor de OCR do Windows
O motor de OCR predefinido no Power Automate é o motor de OCR do Windows. Para extrair textos utilizando o motor de OCR do Windows, tem de instalar o language pack apropriado para o idioma que pretende extrair.
Se o language pack apropriado não estiver instalado, o Power Automate lança um erro que lhe pedirá que o instale. Para encontrar mais informações sobre a transferência e instalação de language packs, aceda a Language packs para o Windows.
Depois de instalar o language pack apropriado, estenda as Definições de motor de OCR da ação OCR e selecione o idioma que pretende. O motor de OCR do Windows suporta 25 idiomas, incluindo Chinês (Simplificado e Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico e Latim), Eslovaco, Espanhol, Sueco e Turco.
Utilizar o motor de OCR do Tesseract
Nota
Para utilizar o motor de OCR Tesseract, certifique-se de que a CPU da máquina suporta o conjunto de instruções AVX2.
Além do motor de OCR do Windows, o Power Automate suporta o motor de Tesseract. Este motor pode extrair texto em cinco idiomas sem configuração adicional: Inglês, Alemão, Espanhol, Francês e Italiano.
Para extrair texto num idioma fora da lista mencionada, ative a opção Utilizar outros idiomas nas Definições de motor de OCR da ação OCR. Quando esta opção está ativada, a ação apresenta mais dois parâmetros: Abreviatura do idioma e Caminho de dados do idioma.
O campo Abreviatura do idioma indica ao motor qual é o idioma a procurar durante o OCR. O campo Caminho de dados do idioma contém os ficheiros de dados do idioma (.traineddata) utilizados para treinar o motor de OCR. Pode encontrar os ficheiros de dados de idioma de todos os idiomas disponíveis neste repositório do GitHub.
Também pode utilizar o motor do Tesseract para extrair texto de documentos multilingues. Para encontrar mais informações sobre a extração de texto de documentos multilingues, aceda a Efetuar OCR em documentos multilingues.
Se texto no ecrã (OCR)
Marca o início de um bloco condicional de ações consoante um dado texto fornecido aparece ou não no ecrã utilizando OCR.
Parâmetros de entrada
Argumento | Opcional | Aceita | Valor Predefinido | Descrição |
---|---|---|---|---|
If text | N/D | Existe, Não existe | Existe | Especifica se pretende verificar se o texto existe ou não na origem indicada para analisar |
Tipo de motor de OCR | Não | Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR | Variável do motor de OCR | O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo. |
Variável do motor de OCR | Não | OCREngineObject | O motor a utilizar para a operação de OCR | |
Text to find | Não | Valor de texto | O texto a procurar na origem especificada | |
Is regular expression | N/D | Valor booleano | Falso | Especifica se pretende utilizar uma expressão regular para localizar o texto especificado |
Search for text on | N/D | Ecrã inteiro, Janela em primeiro plano | Ecrã inteiro | Especifica se pretende procurar o texto especificado na totalidade do ecrã visível ou apenas na janela em primeiro plano |
Search mode | N/A | A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica | A totalidade da origem especificada | Especifica se pretende analisar o ecrã (ou janela) inteiro ou uma sub-região deste |
Imagem(ns) | Não | Lista de Imagens | As imagens que especificam a sub-região (relativamente ao canto superior esquerdo da imagem) para procurar o texto fornecido | |
X1 | Sim | Valor numérico | A coordenada X de início da sub-região para procurar o texto fornecido | |
Tolerance | Sim | Valor numérico | 10 | Especifica quanto as imagens procuradas podem diferir da imagem originalmente escolhida |
Y1 | Sim | Valor numérico | A coordenada Y de início da sub-região para procurar o texto fornecido | |
X1 | Sim | Valor numérico | A coordenada X de início da sub-região da imagem especificada para procurar o texto fornecido | |
X2 | Sim | Valor numérico | A coordenada X de fim da sub-região para procurar o texto fornecido | |
Y1 | Sim | Valor numérico | A coordenada Y de início da sub-região da imagem especificada para procurar o texto fornecido | |
Y2 | Sim | Valor numérico | A coordenada Y de fim da sub-região para procurar o texto fornecido | |
X2 | Sim | Valor numérico | A coordenada X de fim da sub-região da imagem especificada para procurar o texto fornecido | |
Y2 | Sim | Valor numérico | A coordenada Y de fim da sub-região da imagem especificada para procurar o texto fornecido | |
Idioma do Windows OCR | N/A | Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco | Português | O idioma do texto detetado pelo motor de OCR do Windows |
Utilizar outro idioma | N/A | Valor booleano | Falso | Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract" |
Idioma do Tesseract | N/A | Inglês, alemão, espanhol, francês, italiano | Português | O idioma do texto detetado pelo motor Tesseract |
Abreviatura de idioma | Não | Valor de texto | A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng" | |
Caminho de dados do idioma | Não | Valor de texto | O caminho da pasta que contém os dados do Tesseract do idioma especificado | |
Multiplicador de largura da imagem | Não | Valor numérico | 1 | O multiplicador de largura da imagem |
Multiplicador de altura da imagem | Não | Valor numérico | 1 | O multiplicador de altura da imagem |
Algoritmo de correspondência de imagens | N/D | Básica, Avançada | Básica | Que algoritmo de imagem a utilizar para procurar a imagem |
Nota
- O motor de expressão regular do Power Automate é .NET. Para encontrar mais informações sobre expressões regulares, aceda a Linguagem de Expressão Regular – Referência Rápida.
- Está previsto que a opção Variável de motor de OCR seja preterida.
Variáveis produzidas
Argumento | Tipo | Descrição |
---|---|---|
LocationOfTextFoundX | Valor numérico | A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela |
LocationOfTextFoundY | Valor numérico | A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela |
Exceções
Exceção | Descrição |
---|---|
Não é possível verificar se o texto existe no modo não interativo | Indica que não é possível procurar o texto no ecrã no modo não interativo |
Coordenadas de sub-região inválidas | Indica que as coordenadas da sub-região indicada são inválidas |
Falha ao analisar texto com OCR | Indica que ocorreu um erro ao tentar analisar o texto utilizando OCR |
Falha ao criar o motor de OCR | Indica que ocorreu um erro ao tentar criar o motor de OCR |
A pasta do caminho de dados não existe | Indica que a pasta especificada para os dados de idioma não existe |
O language pack do Windows selecionado não está instalado no computador | Indica que o language pack do Windows selecionado não foi instalado no computador |
Motor de OCR não ativo | Indica que o motor de OCR não está ativo |
Esperar por texto no ecrã (OCR)
Esperar até que um texto específico apareça/desapareça do ecrã, na janela em primeiro plano ou relativamente a uma imagem existente no ecrã ou na janela em primeiro plano utilizando OCR.
Parâmetros de entrada
Argumento | Opcional | Aceita | Valor Predefinido | Descrição |
---|---|---|---|---|
Wait for text to | N/D | Aparecer, Desaparecer | Aparecer | Especifica se deve esperar que o texto apareça ou desapareça |
Tipo de motor de OCR | Não | Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR | Variável do motor de OCR | O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo. |
Variável do motor de OCR | Não | OCREngineObject | O motor a utilizar para a operação de OCR | |
Text to find | Não | Valor de texto | O texto a procurar na origem especificada | |
Is regular expression | N/D | Valor booleano | Falso | Especifica se pretende utilizar uma expressão regular para localizar o texto especificado |
Search for text on | N/D | Ecrã inteiro, Janela em primeiro plano | Ecrã inteiro | Especifica se pretende procurar o texto especificado na totalidade do ecrã visível ou apenas na janela em primeiro plano |
Search mode | N/A | A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica | A totalidade da origem especificada | Especifica se pretende analisar o ecrã (ou janela) inteiro ou uma sub-região deste |
Imagem(ns) | Não | Lista de Imagens | As imagens que especificam a sub-região (relativamente ao canto superior esquerdo da imagem) para procurar o texto fornecido | |
X1 | Sim | Valor numérico | A coordenada X de início da sub-região para procurar o texto fornecido | |
Tolerance | Sim | Valor numérico | 10 | Especifica quanto as imagens procuradas podem diferir da imagem originalmente escolhida |
Y1 | Sim | Valor numérico | A coordenada Y de início da sub-região para procurar o texto fornecido | |
X1 | Sim | Valor numérico | A coordenada X de início da sub-região da imagem especificada para procurar o texto fornecido | |
X2 | Sim | Valor numérico | A coordenada X de fim da sub-região para procurar o texto fornecido | |
Y1 | Sim | Valor numérico | A coordenada Y de início da sub-região da imagem especificada para procurar o texto fornecido | |
Y2 | Sim | Valor numérico | A coordenada Y de fim da sub-região para procurar o texto fornecido | |
X2 | Sim | Valor numérico | A coordenada X de fim da sub-região da imagem especificada para procurar o texto fornecido | |
Y2 | Sim | Valor numérico | A coordenada Y de fim da sub-região da imagem especificada para procurar o texto fornecido | |
Idioma do Windows OCR | N/A | Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco | Português | O idioma do texto detetado pelo motor de OCR do Windows |
Utilizar outro idioma | N/A | Valor booleano | Falso | Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract" |
Idioma do Tesseract | N/A | Inglês, alemão, espanhol, francês, italiano | Português | O idioma do texto detetado pelo motor Tesseract |
Abreviatura de idioma | Não | Valor de texto | A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng" | |
Caminho de dados do idioma | Não | Valor de texto | O caminho da pasta que contém os dados do Tesseract do idioma especificado | |
Multiplicador de largura da imagem | Não | Valor numérico | 1 | O multiplicador de largura da imagem |
Multiplicador de altura da imagem | Não | Valor numérico | 1 | O multiplicador de altura da imagem |
Algoritmo de correspondência de imagens | N/D | Básica, Avançada | Básica | Que algoritmo de imagem a utilizar para procurar a imagem |
Falha com erro de tempo limite | N/D | Valor booleano | Falso | Especifique se pretende que a ação aguarde indefinidamente ou falhe após um período de tempo definido |
Nota
- O motor de expressão regular do Power Automate é .NET. Para encontrar mais informações sobre expressões regulares, aceda a Linguagem de Expressão Regular – Referência Rápida.
- Está previsto que a opção Variável de motor de OCR seja preterida.
Variáveis produzidas
Argumento | Tipo | Descrição |
---|---|---|
LocationOfTextFoundX | Valor numérico | A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela |
LocationOfTextFoundY | Valor numérico | A coordenada X do ponto onde o texto aparece no ecrã. Se a pesquisa for efetuada na janela em primeiro plano, a coordenada devolvida é relativa ao canto superior esquerdo da janela |
Exceções
Exceção | Descrição |
---|---|
Não é possível verificar se o texto existe no modo não interativo | Indica que não é possível procurar o texto no ecrã no modo não interativo |
Coordenadas de sub-região inválidas | Indica que as coordenadas da sub-região indicada são inválidas |
Falha ao analisar texto com OCR | Indica que ocorreu um erro ao tentar analisar o texto utilizando OCR |
Falha ao criar o motor de OCR | Indica que ocorreu um erro ao tentar criar o motor de OCR |
A pasta do caminho de dados não existe | Indica que a pasta especificada para os dados de idioma não existe |
O language pack do Windows selecionado não está instalado no computador | Indica que o language pack do Windows selecionado não foi instalado no computador |
Motor de OCR não ativo | Indica que o motor de OCR não está ativo |
Erro de tempo limite | Indica que a ação falhou após um período de tempo definido |
Extrair texto com OCR
Extrair texto de uma determinada origem utilizando o motor de OCR fornecido.
Parâmetros de entrada
Argumento | Opcional | Aceita | Valor Predefinido | Descrição |
---|---|---|---|---|
motor de OCR | Não | Motor de OCR do Windows, motor de Tesseract, variável de motor de OCR | Variável do motor de OCR | O tipo do motor de OCR a utilizar. Selecione um motor de OCR pré-configurado ou configure um novo |
Variável do motor de OCR | Não | OCREngineObject | O motor a utilizar para a operação de OCR | |
OCR source | N/D | Ecrã, Janela em primeiro plano, Imagem no disco | Ecrã | A origem da imagem na qual a operação de OCR deve ser efetuada |
Image file path | Não | Ficheiro | O caminho da imagem na qual a operação de OCR deve ser efetuada | |
Search mode | N/D | A totalidade da origem especificada, Apenas sub-região específica, Apenas sub-região específica | A totalidade da origem especificada | O modo selecionado para a operação de OCR |
Imagem | Não | Lista de Imagens | A imagem a utilizar para limitar a análise a uma sub-região relativa à imagem especificada | |
Tolerance | Sim | Valor numérico | 10 | Especifica quanto a imagem pode diferir da imagem originalmente escolhida |
X1 | Sim | Valor numérico | A coordenada X de início da sub-região para limitar a análise | |
X2 | Sim | Valor numérico | A coordenada X de fim da sub-região para limitar a análise | |
Y1 | Sim | Valor numérico | A coordenada Y de início da sub-região para limitar a análise | |
Y2 | Sim | Valor numérico | A coordenada Y de fim da sub-região para limitar a análise | |
Idioma do Windows OCR | N/A | Chinês (Simplificado), Chinês (Tradicional), Checo, Dinamarquês, Neerlandês, Inglês, Finlandês, Francês, Alemão, Grego, Húngaro, Italiano, Japonês, Coreano, Norueguês, Polaco, Português, Romeno, Russo, Sérvio (Cirílico), Sérvio (Latim), Eslovaco, Espanhol, Sueco, Turco | Português | O idioma do texto detetado pelo motor de OCR do Windows |
Utilizar outro idioma | N/A | Valor booleano | Falso | Especifica se deve ser utilizado um idioma não indicado no campo "Idioma do Tesseract" |
Idioma do Tesseract | N/A | Inglês, alemão, espanhol, francês, italiano | Português | O idioma do texto detetado pelo motor Tesseract |
Abreviatura de idioma | Não | Valor de texto | A abreviatura do Tesseract do idioma a utilizar. Por exemplo, se os dados forem "eng.traineddata", defina-este parâmetro como "eng" | |
Caminho de dados do idioma | Não | Valor de texto | O caminho da pasta que contém os dados do Tesseract do idioma especificado | |
Multiplicador de largura da imagem | Não | Valor numérico | 1 | O multiplicador de largura da imagem |
Multiplicador de altura da imagem | Não | Valor numérico | 1 | O multiplicador de altura da imagem |
Aguardar que a imagem apareça | N/D | Valor booleano | Verdadeiro | Especifica se pretende esperar ou não que a imagem apareça no ecrã ou na janela em primeiro plano |
Limite de tempo excedido | Não | Valor numérico | 5 | Especifica o tempo para esperar que a operação esteja concluída antes que a ação falhe |
Algoritmo de correspondência de imagens | N/D | Básica, Avançada | Básica | Que algoritmo de imagem a utilizar para procurar a imagem |
Nota
Está previsto que a opção Variável de motor de OCR seja preterida.
Variáveis produzidas
Argumento | Tipo | Descrição |
---|---|---|
OcrText | Valor de texto | O resultado após a extração de texto |
Exceções
Exceção | Descrição |
---|---|
Falha ao extrair texto com OCR | Indica que ocorreu um erro ao tentar extrair texto com OCR a partir da origem indicada |
Ficheiro de imagem não encontrado | Indica que o ficheiro não existe no caminho indicado |
Imagem do marco não encontrada | Indica que a imagem do marco não existe |
Não é possível obter texto a partir do ecrã no modo não interativo | Indica que não é possível obter texto a partir do ecrã no modo não interativo |
Falha ao criar o motor de OCR | Indica que ocorreu um erro ao tentar criar o motor de OCR |
A pasta do caminho de dados não existe | Indica que a pasta especificada para os dados de idioma não existe |
O language pack do Windows selecionado não está instalado no computador | Indica que o language pack do Windows selecionado não foi instalado no computador |
Motor de OCR não ativo | Indica que o motor de OCR não está ativo |