OCR-handlinger

Artikel
03/16/2023

Power Automate giver brugere mulighed for at læse, udtrække og administrere data i filer via optisk tegngenkendelse (OCR).

Hvis du vil oprette et OCR-program og udtrække tekst fra billeder og dokumenter, skal du bruge handlingen Udtræk tekst med OCR. I følgende eksempel udtrækkes tekst fra hele det angivne billede.

Skærmbillede af handlingen Udtræk tekst med OCR.

Alle OCR-handlinger kan oprette en ny OCR-programvariabel eller bruge en eksisterende. Du kan bruge eksisterende OCR-programvariabler i alle handlinger, der tilbyder OCR-funktioner.

Power Automate understøtter Windows OCR-programmet og Tesseract-programmet. Hvis du vil konfigurere det valgte OCR-program, skal du navigere til Indstillinger for OCR-program for den relevante handling. De tilgængelige indstillinger omfatter sproget og billedbredden og højden.

Bemærk

Alle tilgængelige OCR-programmer er forudinstalleret i Power Automate og fungerer lokalt uden at skulle oprette forbindelse til skyen. Det kan dog være nødvendigt at hente sprogpakker eller datafiler for at udtrække tekster på bestemte sprog.
Billedformidlere øger billedets størrelse for at gøre søgning og tekstudtrækning mere effektiv. Indstillingsværdier, der er større end tre, kan medføre forkerte resultater.

Brug Windows OCR-programmet

Standard-OCR-programmet i Power Automate er Windows OCR-programmet. Hvis du vil udtrække tekst ved hjælp af Windows OCR-programmet, skal du installere den rette sprogpakke for det sprog, du vil udtrække.

Hvis den rette sprogpakke ikke er installeret, viser Power Automate en fejlmeddelelse, hvor du bliver bedt om at installere den. Du kan finde flere oplysninger om, hvordan du henter og installerer sprogpakker, i Sprogpakker til Windows.

Når den rette sprogpakke er installeret, skal du udvide OCR-programindstillingerne for OCR-handlingen og vælge det ønskede sprog. Windows OCR-programmet understøtter 25 sprog, herunder kinesisk (forenklet og traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk og latinsk), slovakisk, spansk, svensk og tyrkisk.

Brug Tesseract OCR-programmet

Bemærk

Hvis du vil bruge Tesseract OCR-programmet, skal du kontrollere, at maskinens CPU understøtter AVX2-instruktionssættet.

Foruden Windows OCR-programmet understøtter Power Automate Tesseract-programmet. Dette program kan udtrække tekst på fem sprog uden yderligere konfiguration: engelsk, tysk, spansk, fransk og italiensk.

Hvis du vil udtrække tekst på et sprog, der ikke findes på den nævnte liste, skal du aktivere indstillingen Brug andre sprog i OCR-programindstillingerne for OCR-handlingen. Når denne indstilling er aktiveret, vises der yderligere to indstillinger for handlingen: felterne Forkortelse for sprog og Sprogdatasti.

Feltet Sprogforkortelse angiver, hvilket sprog der skal søges efter under OCR, til programmet. Feltet Sprogdatasti indeholder de sprogdatafiler (.traineddata), der bruges til at træne OCR-programmet. Du kan finde sprogdatafilerne for alle de tilgængelige sprog i dette GitHub-lager.

Programmet Tesseract kan også bruges til at udtrække tekst fra flersprogede dokumenter. Du kan finde flere oplysninger om udpakning af tekst fra flersprogede dokumenter i Udføre OCR på flersprogede dokumenter.

Hvis der er tekst på skærmen (OCR)

Markerer starten af en betinget blok af handlinger afhængigt af, om en bestemt tekst vises på skærmen ved brug af OCR.

Inputparametre

Argument	Valgfrit	Accepterer	Standardværdi	Beskrivelse
If text	I/R	Eksisterer, Eksisterer ikke	Findes	Angiver, om teksten findes, eller om den ikke findes på den givne kilde, der skal analyseres
OCR-programtype	Nej	Windows OCR-program, Tesseract-program, OCR-programvariabel	Variabel til OCR-program	Den OCR-programtype, der skal bruges. Vælg en forudkonfigureret OCR-programtype, eller konfigurer en ny.
OCR engine variable	Nej	OCREngineObject		Det program, der skal bruges til OCR-handlingen
Tekst, der skal findes	Nej	Tekstværdi		Den tekst, der skal søges efter i den angivne kilde
Is regular expression	I/R	Boolesk værdi	Falsk	Angiver, om der skal bruges et regulært udtryk til at søge efter den angivne tekst
Search for text on	I/R	Hele skærmen, Forgrundsvindue	Hele skærmen	Angiver, om der skal søges efter den angivne tekst på hele den synlige skærm eller kun i vinduet i forgrunden
Søgetilstand	I/R	Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede	Hele den angivne kilde	Angiver, om hele skærmen (eller vinduet) eller et indskrænket underområde skal scannes
Billede(r)	Nej	Liste over billeder		De billeder, der angiver underområdet (i forhold til det øverste venstre hjørne af billedet), der skal scannes for den angivne tekst
X1	Ja	Numerisk værdi		Start X-koordinaten for underområdet for at scanne den angivne tekst
Tolerance	Ja	Numerisk værdi	10	Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede
Y1	Ja	Numerisk værdi		Start Y-koordinaten for underområdet for at scanne den angivne tekst
X1	Ja	Numerisk værdi		Start X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
X2	Ja	Numerisk værdi		Slut X-koordinaten for underområdet for at scanne den angivne tekst
Y1	Ja	Numerisk værdi		Start Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2	Ja	Numerisk værdi		Slut Y-koordinaten for underområdet for at scanne den angivne tekst
X2	Ja	Numerisk værdi		Slut X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2	Ja	Numerisk værdi		Slut Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Windows OCR sprog	I/R	Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk	Engelsk	Sproget i den tekst, som Windows OCR-programmet registrerer
Brug et andet sprog	I/R	Boolesk værdi	Falsk	Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog'
Tesseract-sprog	I/R	Engelsk, tysk, spansk, fransk, italiensk	Engelsk	Sproget i billedteksten, som Tesseract-programmet registrerer
Forkortelse for sprog	Nej	Tekstværdi		Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng'
Sprogdatasti	Nej	Tekstværdi		Stien til den mappe, der indeholder data for det angivne Tesseract-sprog
Billedets breddemultiplikator	Nej	Numerisk værdi	1	Billedets breddemultiplikator
Billedets højdemultiplikator	Nej	Numerisk værdi	1	Billedets højdemultiplikator
Algoritme til billedmatchning	I/R	Grundlæggende, Avanceret	Grundlæggende	Hvilken billedalgoritme skal bruges, når du søger efter billede

Bemærk

Power Automate bruger .NET til almindelige udtryk. Du kan finde flere oplysninger om almindelige udtryk i Normalt udtrykssprog – oversigtsvejledning.
Indstillingen Variabel til OCR-program er planlagt til udfasning.

Variabler produceret

Argument	Type	Beskrivelse
LocationOfTextFoundX	Numerisk værdi	X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne
LocationOfTextFoundY	Numerisk værdi	X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne

Undtagelser

Undtagelse	Beskrivelse
Kan ikke kontrollere, om der findes tekst i ikke-interaktiv tilstand	Angiver, at det ikke er muligt at kontrollere teksten på skærmen i ikke-interaktiv tilstand
ugyldige underområdekoordinater	Angiver, at de angivne koordinater for underområde er ugyldige
Kunne ikke analysere tekst med OCR	Angiver, at der opstod en fejl under forsøg på at analysere tekst ved hjælp af OCR
Kunne ikke oprette OCR-programmet	Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet
Mappe med datasti findes ikke	Angiver, at den mappe, der er angivet for sproget, ikke findes
Den valgte Windows sprogpakke er ikke installeret på computeren	Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren
OCR-program er ikke aktivt	Angiver, at OCR-programmet ikke er aktivt

Vent på tekst på skærmen (OCR)

Vent, indtil en bestemt tekst vises på/fjernes på skærmen, i vinduet i forgrunden eller i forhold til et billede på skærmen eller i vinduet i forgrunden med OCR.

Inputparametre

Argument	Valgfrit	Accepterer	Standardværdi	Beskrivelse
Wait for text to	I/R	Vis, forsvind	Vises	Angiver, om der skal ventes på, at teksten vises eller forsvinder
OCR-programtype	Nej	Windows OCR-program, Tesseract-program, OCR-programvariabel	Variabel til OCR-program	Den OCR-programtype, der skal bruges. Vælg en forudkonfigureret OCR-programtype, eller konfigurer en ny.
OCR engine variable	Nej	OCREngineObject		Det program, der skal bruges til OCR-handlingen
Tekst, der skal findes	Nej	Tekstværdi		Den tekst, der skal søges efter i den angivne kilde
Is regular expression	I/R	Boolesk værdi	Falsk	Angiver, om der skal bruges et regulært udtryk til at søge efter den angivne tekst
Search for text on	I/R	Hele skærmen, Forgrundsvindue	Hele skærmen	Angiver, om der skal søges efter den angivne tekst på hele den synlige skærm eller kun i vinduet i forgrunden
Søgetilstand	I/R	Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede	Hele den angivne kilde	Angiver, om hele skærmen (eller vinduet) eller et indskrænket underområde skal scannes
Billede(r)	Nej	Liste over billeder		De billeder, der angiver underområdet (i forhold til det øverste venstre hjørne af billedet), der skal scannes for den angivne tekst
X1	Ja	Numerisk værdi		Start X-koordinaten for underområdet for at scanne den angivne tekst
Tolerance	Ja	Numerisk værdi	10	Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede
Y1	Ja	Numerisk værdi		Start Y-koordinaten for underområdet for at scanne den angivne tekst
X1	Ja	Numerisk værdi		Start X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
X2	Ja	Numerisk værdi		Slut X-koordinaten for underområdet for at scanne den angivne tekst
Y1	Ja	Numerisk værdi		Start Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2	Ja	Numerisk værdi		Slut Y-koordinaten for underområdet for at scanne den angivne tekst
X2	Ja	Numerisk værdi		Slut X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2	Ja	Numerisk værdi		Slut Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Windows OCR sprog	I/R	Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk	Engelsk	Sproget i den tekst, som Windows OCR-programmet registrerer
Brug et andet sprog	I/R	Boolesk værdi	Falsk	Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog'
Tesseract-sprog	I/R	Engelsk, tysk, spansk, fransk, italiensk	Engelsk	Sproget i billedteksten, som Tesseract-programmet registrerer
Forkortelse for sprog	Nej	Tekstværdi		Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng'
Sprogdatasti	Nej	Tekstværdi		Stien til den mappe, der indeholder data for det angivne Tesseract-sprog
Billedets breddemultiplikator	Nej	Numerisk værdi	1	Billedets breddemultiplikator
Billedets højdemultiplikator	Nej	Numerisk værdi	1	Billedets højdemultiplikator
Algoritme til billedmatchning	I/R	Grundlæggende, Avanceret	Grundlæggende	Hvilken billedalgoritme skal bruges, når du søger efter billede
Mislykkes med fejl ved timeout	I/R	Boolesk værdi	Falsk	Angiv, om handlingen skal vente uendeligt eller skal mislykkes efter en angivet tidsperiode

Bemærk

Power Automate bruger .NET til almindelige udtryk. Du kan finde flere oplysninger om almindelige udtryk i Normalt udtrykssprog – oversigtsvejledning.
Indstillingen Variabel til OCR-program er planlagt til udfasning.

Variabler produceret

Argument	Type	Beskrivelse
LocationOfTextFoundX	Numerisk værdi	X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne
LocationOfTextFoundY	Numerisk værdi	X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne

Undtagelser

Undtagelse	Beskrivelse
Kan ikke kontrollere, om der findes tekst i ikke-interaktiv tilstand	Angiver, at det ikke er muligt at kontrollere teksten på skærmen i ikke-interaktiv tilstand
ugyldige underområdekoordinater	Angiver, at de angivne koordinater for underområde er ugyldige
Kunne ikke analysere tekst med OCR	Angiver, at der opstod en fejl under forsøg på at analysere tekst ved hjælp af OCR
Kunne ikke oprette OCR-programmet	Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet
Mappe med datasti findes ikke	Angiver, at den mappe, der er angivet for sproget, ikke findes
Den valgte Windows sprogpakke er ikke installeret på computeren	Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren
OCR-program er ikke aktivt	Angiver, at OCR-programmet ikke er aktivt
Timeout-fejl	Angiver, at handlingen mislykkedes efter en angivet tidsperiode

Udtræk tekst med OCR

Udtræk tekst fra en given kilde ved hjælp af det angivne OCR-program.

Inputparametre

Argument	Valgfrit	Accepterer	Standardværdi	Beskrivelse
OCR-program	Nej	Windows OCR-program, Tesseract-program, OCR-programvariabel	Variabel til OCR-program	Den OCR-programtype, der skal bruges. Vælg et forudkonfigureret OCR-program, eller konfigurer et nyt
Variabel til OCR-program	Nej	OCREngineObject		Det program, der skal bruges til OCR-handlingen
OCR source	I/R	Skærm, Forgrundsvindue, Billede på disken	Skærm	Kilden til det billede, der skal udføres OCR-handling på
Billedfilsti	Nej	Filer		Stien til det billede, der skal udføres OCR-handling på
Søgetilstand	I/R	Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede	Hele den angivne kilde	Den valgte tilstand for OCR-handlingen
Billede	Nej	Liste over billeder		Det billede, der skal bruges til at indskrænke scanningen til et underområde i forhold til det angivne billede
Tolerance	Ja	Numerisk værdi	10	Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede
X1	Ja	Numerisk værdi		Start X-koordinaten for underområdet for at indsnævre scanningen
X2	Ja	Numerisk værdi		Slut X-koordinaten for underområdet for at indsnævre scanningen
Y1	Ja	Numerisk værdi		Start Y-koordinaten for underområdet for at indsnævre scanningen
Y2	Ja	Numerisk værdi		Slut Y-koordinaten for underområdet for at indsnævre scanningen
Windows OCR sprog	I/R	Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk	Engelsk	Sproget i den tekst, som Windows OCR-programmet registrerer
Brug et andet sprog	I/R	Boolesk værdi	Falsk	Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog'
Tesseract-sprog	I/R	Engelsk, tysk, spansk, fransk, italiensk	Engelsk	Sproget i billedteksten, som Tesseract-programmet registrerer
Forkortelse for sprog	Nej	Tekstværdi		Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng'
Sprogdatasti	Nej	Tekstværdi		Stien til den mappe, der indeholder data for det angivne Tesseract-sprog
Billedets breddemultiplikator	Nej	Numerisk værdi	1	Billedets breddemultiplikator
Billedets højdemultiplikator	Nej	Numerisk værdi	1	Billedets højdemultiplikator
Vent på, at billedet vises	I/R	Boolesk værdi	Sand	Angiver, om der skal ventes på, at billedet vises på skærmen eller i vinduet i forgrunden
Timeout	Nej	Numerisk værdi	5	Angiver den tid, der skal ventes på, at handlingen fuldføres, før handlingen mislykkes
Algoritme til billedmatchning	I/R	Grundlæggende, Avanceret	Grundlæggende	Hvilken billedalgoritme skal bruges, når du søger efter billede

Bemærk

Indstillingen Variabel til OCR-program er planlagt til udfasning.

Variabler produceret

Argument	Type	Beskrivelse
OcrText	Tekstværdi	Resultatet efter udtræk af tekst

Undtagelser

Undtagelse	Beskrivelse
Kunne ikke udtrække tekst med OCR	Angiver, at der opstod en fejl under forsøg på at udtrække tekst med OCR fra den angivne kilde
Billedfil blev ikke fundet	Angiver, at filen ikke findes på den angivne sti
Landmærkebilledet blev ikke fundet	Angiver, at landmærkebilledet ikke findes
Kan ikke hente tekst fra skærmen i ikke-interaktiv tilstand	Angiver, at det ikke er muligt at hente tekst fra skærmen i ikke-interaktiv tilstand
Kunne ikke oprette OCR-programmet	Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet
Mappe med datasti findes ikke	Angiver, at den mappe, der er angivet for sproget, ikke findes
Den valgte Windows sprogpakke er ikke installeret på computeren	Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren
OCR-program er ikke aktivt	Angiver, at OCR-programmet ikke er aktivt

Del via

OCR-handlinger

Brug Windows OCR-programmet

Brug Tesseract OCR-programmet

Hvis der er tekst på skærmen (OCR)

Inputparametre

Variabler produceret

Undtagelser

Vent på tekst på skærmen (OCR)

Inputparametre

Variabler produceret

Undtagelser

Udtræk tekst med OCR

Inputparametre

Variabler produceret

Undtagelser

Yderligere ressourcer