OCR-handlinger
Power Automate giver brugere mulighed for at læse, udtrække og administrere data i filer via optisk tegngenkendelse (OCR).
Hvis du vil oprette et OCR-program og udtrække tekst fra billeder og dokumenter, skal du bruge handlingen Udtræk tekst med OCR. I følgende eksempel udtrækkes tekst fra hele det angivne billede.
Alle OCR-handlinger kan oprette en ny OCR-programvariabel eller bruge en eksisterende. Du kan bruge eksisterende OCR-programvariabler i alle handlinger, der tilbyder OCR-funktioner.
Power Automate understøtter Windows OCR-programmet og Tesseract-programmet. Hvis du vil konfigurere det valgte OCR-program, skal du navigere til Indstillinger for OCR-program for den relevante handling. De tilgængelige indstillinger omfatter sproget og billedbredden og højden.
Bemærk
- Alle tilgængelige OCR-programmer er forudinstalleret i Power Automate og fungerer lokalt uden at skulle oprette forbindelse til skyen. Det kan dog være nødvendigt at hente sprogpakker eller datafiler for at udtrække tekster på bestemte sprog.
- Billedformidlere øger billedets størrelse for at gøre søgning og tekstudtrækning mere effektiv. Indstillingsværdier, der er større end tre, kan medføre forkerte resultater.
Brug Windows OCR-programmet
Standard-OCR-programmet i Power Automate er Windows OCR-programmet. Hvis du vil udtrække tekst ved hjælp af Windows OCR-programmet, skal du installere den rette sprogpakke for det sprog, du vil udtrække.
Hvis den rette sprogpakke ikke er installeret, viser Power Automate en fejlmeddelelse, hvor du bliver bedt om at installere den. Du kan finde flere oplysninger om, hvordan du henter og installerer sprogpakker, i Sprogpakker til Windows.
Når den rette sprogpakke er installeret, skal du udvide OCR-programindstillingerne for OCR-handlingen og vælge det ønskede sprog. Windows OCR-programmet understøtter 25 sprog, herunder kinesisk (forenklet og traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk og latinsk), slovakisk, spansk, svensk og tyrkisk.
Brug Tesseract OCR-programmet
Bemærk
Hvis du vil bruge Tesseract OCR-programmet, skal du kontrollere, at maskinens CPU understøtter AVX2-instruktionssættet.
Foruden Windows OCR-programmet understøtter Power Automate Tesseract-programmet. Dette program kan udtrække tekst på fem sprog uden yderligere konfiguration: engelsk, tysk, spansk, fransk og italiensk.
Hvis du vil udtrække tekst på et sprog, der ikke findes på den nævnte liste, skal du aktivere indstillingen Brug andre sprog i OCR-programindstillingerne for OCR-handlingen. Når denne indstilling er aktiveret, vises der yderligere to indstillinger for handlingen: felterne Forkortelse for sprog og Sprogdatasti.
Feltet Sprogforkortelse angiver, hvilket sprog der skal søges efter under OCR, til programmet. Feltet Sprogdatasti indeholder de sprogdatafiler (.traineddata), der bruges til at træne OCR-programmet. Du kan finde sprogdatafilerne for alle de tilgængelige sprog i dette GitHub-lager.
Programmet Tesseract kan også bruges til at udtrække tekst fra flersprogede dokumenter. Du kan finde flere oplysninger om udpakning af tekst fra flersprogede dokumenter i Udføre OCR på flersprogede dokumenter.
Hvis der er tekst på skærmen (OCR)
Markerer starten af en betinget blok af handlinger afhængigt af, om en bestemt tekst vises på skærmen ved brug af OCR.
Inputparametre
Argument | Valgfrit | Accepterer | Standardværdi | Beskrivelse |
---|---|---|---|---|
If text | I/R | Eksisterer, Eksisterer ikke | Findes | Angiver, om teksten findes, eller om den ikke findes på den givne kilde, der skal analyseres |
OCR-programtype | Nej | Windows OCR-program, Tesseract-program, OCR-programvariabel | Variabel til OCR-program | Den OCR-programtype, der skal bruges. Vælg en forudkonfigureret OCR-programtype, eller konfigurer en ny. |
OCR engine variable | Nej | OCREngineObject | Det program, der skal bruges til OCR-handlingen | |
Tekst, der skal findes | Nej | Tekstværdi | Den tekst, der skal søges efter i den angivne kilde | |
Is regular expression | I/R | Boolesk værdi | Falsk | Angiver, om der skal bruges et regulært udtryk til at søge efter den angivne tekst |
Search for text on | I/R | Hele skærmen, Forgrundsvindue | Hele skærmen | Angiver, om der skal søges efter den angivne tekst på hele den synlige skærm eller kun i vinduet i forgrunden |
Søgetilstand | I/R | Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede | Hele den angivne kilde | Angiver, om hele skærmen (eller vinduet) eller et indskrænket underområde skal scannes |
Billede(r) | Nej | Liste over billeder | De billeder, der angiver underområdet (i forhold til det øverste venstre hjørne af billedet), der skal scannes for den angivne tekst | |
X1 | Ja | Numerisk værdi | Start X-koordinaten for underområdet for at scanne den angivne tekst | |
Tolerance | Ja | Numerisk værdi | 10 | Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede |
Y1 | Ja | Numerisk værdi | Start Y-koordinaten for underområdet for at scanne den angivne tekst | |
X1 | Ja | Numerisk værdi | Start X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
X2 | Ja | Numerisk værdi | Slut X-koordinaten for underområdet for at scanne den angivne tekst | |
Y1 | Ja | Numerisk værdi | Start Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
Y2 | Ja | Numerisk værdi | Slut Y-koordinaten for underområdet for at scanne den angivne tekst | |
X2 | Ja | Numerisk værdi | Slut X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
Y2 | Ja | Numerisk værdi | Slut Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
Windows OCR sprog | I/R | Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk | Engelsk | Sproget i den tekst, som Windows OCR-programmet registrerer |
Brug et andet sprog | I/R | Boolesk værdi | Falsk | Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog' |
Tesseract-sprog | I/R | Engelsk, tysk, spansk, fransk, italiensk | Engelsk | Sproget i billedteksten, som Tesseract-programmet registrerer |
Forkortelse for sprog | Nej | Tekstværdi | Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng' | |
Sprogdatasti | Nej | Tekstværdi | Stien til den mappe, der indeholder data for det angivne Tesseract-sprog | |
Billedets breddemultiplikator | Nej | Numerisk værdi | 1 | Billedets breddemultiplikator |
Billedets højdemultiplikator | Nej | Numerisk værdi | 1 | Billedets højdemultiplikator |
Algoritme til billedmatchning | I/R | Grundlæggende, Avanceret | Grundlæggende | Hvilken billedalgoritme skal bruges, når du søger efter billede |
Bemærk
- Power Automate bruger .NET til almindelige udtryk. Du kan finde flere oplysninger om almindelige udtryk i Normalt udtrykssprog – oversigtsvejledning.
- Indstillingen Variabel til OCR-program er planlagt til udfasning.
Variabler produceret
Argument | Type | Beskrivelse |
---|---|---|
LocationOfTextFoundX | Numerisk værdi | X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne |
LocationOfTextFoundY | Numerisk værdi | X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne |
Undtagelser
Undtagelse | Beskrivelse |
---|---|
Kan ikke kontrollere, om der findes tekst i ikke-interaktiv tilstand | Angiver, at det ikke er muligt at kontrollere teksten på skærmen i ikke-interaktiv tilstand |
ugyldige underområdekoordinater | Angiver, at de angivne koordinater for underområde er ugyldige |
Kunne ikke analysere tekst med OCR | Angiver, at der opstod en fejl under forsøg på at analysere tekst ved hjælp af OCR |
Kunne ikke oprette OCR-programmet | Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet |
Mappe med datasti findes ikke | Angiver, at den mappe, der er angivet for sproget, ikke findes |
Den valgte Windows sprogpakke er ikke installeret på computeren | Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren |
OCR-program er ikke aktivt | Angiver, at OCR-programmet ikke er aktivt |
Vent på tekst på skærmen (OCR)
Vent, indtil en bestemt tekst vises på/fjernes på skærmen, i vinduet i forgrunden eller i forhold til et billede på skærmen eller i vinduet i forgrunden med OCR.
Inputparametre
Argument | Valgfrit | Accepterer | Standardværdi | Beskrivelse |
---|---|---|---|---|
Wait for text to | I/R | Vis, forsvind | Vises | Angiver, om der skal ventes på, at teksten vises eller forsvinder |
OCR-programtype | Nej | Windows OCR-program, Tesseract-program, OCR-programvariabel | Variabel til OCR-program | Den OCR-programtype, der skal bruges. Vælg en forudkonfigureret OCR-programtype, eller konfigurer en ny. |
OCR engine variable | Nej | OCREngineObject | Det program, der skal bruges til OCR-handlingen | |
Tekst, der skal findes | Nej | Tekstværdi | Den tekst, der skal søges efter i den angivne kilde | |
Is regular expression | I/R | Boolesk værdi | Falsk | Angiver, om der skal bruges et regulært udtryk til at søge efter den angivne tekst |
Search for text on | I/R | Hele skærmen, Forgrundsvindue | Hele skærmen | Angiver, om der skal søges efter den angivne tekst på hele den synlige skærm eller kun i vinduet i forgrunden |
Søgetilstand | I/R | Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede | Hele den angivne kilde | Angiver, om hele skærmen (eller vinduet) eller et indskrænket underområde skal scannes |
Billede(r) | Nej | Liste over billeder | De billeder, der angiver underområdet (i forhold til det øverste venstre hjørne af billedet), der skal scannes for den angivne tekst | |
X1 | Ja | Numerisk værdi | Start X-koordinaten for underområdet for at scanne den angivne tekst | |
Tolerance | Ja | Numerisk værdi | 10 | Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede |
Y1 | Ja | Numerisk værdi | Start Y-koordinaten for underområdet for at scanne den angivne tekst | |
X1 | Ja | Numerisk værdi | Start X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
X2 | Ja | Numerisk værdi | Slut X-koordinaten for underområdet for at scanne den angivne tekst | |
Y1 | Ja | Numerisk værdi | Start Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
Y2 | Ja | Numerisk værdi | Slut Y-koordinaten for underområdet for at scanne den angivne tekst | |
X2 | Ja | Numerisk værdi | Slut X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
Y2 | Ja | Numerisk værdi | Slut Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst | |
Windows OCR sprog | I/R | Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk | Engelsk | Sproget i den tekst, som Windows OCR-programmet registrerer |
Brug et andet sprog | I/R | Boolesk værdi | Falsk | Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog' |
Tesseract-sprog | I/R | Engelsk, tysk, spansk, fransk, italiensk | Engelsk | Sproget i billedteksten, som Tesseract-programmet registrerer |
Forkortelse for sprog | Nej | Tekstværdi | Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng' | |
Sprogdatasti | Nej | Tekstværdi | Stien til den mappe, der indeholder data for det angivne Tesseract-sprog | |
Billedets breddemultiplikator | Nej | Numerisk værdi | 1 | Billedets breddemultiplikator |
Billedets højdemultiplikator | Nej | Numerisk værdi | 1 | Billedets højdemultiplikator |
Algoritme til billedmatchning | I/R | Grundlæggende, Avanceret | Grundlæggende | Hvilken billedalgoritme skal bruges, når du søger efter billede |
Mislykkes med fejl ved timeout | I/R | Boolesk værdi | Falsk | Angiv, om handlingen skal vente uendeligt eller skal mislykkes efter en angivet tidsperiode |
Bemærk
- Power Automate bruger .NET til almindelige udtryk. Du kan finde flere oplysninger om almindelige udtryk i Normalt udtrykssprog – oversigtsvejledning.
- Indstillingen Variabel til OCR-program er planlagt til udfasning.
Variabler produceret
Argument | Type | Beskrivelse |
---|---|---|
LocationOfTextFoundX | Numerisk værdi | X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne |
LocationOfTextFoundY | Numerisk værdi | X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne |
Undtagelser
Undtagelse | Beskrivelse |
---|---|
Kan ikke kontrollere, om der findes tekst i ikke-interaktiv tilstand | Angiver, at det ikke er muligt at kontrollere teksten på skærmen i ikke-interaktiv tilstand |
ugyldige underområdekoordinater | Angiver, at de angivne koordinater for underområde er ugyldige |
Kunne ikke analysere tekst med OCR | Angiver, at der opstod en fejl under forsøg på at analysere tekst ved hjælp af OCR |
Kunne ikke oprette OCR-programmet | Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet |
Mappe med datasti findes ikke | Angiver, at den mappe, der er angivet for sproget, ikke findes |
Den valgte Windows sprogpakke er ikke installeret på computeren | Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren |
OCR-program er ikke aktivt | Angiver, at OCR-programmet ikke er aktivt |
Timeout-fejl | Angiver, at handlingen mislykkedes efter en angivet tidsperiode |
Udtræk tekst med OCR
Udtræk tekst fra en given kilde ved hjælp af det angivne OCR-program.
Inputparametre
Argument | Valgfrit | Accepterer | Standardværdi | Beskrivelse |
---|---|---|---|---|
OCR-program | Nej | Windows OCR-program, Tesseract-program, OCR-programvariabel | Variabel til OCR-program | Den OCR-programtype, der skal bruges. Vælg et forudkonfigureret OCR-program, eller konfigurer et nyt |
Variabel til OCR-program | Nej | OCREngineObject | Det program, der skal bruges til OCR-handlingen | |
OCR source | I/R | Skærm, Forgrundsvindue, Billede på disken | Skærm | Kilden til det billede, der skal udføres OCR-handling på |
Billedfilsti | Nej | Filer | Stien til det billede, der skal udføres OCR-handling på | |
Søgetilstand | I/R | Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede | Hele den angivne kilde | Den valgte tilstand for OCR-handlingen |
Billede | Nej | Liste over billeder | Det billede, der skal bruges til at indskrænke scanningen til et underområde i forhold til det angivne billede | |
Tolerance | Ja | Numerisk værdi | 10 | Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede |
X1 | Ja | Numerisk værdi | Start X-koordinaten for underområdet for at indsnævre scanningen | |
X2 | Ja | Numerisk værdi | Slut X-koordinaten for underområdet for at indsnævre scanningen | |
Y1 | Ja | Numerisk værdi | Start Y-koordinaten for underområdet for at indsnævre scanningen | |
Y2 | Ja | Numerisk værdi | Slut Y-koordinaten for underområdet for at indsnævre scanningen | |
Windows OCR sprog | I/R | Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk | Engelsk | Sproget i den tekst, som Windows OCR-programmet registrerer |
Brug et andet sprog | I/R | Boolesk værdi | Falsk | Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog' |
Tesseract-sprog | I/R | Engelsk, tysk, spansk, fransk, italiensk | Engelsk | Sproget i billedteksten, som Tesseract-programmet registrerer |
Forkortelse for sprog | Nej | Tekstværdi | Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng' | |
Sprogdatasti | Nej | Tekstværdi | Stien til den mappe, der indeholder data for det angivne Tesseract-sprog | |
Billedets breddemultiplikator | Nej | Numerisk værdi | 1 | Billedets breddemultiplikator |
Billedets højdemultiplikator | Nej | Numerisk værdi | 1 | Billedets højdemultiplikator |
Vent på, at billedet vises | I/R | Boolesk værdi | Sand | Angiver, om der skal ventes på, at billedet vises på skærmen eller i vinduet i forgrunden |
Timeout | Nej | Numerisk værdi | 5 | Angiver den tid, der skal ventes på, at handlingen fuldføres, før handlingen mislykkes |
Algoritme til billedmatchning | I/R | Grundlæggende, Avanceret | Grundlæggende | Hvilken billedalgoritme skal bruges, når du søger efter billede |
Bemærk
Indstillingen Variabel til OCR-program er planlagt til udfasning.
Variabler produceret
Argument | Type | Beskrivelse |
---|---|---|
OcrText | Tekstværdi | Resultatet efter udtræk af tekst |
Undtagelser
Undtagelse | Beskrivelse |
---|---|
Kunne ikke udtrække tekst med OCR | Angiver, at der opstod en fejl under forsøg på at udtrække tekst med OCR fra den angivne kilde |
Billedfil blev ikke fundet | Angiver, at filen ikke findes på den angivne sti |
Landmærkebilledet blev ikke fundet | Angiver, at landmærkebilledet ikke findes |
Kan ikke hente tekst fra skærmen i ikke-interaktiv tilstand | Angiver, at det ikke er muligt at hente tekst fra skærmen i ikke-interaktiv tilstand |
Kunne ikke oprette OCR-programmet | Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet |
Mappe med datasti findes ikke | Angiver, at den mappe, der er angivet for sproget, ikke findes |
Den valgte Windows sprogpakke er ikke installeret på computeren | Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren |
OCR-program er ikke aktivt | Angiver, at OCR-programmet ikke er aktivt |