Del via


OCR-handlinger

Power Automate giver brugere mulighed for at læse, udtrække og administrere data i filer via optisk tegngenkendelse (OCR).

Hvis du vil oprette et OCR-program og udtrække tekst fra billeder og dokumenter, skal du bruge handlingen Udtræk tekst med OCR. I følgende eksempel udtrækkes tekst fra hele det angivne billede.

Skærmbillede af handlingen Udtræk tekst med OCR.

Alle OCR-handlinger kan oprette en ny OCR-programvariabel eller bruge en eksisterende. Du kan bruge eksisterende OCR-programvariabler i alle handlinger, der tilbyder OCR-funktioner.

Power Automate understøtter Windows OCR-programmet og Tesseract-programmet. Hvis du vil konfigurere det valgte OCR-program, skal du navigere til Indstillinger for OCR-program for den relevante handling. De tilgængelige indstillinger omfatter sproget og billedbredden og højden.

Bemærk

  • Alle tilgængelige OCR-programmer er forudinstalleret i Power Automate og fungerer lokalt uden at skulle oprette forbindelse til skyen. Det kan dog være nødvendigt at hente sprogpakker eller datafiler for at udtrække tekster på bestemte sprog.
  • Billedformidlere øger billedets størrelse for at gøre søgning og tekstudtrækning mere effektiv. Indstillingsværdier, der er større end tre, kan medføre forkerte resultater.

Brug Windows OCR-programmet

Standard-OCR-programmet i Power Automate er Windows OCR-programmet. Hvis du vil udtrække tekst ved hjælp af Windows OCR-programmet, skal du installere den rette sprogpakke for det sprog, du vil udtrække.

Hvis den rette sprogpakke ikke er installeret, viser Power Automate en fejlmeddelelse, hvor du bliver bedt om at installere den. Du kan finde flere oplysninger om, hvordan du henter og installerer sprogpakker, i Sprogpakker til Windows.

Når den rette sprogpakke er installeret, skal du udvide OCR-programindstillingerne for OCR-handlingen og vælge det ønskede sprog. Windows OCR-programmet understøtter 25 sprog, herunder kinesisk (forenklet og traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk og latinsk), slovakisk, spansk, svensk og tyrkisk.

Brug Tesseract OCR-programmet

Bemærk

Hvis du vil bruge Tesseract OCR-programmet, skal du kontrollere, at maskinens CPU understøtter AVX2-instruktionssættet.

Foruden Windows OCR-programmet understøtter Power Automate Tesseract-programmet. Dette program kan udtrække tekst på fem sprog uden yderligere konfiguration: engelsk, tysk, spansk, fransk og italiensk.

Hvis du vil udtrække tekst på et sprog, der ikke findes på den nævnte liste, skal du aktivere indstillingen Brug andre sprog i OCR-programindstillingerne for OCR-handlingen. Når denne indstilling er aktiveret, vises der yderligere to indstillinger for handlingen: felterne Forkortelse for sprog og Sprogdatasti.

Feltet Sprogforkortelse angiver, hvilket sprog der skal søges efter under OCR, til programmet. Feltet Sprogdatasti indeholder de sprogdatafiler (.traineddata), der bruges til at træne OCR-programmet. Du kan finde sprogdatafilerne for alle de tilgængelige sprog i dette GitHub-lager.

Programmet Tesseract kan også bruges til at udtrække tekst fra flersprogede dokumenter. Du kan finde flere oplysninger om udpakning af tekst fra flersprogede dokumenter i Udføre OCR på flersprogede dokumenter.

Hvis der er tekst på skærmen (OCR)

Markerer starten af en betinget blok af handlinger afhængigt af, om en bestemt tekst vises på skærmen ved brug af OCR.

Inputparametre

Argument Valgfrit Accepterer Standardværdi Beskrivelse
If text I/R Eksisterer, Eksisterer ikke Findes Angiver, om teksten findes, eller om den ikke findes på den givne kilde, der skal analyseres
OCR-programtype Nej Windows OCR-program, Tesseract-program, OCR-programvariabel Variabel til OCR-program Den OCR-programtype, der skal bruges. Vælg en forudkonfigureret OCR-programtype, eller konfigurer en ny.
OCR engine variable Nej OCREngineObject Det program, der skal bruges til OCR-handlingen
Tekst, der skal findes Nej Tekstværdi Den tekst, der skal søges efter i den angivne kilde
Is regular expression I/R Boolesk værdi Falsk Angiver, om der skal bruges et regulært udtryk til at søge efter den angivne tekst
Search for text on I/R Hele skærmen, Forgrundsvindue Hele skærmen Angiver, om der skal søges efter den angivne tekst på hele den synlige skærm eller kun i vinduet i forgrunden
Søgetilstand I/R Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede Hele den angivne kilde Angiver, om hele skærmen (eller vinduet) eller et indskrænket underområde skal scannes
Billede(r) Nej Liste over billeder De billeder, der angiver underområdet (i forhold til det øverste venstre hjørne af billedet), der skal scannes for den angivne tekst
X1 Ja Numerisk værdi Start X-koordinaten for underområdet for at scanne den angivne tekst
Tolerance Ja Numerisk værdi 10 Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede
Y1 Ja Numerisk værdi Start Y-koordinaten for underområdet for at scanne den angivne tekst
X1 Ja Numerisk værdi Start X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
X2 Ja Numerisk værdi Slut X-koordinaten for underområdet for at scanne den angivne tekst
Y1 Ja Numerisk værdi Start Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2 Ja Numerisk værdi Slut Y-koordinaten for underområdet for at scanne den angivne tekst
X2 Ja Numerisk værdi Slut X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2 Ja Numerisk værdi Slut Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Windows OCR sprog I/R Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk Engelsk Sproget i den tekst, som Windows OCR-programmet registrerer
Brug et andet sprog I/R Boolesk værdi Falsk Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog'
Tesseract-sprog I/R Engelsk, tysk, spansk, fransk, italiensk Engelsk Sproget i billedteksten, som Tesseract-programmet registrerer
Forkortelse for sprog Nej Tekstværdi Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng'
Sprogdatasti Nej Tekstværdi Stien til den mappe, der indeholder data for det angivne Tesseract-sprog
Billedets breddemultiplikator Nej Numerisk værdi 1 Billedets breddemultiplikator
Billedets højdemultiplikator Nej Numerisk værdi 1 Billedets højdemultiplikator
Algoritme til billedmatchning I/R Grundlæggende, Avanceret Grundlæggende Hvilken billedalgoritme skal bruges, når du søger efter billede

Bemærk

Variabler produceret

Argument Type Beskrivelse
LocationOfTextFoundX Numerisk værdi X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne
LocationOfTextFoundY Numerisk værdi X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne

Undtagelser

Undtagelse Beskrivelse
Kan ikke kontrollere, om der findes tekst i ikke-interaktiv tilstand Angiver, at det ikke er muligt at kontrollere teksten på skærmen i ikke-interaktiv tilstand
ugyldige underområdekoordinater Angiver, at de angivne koordinater for underområde er ugyldige
Kunne ikke analysere tekst med OCR Angiver, at der opstod en fejl under forsøg på at analysere tekst ved hjælp af OCR
Kunne ikke oprette OCR-programmet Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet
Mappe med datasti findes ikke Angiver, at den mappe, der er angivet for sproget, ikke findes
Den valgte Windows sprogpakke er ikke installeret på computeren Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren
OCR-program er ikke aktivt Angiver, at OCR-programmet ikke er aktivt

Vent på tekst på skærmen (OCR)

Vent, indtil en bestemt tekst vises på/fjernes på skærmen, i vinduet i forgrunden eller i forhold til et billede på skærmen eller i vinduet i forgrunden med OCR.

Inputparametre

Argument Valgfrit Accepterer Standardværdi Beskrivelse
Wait for text to I/R Vis, forsvind Vises Angiver, om der skal ventes på, at teksten vises eller forsvinder
OCR-programtype Nej Windows OCR-program, Tesseract-program, OCR-programvariabel Variabel til OCR-program Den OCR-programtype, der skal bruges. Vælg en forudkonfigureret OCR-programtype, eller konfigurer en ny.
OCR engine variable Nej OCREngineObject Det program, der skal bruges til OCR-handlingen
Tekst, der skal findes Nej Tekstværdi Den tekst, der skal søges efter i den angivne kilde
Is regular expression I/R Boolesk værdi Falsk Angiver, om der skal bruges et regulært udtryk til at søge efter den angivne tekst
Search for text on I/R Hele skærmen, Forgrundsvindue Hele skærmen Angiver, om der skal søges efter den angivne tekst på hele den synlige skærm eller kun i vinduet i forgrunden
Søgetilstand I/R Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede Hele den angivne kilde Angiver, om hele skærmen (eller vinduet) eller et indskrænket underområde skal scannes
Billede(r) Nej Liste over billeder De billeder, der angiver underområdet (i forhold til det øverste venstre hjørne af billedet), der skal scannes for den angivne tekst
X1 Ja Numerisk værdi Start X-koordinaten for underområdet for at scanne den angivne tekst
Tolerance Ja Numerisk værdi 10 Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede
Y1 Ja Numerisk værdi Start Y-koordinaten for underområdet for at scanne den angivne tekst
X1 Ja Numerisk værdi Start X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
X2 Ja Numerisk værdi Slut X-koordinaten for underområdet for at scanne den angivne tekst
Y1 Ja Numerisk værdi Start Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2 Ja Numerisk værdi Slut Y-koordinaten for underområdet for at scanne den angivne tekst
X2 Ja Numerisk værdi Slut X-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Y2 Ja Numerisk værdi Slut Y-koordinaten for underområdet i forhold til det specifikke billede, der skal scannes for den angivne tekst
Windows OCR sprog I/R Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk Engelsk Sproget i den tekst, som Windows OCR-programmet registrerer
Brug et andet sprog I/R Boolesk værdi Falsk Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog'
Tesseract-sprog I/R Engelsk, tysk, spansk, fransk, italiensk Engelsk Sproget i billedteksten, som Tesseract-programmet registrerer
Forkortelse for sprog Nej Tekstværdi Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng'
Sprogdatasti Nej Tekstværdi Stien til den mappe, der indeholder data for det angivne Tesseract-sprog
Billedets breddemultiplikator Nej Numerisk værdi 1 Billedets breddemultiplikator
Billedets højdemultiplikator Nej Numerisk værdi 1 Billedets højdemultiplikator
Algoritme til billedmatchning I/R Grundlæggende, Avanceret Grundlæggende Hvilken billedalgoritme skal bruges, når du søger efter billede
Mislykkes med fejl ved timeout I/R Boolesk værdi Falsk Angiv, om handlingen skal vente uendeligt eller skal mislykkes efter en angivet tidsperiode

Bemærk

Variabler produceret

Argument Type Beskrivelse
LocationOfTextFoundX Numerisk værdi X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne
LocationOfTextFoundY Numerisk værdi X-koordinaten for det punkt, hvor teksten vises på skærmen. Hvis søgningen udføres i forgrundsvinduet, er den returnerede koordinat relativ i forhold til vinduets øverste venstre hjørne

Undtagelser

Undtagelse Beskrivelse
Kan ikke kontrollere, om der findes tekst i ikke-interaktiv tilstand Angiver, at det ikke er muligt at kontrollere teksten på skærmen i ikke-interaktiv tilstand
ugyldige underområdekoordinater Angiver, at de angivne koordinater for underområde er ugyldige
Kunne ikke analysere tekst med OCR Angiver, at der opstod en fejl under forsøg på at analysere tekst ved hjælp af OCR
Kunne ikke oprette OCR-programmet Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet
Mappe med datasti findes ikke Angiver, at den mappe, der er angivet for sproget, ikke findes
Den valgte Windows sprogpakke er ikke installeret på computeren Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren
OCR-program er ikke aktivt Angiver, at OCR-programmet ikke er aktivt
Timeout-fejl Angiver, at handlingen mislykkedes efter en angivet tidsperiode

Udtræk tekst med OCR

Udtræk tekst fra en given kilde ved hjælp af det angivne OCR-program.

Inputparametre

Argument Valgfrit Accepterer Standardværdi Beskrivelse
OCR-program Nej Windows OCR-program, Tesseract-program, OCR-programvariabel Variabel til OCR-program Den OCR-programtype, der skal bruges. Vælg et forudkonfigureret OCR-program, eller konfigurer et nyt
Variabel til OCR-program Nej OCREngineObject Det program, der skal bruges til OCR-handlingen
OCR source I/R Skærm, Forgrundsvindue, Billede på disken Skærm Kilden til det billede, der skal udføres OCR-handling på
Billedfilsti Nej Filer Stien til det billede, der skal udføres OCR-handling på
Søgetilstand I/R Hele den angivne kilde, Kun specifik underregion, Underregion i forhold til billede Hele den angivne kilde Den valgte tilstand for OCR-handlingen
Billede Nej Liste over billeder Det billede, der skal bruges til at indskrænke scanningen til et underområde i forhold til det angivne billede
Tolerance Ja Numerisk værdi 10 Angiver, hvor meget billedet kan adskille sig fra det oprindeligt valgte billede
X1 Ja Numerisk værdi Start X-koordinaten for underområdet for at indsnævre scanningen
X2 Ja Numerisk værdi Slut X-koordinaten for underområdet for at indsnævre scanningen
Y1 Ja Numerisk værdi Start Y-koordinaten for underområdet for at indsnævre scanningen
Y2 Ja Numerisk værdi Slut Y-koordinaten for underområdet for at indsnævre scanningen
Windows OCR sprog I/R Kinesisk (forenklet), kinesisk (traditionelt), tjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, tysk, græsk, italiensk, japansk, ungarsk, koreansk, norsk, polsk, portugisisk, rumænsk, russisk, serbisk (kyrillisk), serbisk (latinsk), slovakisk, spansk, svensk, tyrkisk Engelsk Sproget i den tekst, som Windows OCR-programmet registrerer
Brug et andet sprog I/R Boolesk værdi Falsk Angiver, om der skal bruges et sprog, der ikke er angivet i feltet 'Tesseract-sprog'
Tesseract-sprog I/R Engelsk, tysk, spansk, fransk, italiensk Engelsk Sproget i billedteksten, som Tesseract-programmet registrerer
Forkortelse for sprog Nej Tekstværdi Tesseract-forkortelsen for sproget, du skal bruge. Hvis dataene f.eks. er 'eng.traineddata', skal du angive dette parameter til 'eng'
Sprogdatasti Nej Tekstværdi Stien til den mappe, der indeholder data for det angivne Tesseract-sprog
Billedets breddemultiplikator Nej Numerisk værdi 1 Billedets breddemultiplikator
Billedets højdemultiplikator Nej Numerisk værdi 1 Billedets højdemultiplikator
Vent på, at billedet vises I/R Boolesk værdi Sand Angiver, om der skal ventes på, at billedet vises på skærmen eller i vinduet i forgrunden
Timeout Nej Numerisk værdi 5 Angiver den tid, der skal ventes på, at handlingen fuldføres, før handlingen mislykkes
Algoritme til billedmatchning I/R Grundlæggende, Avanceret Grundlæggende Hvilken billedalgoritme skal bruges, når du søger efter billede

Bemærk

Indstillingen Variabel til OCR-program er planlagt til udfasning.

Variabler produceret

Argument Type Beskrivelse
OcrText Tekstværdi Resultatet efter udtræk af tekst

Undtagelser

Undtagelse Beskrivelse
Kunne ikke udtrække tekst med OCR Angiver, at der opstod en fejl under forsøg på at udtrække tekst med OCR fra den angivne kilde
Billedfil blev ikke fundet Angiver, at filen ikke findes på den angivne sti
Landmærkebilledet blev ikke fundet Angiver, at landmærkebilledet ikke findes
Kan ikke hente tekst fra skærmen i ikke-interaktiv tilstand Angiver, at det ikke er muligt at hente tekst fra skærmen i ikke-interaktiv tilstand
Kunne ikke oprette OCR-programmet Angiver, at der opstod en fejl under forsøg på at oprette OCR-programmet
Mappe med datasti findes ikke Angiver, at den mappe, der er angivet for sproget, ikke findes
Den valgte Windows sprogpakke er ikke installeret på computeren Angiver, at den valgte Windows sprogpakke ikke er installeret på computeren
OCR-program er ikke aktivt Angiver, at OCR-programmet ikke er aktivt