Del via


OCR-handlinger

Power Automate gjør det mulig for brukere å lese, trekke ut og behandle data i filer ved hjelp av optisk tegngjenkjenning (OCR).

Hvis du vil opprette en OCR-motor og trekke ut tekst fra bilder og dokumenter, bruker du handlingen Trekk ut tekst med OCR. Eksemplet nedenfor trekker ut tekst fra hele det angitte bildet.

Skjermbilde av handlingen Trekk ut tekst med OCR.

Alle OCR-handlinger kan opprette en ny OCR-motorvariabel eller bruke en eksisterende. Du kan bruke eksisternede OCR-motorvariabler i alle handlinger som tilbyr OCR-funksjoner.

Power Automate støtter Windows OCR- og Tesseract-motorene. Hvis du vil konfigurere den valgte OCR-motoren, navigerer du til OCR-motorinnstillingene for den aktuelle handlingen. De tilgjengelige alternativene omfatter språket og multiplikatorer for bildebredde og -høyde.

Merk

  • Alle tilgjengelige OCR-motorer er forhåndsinstallert i Power Automate og fungerer lokalt uten å koble til skyen. Det kan imidlertid hende du må laste ned språkpakker eller datafiler for å pakke ut tekster på bestemte språk.
  • Bildemultiplikatorer øker bildestørrelsen for å gjøre søk og utpakking av tekst mer effektivt. Angivelse av verdier som er større enn tre, kan føre til feil resultater.

Bruk Windows OCR-motoren

Standard OCR-motor i Power Automate er Windows OCR-motoren. Hvis du vil trekke ut tekster med Windows OCR-motoren, må du installere språkpakken for språket du vil trekke ut.

Hvis den riktige språkpakken ikke er installert, utløser Power Automate en feil der du blir bedt om å installere den. Du finner mer informasjon om nedlasting og installasjon av språkpakker ved å gå til Språkpakker for Windows.

Etter at du har installert riktig språkpakke, utvider du OCR-motorinnstillingene for OCR-handlingen og velger ønsket språk. Windows OCR-motoren støtter 25 språk, inkludert kinesisk (forenklet og tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk og latin), slovensk, spansk, svensk og tyrkisk.

Bruk Tesseract OCR-motoren

Merk

For å kunne bruke Tesseract OCR-motoren må du kontrollere at hovedprosessoren i maskinen støtter instruksjonssettet AVX2.

Bortsett fra Windows OCR-motoren støtter Power Automate Tesseract-motoren. Denne motoren kan trekke ut tekst på fem språk uten videre konfigurasjon: engelsk, tysk, spansk, fransk og italiensk.

Hvis du vil trekke ut tekst på et annet språk enn den nevnte listen, aktiverer du alternativet Bruk andre språk i OCR-motorinnstillingene for OCR-handlingen. Når dette alternativet er aktivert, viser handlingen to parametere til: språkforkortelse og språkdatabaner.

Feltet Språkforkortelse angir for motoren hvilket språk det skal søkes etter under OCR. Feltet Bane til språkdata inneholder språkdatafilene (.traineddata) som brukes til å lære opp OCR-motoren. Du finner språkdatafilene for alle tilgjengelige språk i dette GitHub-lageret.

Du kan også bruke Tesseract-motoren til å trekke ut tekst fra flerspråklige dokumenter. Du finner mer informasjon om uttrekking av tekst fra flerspråklige dokumenter ved å gå til Utfør OCR på flerspråklige dokumenter.

Hvis tekst på skjermen (OCR)

Markerer begynnelsen på en betinget blokk med handlinger, avhengig av om en gitt tekst vises på skjermen eller ikke, ved hjelp av OCR.

Inndataparametere

Argument Valgfritt Godtar Standardverdi Bekrivelse
If text Ikke tilgjengelig Finnes, Finnes ikke Finnes Angir om det skal kontrolleres om teksten finnes eller ikke, på den angitte kilden som skal analyseres
OCR-motortype Nei Windows OCR-motor, Tesseract-motor, OCR-motorvariabel OCR-motorvariabel OCR-motortypen som skal brukes. Velg en forhåndskonfigurert OCR-motor, eller konfigurer en ny.
OCR engine variable Nei OCREngineObject Motoren som skal brukes til OCR-operasjonen
Text to find Nei Tekstverdi Teksten det skal søkes etter i den angitte kilden
Is regular expression Ikke tilgjengelig Boolsk verdi Usann Angir om et regulært uttrykk skal brukes til å finne den angitte teksten
Search for text on Ikke tilgjengelig Hele skjermen, Forgrunnsvindu Hele skjermen Angir om det skal søkes etter den angitte teksten på hele den synlige skjermen eller bare i forgrunnsvinduet
Search mode Ikke tilgjengelig Hele den angitte kilden, Bare bestemt delområde, Delområde i forhold til bilde Hele den angitte kilden Angir om hele skjermen (eller vinduet) eller et begrenset delområde av den skal skannes
Image(s) Nei Liste over bilder Bildene som angir delområdet (i forhold til øvre venstre hjørne av bildet) der det skal søkes etter den angitte teksten
X1 Ja Numerisk verdi X-startkoordinaten til delområdet der det skal søkes etter den angitte teksten
Tolerance Ja Numerisk verdi 10 Angir hvor mye bildene som det søkes etter, kan avvike fra det opprinnelig valgte bildet
Y1 Ja Numerisk verdi Y-startkoordinaten til delområdet der det skal søkes etter den angitte teksten
X1 Ja Numerisk verdi X-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
X2 Ja Numerisk verdi X-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten
Y1 Ja Numerisk verdi Y-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
Y2 Ja Numerisk verdi Y-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten
X2 Ja Numerisk verdi X-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
Y2 Ja Numerisk verdi Y-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
Windows OCR-språk Ikke tilgjengelig Kinesisk (forenklet), kinesisk (tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk), serbisk (latin), slovensk, spansk, svensk, tyrkisk Engelsk Språket til teksten som Windows OCR-motoren registrerer
Bruk annet språk Ikke tilgjengelig Boolsk verdi Usann Angir om det skal brukes et språk som ikke er i feltet Tesseract-språk
Tesseract-språk Ikke tilgjengelig Engelsk, tysk, spansk, fransk, italiensk Engelsk Språket til bildeteksten som Tesseract-motoren registrerer
Språkforkortelse Nei Tekstverdi Tesseract-forkortelsen for språket som skal brukes. Hvis dataene for eksempel er "eng.traineddata", angir du denne parameteren til "eng"
Bane til språkdata Nei Tekstverdi Banen til mappen som inneholder språkdataene for Tesseract
Breddemultiplikator for bilde Nei Numerisk verdi 1 Breddemultiplikatoren for bildet
Høydemultiplikator for bilde Nei Numerisk verdi 1 Høydemultiplikatoren for bildet
Algoritme for bildesamsvar Ikke tilgjengelig Standard, avansert Standard Hvilken bildealgoritme som skal brukes ved søk etter bilder

Merk

Variabler produsert

Argument Type Bekrivelse
LocationOfTextFoundX Numerisk verdi X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet
LocationOfTextFoundY Numerisk verdi X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet

Unntak

Unntak Bekrivelse
Kan ikke kontrollere om tekst finnes, i ikke-interaktiv modus Angir at det ikke går an å se etter teksten på skjermen i ikke-interaktiv modus
Ugyldige koordinater for delområde Angir at de angitte koordinatene for delområdet er ugyldige
Kan ikke analysere tekst med OCR Angir at det oppstod en feil under forsøk på å analysere tekst med OCR
Kan ikke opprette OCR-motoren Angir at det oppstod en feil under forsøk på å opprette OCR-motoren
Banen til datamappen finnes ikke Angir at mappen som er angitt for språkdataene, ikke finnes
Den valgte Windows-språkpakken er ikke installert på maskinen Angir at den valgte Windows-språkpakken ikke er installert på maskinen
OCR-motor ikke aktiv Angir at OCR-motoren ikke er aktiv

Vent til tekst på skjermen (OCR)

Vent til en bestemt tekst vises på / forsvinner fra skjermen eller forgrunnsvinduet eller i forhold til et bilde på skjermen eller i forgrunnsvinduet ved hjelp av OCR.

Inndataparametere

Argument Valgfritt Godtar Standardverdi Bekrivelse
Wait for text to Ikke tilgjengelig Vises, Forsvinner Vises Angir om systemet skal vente til teksten vises eller forsvinner
OCR-motortype Nei Windows OCR-motor, Tesseract-motor, OCR-motorvariabel OCR-motorvariabel OCR-motortypen som skal brukes. Velg en forhåndskonfigurert OCR-motor, eller konfigurer en ny.
OCR engine variable Nei OCREngineObject Motoren som skal brukes til OCR-operasjonen
Text to find Nei Tekstverdi Teksten det skal søkes etter i den angitte kilden
Is regular expression Ikke tilgjengelig Boolsk verdi Usann Angir om et regulært uttrykk skal brukes til å finne den angitte teksten
Search for text on Ikke tilgjengelig Hele skjermen, Forgrunnsvindu Hele skjermen Angir om det skal søkes etter den angitte teksten på hele den synlige skjermen eller bare i forgrunnsvinduet
Search mode Ikke tilgjengelig Hele den angitte kilden, Bare bestemt delområde, Delområde i forhold til bilde Hele den angitte kilden Angir om hele skjermen (eller vinduet) eller et begrenset delområde av den skal skannes
Image(s) Nei Liste over bilder Bildene som angir delområdet (i forhold til øvre venstre hjørne av bildet) der det skal søkes etter den angitte teksten
X1 Ja Numerisk verdi X-startkoordinaten til delområdet der det skal søkes etter den angitte teksten
Tolerance Ja Numerisk verdi 10 Angir hvor mye bildene som det søkes etter, kan avvike fra det opprinnelig valgte bildet
Y1 Ja Numerisk verdi Y-startkoordinaten til delområdet der det skal søkes etter den angitte teksten
X1 Ja Numerisk verdi X-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
X2 Ja Numerisk verdi X-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten
Y1 Ja Numerisk verdi Y-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
Y2 Ja Numerisk verdi Y-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten
X2 Ja Numerisk verdi X-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
Y2 Ja Numerisk verdi Y-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten
Windows OCR-språk Ikke tilgjengelig Kinesisk (forenklet), kinesisk (tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk), serbisk (latin), slovensk, spansk, svensk, tyrkisk Engelsk Språket til teksten som Windows OCR-motoren registrerer
Bruk annet språk Ikke tilgjengelig Boolsk verdi Usann Angir om det skal brukes et språk som ikke er i feltet Tesseract-språk
Tesseract-språk Ikke tilgjengelig Engelsk, tysk, spansk, fransk, italiensk Engelsk Språket til bildeteksten som Tesseract-motoren registrerer
Språkforkortelse Nei Tekstverdi Tesseract-forkortelsen for språket som skal brukes. Hvis dataene for eksempel er "eng.traineddata", angir du denne parameteren til "eng"
Bane til språkdata Nei Tekstverdi Banen til mappen som inneholder språkdataene for Tesseract
Breddemultiplikator for bilde Nei Numerisk verdi 1 Breddemultiplikatoren for bildet
Høydemultiplikator for bilde Nei Numerisk verdi 1 Høydemultiplikatoren for bildet
Algoritme for bildesamsvar Ikke tilgjengelig Standard, avansert Standard Hvilken bildealgoritme som skal brukes ved søk etter bilder
Mislyktes med tidsavbruddsfeil Ikke tilgjengelig Boolsk verdi Usann Angi om du vil at handlingen skal vente i ubestemt tid eller mislykkes etter en angitt tidsperiode

Merk

Variabler produsert

Argument Type Bekrivelse
LocationOfTextFoundX Numerisk verdi X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet
LocationOfTextFoundY Numerisk verdi X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet

Unntak

Unntak Bekrivelse
Kan ikke kontrollere om tekst finnes, i ikke-interaktiv modus Angir at det ikke går an å se etter teksten på skjermen i ikke-interaktiv modus
Ugyldige koordinater for delområde Angir at de angitte koordinatene for delområdet er ugyldige
Kan ikke analysere tekst med OCR Angir at det oppstod en feil under forsøk på å analysere tekst med OCR
Kan ikke opprette OCR-motoren Angir at det oppstod en feil under forsøk på å opprette OCR-motoren
Banen til datamappen finnes ikke Angir at mappen som er angitt for språkdataene, ikke finnes
Den valgte Windows-språkpakken er ikke installert på maskinen Angir at den valgte Windows-språkpakken ikke er installert på maskinen
OCR-motor ikke aktiv Angir at OCR-motoren ikke er aktiv
Tidsavbruddsfeil Angir at handlingen mislyktes etter en angitt tidsperiode

Trekk ut tekst med OCR

Trekk ut tekst fra en gitt kilde med den angitte OCR-motoren.

Inndataparametere

Argument Valgfritt Godtar Standardverdi Bekrivelse
OCR-motor Nei Windows OCR-motor, Tesseract-motor, OCR-motorvariabel OCR-motorvariabel OCR-motortypen som skal brukes. Velg en forhåndskonfigurert OCR-motor, eller konfigurer en ny
OCR-motorvariabel Nei OCREngineObject Motoren som skal brukes til OCR-operasjonen
OCR source Ikke tilgjengelig Skjerm, Forgrunnsvindu, Bilde på disk Skjerm Kilden til bildet som OCR-operasjonen skal utføres på
Image file path Nei Fil Banen til bildet som OCR-operasjonen skal utføres på
Search mode Ikke tilgjengelig Hele den angitte kilden, Bare bestemt delområde, Delområde i forhold til bilde Hele den angitte kilden Den valgte modusen for OCR-operasjonen
Bilde Nei Liste over bilder Bildet som skal brukes til å begrense skanningen til et delområde i forhold til det angitte bildet
Tolerance Ja Numerisk verdi 10 Angir hvor mye bildet kan avvike fra det opprinnelig valgte bildet
X1 Ja Numerisk verdi X-startkoordinaten for delområdet for å begrense skanningen
X2 Ja Numerisk verdi X-sluttkoordinaten for delområdet for å begrense skanningen
Y1 Ja Numerisk verdi Y-startkoordinaten for delområdet for å begrense skanningen
Y2 Ja Numerisk verdi Y-sluttkoordinaten for delområdet for å begrense skanningen
Windows OCR-språk Ikke tilgjengelig Kinesisk (forenklet), kinesisk (tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk), serbisk (latin), slovensk, spansk, svensk, tyrkisk Engelsk Språket til teksten som Windows OCR-motoren registrerer
Bruk annet språk Ikke tilgjengelig Boolsk verdi Usann Angir om det skal brukes et språk som ikke er i feltet Tesseract-språk
Tesseract-språk Ikke tilgjengelig Engelsk, tysk, spansk, fransk, italiensk Engelsk Språket til bildeteksten som Tesseract-motoren registrerer
Språkforkortelse Nei Tekstverdi Tesseract-forkortelsen for språket som skal brukes. Hvis dataene for eksempel er "eng.traineddata", angir du denne parameteren til "eng"
Bane til språkdata Nei Tekstverdi Banen til mappen som inneholder språkdataene for Tesseract
Breddemultiplikator for bilde Nei Numerisk verdi 1 Breddemultiplikatoren for bildet
Høydemultiplikator for bilde Nei Numerisk verdi 1 Høydemultiplikatoren for bildet
Vent til bildet vises Ikke tilgjengelig Boolsk verdi Sann Angir om det skal ventes på at bildet vises på skjermen eller i forgrunnsvinduet
Tidsavbrudd Nei Numerisk verdi Fem Angir hvor lenge systemet skal vente på at operasjonen fullføres, før handlingen mislykkes
Algoritme for bildesamsvar Ikke tilgjengelig Standard, avansert Standard Hvilken bildealgoritme som skal brukes ved søk etter bilder

Merk

Alternativet OCR-motorvariabel er planlagt for avskriving.

Variabler produsert

Argument Type Bekrivelse
OcrText Tekstverdi Resultatet etter uttrekkingen av teksten

Unntak

Unntak Beskrivelse
Kan ikke trekke ut tekst med OCR Angir at det oppstod en feil under forsøk på å trekke ut tekst med OCR fra den angitte kilden
Finner ikke bildefilen Angir at filen ikke finnes i den gitte banen
Finner ikke landemerkebilde Angir at landemerkebildet ikke finnes
Kan ikke hente tekst fra skjermen i ikke-interaktiv modus Angir at det ikke går an å hente tekst fra skjermen i ikke-interaktiv modus
Kan ikke opprette OCR-motoren Angir at det oppstod en feil under forsøk på å opprette OCR-motoren
Banen til datamappen finnes ikke Angir at mappen som er angitt for språkdataene, ikke finnes
Den valgte Windows-språkpakken er ikke installert på maskinen Angir at den valgte Windows-språkpakken ikke er installert på maskinen
OCR-motor ikke aktiv Angir at OCR-motoren ikke er aktiv