OCR-handlinger
Power Automate gjør det mulig for brukere å lese, trekke ut og behandle data i filer ved hjelp av optisk tegngjenkjenning (OCR).
Hvis du vil opprette en OCR-motor og trekke ut tekst fra bilder og dokumenter, bruker du handlingen Trekk ut tekst med OCR. Eksemplet nedenfor trekker ut tekst fra hele det angitte bildet.
Alle OCR-handlinger kan opprette en ny OCR-motorvariabel eller bruke en eksisterende. Du kan bruke eksisternede OCR-motorvariabler i alle handlinger som tilbyr OCR-funksjoner.
Power Automate støtter Windows OCR- og Tesseract-motorene. Hvis du vil konfigurere den valgte OCR-motoren, navigerer du til OCR-motorinnstillingene for den aktuelle handlingen. De tilgjengelige alternativene omfatter språket og multiplikatorer for bildebredde og -høyde.
Merk
- Alle tilgjengelige OCR-motorer er forhåndsinstallert i Power Automate og fungerer lokalt uten å koble til skyen. Det kan imidlertid hende du må laste ned språkpakker eller datafiler for å pakke ut tekster på bestemte språk.
- Bildemultiplikatorer øker bildestørrelsen for å gjøre søk og utpakking av tekst mer effektivt. Angivelse av verdier som er større enn tre, kan føre til feil resultater.
Bruk Windows OCR-motoren
Standard OCR-motor i Power Automate er Windows OCR-motoren. Hvis du vil trekke ut tekster med Windows OCR-motoren, må du installere språkpakken for språket du vil trekke ut.
Hvis den riktige språkpakken ikke er installert, utløser Power Automate en feil der du blir bedt om å installere den. Du finner mer informasjon om nedlasting og installasjon av språkpakker ved å gå til Språkpakker for Windows.
Etter at du har installert riktig språkpakke, utvider du OCR-motorinnstillingene for OCR-handlingen og velger ønsket språk. Windows OCR-motoren støtter 25 språk, inkludert kinesisk (forenklet og tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk og latin), slovensk, spansk, svensk og tyrkisk.
Bruk Tesseract OCR-motoren
Merk
For å kunne bruke Tesseract OCR-motoren må du kontrollere at hovedprosessoren i maskinen støtter instruksjonssettet AVX2.
Bortsett fra Windows OCR-motoren støtter Power Automate Tesseract-motoren. Denne motoren kan trekke ut tekst på fem språk uten videre konfigurasjon: engelsk, tysk, spansk, fransk og italiensk.
Hvis du vil trekke ut tekst på et annet språk enn den nevnte listen, aktiverer du alternativet Bruk andre språk i OCR-motorinnstillingene for OCR-handlingen. Når dette alternativet er aktivert, viser handlingen to parametere til: språkforkortelse og språkdatabaner.
Feltet Språkforkortelse angir for motoren hvilket språk det skal søkes etter under OCR. Feltet Bane til språkdata inneholder språkdatafilene (.traineddata) som brukes til å lære opp OCR-motoren. Du finner språkdatafilene for alle tilgjengelige språk i dette GitHub-lageret.
Du kan også bruke Tesseract-motoren til å trekke ut tekst fra flerspråklige dokumenter. Du finner mer informasjon om uttrekking av tekst fra flerspråklige dokumenter ved å gå til Utfør OCR på flerspråklige dokumenter.
Hvis tekst på skjermen (OCR)
Markerer begynnelsen på en betinget blokk med handlinger, avhengig av om en gitt tekst vises på skjermen eller ikke, ved hjelp av OCR.
Inndataparametere
Argument | Valgfritt | Godtar | Standardverdi | Bekrivelse |
---|---|---|---|---|
If text | Ikke tilgjengelig | Finnes, Finnes ikke | Finnes | Angir om det skal kontrolleres om teksten finnes eller ikke, på den angitte kilden som skal analyseres |
OCR-motortype | Nei | Windows OCR-motor, Tesseract-motor, OCR-motorvariabel | OCR-motorvariabel | OCR-motortypen som skal brukes. Velg en forhåndskonfigurert OCR-motor, eller konfigurer en ny. |
OCR engine variable | Nei | OCREngineObject | Motoren som skal brukes til OCR-operasjonen | |
Text to find | Nei | Tekstverdi | Teksten det skal søkes etter i den angitte kilden | |
Is regular expression | Ikke tilgjengelig | Boolsk verdi | Usann | Angir om et regulært uttrykk skal brukes til å finne den angitte teksten |
Search for text on | Ikke tilgjengelig | Hele skjermen, Forgrunnsvindu | Hele skjermen | Angir om det skal søkes etter den angitte teksten på hele den synlige skjermen eller bare i forgrunnsvinduet |
Search mode | Ikke tilgjengelig | Hele den angitte kilden, Bare bestemt delområde, Delområde i forhold til bilde | Hele den angitte kilden | Angir om hele skjermen (eller vinduet) eller et begrenset delområde av den skal skannes |
Image(s) | Nei | Liste over bilder | Bildene som angir delområdet (i forhold til øvre venstre hjørne av bildet) der det skal søkes etter den angitte teksten | |
X1 | Ja | Numerisk verdi | X-startkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
Tolerance | Ja | Numerisk verdi | 10 | Angir hvor mye bildene som det søkes etter, kan avvike fra det opprinnelig valgte bildet |
Y1 | Ja | Numerisk verdi | Y-startkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
X1 | Ja | Numerisk verdi | X-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
X2 | Ja | Numerisk verdi | X-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
Y1 | Ja | Numerisk verdi | Y-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
Y2 | Ja | Numerisk verdi | Y-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
X2 | Ja | Numerisk verdi | X-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
Y2 | Ja | Numerisk verdi | Y-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
Windows OCR-språk | Ikke tilgjengelig | Kinesisk (forenklet), kinesisk (tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk), serbisk (latin), slovensk, spansk, svensk, tyrkisk | Engelsk | Språket til teksten som Windows OCR-motoren registrerer |
Bruk annet språk | Ikke tilgjengelig | Boolsk verdi | Usann | Angir om det skal brukes et språk som ikke er i feltet Tesseract-språk |
Tesseract-språk | Ikke tilgjengelig | Engelsk, tysk, spansk, fransk, italiensk | Engelsk | Språket til bildeteksten som Tesseract-motoren registrerer |
Språkforkortelse | Nei | Tekstverdi | Tesseract-forkortelsen for språket som skal brukes. Hvis dataene for eksempel er "eng.traineddata", angir du denne parameteren til "eng" | |
Bane til språkdata | Nei | Tekstverdi | Banen til mappen som inneholder språkdataene for Tesseract | |
Breddemultiplikator for bilde | Nei | Numerisk verdi | 1 | Breddemultiplikatoren for bildet |
Høydemultiplikator for bilde | Nei | Numerisk verdi | 1 | Høydemultiplikatoren for bildet |
Algoritme for bildesamsvar | Ikke tilgjengelig | Standard, avansert | Standard | Hvilken bildealgoritme som skal brukes ved søk etter bilder |
Merk
- Power Automate bruker .NET som motor for regulære uttrykk. Du finner mer informasjon om regulære uttrykk ved å gå til Språk for regulære uttrykk – hurtigreferanse.
- Alternativet OCR-motorvariabel er planlagt for avskriving.
Variabler produsert
Argument | Type | Bekrivelse |
---|---|---|
LocationOfTextFoundX | Numerisk verdi | X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet |
LocationOfTextFoundY | Numerisk verdi | X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet |
Unntak
Unntak | Bekrivelse |
---|---|
Kan ikke kontrollere om tekst finnes, i ikke-interaktiv modus | Angir at det ikke går an å se etter teksten på skjermen i ikke-interaktiv modus |
Ugyldige koordinater for delområde | Angir at de angitte koordinatene for delområdet er ugyldige |
Kan ikke analysere tekst med OCR | Angir at det oppstod en feil under forsøk på å analysere tekst med OCR |
Kan ikke opprette OCR-motoren | Angir at det oppstod en feil under forsøk på å opprette OCR-motoren |
Banen til datamappen finnes ikke | Angir at mappen som er angitt for språkdataene, ikke finnes |
Den valgte Windows-språkpakken er ikke installert på maskinen | Angir at den valgte Windows-språkpakken ikke er installert på maskinen |
OCR-motor ikke aktiv | Angir at OCR-motoren ikke er aktiv |
Vent til tekst på skjermen (OCR)
Vent til en bestemt tekst vises på / forsvinner fra skjermen eller forgrunnsvinduet eller i forhold til et bilde på skjermen eller i forgrunnsvinduet ved hjelp av OCR.
Inndataparametere
Argument | Valgfritt | Godtar | Standardverdi | Bekrivelse |
---|---|---|---|---|
Wait for text to | Ikke tilgjengelig | Vises, Forsvinner | Vises | Angir om systemet skal vente til teksten vises eller forsvinner |
OCR-motortype | Nei | Windows OCR-motor, Tesseract-motor, OCR-motorvariabel | OCR-motorvariabel | OCR-motortypen som skal brukes. Velg en forhåndskonfigurert OCR-motor, eller konfigurer en ny. |
OCR engine variable | Nei | OCREngineObject | Motoren som skal brukes til OCR-operasjonen | |
Text to find | Nei | Tekstverdi | Teksten det skal søkes etter i den angitte kilden | |
Is regular expression | Ikke tilgjengelig | Boolsk verdi | Usann | Angir om et regulært uttrykk skal brukes til å finne den angitte teksten |
Search for text on | Ikke tilgjengelig | Hele skjermen, Forgrunnsvindu | Hele skjermen | Angir om det skal søkes etter den angitte teksten på hele den synlige skjermen eller bare i forgrunnsvinduet |
Search mode | Ikke tilgjengelig | Hele den angitte kilden, Bare bestemt delområde, Delområde i forhold til bilde | Hele den angitte kilden | Angir om hele skjermen (eller vinduet) eller et begrenset delområde av den skal skannes |
Image(s) | Nei | Liste over bilder | Bildene som angir delområdet (i forhold til øvre venstre hjørne av bildet) der det skal søkes etter den angitte teksten | |
X1 | Ja | Numerisk verdi | X-startkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
Tolerance | Ja | Numerisk verdi | 10 | Angir hvor mye bildene som det søkes etter, kan avvike fra det opprinnelig valgte bildet |
Y1 | Ja | Numerisk verdi | Y-startkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
X1 | Ja | Numerisk verdi | X-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
X2 | Ja | Numerisk verdi | X-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
Y1 | Ja | Numerisk verdi | Y-startkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
Y2 | Ja | Numerisk verdi | Y-sluttkoordinaten til delområdet der det skal søkes etter den angitte teksten | |
X2 | Ja | Numerisk verdi | X-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
Y2 | Ja | Numerisk verdi | Y-sluttkoordinaten for delområdet i forhold til det angitte bildet der det skal søkes etter den angitte teksten | |
Windows OCR-språk | Ikke tilgjengelig | Kinesisk (forenklet), kinesisk (tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk), serbisk (latin), slovensk, spansk, svensk, tyrkisk | Engelsk | Språket til teksten som Windows OCR-motoren registrerer |
Bruk annet språk | Ikke tilgjengelig | Boolsk verdi | Usann | Angir om det skal brukes et språk som ikke er i feltet Tesseract-språk |
Tesseract-språk | Ikke tilgjengelig | Engelsk, tysk, spansk, fransk, italiensk | Engelsk | Språket til bildeteksten som Tesseract-motoren registrerer |
Språkforkortelse | Nei | Tekstverdi | Tesseract-forkortelsen for språket som skal brukes. Hvis dataene for eksempel er "eng.traineddata", angir du denne parameteren til "eng" | |
Bane til språkdata | Nei | Tekstverdi | Banen til mappen som inneholder språkdataene for Tesseract | |
Breddemultiplikator for bilde | Nei | Numerisk verdi | 1 | Breddemultiplikatoren for bildet |
Høydemultiplikator for bilde | Nei | Numerisk verdi | 1 | Høydemultiplikatoren for bildet |
Algoritme for bildesamsvar | Ikke tilgjengelig | Standard, avansert | Standard | Hvilken bildealgoritme som skal brukes ved søk etter bilder |
Mislyktes med tidsavbruddsfeil | Ikke tilgjengelig | Boolsk verdi | Usann | Angi om du vil at handlingen skal vente i ubestemt tid eller mislykkes etter en angitt tidsperiode |
Merk
- Power Automate bruker .NET som motor for regulære uttrykk. Du finner mer informasjon om regulære uttrykk ved å gå til Språk for regulære uttrykk – hurtigreferanse.
- Alternativet OCR-motorvariabel er planlagt for avskriving.
Variabler produsert
Argument | Type | Bekrivelse |
---|---|---|
LocationOfTextFoundX | Numerisk verdi | X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet |
LocationOfTextFoundY | Numerisk verdi | X-koordinaten for punktet der teksten vises på skjermen. Hvis søket utføres i forgrunnsvinduet, er koordinaten som returneres, i forhold til øverste venstre hjørne av vinduet |
Unntak
Unntak | Bekrivelse |
---|---|
Kan ikke kontrollere om tekst finnes, i ikke-interaktiv modus | Angir at det ikke går an å se etter teksten på skjermen i ikke-interaktiv modus |
Ugyldige koordinater for delområde | Angir at de angitte koordinatene for delområdet er ugyldige |
Kan ikke analysere tekst med OCR | Angir at det oppstod en feil under forsøk på å analysere tekst med OCR |
Kan ikke opprette OCR-motoren | Angir at det oppstod en feil under forsøk på å opprette OCR-motoren |
Banen til datamappen finnes ikke | Angir at mappen som er angitt for språkdataene, ikke finnes |
Den valgte Windows-språkpakken er ikke installert på maskinen | Angir at den valgte Windows-språkpakken ikke er installert på maskinen |
OCR-motor ikke aktiv | Angir at OCR-motoren ikke er aktiv |
Tidsavbruddsfeil | Angir at handlingen mislyktes etter en angitt tidsperiode |
Trekk ut tekst med OCR
Trekk ut tekst fra en gitt kilde med den angitte OCR-motoren.
Inndataparametere
Argument | Valgfritt | Godtar | Standardverdi | Bekrivelse |
---|---|---|---|---|
OCR-motor | Nei | Windows OCR-motor, Tesseract-motor, OCR-motorvariabel | OCR-motorvariabel | OCR-motortypen som skal brukes. Velg en forhåndskonfigurert OCR-motor, eller konfigurer en ny |
OCR-motorvariabel | Nei | OCREngineObject | Motoren som skal brukes til OCR-operasjonen | |
OCR source | Ikke tilgjengelig | Skjerm, Forgrunnsvindu, Bilde på disk | Skjerm | Kilden til bildet som OCR-operasjonen skal utføres på |
Image file path | Nei | Fil | Banen til bildet som OCR-operasjonen skal utføres på | |
Search mode | Ikke tilgjengelig | Hele den angitte kilden, Bare bestemt delområde, Delområde i forhold til bilde | Hele den angitte kilden | Den valgte modusen for OCR-operasjonen |
Bilde | Nei | Liste over bilder | Bildet som skal brukes til å begrense skanningen til et delområde i forhold til det angitte bildet | |
Tolerance | Ja | Numerisk verdi | 10 | Angir hvor mye bildet kan avvike fra det opprinnelig valgte bildet |
X1 | Ja | Numerisk verdi | X-startkoordinaten for delområdet for å begrense skanningen | |
X2 | Ja | Numerisk verdi | X-sluttkoordinaten for delområdet for å begrense skanningen | |
Y1 | Ja | Numerisk verdi | Y-startkoordinaten for delområdet for å begrense skanningen | |
Y2 | Ja | Numerisk verdi | Y-sluttkoordinaten for delområdet for å begrense skanningen | |
Windows OCR-språk | Ikke tilgjengelig | Kinesisk (forenklet), kinesisk (tradisjonell), tsjekkisk, dansk, nederlandsk, engelsk, finsk, fransk, gresk, gresk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russer, russisk, serbisk (kyrillisk), serbisk (latin), slovensk, spansk, svensk, tyrkisk | Engelsk | Språket til teksten som Windows OCR-motoren registrerer |
Bruk annet språk | Ikke tilgjengelig | Boolsk verdi | Usann | Angir om det skal brukes et språk som ikke er i feltet Tesseract-språk |
Tesseract-språk | Ikke tilgjengelig | Engelsk, tysk, spansk, fransk, italiensk | Engelsk | Språket til bildeteksten som Tesseract-motoren registrerer |
Språkforkortelse | Nei | Tekstverdi | Tesseract-forkortelsen for språket som skal brukes. Hvis dataene for eksempel er "eng.traineddata", angir du denne parameteren til "eng" | |
Bane til språkdata | Nei | Tekstverdi | Banen til mappen som inneholder språkdataene for Tesseract | |
Breddemultiplikator for bilde | Nei | Numerisk verdi | 1 | Breddemultiplikatoren for bildet |
Høydemultiplikator for bilde | Nei | Numerisk verdi | 1 | Høydemultiplikatoren for bildet |
Vent til bildet vises | Ikke tilgjengelig | Boolsk verdi | Sann | Angir om det skal ventes på at bildet vises på skjermen eller i forgrunnsvinduet |
Tidsavbrudd | Nei | Numerisk verdi | Fem | Angir hvor lenge systemet skal vente på at operasjonen fullføres, før handlingen mislykkes |
Algoritme for bildesamsvar | Ikke tilgjengelig | Standard, avansert | Standard | Hvilken bildealgoritme som skal brukes ved søk etter bilder |
Merk
Alternativet OCR-motorvariabel er planlagt for avskriving.
Variabler produsert
Argument | Type | Bekrivelse |
---|---|---|
OcrText | Tekstverdi | Resultatet etter uttrekkingen av teksten |
Unntak
Unntak | Beskrivelse |
---|---|
Kan ikke trekke ut tekst med OCR | Angir at det oppstod en feil under forsøk på å trekke ut tekst med OCR fra den angitte kilden |
Finner ikke bildefilen | Angir at filen ikke finnes i den gitte banen |
Finner ikke landemerkebilde | Angir at landemerkebildet ikke finnes |
Kan ikke hente tekst fra skjermen i ikke-interaktiv modus | Angir at det ikke går an å hente tekst fra skjermen i ikke-interaktiv modus |
Kan ikke opprette OCR-motoren | Angir at det oppstod en feil under forsøk på å opprette OCR-motoren |
Banen til datamappen finnes ikke | Angir at mappen som er angitt for språkdataene, ikke finnes |
Den valgte Windows-språkpakken er ikke installert på maskinen | Angir at den valgte Windows-språkpakken ikke er installert på maskinen |
OCR-motor ikke aktiv | Angir at OCR-motoren ikke er aktiv |