OCR-åtgärder
Power Automate gör det möjligt för användare att läsa, extrahera och hantera data i filer genom teckenidentifiering (OCR).
Om du vill skapa en OCR-motor och extrahera text från bilder och dokument använder du åtgärden Extrahera text med OCR. I följande exempel extraheras text från hela den angivna bilden.
Alla OCR-åtgärder kan skapa en ny OCR-motorvariabel eller använda en befintlig. Du kan använda befintliga OCR-motorvariabler i alla åtgärder som erbjuder OCR-funktioner.
Power Automate har stöd för både Windows OCR- och Tesseract-motorn. För att konfigurera den valda OCR-motorn, navigera till OCR-motorinställningar av lämplig åtgärd. De tillgängliga alternativen inkluderar språket och multiplikatorerna för bildens bredd och höjd.
Kommentar
- Alla tillgängliga OCR-motorer är förinstallerade i Power Automate och arbeta lokalt utan att ansluta till molnet. Du kan dock behöva hämta språkpaket eller datafiler för att extrahera text på specifika språk.
- Bildmultiplikatorer ökar storleken på bilden i syfte att göra sökning och textextrahering effektivare. Ange värden som är större än tre kan leda till felaktiga resultat.
Använda Windows OCR-motorn
Standard OCR-motor i Power Automate är Windows OCR-motorn. Om du vill extrahera text med Windows OCR-motorn måste du installera rätt språkpaket för det språk du vill extrahera.
Om rätt språkpaket inte har installerats visas Power Automate ett felmeddelande som uppmanar dig att installera det. Mer information finns om att hämta och installera språkpaket i språkpaket för Windows.
När du har installerat rätt språkpaket utökar du OCR-motorns inställningar för OCR-åtgärden och väljer önskat språk. Windows OCR-motorn stöder 25 språk: kinesiska (förenklad och traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska och latin), slovakiska, spanska, svenska och turkiska.
Använda Tesseract OCR-motorn
Kommentar
För att använda Tesseract OCR-motorn, se till att maskinens CPU stöder AVX2-instruktionsuppsättningen.
Förutom Windows OCR-motorn har Power Automate stöd för Tesseract-motorn. Den här motorn kan extrahera text på fem språk utan ytterligare konfiguration: engelska, tyska, spanska, franska och italienska.
Om du vill extrahera text på ett språk som inte finns i listan aktiverar du alternativet Använd andra språk i OCR-motorns inställningar för OCR-åtgärden. När alternativet har aktiverats visas ytterligare två parametrar för åtgärden: Språkförkortning och Datasökväg för språk.
Fältet Språkförkortning anger för motorn vilket språk som ska sökas under OCR. Fältet Sökväg till språkdata innehåller språkdatafilerna (.traineddata) som används för att utbilda OCR-motorn. Du hittar språkdatafilerna för alla tillgängliga språk i den här GitHub-databasen.
Du kan också använda Tesseract-motorn för att extrahera text från flerspråkiga dokument. Mer information om hur du extraherar text från flerspråkiga dokument finns i Utföra OCR på flerspråkiga dokument.
Om text på skärmen (OCR)
Markerar början på ett villkorsstyrt block med åtgärder beroende på om en given text visas på skärmen eller inte, med OCR.
Indataparametrar
Argument | Valfri | Accepterar | Standardvärde | Beskrivning |
---|---|---|---|---|
If text | Inte tillgängligt | Finns, Finns inte | Finns | Anger om du vill kontrollera om texten finns eller inte på den givna källan att analysera |
OCR engine type | Nej | Windows OCR-motorn, Tesseract-motorn, OCR-motorvariabel | OCR-motorvariabel | Den OCR-motortyp som ska användas. Välj en förkonfigurerad OCR-motor eller konfigurera en ny. |
OCR-motorvariabel | Nej | OCREngineObject | Motorn som ska användas för OCR-åtgärden | |
Text att söka efter | Nej | Textvärde | Textsträngen att söka efter i den angivna källan | |
Is regular expression | Inte tillgängligt | Booleskt värde | Falsk | Anger om ett reguljärt uttryck ska användas för att hitta den angivna texten |
Search for text on | Inte tillgängligt | Helskärm, förgrundsfönster | Hela skärmen | Anger om du vill söka efter den angivna texten på hela den synliga skärmen eller bara i förgrundsfönstret |
Search mode | Inte tillgänglig | Hel av specificerad källa, Endast specifik underregion, Underregion i förhållande till bild | Hela den angivna källan | Anger om hela skärmen (eller fönstret) ska skannas, eller bara en begränsad del |
Bild(er) | Nej | Lista över Bilder | Den bild/de bilder som anger delen (relativ till bildens övre vänstra hörn) som ska skannas för tillhandahållen text | |
X1 | Ja | Numeriskt värde | Den inledande X-koordinaten för underregionen att söka efter den angivna texten | |
Tolerance | Ja | Numeriskt värde | 10 | Anger hur mycket bilden du söker efter kan skilja sig från den ursprungligen valda bilden |
Y1 | Ja | Numeriskt värde | Den inledande Y-koordinaten för underregionen att söka efter den angivna texten | |
X1 | Ja | Numeriskt värde | Den inledande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
X2 | Ja | Numeriskt värde | Den avslutande X-koordinaten för underregionen att söka efter den angivna texten | |
Y1 | Ja | Numeriskt värde | Den inledande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
Y2 | Ja | Numeriskt värde | Den avslutande Y-koordinaten för underregionen att söka efter den angivna texten | |
X2 | Ja | Numeriskt värde | Den avslutande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
Y2 | Ja | Numeriskt värde | Den avslutande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
Windows OCR-språk | Inte tillgänglig | Kinesiska (förenklad), kinesiska (traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska), serbiska (latin), slovakiska, spanska, svenska, turkiska | Engelska | Språket för bildens text som Windows OCR-motorn detekterar |
Använd annat språk | Inte tillgänglig | Booleskt värde | Falsk | Anger om ett språk som inte angetts i fältet Tesseract-språk ska användas |
Tesseract-språk | Inte tillgänglig | Engelska, tyska, spanska, franska, italienska | Engelska | Språket för bildens text som Tesseract-motorn detekterar |
Språkförkortning | Nej | Textvärde | Tesseract-förkortningen för språket som ska användas. Om data till exempel är "eng.traineddata" anger du denna parameter som "eng" | |
Sökväg till språkdata | Nej | Textvärde | Sökvägen till mappen som innehåller den angivna språkets Tesseract-data | |
Bildbreddsmultiplikator | Nej | Numeriskt värde | 1 | Breddmultiplikator för bilden |
Bildhöjdsmultiplikator | Nej | Numeriskt värde | 1 | Höjdmultiplikator för bilden |
Bildmatchningsalgoritm | Inte tillgänglig | Grundläggande, avancerad | Grundläggande | Vilken bildalgoritm som ska användas vid sökning efter bilder |
Kommentar
- Power Automates reguljära uttrycksmotor är .NET. Du hittar mer information gällande standarduttryck i Standard-uttrycksspråk – Snabbreferens.
- Alternativet med variabel för OCR-motor är planerat för avfasning.
Producerade variabler
Argument | Typ | Beskrivning |
---|---|---|
LocationOfTextFoundX | Numeriskt värde | X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn |
LocationOfTextFoundY | Numeriskt värde | X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn |
Undantag
Undantag | Beskrivning |
---|---|
Det går inte att kontrollera om text finns i icke-interaktivt läge | Anger att det inte går att söka efter texten på skärmen i icke-interaktivt läge |
Ogiltiga koordinater för underregion | Anger att de angivna koordinaterna för underregionen är ogiltiga |
Det gick inte att analysera text med OCR | Anger att ett fel inträffade vid försök att analysera texten med OCR |
Det gick inte att skapa OCR-motorn | Anger att ett fel inträffade vid försök att skapa OCR-motorn |
Datasökvägsmappen finns inte | Anger att mappen som har angetts för språkdata inte finns |
Det valda Windows-språkpaketet är inte installerat på datorn | Indikerar att det valda Windows-språkpaketet inte har installerats på datorn |
OCR-motorn är inte aktiv | Anger att OCR-motorn inte är aktiv |
Vänta på text på skärmen (OCR)
Vänta tills en viss text visas på/försvinner från skärmen, i förgrundsfönstret eller i förhållande till en bild på skärmen eller i förgrundsfönstret med OCR.
Indataparametrar
Argument | Valfri | Accepterar | Standardvärde | Beskrivning |
---|---|---|---|---|
Wait for text to | Inte tillgängligt | Visas, Försvinna | Visas | Anger om du ska vänta på att texten ska visas eller försvinna |
OCR engine type | Nej | Windows OCR-motorn, Tesseract-motorn, OCR-motorvariabel | OCR-motorvariabel | Den OCR-motortyp som ska användas. Välj en förkonfigurerad OCR-motor eller konfigurera en ny. |
OCR-motorvariabel | Nej | OCREngineObject | Motorn som ska användas för OCR-åtgärden | |
Text att söka efter | Nej | Textvärde | Textsträngen att söka efter i den angivna källan | |
Is regular expression | Inte tillgängligt | Booleskt värde | Falsk | Anger om ett reguljärt uttryck ska användas för att hitta den angivna texten |
Search for text on | Inte tillgängligt | Helskärm, förgrundsfönster | Hela skärmen | Anger om du vill söka efter den angivna texten på hela den synliga skärmen eller bara i förgrundsfönstret |
Search mode | Inte tillgänglig | Hel av specificerad källa, Endast specifik underregion, Underregion i förhållande till bild | Hela den angivna källan | Anger om hela skärmen (eller fönstret) ska skannas, eller bara en begränsad del |
Bild(er) | Nej | Lista över Bilder | Den bild/de bilder som anger delen (relativ till bildens övre vänstra hörn) som ska skannas för tillhandahållen text | |
X1 | Ja | Numeriskt värde | Den inledande X-koordinaten för underregionen att söka efter den angivna texten | |
Tolerance | Ja | Numeriskt värde | 10 | Anger hur mycket bilden du söker efter kan skilja sig från den ursprungligen valda bilden |
Y1 | Ja | Numeriskt värde | Den inledande Y-koordinaten för underregionen att söka efter den angivna texten | |
X1 | Ja | Numeriskt värde | Den inledande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
X2 | Ja | Numeriskt värde | Den avslutande X-koordinaten för underregionen att söka efter den angivna texten | |
Y1 | Ja | Numeriskt värde | Den inledande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
Y2 | Ja | Numeriskt värde | Den avslutande Y-koordinaten för underregionen att söka efter den angivna texten | |
X2 | Ja | Numeriskt värde | Den avslutande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
Y2 | Ja | Numeriskt värde | Den avslutande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten | |
Windows OCR-språk | Inte tillgänglig | Kinesiska (förenklad), kinesiska (traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska), serbiska (latin), slovakiska, spanska, svenska, turkiska | Engelska | Språket för bildens text som Windows OCR-motorn detekterar |
Använd annat språk | Inte tillgänglig | Booleskt värde | Falsk | Anger om ett språk som inte angetts i fältet Tesseract-språk ska användas |
Tesseract-språk | Inte tillgänglig | Engelska, tyska, spanska, franska, italienska | Engelska | Språket för bildens text som Tesseract-motorn detekterar |
Språkförkortning | Nej | Textvärde | Tesseract-förkortningen för språket som ska användas. Om data till exempel är "eng.traineddata" anger du denna parameter som "eng" | |
Sökväg till språkdata | Nej | Textvärde | Sökvägen till mappen som innehåller den angivna språkets Tesseract-data | |
Bildbreddsmultiplikator | Nej | Numeriskt värde | 1 | Breddmultiplikator för bilden |
Bildhöjdsmultiplikator | Nej | Numeriskt värde | 1 | Höjdmultiplikator för bilden |
Bildmatchningsalgoritm | Inte tillgänglig | Grundläggande, avancerad | Grundläggande | Vilken bildalgoritm som ska användas vid sökning efter bilder |
Misslyckades med tidsgränsfel | Inte tillgänglig | Booleskt värde | Falsk | Ange om du vill att åtgärden ska vänta oändligt eller misslyckas efter en angiven tidsperiod |
Kommentar
- Power Automates reguljära uttrycksmotor är .NET. Du hittar mer information gällande standarduttryck i Standard-uttrycksspråk – Snabbreferens.
- Alternativet med variabel för OCR-motor är planerat för avfasning.
Producerade variabler
Argument | Typ | Beskrivning |
---|---|---|
LocationOfTextFoundX | Numeriskt värde | X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn |
LocationOfTextFoundY | Numeriskt värde | X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn |
Undantag
Undantag | Beskrivning |
---|---|
Det går inte att kontrollera om text finns i icke-interaktivt läge | Anger att det inte går att söka efter texten på skärmen i icke-interaktivt läge |
Ogiltiga koordinater för underregion | Anger att de angivna koordinaterna för underregionen är ogiltiga |
Det gick inte att analysera text med OCR | Anger att ett fel inträffade vid försök att analysera texten med OCR |
Det gick inte att skapa OCR-motorn | Anger att ett fel inträffade vid försök att skapa OCR-motorn |
Datasökvägsmappen finns inte | Anger att mappen som har angetts för språkdata inte finns |
Det valda Windows-språkpaketet är inte installerat på datorn | Indikerar att det valda Windows-språkpaketet inte har installerats på datorn |
OCR-motorn är inte aktiv | Anger att OCR-motorn inte är aktiv |
Tidsgränsfel | Anger att åtgärden misslyckades efter en a inställd tidsperiod |
Extrahera text med OCR
Extrahera text från en given källa med den givna OCR-motorn.
Indataparametrar
Argument | Valfri | Accepterar | Standardvärde | Beskrivning |
---|---|---|---|---|
OCR-motor | Nej | Windows OCR-motorn, Tesseract-motorn, OCR-motorvariabel | OCR-motorvariabel | Den OCR-motortyp som ska användas. Välj en förkonfigurerad OCR-motor eller konfigurera en ny |
OCR-motorvariabel | Nej | OCREngineObject | Motorn som ska användas för OCR-åtgärden | |
OCR source | Inte tillgängligt | Skärm, Förgrundsfönster, Bild på disk | Skärm | Källan för bilden för att utföra OCR-åtgärden på |
Image file path | Nej | Arkiv | Sökvägen till bilden för att utföra OCR-åtgärden på | |
Search mode | Inte tillgängligt | Hel av specificerad källa, Endast specifik underregion, Underregion i förhållande till bild | Hela den angivna källan | Valt läge för OCR-åtgärden |
Bild | Nej | Lista över Bilder | Den bild som ska användas för att begränsa skanningen till en del som är relativ till angiven bild | |
Tolerance | Ja | Numeriskt värde | 10 | Anger hur mycket bilden kan skilja sig från den ursprungligen valda bilden |
X1 | Ja | Numeriskt värde | Den inledande X-koordinaten för underregionen för att begränsa sökningen | |
X2 | Ja | Numeriskt värde | Den avslutande X-koordinaten för underregionen för att begränsa sökningen | |
Y1 | Ja | Numeriskt värde | Den inledande Y-koordinaten för underregionen för att begränsa sökningen | |
Y2 | Ja | Numeriskt värde | Den avslutande Y-koordinaten för underregionen för att begränsa sökningen | |
Windows OCR-språk | Inte tillgänglig | Kinesiska (förenklad), kinesiska (traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska), serbiska (latin), slovakiska, spanska, svenska, turkiska | Engelska | Språket för bildens text som Windows OCR-motorn detekterar |
Använd annat språk | Inte tillgänglig | Booleskt värde | Falsk | Anger om ett språk som inte angetts i fältet Tesseract-språk ska användas |
Tesseract-språk | Inte tillgänglig | Engelska, tyska, spanska, franska, italienska | Engelska | Språket för bildens text som Tesseract-motorn detekterar |
Språkförkortning | Nej | Textvärde | Tesseract-förkortningen för språket som ska användas. Om data till exempel är "eng.traineddata" anger du denna parameter som "eng" | |
Sökväg till språkdata | Nej | Textvärde | Sökvägen till mappen som innehåller den angivna språkets Tesseract-data | |
Bildbreddsmultiplikator | Nej | Numeriskt värde | 1 | Breddmultiplikator för bilden |
Bildhöjdsmultiplikator | Nej | Numeriskt värde | 1 | Höjdmultiplikator för bilden |
Wait for image to appear | Inte tillgänglig | Booleskt värde | Sann | Anger om du vill vänta på att bilden ska visas på skärmen eller i förgrundsfönstret eller inte |
Tidsgräns | Nej | Numeriskt värde | 5 | Anger väntetiden för att slutföra åtgärden innan åtgärden misslyckas |
Bildmatchningsalgoritm | Inte tillgänglig | Grundläggande, avancerad | Grundläggande | Vilken bildalgoritm som ska användas vid sökning efter bilder |
Kommentar
Alternativet med variabel för OCR-motor är planerat för avfasning.
Producerade variabler
Argument | Typ | Beskrivning |
---|---|---|
OcrText | Textvärde | Resultatet efter textextraheringen |
Undantag
Undantag | Beskrivning |
---|---|
Det gick inte att extrahera text med OCR | Anger att ett fel inträffade vid försök att extrahera text med OCR från den angivna källan |
Bildfilen hittades inte | Indikerar att filen inte finns på den angivna sökvägen |
Landmärkesbilden hittades inte | Indikerar att landmärkesbilden inte finns |
Det går inte att hämta text från skärmen i icke-interaktivt läge | Anger att det inte går att hämta text på skärmen i icke-interaktivt läge |
Det gick inte att skapa OCR-motorn | Anger att ett fel inträffade vid försök att skapa OCR-motorn |
Datasökvägsmappen finns inte | Anger att mappen som har angetts för språkdata inte finns |
Det valda Windows-språkpaketet är inte installerat på datorn | Indikerar att det valda Windows-språkpaketet inte har installerats på datorn |
OCR-motorn är inte aktiv | Anger att OCR-motorn inte är aktiv |