Dela via


OCR-åtgärder

Power Automate gör det möjligt för användare att läsa, extrahera och hantera data i filer genom teckenidentifiering (OCR).

Om du vill skapa en OCR-motor och extrahera text från bilder och dokument använder du åtgärden Extrahera text med OCR. I följande exempel extraheras text från hela den angivna bilden.

Skärmbild av alternativet Extrahera text med OCR-åtgärden.

Alla OCR-åtgärder kan skapa en ny OCR-motorvariabel eller använda en befintlig. Du kan använda befintliga OCR-motorvariabler i alla åtgärder som erbjuder OCR-funktioner.

Power Automate har stöd för både Windows OCR- och Tesseract-motorn. För att konfigurera den valda OCR-motorn, navigera till OCR-motorinställningar av lämplig åtgärd. De tillgängliga alternativen inkluderar språket och multiplikatorerna för bildens bredd och höjd.

Kommentar

  • Alla tillgängliga OCR-motorer är förinstallerade i Power Automate och arbeta lokalt utan att ansluta till molnet. Du kan dock behöva hämta språkpaket eller datafiler för att extrahera text på specifika språk.
  • Bildmultiplikatorer ökar storleken på bilden i syfte att göra sökning och textextrahering effektivare. Ange värden som är större än tre kan leda till felaktiga resultat.

Använda Windows OCR-motorn

Standard OCR-motor i Power Automate är Windows OCR-motorn. Om du vill extrahera text med Windows OCR-motorn måste du installera rätt språkpaket för det språk du vill extrahera.

Om rätt språkpaket inte har installerats visas Power Automate ett felmeddelande som uppmanar dig att installera det. Mer information finns om att hämta och installera språkpaket i språkpaket för Windows.

När du har installerat rätt språkpaket utökar du OCR-motorns inställningar för OCR-åtgärden och väljer önskat språk. Windows OCR-motorn stöder 25 språk: kinesiska (förenklad och traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska och latin), slovakiska, spanska, svenska och turkiska.

Använda Tesseract OCR-motorn

Kommentar

För att använda Tesseract OCR-motorn, se till att maskinens CPU stöder AVX2-instruktionsuppsättningen.

Förutom Windows OCR-motorn har Power Automate stöd för Tesseract-motorn. Den här motorn kan extrahera text på fem språk utan ytterligare konfiguration: engelska, tyska, spanska, franska och italienska.

Om du vill extrahera text på ett språk som inte finns i listan aktiverar du alternativet Använd andra språk i OCR-motorns inställningar för OCR-åtgärden. När alternativet har aktiverats visas ytterligare två parametrar för åtgärden: Språkförkortning och Datasökväg för språk.

Fältet Språkförkortning anger för motorn vilket språk som ska sökas under OCR. Fältet Sökväg till språkdata innehåller språkdatafilerna (.traineddata) som används för att utbilda OCR-motorn. Du hittar språkdatafilerna för alla tillgängliga språk i den här GitHub-databasen.

Du kan också använda Tesseract-motorn för att extrahera text från flerspråkiga dokument. Mer information om hur du extraherar text från flerspråkiga dokument finns i Utföra OCR på flerspråkiga dokument.

Om text på skärmen (OCR)

Markerar början på ett villkorsstyrt block med åtgärder beroende på om en given text visas på skärmen eller inte, med OCR.

Indataparametrar

Argument Valfri Accepterar Standardvärde Beskrivning
If text Inte tillgängligt Finns, Finns inte Finns Anger om du vill kontrollera om texten finns eller inte på den givna källan att analysera
OCR engine type Nej Windows OCR-motorn, Tesseract-motorn, OCR-motorvariabel OCR-motorvariabel Den OCR-motortyp som ska användas. Välj en förkonfigurerad OCR-motor eller konfigurera en ny.
OCR-motorvariabel Nej OCREngineObject Motorn som ska användas för OCR-åtgärden
Text att söka efter Nej Textvärde Textsträngen att söka efter i den angivna källan
Is regular expression Inte tillgängligt Booleskt värde Falsk Anger om ett reguljärt uttryck ska användas för att hitta den angivna texten
Search for text on Inte tillgängligt Helskärm, förgrundsfönster Hela skärmen Anger om du vill söka efter den angivna texten på hela den synliga skärmen eller bara i förgrundsfönstret
Search mode Inte tillgänglig Hel av specificerad källa, Endast specifik underregion, Underregion i förhållande till bild Hela den angivna källan Anger om hela skärmen (eller fönstret) ska skannas, eller bara en begränsad del
Bild(er) Nej Lista över Bilder Den bild/de bilder som anger delen (relativ till bildens övre vänstra hörn) som ska skannas för tillhandahållen text
X1 Ja Numeriskt värde Den inledande X-koordinaten för underregionen att söka efter den angivna texten
Tolerance Ja Numeriskt värde 10 Anger hur mycket bilden du söker efter kan skilja sig från den ursprungligen valda bilden
Y1 Ja Numeriskt värde Den inledande Y-koordinaten för underregionen att söka efter den angivna texten
X1 Ja Numeriskt värde Den inledande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
X2 Ja Numeriskt värde Den avslutande X-koordinaten för underregionen att söka efter den angivna texten
Y1 Ja Numeriskt värde Den inledande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
Y2 Ja Numeriskt värde Den avslutande Y-koordinaten för underregionen att söka efter den angivna texten
X2 Ja Numeriskt värde Den avslutande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
Y2 Ja Numeriskt värde Den avslutande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
Windows OCR-språk Inte tillgänglig Kinesiska (förenklad), kinesiska (traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska), serbiska (latin), slovakiska, spanska, svenska, turkiska Engelska Språket för bildens text som Windows OCR-motorn detekterar
Använd annat språk Inte tillgänglig Booleskt värde Falsk Anger om ett språk som inte angetts i fältet Tesseract-språk ska användas
Tesseract-språk Inte tillgänglig Engelska, tyska, spanska, franska, italienska Engelska Språket för bildens text som Tesseract-motorn detekterar
Språkförkortning Nej Textvärde Tesseract-förkortningen för språket som ska användas. Om data till exempel är "eng.traineddata" anger du denna parameter som "eng"
Sökväg till språkdata Nej Textvärde Sökvägen till mappen som innehåller den angivna språkets Tesseract-data
Bildbreddsmultiplikator Nej Numeriskt värde 1 Breddmultiplikator för bilden
Bildhöjdsmultiplikator Nej Numeriskt värde 1 Höjdmultiplikator för bilden
Bildmatchningsalgoritm Inte tillgänglig Grundläggande, avancerad Grundläggande Vilken bildalgoritm som ska användas vid sökning efter bilder

Kommentar

  • Power Automates reguljära uttrycksmotor är .NET. Du hittar mer information gällande standarduttryck i Standard-uttrycksspråk – Snabbreferens.
  • Alternativet med variabel för OCR-motor är planerat för avfasning.

Producerade variabler

Argument Typ Beskrivning
LocationOfTextFoundX Numeriskt värde X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn
LocationOfTextFoundY Numeriskt värde X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn

Undantag

Undantag Beskrivning
Det går inte att kontrollera om text finns i icke-interaktivt läge Anger att det inte går att söka efter texten på skärmen i icke-interaktivt läge
Ogiltiga koordinater för underregion Anger att de angivna koordinaterna för underregionen är ogiltiga
Det gick inte att analysera text med OCR Anger att ett fel inträffade vid försök att analysera texten med OCR
Det gick inte att skapa OCR-motorn Anger att ett fel inträffade vid försök att skapa OCR-motorn
Datasökvägsmappen finns inte Anger att mappen som har angetts för språkdata inte finns
Det valda Windows-språkpaketet är inte installerat på datorn Indikerar att det valda Windows-språkpaketet inte har installerats på datorn
OCR-motorn är inte aktiv Anger att OCR-motorn inte är aktiv

Vänta på text på skärmen (OCR)

Vänta tills en viss text visas på/försvinner från skärmen, i förgrundsfönstret eller i förhållande till en bild på skärmen eller i förgrundsfönstret med OCR.

Indataparametrar

Argument Valfri Accepterar Standardvärde Beskrivning
Wait for text to Inte tillgängligt Visas, Försvinna Visas Anger om du ska vänta på att texten ska visas eller försvinna
OCR engine type Nej Windows OCR-motorn, Tesseract-motorn, OCR-motorvariabel OCR-motorvariabel Den OCR-motortyp som ska användas. Välj en förkonfigurerad OCR-motor eller konfigurera en ny.
OCR-motorvariabel Nej OCREngineObject Motorn som ska användas för OCR-åtgärden
Text att söka efter Nej Textvärde Textsträngen att söka efter i den angivna källan
Is regular expression Inte tillgängligt Booleskt värde Falsk Anger om ett reguljärt uttryck ska användas för att hitta den angivna texten
Search for text on Inte tillgängligt Helskärm, förgrundsfönster Hela skärmen Anger om du vill söka efter den angivna texten på hela den synliga skärmen eller bara i förgrundsfönstret
Search mode Inte tillgänglig Hel av specificerad källa, Endast specifik underregion, Underregion i förhållande till bild Hela den angivna källan Anger om hela skärmen (eller fönstret) ska skannas, eller bara en begränsad del
Bild(er) Nej Lista över Bilder Den bild/de bilder som anger delen (relativ till bildens övre vänstra hörn) som ska skannas för tillhandahållen text
X1 Ja Numeriskt värde Den inledande X-koordinaten för underregionen att söka efter den angivna texten
Tolerance Ja Numeriskt värde 10 Anger hur mycket bilden du söker efter kan skilja sig från den ursprungligen valda bilden
Y1 Ja Numeriskt värde Den inledande Y-koordinaten för underregionen att söka efter den angivna texten
X1 Ja Numeriskt värde Den inledande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
X2 Ja Numeriskt värde Den avslutande X-koordinaten för underregionen att söka efter den angivna texten
Y1 Ja Numeriskt värde Den inledande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
Y2 Ja Numeriskt värde Den avslutande Y-koordinaten för underregionen att söka efter den angivna texten
X2 Ja Numeriskt värde Den avslutande X-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
Y2 Ja Numeriskt värde Den avslutande Y-koordinaten för underregionen i förhållande till den angivna bilden för att söka efter den angivna texten
Windows OCR-språk Inte tillgänglig Kinesiska (förenklad), kinesiska (traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska), serbiska (latin), slovakiska, spanska, svenska, turkiska Engelska Språket för bildens text som Windows OCR-motorn detekterar
Använd annat språk Inte tillgänglig Booleskt värde Falsk Anger om ett språk som inte angetts i fältet Tesseract-språk ska användas
Tesseract-språk Inte tillgänglig Engelska, tyska, spanska, franska, italienska Engelska Språket för bildens text som Tesseract-motorn detekterar
Språkförkortning Nej Textvärde Tesseract-förkortningen för språket som ska användas. Om data till exempel är "eng.traineddata" anger du denna parameter som "eng"
Sökväg till språkdata Nej Textvärde Sökvägen till mappen som innehåller den angivna språkets Tesseract-data
Bildbreddsmultiplikator Nej Numeriskt värde 1 Breddmultiplikator för bilden
Bildhöjdsmultiplikator Nej Numeriskt värde 1 Höjdmultiplikator för bilden
Bildmatchningsalgoritm Inte tillgänglig Grundläggande, avancerad Grundläggande Vilken bildalgoritm som ska användas vid sökning efter bilder
Misslyckades med tidsgränsfel Inte tillgänglig Booleskt värde Falsk Ange om du vill att åtgärden ska vänta oändligt eller misslyckas efter en angiven tidsperiod

Kommentar

  • Power Automates reguljära uttrycksmotor är .NET. Du hittar mer information gällande standarduttryck i Standard-uttrycksspråk – Snabbreferens.
  • Alternativet med variabel för OCR-motor är planerat för avfasning.

Producerade variabler

Argument Typ Beskrivning
LocationOfTextFoundX Numeriskt värde X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn
LocationOfTextFoundY Numeriskt värde X-koordinaten för den punkt där texten visas på skärmen. Om sökningen görs i förgrundsfönstret, är den koordinat som returneras i förhållande till fönstrets övre vänstra hörn

Undantag

Undantag Beskrivning
Det går inte att kontrollera om text finns i icke-interaktivt läge Anger att det inte går att söka efter texten på skärmen i icke-interaktivt läge
Ogiltiga koordinater för underregion Anger att de angivna koordinaterna för underregionen är ogiltiga
Det gick inte att analysera text med OCR Anger att ett fel inträffade vid försök att analysera texten med OCR
Det gick inte att skapa OCR-motorn Anger att ett fel inträffade vid försök att skapa OCR-motorn
Datasökvägsmappen finns inte Anger att mappen som har angetts för språkdata inte finns
Det valda Windows-språkpaketet är inte installerat på datorn Indikerar att det valda Windows-språkpaketet inte har installerats på datorn
OCR-motorn är inte aktiv Anger att OCR-motorn inte är aktiv
Tidsgränsfel Anger att åtgärden misslyckades efter en a inställd tidsperiod

Extrahera text med OCR

Extrahera text från en given källa med den givna OCR-motorn.

Indataparametrar

Argument Valfri Accepterar Standardvärde Beskrivning
OCR-motor Nej Windows OCR-motorn, Tesseract-motorn, OCR-motorvariabel OCR-motorvariabel Den OCR-motortyp som ska användas. Välj en förkonfigurerad OCR-motor eller konfigurera en ny
OCR-motorvariabel Nej OCREngineObject Motorn som ska användas för OCR-åtgärden
OCR source Inte tillgängligt Skärm, Förgrundsfönster, Bild på disk Skärm Källan för bilden för att utföra OCR-åtgärden på
Image file path Nej Arkiv Sökvägen till bilden för att utföra OCR-åtgärden på
Search mode Inte tillgängligt Hel av specificerad källa, Endast specifik underregion, Underregion i förhållande till bild Hela den angivna källan Valt läge för OCR-åtgärden
Bild Nej Lista över Bilder Den bild som ska användas för att begränsa skanningen till en del som är relativ till angiven bild
Tolerance Ja Numeriskt värde 10 Anger hur mycket bilden kan skilja sig från den ursprungligen valda bilden
X1 Ja Numeriskt värde Den inledande X-koordinaten för underregionen för att begränsa sökningen
X2 Ja Numeriskt värde Den avslutande X-koordinaten för underregionen för att begränsa sökningen
Y1 Ja Numeriskt värde Den inledande Y-koordinaten för underregionen för att begränsa sökningen
Y2 Ja Numeriskt värde Den avslutande Y-koordinaten för underregionen för att begränsa sökningen
Windows OCR-språk Inte tillgänglig Kinesiska (förenklad), kinesiska (traditionell), tjeckiska, danska, holländska, engelska, finska, franska, grekiska, ungerska, italienska, japanska, koreanska, norska, polska, portugisiska, rumänska, ryska, serbiska (kyrilliska), serbiska (latin), slovakiska, spanska, svenska, turkiska Engelska Språket för bildens text som Windows OCR-motorn detekterar
Använd annat språk Inte tillgänglig Booleskt värde Falsk Anger om ett språk som inte angetts i fältet Tesseract-språk ska användas
Tesseract-språk Inte tillgänglig Engelska, tyska, spanska, franska, italienska Engelska Språket för bildens text som Tesseract-motorn detekterar
Språkförkortning Nej Textvärde Tesseract-förkortningen för språket som ska användas. Om data till exempel är "eng.traineddata" anger du denna parameter som "eng"
Sökväg till språkdata Nej Textvärde Sökvägen till mappen som innehåller den angivna språkets Tesseract-data
Bildbreddsmultiplikator Nej Numeriskt värde 1 Breddmultiplikator för bilden
Bildhöjdsmultiplikator Nej Numeriskt värde 1 Höjdmultiplikator för bilden
Wait for image to appear Inte tillgänglig Booleskt värde Sann Anger om du vill vänta på att bilden ska visas på skärmen eller i förgrundsfönstret eller inte
Tidsgräns Nej Numeriskt värde 5 Anger väntetiden för att slutföra åtgärden innan åtgärden misslyckas
Bildmatchningsalgoritm Inte tillgänglig Grundläggande, avancerad Grundläggande Vilken bildalgoritm som ska användas vid sökning efter bilder

Kommentar

Alternativet med variabel för OCR-motor är planerat för avfasning.

Producerade variabler

Argument Typ Beskrivning
OcrText Textvärde Resultatet efter textextraheringen

Undantag

Undantag Beskrivning
Det gick inte att extrahera text med OCR Anger att ett fel inträffade vid försök att extrahera text med OCR från den angivna källan
Bildfilen hittades inte Indikerar att filen inte finns på den angivna sökvägen
Landmärkesbilden hittades inte Indikerar att landmärkesbilden inte finns
Det går inte att hämta text från skärmen i icke-interaktivt läge Anger att det inte går att hämta text på skärmen i icke-interaktivt läge
Det gick inte att skapa OCR-motorn Anger att ett fel inträffade vid försök att skapa OCR-motorn
Datasökvägsmappen finns inte Anger att mappen som har angetts för språkdata inte finns
Det valda Windows-språkpaketet är inte installerat på datorn Indikerar att det valda Windows-språkpaketet inte har installerats på datorn
OCR-motorn är inte aktiv Anger att OCR-motorn inte är aktiv