Delen via


OCR-acties

Power Automate stelt gebruikers in staat om gegevens binnen bestanden te lezen, extraheren en beheren via optische tekenherkenning (OCR).

Als u een OCR-engine wilt maken en tekst uit afbeeldingen en documenten wilt extraheren, gebruikt u de actie Tekst extraheren met OCR. In het volgende voorbeeld wordt tekst uit de gehele opgegeven afbeelding geëxtraheerd.

Schermopname van het dialoogvenster Tekst extraheren met OCR.

Alle OCR-acties kunnen een nieuwe OCR-enginevariabele maken of een bestaande gebruiken. U kunt bestaande variabelen van de OCR-engine gebruiken in elke actie die OCR-mogelijkheden biedt.

Power Automate ondersteunt de Windows OCR- en Tesseract-engines. Om de geselecteerde OCR-engine te configureren, navigeert u naar de Instellingen OCR-engine van de desbetreffende actie. De beschikbare opties omvatten de taal en de vermenigvuldigers voor de afbeeldingsbreedte en -hoogte.

Notitie

  • Alle beschikbare OCR-engines zijn vooraf geïnstalleerd in Power Automate en werken lokaal zonder verbinding te maken met de cloud. Het kan echter zijn dat u taalpakketten of gegevensbestanden moet downloaden om teksten in specifieke talen te extraheren.
  • Met afbeeldingsvermenigvuldigers wordt het afbeeldingsfromaat vergroot om zoeken en tekstextractie effectiever te maken. Het instellen van waarden groter dan drie kan tot foutieve resultaten leiden.

De Windows OCR-engine gebruiken

De standaard OCR-engine in Power Automate is de Windows OCR-engine. Als u teksten wilt extraheren met behulp van de Windows OCR-engine, moet u het juiste taalpakket installeren voor de taal die u wilt extraheren.

Als niet het juiste taalpakket is geïnstalleerd, geeft Power Automate een foutmelding waarin u wordt gevraagd om het te installeren. Ga naar Taalpakketten voor Windows voor meer informatie over het downloaden en installeren van taalpakketten.

Breid, na het installeren van het juiste taalpakket, de instellingen van de OCR-engine van de OCR-actie uit en selecteer de gewenste taal. De Windows OCR-engine ondersteunt 25 talen, zoals Chinees (vereenvoudigd en traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch en Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds.

De Tesseract OCR-engine gebruiken

Notitie

Als u gebruik wilt maken van de Tesseract OCR-engine, moet u ervoor zorgen dat de CPU van het apparaat de AVX2-instructieset ondersteunt.

Afgezien van de Windows OCR-engine, ondersteunt Power Automate ook de Tesseract-engine. Deze engine kan tekst in vijf talen extraheren zonder verdere configuratie: Duits, Engels, Frans, Italiaans en Spaans.

Als u tekst in een taal buiten de genoemde lijst wilt extraheren, schakelt u de optie Andere talen gebruiken in de instellingen voor OCR-engine van de OCR-actie in. Als deze optie is ingeschakeld, geeft de actie nog twee parameters weer: de velden Taalafkorting en Taalgegevenspad.

De Taalafkorting veld geeft aan de engine aan naar welke taal moet worden gezocht tijdens OCR. Het veld Pad voor taalgegevens bevat de taalgegevensbestanden (.traineddata) die zijn gebruikt om de OCR-engine te trainen. U vindt de taalgegevensbestanden voor alle beschikbare talen in deze GitHub-opslagplaats.

U kunt ook de Tesseract-engine gebruiken om tekst uit meertalige documenten te extraheren. Ga naar OCR uitvoeren op meertalige documenten voor meer informatie over het extraheren van tekst uit meertalige documenten.

Als tekst op scherm (OCR)

Markeert het begin van een voorwaardelijk blok met acties, afhankelijk van of een bepaalde tekst op het scherm verschijnt of niet, met OCR.

Invoerparameters

Argument Optioneel Accepteert Standaardwaarde Omschrijving
If text N.v.t. Bestaat, Bestaat niet Bestaat Geeft aan of wordt gecontroleerd of de tekst bestaat of niet in de te analyseren bron
OCR engine type Nee Windows OCR-engine, Tesseract-engine, OCR-enginevariabele OCR-enginevariabele Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in.
OCR-enginevariabele Nee OCREngineObject De engine die moet worden gebruikt voor de OCR-bewerking
Text to find Nee Tekstwaarde De tekst die moet worden gezocht in de opgegeven bron
Is regular expression N.v.t. Booleaanse waarde Onwaar Geeft aan of een reguliere expressie moet worden gebruikt om de opgegeven tekst te vinden
Search for text on N.v.t. Volledig scherm, Voorgrondvenster Volledig scherm Geeft aan of de opgegeven tekst moet worden gezocht in het volledige zichtbare scherm of alleen in het voorgrondvenster
Search mode N.v.t. Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding Geheel van opgegeven bron Geeft aan of het hele scherm (of venster) of een kleiner subgebied ervan moet worden gescand
Afbeelding(en) Nee Lijst met afbeeldingen De afbeeldingen die het subgebied (ten opzichte van de linkerbovenhoek van de afbeelding) aangeven, dat moet worden gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Tolerance Ja Numerieke waarde 10 Geeft aan hoeveel de doorzochte afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Windows OCR language N.v.t. Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds Engels De taal van de tekst die door Windows OCR-engine wordt gedetecteerd
Use other language N.v.t. Booleaanse waarde Onwaar Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal'
Tesseract language N.v.t. Engels, Duits, Spaans, Frans, Italiaans Engels De taal van de tekst die door de Tesseract-engine wordt gedetecteerd
Language abbreviation Nee Tekstwaarde De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u deze parameter in op 'eng'
Language data path Nee Tekstwaarde Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat
Image width multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de breedte van de afbeelding
Image height multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de hoogte van de afbeelding
Image matching algorithm N.v.t. Basis, Geavanceerd Basis Welk afbeeldingsalgoritme moet worden gebruikt bij het zoeken naar afbeeldingen

Notitie

  • De engine voor reguliere expressies in Power Automate is .NET. Ga naar Reguliere expressietaal - Beknopte naslag voor meer informatie over reguliere expressies.
  • De optie OCR engine variable staat gepland voor afschaffing.

Variabelen gemaakt

Argument Type Omschrijving
LocationOfTextFoundX Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster
LocationOfTextFoundY Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster

Uitzonderingen

Uitzondering Omschrijving
Kan niet controleren of tekst bestaat in de niet-interactieve modus Geeft aan dat het niet mogelijk is op de tekst op het scherm te zoeken in de niet-interactieve modus
Ongeldige coördinaten voor subgebied Geeft aan dat de opgegeven coördinaten van het subgebied ongeldig zijn
Kan geen tekst analyseren met OCR Geeft aan dat er een fout is opgetreden bij het analyseren van de tekst met OCR
De OCR-engine kan niet worden gemaakt Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine
Map in gegevenspad bestaat niet Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer
OCR-engine niet actief Geeft aan dat de OCR-engine niet actief is

Wachten op tekst op het scherm (OCR)

Wachten totdat een specifieke tekst wordt weergegeven/verdwijnt op het scherm, op het voorgrondvenster of relatief ten opzichte van een afbeelding op het scherm of voorgrondvenster met OCR.

Invoerparameters

Argument Optioneel Accepteert Standaardwaarde Omschrijving
Wait for text to N.v.t. Verschijnen, Verdwijnen Verschijnen Geeft aan of wordt gewacht tot de tekst wordt weergegeven of verdwijnt
OCR engine type Nee Windows OCR-engine, Tesseract-engine, OCR-enginevariabele OCR-enginevariabele Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in.
OCR-enginevariabele Nee OCREngineObject De engine die moet worden gebruikt voor de OCR-bewerking
Text to find Nee Tekstwaarde De tekst die moet worden gezocht in de opgegeven bron
Is regular expression N.v.t. Booleaanse waarde Onwaar Geeft aan of een reguliere expressie moet worden gebruikt om de opgegeven tekst te vinden
Search for text on N.v.t. Volledig scherm, Voorgrondvenster Volledig scherm Geeft aan of de opgegeven tekst moet worden gezocht in het volledige zichtbare scherm of alleen in het voorgrondvenster
Search mode N.v.t. Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding Geheel van opgegeven bron Geeft aan of het hele scherm (of venster) of een kleiner subgebied ervan moet worden gescand
Afbeelding(en) Nee Lijst met afbeeldingen De afbeeldingen die het subgebied (ten opzichte van de linkerbovenhoek van de afbeelding) aangeven, dat moet worden gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Tolerance Ja Numerieke waarde 10 Geeft aan hoeveel de doorzochte afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Windows OCR language N.v.t. Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds Engels De taal van de tekst die door Windows OCR-engine wordt gedetecteerd
Use other language N.v.t. Booleaanse waarde Onwaar Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal'
Tesseract language N.v.t. Engels, Duits, Spaans, Frans, Italiaans Engels De taal van de tekst die door de Tesseract-engine wordt gedetecteerd
Language abbreviation Nee Tekstwaarde De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u deze parameter in op 'eng'
Language data path Nee Tekstwaarde Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat
Image width multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de breedte van de afbeelding
Image height multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de hoogte van de afbeelding
Image matching algorithm N.v.t. Basis, Geavanceerd Basis Welk afbeeldingsalgoritme moet worden gebruikt bij het zoeken naar afbeeldingen
Fail with timeout error N.v.t. Booleaanse waarde Onwaar Geef op of u de actie onbepaalde tijd wilt laten wachten of dat u wilt stoppen na een ingestelde tijdsperiode

Notitie

  • De engine voor reguliere expressies in Power Automate is .NET. Ga naar Reguliere expressietaal - Beknopte naslag voor meer informatie over reguliere expressies.
  • De optie OCR engine variable staat gepland voor afschaffing.

Variabelen gemaakt

Argument Type Omschrijving
LocationOfTextFoundX Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster
LocationOfTextFoundY Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster

Uitzonderingen

Uitzondering Omschrijving
Kan niet controleren of tekst bestaat in de niet-interactieve modus Geeft aan dat het niet mogelijk is op de tekst op het scherm te zoeken in de niet-interactieve modus
Ongeldige coördinaten voor subgebied Geeft aan dat de opgegeven coördinaten van het subgebied ongeldig zijn
Kan geen tekst analyseren met OCR Geeft aan dat er een fout is opgetreden bij het analyseren van de tekst met OCR
De OCR-engine kan niet worden gemaakt Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine
Map in gegevenspad bestaat niet Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer
OCR-engine niet actief Geeft aan dat de OCR-engine niet actief is
Time-outfout Geeft aan dat de actie is mislukt na een ingestelde tijdsperiode

Tekst extraheren met OCR

Tekst uit een bepaalde bron extraheren met de opgegeven OCR-engine.

Invoerparameters

Argument Optioneel Accepteert Standaardwaarde Omschrijving
OCR engine Nee Windows OCR-engine, Tesseract-engine, OCR-enginevariabele OCR-enginevariabele Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in
OCR-enginevariabele Nee OCREngineObject De engine die moet worden gebruikt voor de OCR-bewerking
OCR source N.v.t. Scherm, Voorgrondvenster, Afbeelding op schijf Scherm Het bron van de afbeelding waarop de OCR-bewerking moet worden uitgevoerd
Image file path Nee Bestand Het pad van de afbeelding waarop de OCR-bewerking moet worden uitgevoerd
Search mode N.v.t. Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding Geheel van opgegeven bron De geselecteerde modus voor de OCR-bewerking
Afbeelding Nee Lijst met afbeeldingen De afbeelding die moet worden gebruikt voor het beperken van het scannen van een subgebied relatief ten opzichte van de opgegeven afbeelding
Tolerance Ja Numerieke waarde 10 Geeft aan hoeveel de afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied om de scan te beperken
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied om de scan te beperken
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied om de scan te beperken
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied om de scan te beperken
Windows OCR language N.v.t. Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds Engels De taal van de tekst die door Windows OCR-engine wordt gedetecteerd
Use other language N.v.t. Booleaanse waarde Onwaar Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal'
Tesseract language N.v.t. Engels, Duits, Spaans, Frans, Italiaans Engels De taal van de tekst die door de Tesseract-engine wordt gedetecteerd
Language abbreviation Nee Tekstwaarde De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u deze parameter in op 'eng'
Language data path Nee Tekstwaarde Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat
Image width multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de breedte van de afbeelding
Image height multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de hoogte van de afbeelding
Wait for image to appear N.v.t. Booleaanse waarde Waar Geeft op of al dan niet moet worden gewacht tot de afbeelding op het scherm of in het voorgrondvenster wordt weergegeven
Timeout Nee Numerieke waarde 5 Geeft de tijd aan waarna de bewerking moet worden voltooid voordat de actie mislukt
Image matching algorithm N.v.t. Basis, Geavanceerd Basis Welk afbeeldingsalgoritme moet worden gebruikt bij het zoeken naar afbeeldingen

Notitie

De optie OCR engine variable staat gepland voor afschaffing.

Variabelen gemaakt

Argument Type Omschrijving
OcrText Tekstwaarde Het resultaat na de extractie van tekst

Uitzonderingen

Uitzondering Beschrijving
Kan geen tekst extraheren met OCR Geeft aan dat er een fout is opgetreden bij het extraheren van tekst met OCR uit de opgegeven bron
Afbeeldingsbestand niet gevonden Geeft aan dat het bestand niet bestaat in het opgegeven pad
Afbeelding van oriëntatiepunt niet gevonden Geeft aan dat de afbeelding van het oriëntatiepunt niet bestaat
Kan tekst niet ophalen van scherm in de niet-interactieve modus Geeft aan dat het niet mogelijk is om tekst van het scherm op te halen in de niet-interactieve modus
De OCR-engine kan niet worden gemaakt Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine
Map in gegevenspad bestaat niet Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer
OCR-engine niet actief Geeft aan dat de OCR-engine niet actief is