OCR-acties
Power Automate stelt gebruikers in staat om gegevens binnen bestanden te lezen, extraheren en beheren via optische tekenherkenning (OCR).
Als u een OCR-engine wilt maken en tekst uit afbeeldingen en documenten wilt extraheren, gebruikt u de actie Tekst extraheren met OCR. In het volgende voorbeeld wordt tekst uit de gehele opgegeven afbeelding geëxtraheerd.
Alle OCR-acties kunnen een nieuwe OCR-enginevariabele maken of een bestaande gebruiken. U kunt bestaande variabelen van de OCR-engine gebruiken in elke actie die OCR-mogelijkheden biedt.
Power Automate ondersteunt de Windows OCR- en Tesseract-engines. Om de geselecteerde OCR-engine te configureren, navigeert u naar de Instellingen OCR-engine van de desbetreffende actie. De beschikbare opties omvatten de taal en de vermenigvuldigers voor de afbeeldingsbreedte en -hoogte.
Notitie
- Alle beschikbare OCR-engines zijn vooraf geïnstalleerd in Power Automate en werken lokaal zonder verbinding te maken met de cloud. Het kan echter zijn dat u taalpakketten of gegevensbestanden moet downloaden om teksten in specifieke talen te extraheren.
- Met afbeeldingsvermenigvuldigers wordt het afbeeldingsfromaat vergroot om zoeken en tekstextractie effectiever te maken. Het instellen van waarden groter dan drie kan tot foutieve resultaten leiden.
De Windows OCR-engine gebruiken
De standaard OCR-engine in Power Automate is de Windows OCR-engine. Als u teksten wilt extraheren met behulp van de Windows OCR-engine, moet u het juiste taalpakket installeren voor de taal die u wilt extraheren.
Als niet het juiste taalpakket is geïnstalleerd, geeft Power Automate een foutmelding waarin u wordt gevraagd om het te installeren. Ga naar Taalpakketten voor Windows voor meer informatie over het downloaden en installeren van taalpakketten.
Breid, na het installeren van het juiste taalpakket, de instellingen van de OCR-engine van de OCR-actie uit en selecteer de gewenste taal. De Windows OCR-engine ondersteunt 25 talen, zoals Chinees (vereenvoudigd en traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch en Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds.
De Tesseract OCR-engine gebruiken
Notitie
Als u gebruik wilt maken van de Tesseract OCR-engine, moet u ervoor zorgen dat de CPU van het apparaat de AVX2-instructieset ondersteunt.
Afgezien van de Windows OCR-engine, ondersteunt Power Automate ook de Tesseract-engine. Deze engine kan tekst in vijf talen extraheren zonder verdere configuratie: Duits, Engels, Frans, Italiaans en Spaans.
Als u tekst in een taal buiten de genoemde lijst wilt extraheren, schakelt u de optie Andere talen gebruiken in de instellingen voor OCR-engine van de OCR-actie in. Als deze optie is ingeschakeld, geeft de actie nog twee parameters weer: de velden Taalafkorting en Taalgegevenspad.
De Taalafkorting veld geeft aan de engine aan naar welke taal moet worden gezocht tijdens OCR. Het veld Pad voor taalgegevens bevat de taalgegevensbestanden (.traineddata) die zijn gebruikt om de OCR-engine te trainen. U vindt de taalgegevensbestanden voor alle beschikbare talen in deze GitHub-opslagplaats.
U kunt ook de Tesseract-engine gebruiken om tekst uit meertalige documenten te extraheren. Ga naar OCR uitvoeren op meertalige documenten voor meer informatie over het extraheren van tekst uit meertalige documenten.
Als tekst op scherm (OCR)
Markeert het begin van een voorwaardelijk blok met acties, afhankelijk van of een bepaalde tekst op het scherm verschijnt of niet, met OCR.
Invoerparameters
Argument | Optioneel | Accepteert | Standaardwaarde | Omschrijving |
---|---|---|---|---|
If text | N.v.t. | Bestaat, Bestaat niet | Bestaat | Geeft aan of wordt gecontroleerd of de tekst bestaat of niet in de te analyseren bron |
OCR engine type | Nee | Windows OCR-engine, Tesseract-engine, OCR-enginevariabele | OCR-enginevariabele | Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in. |
OCR-enginevariabele | Nee | OCREngineObject | De engine die moet worden gebruikt voor de OCR-bewerking | |
Text to find | Nee | Tekstwaarde | De tekst die moet worden gezocht in de opgegeven bron | |
Is regular expression | N.v.t. | Booleaanse waarde | Onwaar | Geeft aan of een reguliere expressie moet worden gebruikt om de opgegeven tekst te vinden |
Search for text on | N.v.t. | Volledig scherm, Voorgrondvenster | Volledig scherm | Geeft aan of de opgegeven tekst moet worden gezocht in het volledige zichtbare scherm of alleen in het voorgrondvenster |
Search mode | N.v.t. | Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding | Geheel van opgegeven bron | Geeft aan of het hele scherm (of venster) of een kleiner subgebied ervan moet worden gescand |
Afbeelding(en) | Nee | Lijst met afbeeldingen | De afbeeldingen die het subgebied (ten opzichte van de linkerbovenhoek van de afbeelding) aangeven, dat moet worden gescand op de opgegeven tekst | |
X1 | Ja | Numerieke waarde | De eerste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
Tolerance | Ja | Numerieke waarde | 10 | Geeft aan hoeveel de doorzochte afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding |
Y1 | Ja | Numerieke waarde | De eerste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
X1 | Ja | Numerieke waarde | De eerste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
X2 | Ja | Numerieke waarde | De laatste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
Y1 | Ja | Numerieke waarde | De eerste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
Y2 | Ja | Numerieke waarde | De laatste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
X2 | Ja | Numerieke waarde | De laatste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
Y2 | Ja | Numerieke waarde | De laatste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
Windows OCR language | N.v.t. | Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds | Engels | De taal van de tekst die door Windows OCR-engine wordt gedetecteerd |
Use other language | N.v.t. | Booleaanse waarde | Onwaar | Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal' |
Tesseract language | N.v.t. | Engels, Duits, Spaans, Frans, Italiaans | Engels | De taal van de tekst die door de Tesseract-engine wordt gedetecteerd |
Language abbreviation | Nee | Tekstwaarde | De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u deze parameter in op 'eng' | |
Language data path | Nee | Tekstwaarde | Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat | |
Image width multiplier | Nee | Numerieke waarde | 1 | De vermenigvuldigingsfactor voor de breedte van de afbeelding |
Image height multiplier | Nee | Numerieke waarde | 1 | De vermenigvuldigingsfactor voor de hoogte van de afbeelding |
Image matching algorithm | N.v.t. | Basis, Geavanceerd | Basis | Welk afbeeldingsalgoritme moet worden gebruikt bij het zoeken naar afbeeldingen |
Notitie
- De engine voor reguliere expressies in Power Automate is .NET. Ga naar Reguliere expressietaal - Beknopte naslag voor meer informatie over reguliere expressies.
- De optie OCR engine variable staat gepland voor afschaffing.
Variabelen gemaakt
Argument | Type | Omschrijving |
---|---|---|
LocationOfTextFoundX | Numerieke waarde | De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster |
LocationOfTextFoundY | Numerieke waarde | De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster |
Uitzonderingen
Uitzondering | Omschrijving |
---|---|
Kan niet controleren of tekst bestaat in de niet-interactieve modus | Geeft aan dat het niet mogelijk is op de tekst op het scherm te zoeken in de niet-interactieve modus |
Ongeldige coördinaten voor subgebied | Geeft aan dat de opgegeven coördinaten van het subgebied ongeldig zijn |
Kan geen tekst analyseren met OCR | Geeft aan dat er een fout is opgetreden bij het analyseren van de tekst met OCR |
De OCR-engine kan niet worden gemaakt | Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine |
Map in gegevenspad bestaat niet | Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat |
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer | Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer |
OCR-engine niet actief | Geeft aan dat de OCR-engine niet actief is |
Wachten op tekst op het scherm (OCR)
Wachten totdat een specifieke tekst wordt weergegeven/verdwijnt op het scherm, op het voorgrondvenster of relatief ten opzichte van een afbeelding op het scherm of voorgrondvenster met OCR.
Invoerparameters
Argument | Optioneel | Accepteert | Standaardwaarde | Omschrijving |
---|---|---|---|---|
Wait for text to | N.v.t. | Verschijnen, Verdwijnen | Verschijnen | Geeft aan of wordt gewacht tot de tekst wordt weergegeven of verdwijnt |
OCR engine type | Nee | Windows OCR-engine, Tesseract-engine, OCR-enginevariabele | OCR-enginevariabele | Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in. |
OCR-enginevariabele | Nee | OCREngineObject | De engine die moet worden gebruikt voor de OCR-bewerking | |
Text to find | Nee | Tekstwaarde | De tekst die moet worden gezocht in de opgegeven bron | |
Is regular expression | N.v.t. | Booleaanse waarde | Onwaar | Geeft aan of een reguliere expressie moet worden gebruikt om de opgegeven tekst te vinden |
Search for text on | N.v.t. | Volledig scherm, Voorgrondvenster | Volledig scherm | Geeft aan of de opgegeven tekst moet worden gezocht in het volledige zichtbare scherm of alleen in het voorgrondvenster |
Search mode | N.v.t. | Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding | Geheel van opgegeven bron | Geeft aan of het hele scherm (of venster) of een kleiner subgebied ervan moet worden gescand |
Afbeelding(en) | Nee | Lijst met afbeeldingen | De afbeeldingen die het subgebied (ten opzichte van de linkerbovenhoek van de afbeelding) aangeven, dat moet worden gescand op de opgegeven tekst | |
X1 | Ja | Numerieke waarde | De eerste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
Tolerance | Ja | Numerieke waarde | 10 | Geeft aan hoeveel de doorzochte afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding |
Y1 | Ja | Numerieke waarde | De eerste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
X1 | Ja | Numerieke waarde | De eerste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
X2 | Ja | Numerieke waarde | De laatste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
Y1 | Ja | Numerieke waarde | De eerste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
Y2 | Ja | Numerieke waarde | De laatste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst | |
X2 | Ja | Numerieke waarde | De laatste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
Y2 | Ja | Numerieke waarde | De laatste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst | |
Windows OCR language | N.v.t. | Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds | Engels | De taal van de tekst die door Windows OCR-engine wordt gedetecteerd |
Use other language | N.v.t. | Booleaanse waarde | Onwaar | Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal' |
Tesseract language | N.v.t. | Engels, Duits, Spaans, Frans, Italiaans | Engels | De taal van de tekst die door de Tesseract-engine wordt gedetecteerd |
Language abbreviation | Nee | Tekstwaarde | De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u deze parameter in op 'eng' | |
Language data path | Nee | Tekstwaarde | Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat | |
Image width multiplier | Nee | Numerieke waarde | 1 | De vermenigvuldigingsfactor voor de breedte van de afbeelding |
Image height multiplier | Nee | Numerieke waarde | 1 | De vermenigvuldigingsfactor voor de hoogte van de afbeelding |
Image matching algorithm | N.v.t. | Basis, Geavanceerd | Basis | Welk afbeeldingsalgoritme moet worden gebruikt bij het zoeken naar afbeeldingen |
Fail with timeout error | N.v.t. | Booleaanse waarde | Onwaar | Geef op of u de actie onbepaalde tijd wilt laten wachten of dat u wilt stoppen na een ingestelde tijdsperiode |
Notitie
- De engine voor reguliere expressies in Power Automate is .NET. Ga naar Reguliere expressietaal - Beknopte naslag voor meer informatie over reguliere expressies.
- De optie OCR engine variable staat gepland voor afschaffing.
Variabelen gemaakt
Argument | Type | Omschrijving |
---|---|---|
LocationOfTextFoundX | Numerieke waarde | De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster |
LocationOfTextFoundY | Numerieke waarde | De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster |
Uitzonderingen
Uitzondering | Omschrijving |
---|---|
Kan niet controleren of tekst bestaat in de niet-interactieve modus | Geeft aan dat het niet mogelijk is op de tekst op het scherm te zoeken in de niet-interactieve modus |
Ongeldige coördinaten voor subgebied | Geeft aan dat de opgegeven coördinaten van het subgebied ongeldig zijn |
Kan geen tekst analyseren met OCR | Geeft aan dat er een fout is opgetreden bij het analyseren van de tekst met OCR |
De OCR-engine kan niet worden gemaakt | Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine |
Map in gegevenspad bestaat niet | Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat |
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer | Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer |
OCR-engine niet actief | Geeft aan dat de OCR-engine niet actief is |
Time-outfout | Geeft aan dat de actie is mislukt na een ingestelde tijdsperiode |
Tekst extraheren met OCR
Tekst uit een bepaalde bron extraheren met de opgegeven OCR-engine.
Invoerparameters
Argument | Optioneel | Accepteert | Standaardwaarde | Omschrijving |
---|---|---|---|---|
OCR engine | Nee | Windows OCR-engine, Tesseract-engine, OCR-enginevariabele | OCR-enginevariabele | Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in |
OCR-enginevariabele | Nee | OCREngineObject | De engine die moet worden gebruikt voor de OCR-bewerking | |
OCR source | N.v.t. | Scherm, Voorgrondvenster, Afbeelding op schijf | Scherm | Het bron van de afbeelding waarop de OCR-bewerking moet worden uitgevoerd |
Image file path | Nee | Bestand | Het pad van de afbeelding waarop de OCR-bewerking moet worden uitgevoerd | |
Search mode | N.v.t. | Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding | Geheel van opgegeven bron | De geselecteerde modus voor de OCR-bewerking |
Afbeelding | Nee | Lijst met afbeeldingen | De afbeelding die moet worden gebruikt voor het beperken van het scannen van een subgebied relatief ten opzichte van de opgegeven afbeelding | |
Tolerance | Ja | Numerieke waarde | 10 | Geeft aan hoeveel de afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding |
X1 | Ja | Numerieke waarde | De eerste X-coördinaat van het subgebied om de scan te beperken | |
X2 | Ja | Numerieke waarde | De laatste X-coördinaat van het subgebied om de scan te beperken | |
Y1 | Ja | Numerieke waarde | De eerste Y-coördinaat van het subgebied om de scan te beperken | |
Y2 | Ja | Numerieke waarde | De laatste Y-coördinaat van het subgebied om de scan te beperken | |
Windows OCR language | N.v.t. | Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds | Engels | De taal van de tekst die door Windows OCR-engine wordt gedetecteerd |
Use other language | N.v.t. | Booleaanse waarde | Onwaar | Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal' |
Tesseract language | N.v.t. | Engels, Duits, Spaans, Frans, Italiaans | Engels | De taal van de tekst die door de Tesseract-engine wordt gedetecteerd |
Language abbreviation | Nee | Tekstwaarde | De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u deze parameter in op 'eng' | |
Language data path | Nee | Tekstwaarde | Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat | |
Image width multiplier | Nee | Numerieke waarde | 1 | De vermenigvuldigingsfactor voor de breedte van de afbeelding |
Image height multiplier | Nee | Numerieke waarde | 1 | De vermenigvuldigingsfactor voor de hoogte van de afbeelding |
Wait for image to appear | N.v.t. | Booleaanse waarde | Waar | Geeft op of al dan niet moet worden gewacht tot de afbeelding op het scherm of in het voorgrondvenster wordt weergegeven |
Timeout | Nee | Numerieke waarde | 5 | Geeft de tijd aan waarna de bewerking moet worden voltooid voordat de actie mislukt |
Image matching algorithm | N.v.t. | Basis, Geavanceerd | Basis | Welk afbeeldingsalgoritme moet worden gebruikt bij het zoeken naar afbeeldingen |
Notitie
De optie OCR engine variable staat gepland voor afschaffing.
Variabelen gemaakt
Argument | Type | Omschrijving |
---|---|---|
OcrText | Tekstwaarde | Het resultaat na de extractie van tekst |
Uitzonderingen
Uitzondering | Beschrijving |
---|---|
Kan geen tekst extraheren met OCR | Geeft aan dat er een fout is opgetreden bij het extraheren van tekst met OCR uit de opgegeven bron |
Afbeeldingsbestand niet gevonden | Geeft aan dat het bestand niet bestaat in het opgegeven pad |
Afbeelding van oriëntatiepunt niet gevonden | Geeft aan dat de afbeelding van het oriëntatiepunt niet bestaat |
Kan tekst niet ophalen van scherm in de niet-interactieve modus | Geeft aan dat het niet mogelijk is om tekst van het scherm op te halen in de niet-interactieve modus |
De OCR-engine kan niet worden gemaakt | Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine |
Map in gegevenspad bestaat niet | Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat |
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer | Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer |
OCR-engine niet actief | Geeft aan dat de OCR-engine niet actief is |