Ενέργειες OCR
Το Power Automate επιτρέπει στους χρήστες να διαβάζουν, να εξάγουν και να διαχειρίζονται δεδομένα εντός αρχείων μέσω της οπτικής αναγνώρισης χαρακτήρων (OCR).
Για να δημιουργήσετε μια μηχανή OCR και να εξαγάγετε κείμενο από εικόνες και έγγραφα, χρησιμοποιήστε την ενέργεια Εξαγωγή κειμένου με OCR. Το παρακάτω παράδειγμα εξάγει κείμενο από ολόκληρη την καθορισμένη εικόνα.
Όλες οι ενέργειες OCR μπορούν να δημιουργήσουν μια νέα μεταβλητή μηχανής OCR ή να χρησιμοποιήσουν μια υπάρχουσα. Μπορείτε να χρησιμοποιήσετε υφιστάμενες μεταβλητές OCR σε οποιαδήποτε ενέργεια περιέχει δυνατότητες OCR.
Το Power Automate υποστηρίζει και το μηχανισμό Windows OCR και Tesseract. Για να ρυθμίσετε τις παραμέτρους της επιλεγμένης μηχανής OCR, μεταβείτε στις Ρυθμίσεις μηχανής OCR της κατάλληλης ενέργειας. Οι διαθέσιμες επιλογές περιλαμβάνουν τη γλώσσα και τους πολλαπλασιαστές πλάτους και ύψους της εικόνας.
Σημείωμα
- Όλες οι διαθέσιμες μηχανές OCR είναι προ-εγκατεστημένες στο Power Automate και λειτουργούν τοπικά χωρίς σύνδεση στο cloud. Ωστόσο, ενδεχομένως να χρειαστεί να κάνετε λήψη πακέτων γλωσσών ή αρχείων δεδομένων για την εξαγωγή κειμένων σε συγκεκριμένες γλώσσες.
- Οι πολλαπλασιαστές εικόνας αυξάνουν το μέγεθος εικόνας για να κάνουν πιο αποτελεσματική την αναζήτηση και την εξαγωγή κειμένου. Η ρύθμιση τιμών μεγαλύτερων από το τρία μπορεί να οδηγήσει σε εσφαλμένα αποτελέσματα.
Χρησιμοποιήστε τον μηχανισμό Windows OCR
Η προεπιλεγμένη μηχανή OCR στο Power Automate είναι ο μηχανισμός Windows OCR. Για να εξαγάγετε κείμενα χρησιμοποιώντας τον μηχανισμό Windows OCR, πρέπει να εγκαταστήσετε το κατάλληλο πακέτο γλωσσών για τη γλώσσα που θέλετε να εξαγάγετε.
Εάν δεν έχει εγκατασταθεί το κατάλληλο πακέτο γλωσσών, το Power Automate θα εμφανίσει ένα σφάλμα που θα σας ζητήσει να το εγκαταστήσετε. Για να βρείτε περισσότερες πληροφορίες σχετικά με τη λήψη και την εγκατάσταση πακέτων γλωσσών, μεταβείτε στα Πακέτα γλωσσών για Windows.
Αφού εγκαταστήσετε το κατάλληλο πακέτο γλωσσών, επεκτείνετε τις ρυθμίσεις του μηχανισμού OCR της ενέργειας OCR και επιλέξτε τη γλώσσα που θέλετε. Ο μηχανισμός Windows OCR υποστηρίζει 25 γλώσσες: Κινέζικα (Απλοποιημένα και παραδοσιακά), Τσέχικα, Δανέζικα, Ολλανδικά, Αγγλικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ελληνικά, Ουγγρικά, Ιταλικά, Ιαπωνικά, Κορεάτικα, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Ρώσικα, Σέρβικα (Κυριλλικά και Λατινικά), Σλοβακικά, Ισπανικά, Σουηδικά και Τουρκικά.
Χρησιμοποιήστε τον μηχανισμό Tesseract OCR
Σημείωμα
Για να χρησιμοποιήσετε τη μηχανή Tesseract OCR, βεβαιωθείτε ότι το CPU του υπολογιστή υποστηρίζει σύνολο οδηγιών AVX2.
Εκτός από τον μηχανισμό Windows OCR, το Power Automate υποστηρίζει και τον μηχανισμό Tesseract. Αυτός ο μηχανισμός μπορεί να εξαγάγει κείμενο σε πέντε γλώσσες χωρίς περαιτέρω ρύθμιση παραμέτρων: Αγγλικά, Γερμανικά, Ισπανικά, Γαλλικά και Ιταλικά.
Για να εξαγάγετε κείμενο σε μια γλώσσα εκτός της αναφερόμενης λίστας, ενεργοποιήστε την επιλογή Χρήση άλλων γλωσσών στις ρυθμίσεις μηχανισμού OCR της ενέργειας OCR. Όταν ενεργοποιηθεί αυτή η επιλογή, η ενέργεια εμφανίζει δύο πρόσθετες παραμέτρους: τη συντομογραφία γλώσσας και διαδρομής δεδομένων γλώσσας.
Το πεδίο συντομογραφία γλώσσας υποδεικνύει στη μηχανή τη γλώσσα που θα αναζητήσετε στη διάρκεια της επιλογής OCR. Το πεδίο διαδρομής δεδομένων γλώσσας περιέχει τα αρχεία δεδομένων γλώσσας (.traineddata) που χρησιμοποιούνται για την εκπαίδευση του μηχανισμού OCR. Μπορείτε να βρείτε τα αρχεία δεδομένων γλώσσας για όλες τις διαθέσιμες γλώσσες σε αυτήν την αποθήκη GitHub.
Μπορείτε επίσης να χρησιμοποιήσετε τον μηχανισμό Tesseract για την εξαγωγή κειμένου από πολύγλωσσα έγγραφα. Για να βρείτε περισσότερες πληροφορίες σχετικά με την εξαγωγή κειμένου από πολύγλωσσα έγγραφα, μεταβείτε στο Εκτέλεση OCR σε πολύγλωσσα έγγραφα.
Εάν το κείμενο στην οθόνη (OCR)
Επισημαίνει την αρχή ενός μπλοκ ενεργειών συνθηκών ανάλογα με το αν ένα δεδομένο κείμενο εμφανίζεται στην οθόνη ή όχι, χρησιμοποιώντας OCR.
Παράμετροι εισόδου
Όρισμα | Προαιρετικές | Αποδοχή | Προεπιλεγμένη τιμή | Description |
---|---|---|---|---|
If text | Μη διαθέσιμο | Υπάρχει, δεν υπάρχει | Υπάρχει | Καθορίζει εάν θα γίνεται έλεγχος για το αν υπάρχει το κείμενο στη δεδομένη προέλευση για ανάλυση ή όχι |
Τύπος μηχανισμού OCR | Όχι | Μηχανισμός Windows OCR, μηχανισμός Tesseract, μεταβλητή μηχανισμού OCR | Μεταβλητή μηχανισμού OCR | Ο τύπος μηχανισμού OCR που θα χρησιμοποιηθεί. Επιλέξτε έναν προρυθμισμένο μηχανισμό OCR ή ρυθμίστε έναν νέο. |
OCR engine variable | Όχι | OCREngineObject | Ο μηχανισμός που θα χρησιμοποιηθεί για τη λειτουργία OCR | |
Text to find | Όχι | Τιμή κειμένου | Το κείμενο για αναζήτηση στην καθορισμένη προέλευση | |
Is regular expression | Μη διαθέσιμο | Δυαδική τιμή | Ανενεργή | Καθορίζει εάν θα χρησιμοποιείται τακτική παράσταση για την εύρεση του καθορισμένου κειμένου |
Search for text on | Μη διαθέσιμο | Ολόκληρη οθόνη, παράθυρο προσκηνίου | Ολόκληρη η οθόνη | Καθορίζει εάν θα γίνεται αναζήτηση για το καθορισμένο κείμενο σε ολόκληρη την ορατή οθόνη ή μόνο στο παράθυρο του προσκηνίου |
Search mode | ΔΙ | Ολόκληρη η καθορισμένη προέλευση, Μόνο συγκεκριμένη υποπεριοχή, Υποπεριοχή σχετική με την εικόνα | Σύνολο της καθορισμένης προέλευσης | Καθορίζει εάν θα γίνεται σάρωση ολόκληρης της οθόνης (ή παραθύρου) ή μιας περιορισμένης υποπεριοχής της |
Image(s) | Όχι | ΛίσταΕικόνων | Οι εικόνες που καθορίζουν την υποπεριοχή (σε σχέση με την επάνω αριστερή γωνία της εικόνας) για σάρωση του παρεχόμενου κειμένου | |
X1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X αρχής της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
Tolerance | Ναι | Αριθμητική τιμή | 10 | Καθορίζει πόσο μπορεί να διαφέρει η εικόνα ή εικόνες που αναζητούνται από την εικόνα που επιλέχθηκε αρχικά |
Y1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y αρχής της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
X1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X αρχής της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
X2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X τέλους της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
Y1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y αρχής της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
Y2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y τέλους της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
X2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X τέλους της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
Y2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y τέλους της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
Γλώσσα Windows OCR | ΔΙ | Κινέζικα (Απλοποιημένα), Κινέζικα (Παραδοσιακά) Τσέχικα, Δανέζικα, Ολλανδικά, Αγγλικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ελληνικά, Ουγγρικά, Ιταλικά, Ιαπωνικά, Κορεάτικα, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Ρώσικα, Σέρβικα (Κυριλλικά), Σέρβικα (Λατινικά), Σλοβακικά, Ισπανικά, Σουηδικά, Τουρκικά | Αγγλικά | Η γλώσσα του κειμένου που εντοπίζει ο μηχανισμός Windows OCR |
Χρήση άλλης γλώσσας | ΔΙ | Δυαδική τιμή | Ψευδές | Καθορίζει εάν θα χρησιμοποιηθεί μια γλώσσα που δεν παρέχεται στο πεδίο «Γλώσσα Tesseract» |
Γλώσσα Tesseract | ΔΙ | Αγγλικά, Γερμανικά, Ισπανικά, Γαλλικά, Ιταλικά | Αγγλικά | Η γλώσσα του κειμένου που εντοπίζει ο μηχανισμός Tesseract |
Συντομογραφία γλώσσας | Όχι | Τιμή κειμένου | Η συντόμευση Tesseract για τη γλώσσα προς χρήση. Για παράδειγμα, εάν τα δεδομένα είναι 'eng.traineddata', ορίστε αυτήν την παράμετρο σε "eng" | |
Διαδρομή δεδομένων γλώσσας | Όχι | Τιμή κειμένου | Η διαδρομή του φακέλου που περιέχει τα δεδομένα Tesseract της καθορισμένης γλώσσας | |
Πολλαπλασιαστής πλάτους εικόνας | Όχι | Αριθμητική τιμή | 1 | Ο πολλαπλασιαστής πλάτους της εικόνας |
Πολλαπλασιαστής ύψους εικόνας | Όχι | Αριθμητική τιμή | 1 | Ο πολλαπλασιαστής ύψους της εικόνας |
Εικόνα που αντιστοιχεί με τον αλγόριθμο | ΔΙ | Βασική, Προηγμένη | Βασική | Ο αλγόριθμος εικόνας που θα χρησιμοποιηθεί κατά την αναζήτηση εικόνας |
Σημείωμα
- Ο υπολογιστής τακτικής παράστασης του Power Automate είναι .NET. Για να βρείτε περισσότερες πληροφορίες για τις τακτικές παραστάσεις, μεταβείτε στη Γλώσσα τακτικής παράστασης - Γρήγορη αναφορά.
- Η επιλογή μεταβλητή μηχανισμού OCR σχεδιάζεται για απόσυρση.
Μεταβλητές που δημιουργήθηκαν
Όρισμα | Type | Description |
---|---|---|
LocationOfTextFoundX | Αριθμητική τιμή | Η συντεταγμένες X του σημείου όπου εμφανίζεται το κείμενο στην οθόνη. Εάν η αναζήτηση πραγματοποιείται στο παράθυρο προσκηνίου, η συντεταγμένη που επιστρέφεται είναι σχετική με την επάνω αριστερή γωνία του παραθύρου |
LocationOfTextFoundY | Αριθμητική τιμή | Η συντεταγμένες X του σημείου όπου εμφανίζεται το κείμενο στην οθόνη. Εάν η αναζήτηση πραγματοποιείται στο παράθυρο προσκηνίου, η συντεταγμένη που επιστρέφεται είναι σχετική με την επάνω αριστερή γωνία του παραθύρου |
Εξαιρέσεις
Εξαίρεση | Description |
---|---|
Δεν είναι δυνατός ο έλεγχος αν το κείμενο υπάρχει σε μη αλληλεπιδραστική λειτουργία | Υποδεικνύει ότι δεν είναι δυνατός ο έλεγχος του κειμένου στην οθόνη σε μη αλληλεπιδραστική λειτουργία |
Μη έγκυρες συντεταγμένες υποπεριοχής | Υποδεικνύει ότι οι συντεταγμένες της καθορισμένης υποπεριοχής δεν είναι έγκυρες |
Η ανάλυση κειμένου με OCR απέτυχε | Υποδεικνύει ότι παρουσιάστηκε σφάλμα κατά την προσπάθεια ανάλυσης του κειμένου χρησιμοποιώντας OCR |
Η δημιουργία του μηχανισμού OCR απέτυχε | Υποδεικνύει ότι παρουσιάστηκε σφάλμα κατά την προσπάθεια δημιουργίας του μηχανισμού OCR |
Ο φάκελος διαδρομής δεδομένων δεν υπάρχει | Υποδεικνύει ότι ο φάκελος που καθορίστηκε για τα δεδομένα γλώσσας δεν υπάρχει |
Το επιλεγμένο πακέτο γλωσσών των Windows δεν είναι εγκατεστημένο στον υπολογιστή | Υποδεικνύει ότι το επιλεγμένο πακέτο γλωσσών των Windows δεν έχει εγκατασταθεί στον υπολογιστή |
Ο μηχανισμός OCR δεν είναι εν λειτουργία | Υποδεικνύει ότι ο μηχανισμός OCR δεν είναι εν λειτουργία |
Περιμένετε για κείμενο στην οθόνη (OCR)
Περιμένετε μέχρι να εμφανιστεί/εξαφανιστεί ένα συγκεκριμένο κείμενο στην οθόνη, στο παράθυρο του προσκηνίου ή σε σχέση με μια εικόνα στην οθόνη ή το παράθυρο προσκηνίου με χρήση OCR.
Παράμετροι εισόδου
Όρισμα | Προαιρετικές | Αποδοχή | Προεπιλεγμένη τιμή | Description |
---|---|---|---|---|
Wait for text to | Μη διαθέσιμο | Εμφανίζεται, Εξαφανίζεται | Εμφάνιση | Καθορίζει εάν θα πρέπει να περιμένετε να εμφανιστεί ή να εξαφανιστεί το κείμενο |
Τύπος μηχανισμού OCR | Όχι | Μηχανισμός Windows OCR, μηχανισμός Tesseract, μεταβλητή μηχανισμού OCR | Μεταβλητή μηχανισμού OCR | Ο τύπος μηχανισμού OCR που θα χρησιμοποιηθεί. Επιλέξτε έναν προρυθμισμένο μηχανισμό OCR ή ρυθμίστε έναν νέο. |
OCR engine variable | Όχι | OCREngineObject | Ο μηχανισμός που θα χρησιμοποιηθεί για τη λειτουργία OCR | |
Text to find | Όχι | Τιμή κειμένου | Το κείμενο για αναζήτηση στην καθορισμένη προέλευση | |
Is regular expression | Μη διαθέσιμο | Δυαδική τιμή | Ανενεργή | Καθορίζει εάν θα χρησιμοποιείται τακτική παράσταση για την εύρεση του καθορισμένου κειμένου |
Search for text on | Μη διαθέσιμο | Ολόκληρη οθόνη, παράθυρο προσκηνίου | Ολόκληρη η οθόνη | Καθορίζει εάν θα γίνεται αναζήτηση για το καθορισμένο κείμενο σε ολόκληρη την ορατή οθόνη ή μόνο στο παράθυρο του προσκηνίου |
Search mode | ΔΙ | Ολόκληρη η καθορισμένη προέλευση, Μόνο συγκεκριμένη υποπεριοχή, Υποπεριοχή σχετική με την εικόνα | Σύνολο της καθορισμένης προέλευσης | Καθορίζει εάν θα γίνεται σάρωση ολόκληρης της οθόνης (ή παραθύρου) ή μιας περιορισμένης υποπεριοχής της |
Image(s) | Όχι | ΛίσταΕικόνων | Οι εικόνες που καθορίζουν την υποπεριοχή (σε σχέση με την επάνω αριστερή γωνία της εικόνας) για σάρωση του παρεχόμενου κειμένου | |
X1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X αρχής της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
Tolerance | Ναι | Αριθμητική τιμή | 10 | Καθορίζει πόσο μπορεί να διαφέρει η εικόνα ή εικόνες που αναζητούνται από την εικόνα που επιλέχθηκε αρχικά |
Y1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y αρχής της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
X1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X αρχής της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
X2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X τέλους της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
Y1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y αρχής της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
Y2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y τέλους της υποπεριοχής για σάρωση του παρεχόμενου κειμένου | |
X2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X τέλους της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
Y2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y τέλους της υποπεριοχής σε σχέση με την καθορισμένη εικόνα για σάρωση του παρεχόμενου κειμένου | |
Γλώσσα Windows OCR | ΔΙ | Κινέζικα (Απλοποιημένα), Κινέζικα (Παραδοσιακά) Τσέχικα, Δανέζικα, Ολλανδικά, Αγγλικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ελληνικά, Ουγγρικά, Ιταλικά, Ιαπωνικά, Κορεάτικα, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Ρώσικα, Σέρβικα (Κυριλλικά), Σέρβικα (Λατινικά), Σλοβακικά, Ισπανικά, Σουηδικά, Τουρκικά | Αγγλικά | Η γλώσσα του κειμένου που εντοπίζει ο μηχανισμός Windows OCR |
Χρήση άλλης γλώσσας | ΔΙ | Δυαδική τιμή | Ψευδές | Καθορίζει εάν θα χρησιμοποιηθεί μια γλώσσα που δεν παρέχεται στο πεδίο «Γλώσσα Tesseract» |
Γλώσσα Tesseract | ΔΙ | Αγγλικά, Γερμανικά, Ισπανικά, Γαλλικά, Ιταλικά | Αγγλικά | Η γλώσσα του κειμένου που εντοπίζει ο μηχανισμός Tesseract |
Συντομογραφία γλώσσας | Όχι | Τιμή κειμένου | Η συντόμευση Tesseract για τη γλώσσα προς χρήση. Για παράδειγμα, εάν τα δεδομένα είναι 'eng.traineddata', ορίστε αυτήν την παράμετρο σε "eng" | |
Διαδρομή δεδομένων γλώσσας | Όχι | Τιμή κειμένου | Η διαδρομή του φακέλου που περιέχει τα δεδομένα Tesseract της καθορισμένης γλώσσας | |
Πολλαπλασιαστής πλάτους εικόνας | Όχι | Αριθμητική τιμή | 1 | Ο πολλαπλασιαστής πλάτους της εικόνας |
Πολλαπλασιαστής ύψους εικόνας | Όχι | Αριθμητική τιμή | 1 | Ο πολλαπλασιαστής ύψους της εικόνας |
Εικόνα που αντιστοιχεί με τον αλγόριθμο | ΔΙ | Βασική, Προηγμένη | Βασικές | Ο αλγόριθμος εικόνας που θα χρησιμοποιηθεί κατά την αναζήτηση εικόνας |
Αποτυχία με σφάλμα χρονικού ορίου | ΔΙ | Δυαδική τιμή | False | Καθορίστε αν θέλετε η ενέργεια να περιμένει απεριόριστα ή να αποτυγχάνει μετά από μια συγκεκριμένη χρονική περίοδο |
Σημείωμα
- Ο υπολογιστής τακτικής παράστασης του Power Automate είναι .NET. Για να βρείτε περισσότερες πληροφορίες για τις τακτικές παραστάσεις, μεταβείτε στη Γλώσσα τακτικής παράστασης - Γρήγορη αναφορά.
- Η επιλογή μεταβλητή μηχανισμού OCR σχεδιάζεται για απόσυρση.
Μεταβλητές που δημιουργήθηκαν
Όρισμα | Type | Description |
---|---|---|
LocationOfTextFoundX | Αριθμητική τιμή | Η συντεταγμένες X του σημείου όπου εμφανίζεται το κείμενο στην οθόνη. Εάν η αναζήτηση πραγματοποιείται στο παράθυρο προσκηνίου, η συντεταγμένη που επιστρέφεται είναι σχετική με την επάνω αριστερή γωνία του παραθύρου |
LocationOfTextFoundY | Αριθμητική τιμή | Η συντεταγμένες X του σημείου όπου εμφανίζεται το κείμενο στην οθόνη. Εάν η αναζήτηση πραγματοποιείται στο παράθυρο προσκηνίου, η συντεταγμένη που επιστρέφεται είναι σχετική με την επάνω αριστερή γωνία του παραθύρου |
Εξαιρέσεις
Εξαίρεση | Description |
---|---|
Δεν είναι δυνατός ο έλεγχος αν το κείμενο υπάρχει σε μη αλληλεπιδραστική λειτουργία | Υποδεικνύει ότι δεν είναι δυνατός ο έλεγχος του κειμένου στην οθόνη σε μη αλληλεπιδραστική λειτουργία |
Μη έγκυρες συντεταγμένες υποπεριοχής | Υποδεικνύει ότι οι συντεταγμένες της καθορισμένης υποπεριοχής δεν είναι έγκυρες |
Η ανάλυση κειμένου με OCR απέτυχε | Υποδεικνύει ότι παρουσιάστηκε σφάλμα κατά την προσπάθεια ανάλυσης του κειμένου χρησιμοποιώντας OCR |
Η δημιουργία του μηχανισμού OCR απέτυχε | Υποδεικνύει ότι παρουσιάστηκε σφάλμα κατά την προσπάθεια δημιουργίας του μηχανισμού OCR |
Ο φάκελος διαδρομής δεδομένων δεν υπάρχει | Υποδεικνύει ότι ο φάκελος που καθορίστηκε για τα δεδομένα γλώσσας δεν υπάρχει |
Το επιλεγμένο πακέτο γλωσσών των Windows δεν είναι εγκατεστημένο στον υπολογιστή | Υποδεικνύει ότι το επιλεγμένο πακέτο γλωσσών των Windows δεν έχει εγκατασταθεί στον υπολογιστή |
Ο μηχανισμός OCR δεν είναι εν λειτουργία | Υποδεικνύει ότι ο μηχανισμός OCR δεν είναι εν λειτουργία |
Σφάλμα ορίου λήξης | Υποδεικνύει ότι η ενέργεια απέτυχε μετά από μια συγκεκριμένη χρονική περίοδο |
Εξαγωγή κειμένου με OCR
Εξαγωγή κειμένου από μια δεδομένη προέλευση με χρήση του δεδομένου μηχανισμού OCR.
Παράμετροι εισόδου
Όρισμα | Προαιρετικές | Αποδοχή | Προεπιλεγμένη τιμή | Description |
---|---|---|---|---|
Μηχανισμός OCR | Όχι | Μηχανισμός Windows OCR, μηχανισμός Tesseract, μεταβλητή μηχανισμού OCR | Μεταβλητή μηχανισμού OCR | Ο τύπος μηχανισμού OCR που θα χρησιμοποιηθεί. Επιλέξτε έναν προρυθμισμένο μηχανισμό OCR ή ρυθμίστε έναν νέο |
OCR engine variable | Όχι | OCREngineObject | Ο μηχανισμός που θα χρησιμοποιηθεί για τη λειτουργία OCR | |
OCR source | Μη διαθέσιμο | Οθόνη, Παράθυρο προσκηνίου, Εικόνα στο δίσκο | Οθόνη | Η προέλευση της εικόνας στην οποία εκτελείται η λειτουργία OCR |
Image file path | Όχι | Αρχείο | Η διαδρομή της εικόνας στην οποία εκτελείται η λειτουργία OCR | |
Search mode | Μη διαθέσιμο | Ολόκληρη η καθορισμένη προέλευση, Μόνο συγκεκριμένη υποπεριοχή, Υποπεριοχή σχετική με την εικόνα | Σύνολο της καθορισμένης προέλευσης | Η επιλεγμένη λειτουργία για τη λειτουργία OCR |
Εικόνα | Όχι | ΛίσταΕικόνων | Η εικόνα που θα χρησιμοποιηθεί για τον περιορισμό της σάρωσης σε μια υποπεριοχή που σχετίζεται με την καθορισμένη εικόνα | |
Tolerance | Ναι | Αριθμητική τιμή | 10 | Καθορίζει πόσο μπορεί να διαφέρει η εικόνα από την εικόνα που επιλέχθηκε αρχικά |
X1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X αρχής της υποπεριοχής για περιορισμό της σάρωσης | |
X2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη X τέλους της υποπεριοχής για περιορισμό της σάρωσης | |
Y1 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y αρχής της υποπεριοχής για περιορισμό της σάρωσης | |
Y2 | Ναι | Αριθμητική τιμή | Η συντεταγμένη Y τέλους της υποπεριοχής για περιορισμό της σάρωσης | |
Γλώσσα Windows OCR | ΔΙ | Κινέζικα (Απλοποιημένα), Κινέζικα (Παραδοσιακά) Τσέχικα, Δανέζικα, Ολλανδικά, Αγγλικά, Φινλανδικά, Γαλλικά, Γερμανικά, Ελληνικά, Ουγγρικά, Ιταλικά, Ιαπωνικά, Κορεάτικα, Νορβηγικά, Πολωνικά, Πορτογαλικά, Ρουμανικά, Ρώσικα, Σέρβικα (Κυριλλικά), Σέρβικα (Λατινικά), Σλοβακικά, Ισπανικά, Σουηδικά, Τουρκικά | Αγγλικά | Η γλώσσα του κειμένου που εντοπίζει ο μηχανισμός Windows OCR |
Χρήση άλλης γλώσσας | ΔΙ | Δυαδική τιμή | Ψευδές | Καθορίζει εάν θα χρησιμοποιηθεί μια γλώσσα που δεν παρέχεται στο πεδίο «Γλώσσα Tesseract» |
Γλώσσα Tesseract | ΔΙ | Αγγλικά, Γερμανικά, Ισπανικά, Γαλλικά, Ιταλικά | Αγγλικά | Η γλώσσα του κειμένου που εντοπίζει ο μηχανισμός Tesseract |
Συντομογραφία γλώσσας | Όχι | Τιμή κειμένου | Η συντόμευση Tesseract για τη γλώσσα προς χρήση. Για παράδειγμα, εάν τα δεδομένα είναι 'eng.traineddata', ορίστε αυτήν την παράμετρο σε "eng" | |
Διαδρομή δεδομένων γλώσσας | Όχι | Τιμή κειμένου | Η διαδρομή του φακέλου που περιέχει τα δεδομένα Tesseract της καθορισμένης γλώσσας | |
Πολλαπλασιαστής πλάτους εικόνας | Όχι | Αριθμητική τιμή | 1 | Ο πολλαπλασιαστής πλάτους της εικόνας |
Πολλαπλασιαστής ύψους εικόνας | Όχι | Αριθμητική τιμή | 1 | Ο πολλαπλασιαστής ύψους της εικόνας |
Wait for image to appear | ΔΙ | Δυαδική τιμή | Ενεργή | Καθορίζει εάν θα περιμένετε ή όχι την εικόνα να εμφανιστεί στην οθόνη ή στο παράθυρο προσκηνίου |
Timeout | Όχι | Αριθμητική τιμή | 5 | Καθορίζει τον χρόνο αναμονής για την ολοκλήρωση της λειτουργίας, προτού η ενέργεια αποτύχει |
Εικόνα που αντιστοιχεί με τον αλγόριθμο | ΔΙ | Βασική, Προηγμένη | Βασική | Ο αλγόριθμος εικόνας που θα χρησιμοποιηθεί κατά την αναζήτηση εικόνας |
Σημείωμα
Η επιλογή μεταβλητή μηχανισμού OCR σχεδιάζεται για απόσυρση.
Μεταβλητές που δημιουργήθηκαν
Όρισμα | Type | Description |
---|---|---|
OcrText | Τιμή κειμένου | Το αποτέλεσμα μετά την εξαγωγή κειμένου |
Εξαιρέσεις
Εξαίρεση | Περιγραφή |
---|---|
Η εξαγωγή κειμένου με OCR απέτυχε | Υποδεικνύει ότι παρουσιάστηκε σφάλμα κατά την προσπάθεια εξαγωγής κειμένου με OCR από τη δεδομένη προέλευση |
Το αρχείο εικόνας δεν βρέθηκε | Υποδεικνύει ότι το αρχείο δεν υπάρχει στη δεδομένη διαδρομή |
Η εικόνα ορόσημου δεν βρέθηκε | Υποδεικνύει ότι η εικόνα ορόσημου δεν υπάρχει |
Δεν είναι δυνατή η λήψη κειμένου από οθόνη σε μη αλληλεπιδραστική λειτουργία | Υποδεικνύει ότι δεν είναι δυνατή η λήψη κειμένου από την οθόνη κατά τη μη αλληλεπιδραστική λειτουργία |
Η δημιουργία του μηχανισμού OCR απέτυχε | Υποδεικνύει ότι παρουσιάστηκε σφάλμα κατά την προσπάθεια δημιουργίας του μηχανισμού OCR |
Ο φάκελος διαδρομής δεδομένων δεν υπάρχει | Υποδεικνύει ότι ο φάκελος που καθορίστηκε για τα δεδομένα γλώσσας δεν υπάρχει |
Το επιλεγμένο πακέτο γλωσσών των Windows δεν είναι εγκατεστημένο στον υπολογιστή | Υποδεικνύει ότι το επιλεγμένο πακέτο γλωσσών των Windows δεν έχει εγκατασταθεί στον υπολογιστή |
Ο μηχανισμός OCR δεν είναι εν λειτουργία | Υποδεικνύει ότι ο μηχανισμός OCR δεν είναι εν λειτουργία |