Akcje OCR

Artykuł
03/16/2023

Power Automate umożliwia użytkownikom odczytywanie i wyodrębnianie danych z plików oraz zarządzanie nimi za pomocą rozpoznawania znaków (OCR).

Aby utworzyć aparat OCR i wyodrębnić tekst z obrazów i dokumentów za pomocą OCR, użyj akcji Wyodrębnij tekst za pomocą funkcji OCR. W poniższym przykładzie wyodrębniono tekst z całego wskazanego obrazu.

Zrzut ekranu przedstawiający okno dialogowe z akcją wyodrębniania tekstu z OCR.

Wszystkie akcje OCR mogą tworzyć nowe zmienne silnika OCR lub używać istniejących. Możesz użyć istniejących zmiennych silnika OCR w każdej akcji, która oferuje możliwość OCR.

Power Automate obsługuje silnik OCR systemu Windows i Tesseract. Aby skonfigurować wybrany silnik OCR, przejdź do Ustawień silnika OCR odpowiedniej akcji. Dostępne opcje obejmują język oraz mnożniki szerokości i wysokości obrazu.

Uwaga

Wszystkie dostępne silniki OCR są preinstalowane w Power Automate i działają lokalnie bez konieczności łączenia się z chmurą. Jednak aby wyodrębnić teksty w określonych językach, możesz potrzebować pobrać pakiety językowe lub pliki danych.
Mnożniki obrazu zwiększają rozmiar obrazu, aby wyszukiwanie i wyodrębnianie tekstu było efektywniejsze. Ustawienie wartości większych niż trzy może powodować błędne wyniki.

Korzystanie z aparatu OCR systemu Windows

Domyślnym silnikiem OCR w Power Automate jest silnik OCR systemu Windows. Aby wyodrębnić dowolny tekst przy użyciu aparatu OCR systemu Windows, należy zainstalować odpowiedni pakiet językowy dla języka, który ma zostać wyodrębniony.

Jeśli odpowiedni pakiet językowy nie został zainstalowany, usługa Power Automate wyświetli błąd z monitem o zainstalowanie pakietu. Więcej informacji na temat pobierania i instalowania pakietów językowych można znaleźć w temacie Pakiety językowe dla systemu Windows.

Po zainstalowaniu odpowiedniego pakietu językowego należy rozszerzyć ustawienia aparatu OCR w akcji OCR i wybrać żądany język. Aparat Windows OCR obsługuje 25 języków, w tym: chiński (uproszczony i tradycyjny), czeski, duński, holenderski, angielski, fiński, francuski, niemiecki, grecki, węgierski, włoski, japoński, koreański, norweski, polski, portugalski, rumuński, rosyjski, serbski (cyrylica i łaciński), słowacki, hiszpański, szwedzki i turecki.

Korzystanie z aparatu OCR Tesseract

Uwaga

Aby korzystać z aparatu OCR Tesseract, upewnij się, że procesor komputera obsługuje zestaw instrukcji AVX2.

Oprócz aparatu OCR systemu Windows usługa Power Automate obsługuje również aparat Tesseract. Bez konieczności dalszego konfigurowania ten aparat może wyodrębnić tekst w pięciu językach: angielskim, niemieckim, hiszpańskim, francuskim i włoskim.

Aby wyodrębnić tekst w języku poza wymienioną listą, należy włączyć opcję Użyj innych języków w ustawieniach aparatu OCR akcji OCR. Po włączeniu tej opcji w akcji są wyświetlane dwa dodatkowe parametry: pola Skrót językowy i Ścieżka danych językowych.

Pole Skrót językowy wskazuje silnikowi, jakiego języka ma szukać podczas OCR. Pole Ścieżka danych językowych zawiera pliki danych językowych (.traineddata) używane do trenowania aparatu OCR. Pliki danych językowych można znaleźć dla wszystkich dostępnych języków można znaleźć w tym repozytorium GitHub.

Aparat Tesseract może być także używany do wyodrębniania tekstu z dokumentów wielojęzykowych. Aby uzyskać więcej informacji na temat wyodrębniania tekstów z dokumentów wielojęzykowych, zobacz temat Przeprowadzanie OCR w dokumentach wielojęzykowych.

Jeśli tekst znajduje się na ekranie (OCR)

Oznacza początek bloku warunkowego akcji w zależności od tego, czy dany tekst pojawia się na ekranie, czy nie, używając funkcji OCR.

Parametry wejściowe

Argument	Opcjonalnie	Akceptuje	Wartość domyślna	opis
If text	Nie dotyczy	Istnieje, Nie istnieje	Istnieje	Określa, czy ma być sprawdzane istnienie tekstu w danym źródle przeznaczonym do analizy
Typ aparatu OCR	Nie	Aparat OCR systemu Windows, aparat Tesseract, zmienna aparatu OCR	Zmienna aparatu OCR	Typ aparatu OCR do użycia. Wybierz wstępnie skonfigurowany aparat OCR lub skonfiguruj nowy.
OCR engine variable	Nie	OCREngineObject		Aparat używany w celu wykonania operacji OCR
Text to find	Nie	Wartość tekstowa		Tekst do wyszukania w określonym źródle
Is regular expression	Nie dotyczy	Wartość logiczna	Fałsz	Określa, czy w celu wyszukiwania określonego tekstu ma być używane wyrażenie regularne
Search for text on	Nie dotyczy	Cały ekran, Okienko pierwszego planu	Cały ekran	Określa, czy podany tekst ma być wyszukiwany na całym widocznym ekranie, czy tylko w oknie na pierwszym planie
Search mode	Brak	Całe określone źródło, tylko określony podregion, podregion względem obrazu	Całe określone źródło	Określa, czy ma być skanowany cały ekran (lub okno), czy jego zawężony podregion
Image(s)	Nie.	Lista obrazów		Obrazy określające podregion (względem lewego górnego rogu obrazu) do skanowania w poszukiwaniu podanego tekstu
X1	Tak	Wartość liczbowa		Początkowa współrzędna X podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
Tolerance	Tak	Wartość liczbowa	10	Określa, jak bardzo szukane obrazy mogą różnić się od pierwotnie wybranego obrazu
Y1	Tak	Wartość liczbowa		Początkowa współrzędna Y podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
X1	Tak	Wartość liczbowa		Początkowa współrzędna X podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
X2	Tak	Wartość liczbowa		Końcowa współrzędna X podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
Y1	Tak	Wartość liczbowa		Początkowa współrzędna Y podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
Y2	Tak	Wartość liczbowa		Końcowa współrzędna Y podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
X2	Tak	Wartość liczbowa		Końcowa współrzędna X podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
Y2	Tak	Wartość liczbowa		Końcowa współrzędna Y podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
Język aparatu Windows OCR	Brak	Chiński (uproszczony), chiński (tradycyjny), czeski, duński, holenderski, angielski, fiński, francuski, niemiecki, grecki, węgierski, włoski, japoński, koreański, norweski, polski, portugalski, rumuński, rosyjski, serbski (cyrylica), serbski (łaciński), słowacki, hiszpański, szwedzki, turecki	Angielski	Język tekstu wykrywany przez aparat Windows OCR
Użyj innego języka	Brak	Wartość logiczna	Fałsz	Określa, czy ma być używany język, który nie został określony w polu „Język aparatu Tesseract”
Język Tesseract	Brak	Angielski, niemiecki, hiszpański, francuski, włoski	Angielski	Język tekstu wykrywany przez aparat Tesseract
Skrót języka	Nie	Wartość tekstowa		Skrót aparatu Tesseract, który ma być używany. Jeśli na przykład dane to „eng.traineddata”, ustaw ten parametr na „eng”
Ścieżka danych języka	Nie.	Wartość tekstowa		Ścieżka folderu, w którym są przechowywane dane aparatu Tesseract dotyczące określonego języka
Mnożnik szerokości obrazu	Nie	Wartość liczbowa	1	Mnożnik szerokości obrazu
Mnożnik szerokości obrazu	Nie	Wartość liczbowa	1	Mnożnik wysokości obrazu
Algorytm dopasowywania obrazów	Brak	Podstawowe, zaawansowane	Podstawowe	Który algorytm obrazów ma być używany podczas wyszukiwania obrazu

Uwaga

Aparat wyrażenia regularnego usługi Power Automate to .NET. Więcej informacji na temat wyrażeń regularnych można znaleźć w temacie język wyrażenia regularnego — szybkie informacje.
Opcja Zmienna aparatu OCR zostanie w przyszłości wycofana.

Utworzone zmienne

Argument	Type	opis
LocationOfTextFoundX	Wartość liczbowa	Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna
LocationOfTextFoundY	Wartość liczbowa	Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna

Wyjątki

Wyjątek	opis
W trybie nieinterakcyjnym nie można sprawdzić, czy istnieje tekst	Wskazuje, że podczas działania w trybie nieinterakcyjnym nie można sprawdzić, czy na ekranie znajduje się tekst
Nieprawidłowe współrzędne podregionu	Wskazuje, że określone współrzędne podregionu są nieprawidłowe
Nie można przeanalizować tekstu za pomocą funkcji OCR	Wskazuje, że wystąpił błąd podczas próby przeanalizowania tekstu za pomocą funkcji OCR
Nie można utworzyć aparatu OCR	Wskazuje, że wystąpił błąd podczas próby utworzenia aparatu OCR
Folder ścieżki danych nie istnieje	Wskazuje, że określony na potrzeby przechowywania danych języka folder nie istnieje
Wybrany pakiet językowy systemu Windows nie jest zainstalowany na maszynie	Wskazuje, że wybrany pakiet językowy systemu Windows nie został zainstalowany na komputerze
Aparat OCR nie jest aktywny	Wskazuje, że aparat OCR nie jest aktywny

Zaczekaj na tekst na ekranie (OCR)

Zaczekaj, aż określony tekst zostanie wyświetlony na ekranie lub w oknie na pierwszym planie (bądź na pozycji względnej w stosunku do obrazu na ekranie lub w oknie na pierwszym planie) albo z niego zniknie, używając funkcji OCR.

Parametry wejściowe

Argument	Opcjonalnie	Akceptuje	Wartość domyślna	opis
Wait for text to	Nie dotyczy	Pojawi się, Zniknie	Pojawi się	Określa, czy należy czekać na wyświetlenie lub zniknięcie tekstu
Typ aparatu OCR	Nie	Aparat OCR systemu Windows, aparat Tesseract, zmienna aparatu OCR	Zmienna aparatu OCR	Typ aparatu OCR do użycia. Wybierz wstępnie skonfigurowany aparat OCR lub skonfiguruj nowy.
OCR engine variable	Nie	OCREngineObject		Aparat używany w celu wykonania operacji OCR
Text to find	Nie	Wartość tekstowa		Tekst do wyszukania w określonym źródle
Is regular expression	Nie dotyczy	Wartość logiczna	Fałsz	Określa, czy w celu wyszukiwania określonego tekstu ma być używane wyrażenie regularne
Search for text on	Nie dotyczy	Cały ekran, Okienko pierwszego planu	Cały ekran	Określa, czy podany tekst ma być wyszukiwany na całym widocznym ekranie, czy tylko w oknie na pierwszym planie
Search mode	Brak	Całe określone źródło, tylko określony podregion, podregion względem obrazu	Całe określone źródło	Określa, czy ma być skanowany cały ekran (lub okno), czy jego zawężony podregion
Image(s)	Nie.	Lista obrazów		Obrazy określające podregion (względem lewego górnego rogu obrazu) do skanowania w poszukiwaniu podanego tekstu
X1	Tak	Wartość liczbowa		Początkowa współrzędna X podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
Tolerance	Tak	Wartość liczbowa	10	Określa, jak bardzo szukane obrazy mogą różnić się od pierwotnie wybranego obrazu
Y1	Tak	Wartość liczbowa		Początkowa współrzędna Y podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
X1	Tak	Wartość liczbowa		Początkowa współrzędna X podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
X2	Tak	Wartość liczbowa		Końcowa współrzędna X podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
Y1	Tak	Wartość liczbowa		Początkowa współrzędna Y podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
Y2	Tak	Wartość liczbowa		Końcowa współrzędna Y podregionu, który ma być skanowany w poszukiwaniu podanego tekstu
X2	Tak	Wartość liczbowa		Końcowa współrzędna X podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
Y2	Tak	Wartość liczbowa		Końcowa współrzędna Y podregionu względnego w stosunku do określonego obrazu, który ma być skanowany w poszukiwaniu podanego tekstu
Język aparatu Windows OCR	Brak	Chiński (uproszczony), chiński (tradycyjny), czeski, duński, holenderski, angielski, fiński, francuski, niemiecki, grecki, węgierski, włoski, japoński, koreański, norweski, polski, portugalski, rumuński, rosyjski, serbski (cyrylica), serbski (łaciński), słowacki, hiszpański, szwedzki, turecki	Angielski	Język tekstu wykrywany przez aparat Windows OCR
Użyj innego języka	Brak	Wartość logiczna	Fałsz	Określa, czy ma być używany język, który nie został określony w polu „Język aparatu Tesseract”
Język Tesseract	Brak	Angielski, niemiecki, hiszpański, francuski, włoski	Angielski	Język tekstu wykrywany przez aparat Tesseract
Skrót języka	Nie	Wartość tekstowa		Skrót aparatu Tesseract, który ma być używany. Jeśli na przykład dane to „eng.traineddata”, ustaw ten parametr na „eng”
Ścieżka danych języka	Nie.	Wartość tekstowa		Ścieżka folderu, w którym są przechowywane dane aparatu Tesseract dotyczące określonego języka
Mnożnik szerokości obrazu	Nie	Wartość liczbowa	1	Mnożnik szerokości obrazu
Mnożnik szerokości obrazu	Nie	Wartość liczbowa	1	Mnożnik wysokości obrazu
Algorytm dopasowywania obrazów	Brak	Podstawowe, zaawansowane	Podstawowe	Który algorytm obrazów ma być używany podczas wyszukiwania obrazu
Niepowodzenie z powodu błędu przekroczenia limitu czasu	Brak	Wartość logiczna	Fałsz	Określ, czy chcesz, aby akcja oczekiwała bez końca, czy aby była określana jako zakończona niepowodzeniem po upływie ustawionego okresu

Uwaga

Aparat wyrażenia regularnego usługi Power Automate to .NET. Więcej informacji na temat wyrażeń regularnych można znaleźć w temacie język wyrażenia regularnego — szybkie informacje.
Opcja Zmienna aparatu OCR zostanie w przyszłości wycofana.

Utworzone zmienne

Argument	Type	opis
LocationOfTextFoundX	Wartość liczbowa	Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna
LocationOfTextFoundY	Wartość liczbowa	Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna

Wyjątki

Wyjątek	opis
W trybie nieinterakcyjnym nie można sprawdzić, czy istnieje tekst	Wskazuje, że podczas działania w trybie nieinterakcyjnym nie można sprawdzić, czy na ekranie znajduje się tekst
Nieprawidłowe współrzędne podregionu	Wskazuje, że określone współrzędne podregionu są nieprawidłowe
Nie można przeanalizować tekstu za pomocą funkcji OCR	Wskazuje, że wystąpił błąd podczas próby przeanalizowania tekstu za pomocą funkcji OCR
Nie można utworzyć aparatu OCR	Wskazuje, że wystąpił błąd podczas próby utworzenia aparatu OCR
Folder ścieżki danych nie istnieje	Wskazuje, że określony na potrzeby przechowywania danych języka folder nie istnieje
Wybrany pakiet językowy systemu Windows nie jest zainstalowany na maszynie	Wskazuje, że wybrany pakiet językowy systemu Windows nie został zainstalowany na komputerze
Aparat OCR nie jest aktywny	Wskazuje, że aparat OCR nie jest aktywny
Błąd limitu czasu	Wskazuje, że akcja zakończyła się niepowodzeniem po upływie ustawionego okresu

Wyodrębnij tekst za pomocą funkcji OCR

Wyodrębnij tekst z danego źródła za pomocą danego aparatu OCR.

Parametry wejściowe

Argument	Opcjonalnie	Akceptuje	Wartość domyślna	opis
Aparat OCR	Nie	Aparat OCR systemu Windows, aparat Tesseract, zmienna aparatu OCR	Zmienna aparatu OCR	Typ aparatu OCR do użycia. Wybierz wstępnie skonfigurowany aparat OCR lub skonfiguruj nowy
Zmienna aparatu OCR	Nie	OCREngineObject		Aparat używany w celu wykonania operacji OCR
OCR source	Nie dotyczy	Ekran, Okno pierwszego planu, Obraz na dysku	Ekran	Źródło obrazu, na którym ma zostać wykonana operacja OCR
Image file path	Nie	Plik		Ścieżka obrazu, na którym ma zostać wykonana operacja OCR
Search mode	Nie dotyczy	Całe określone źródło, tylko określony podregion, podregion względem obrazu	Całe określone źródło	Wybrany tryb dla operacji OCR
Image	Nie.	Lista obrazów		Obraz używany w celu zawężenia skanowania do podregionu, który jest względny w stosunku do określonego obrazu
Tolerance	Tak	Wartość liczbowa	10	Określa, jak bardzo obraz może różnić się od pierwotnie wybranego obrazu
X1	Tak	Wartość liczbowa		Początkowa współrzędna X podregionu używanego w celu zawężenia skanowania
X2	Tak	Wartość liczbowa		Końcowa współrzędna X podregionu używanego w celu zawężenia skanowania
Y1	Tak	Wartość liczbowa		Początkowa współrzędna Y podregionu używanego w celu zawężenia skanowania
Y2	Tak	Wartość liczbowa		Końcowa współrzędna Y podregionu używanego w celu zawężenia skanowania
Język aparatu Windows OCR	Brak	Chiński (uproszczony), chiński (tradycyjny), czeski, duński, holenderski, angielski, fiński, francuski, niemiecki, grecki, węgierski, włoski, japoński, koreański, norweski, polski, portugalski, rumuński, rosyjski, serbski (cyrylica), serbski (łaciński), słowacki, hiszpański, szwedzki, turecki	Angielski	Język tekstu wykrywany przez aparat Windows OCR
Użyj innego języka	Brak	Wartość logiczna	Fałsz	Określa, czy ma być używany język, który nie został określony w polu „Język aparatu Tesseract”
Język Tesseract	Brak	Angielski, niemiecki, hiszpański, francuski, włoski	Angielski	Język tekstu wykrywany przez aparat Tesseract
Skrót języka	Nie	Wartość tekstowa		Skrót aparatu Tesseract, który ma być używany. Jeśli na przykład dane to „eng.traineddata”, ustaw ten parametr na „eng”
Ścieżka danych języka	Nie.	Wartość tekstowa		Ścieżka folderu, w którym są przechowywane dane aparatu Tesseract dotyczące określonego języka
Mnożnik szerokości obrazu	Nie	Wartość liczbowa	1	Mnożnik szerokości obrazu
Mnożnik szerokości obrazu	Nie	Wartość liczbowa	1	Mnożnik wysokości obrazu
Czekaj na pojawienie się obrazu	Brak	Wartość logiczna	Prawda	Określa, czy należy czekać na wyświetlenie obrazu na ekranie lub w oknie na pierwszym planie, czy nie
Limit czasu	Nie	Wartość liczbowa	5	Określa czas oczekiwania na zakończenie operacji, po upływie którego wykonywanie akcji zakończy się niepowodzeniem
Algorytm dopasowywania obrazów	Brak	Podstawowe, zaawansowane	Podstawowe	Który algorytm obrazów ma być używany podczas wyszukiwania obrazu

Uwaga

Opcja Zmienna aparatu OCR zostanie w przyszłości wycofana.

Utworzone zmienne

Argument	Type	opis
OcrText	Wartość tekstowa	Wynik po wyodrębnieniu tekstu

Wyjątki

Wyjątek	Opis
Nie można wyodrębnić tekstu za pomocą funkcji OCR	Wskazuje, że wystąpił błąd podczas próby wyodrębnienia tekstu za pomocą funkcji OCR z danego źródła
Nie znaleziono pliku obrazu	Wskazuje, że plik nie istnieje w danej ścieżce
Nie znaleziono obrazu punktu orientacyjnego	Wskazuje, że obraz punktu orientacyjnego nie istnieje
W trybie nieinterakcyjnym nie można pobrać tekstu z ekranu	Wskazuje, że podczas działania w trybie nieinterakcyjnym nie można pobrać tekstu z ekranu
Nie można utworzyć aparatu OCR	Wskazuje, że wystąpił błąd podczas próby utworzenia aparatu OCR
Folder ścieżki danych nie istnieje	Wskazuje, że określony na potrzeby przechowywania danych języka folder nie istnieje
Wybrany pakiet językowy systemu Windows nie jest zainstalowany na maszynie	Wskazuje, że wybrany pakiet językowy systemu Windows nie został zainstalowany na komputerze
Aparat OCR nie jest aktywny	Wskazuje, że aparat OCR nie jest aktywny

Udostępnij za pośrednictwem

Akcje OCR

Korzystanie z aparatu OCR systemu Windows

Korzystanie z aparatu OCR Tesseract

Jeśli tekst znajduje się na ekranie (OCR)

Parametry wejściowe

Utworzone zmienne

Wyjątki

Zaczekaj na tekst na ekranie (OCR)

Parametry wejściowe

Utworzone zmienne

Wyjątki

Wyodrębnij tekst za pomocą funkcji OCR

Parametry wejściowe

Utworzone zmienne

Wyjątki

Dodatkowe zasoby