Udostępnij za pośrednictwem


Wstępnie utworzony model rozpoznawania tekstu

Wstępnie utworzony model rozpoznawania tekstu wyodrębnia wyrazy z dokumentów i obrazów do strumieni znaków czytelnych dla komputera. Ten model korzysta z najnowocześniejszej technologii optycznego rozpoznawania znaków (OCR), aby wykrywać na obrazach tekst drukowany i odręczny.

Ten model przetwarza pliki obrazów i dokumentów, aby wyodrębniać wiersze drukowanego i odręcznego tekstu.

Używanie w Power Apps

Wstępnie utworzony model rozpoznawania tekstu jest dostępny w usłudze Power Apps w ramach składnika rozpoznawania tekstu. Więcej informacji: Używanie składnika rozpoznawania tekstu w usłudze Power Apps

Używanie w usłudze Power Automate

Aby uzyskać więcej informacji na temat sposobu korzystania z tego modelu w Power Automate zobacz temat Użycie wstępnie utworzonego modelu rozpoznawania tekstu w Power Automate.

Obsługiwany język, format i rozmiar

Typy plików, które można skanować przy użyciu modelu rozpoznawania tekstu, muszą mieć następujące cechy:

  • Język tekstu drukowanego: afrikaans, albański, angika (Devanagiri), arabski, asturyjski, awadhi-hindi (Devanagiri), azerbejdżański (łaciński), baghelijski, baskijski, białoruski (cyrylica), białoruski (łacina), bhojpuri-hindi (Devanagiri), bislama, bodo (Devanagiri), bośniacki (łacina), brajbha, bretoński, bułgarski, bundeli, buriacki (cyrylica), kataloński, cebuański, chamling, chamród, chhattisgarhi (dewanagiri), chiński (uproszczony), chiński (tradycyjny), kornwalijski, korsykański, krymskotatarski (łacina), chorwacki, czeski, duński, dari, dhimal (Devanagiri), Dogri (Devanagiri), niderlandzki, angielski, erzjański (cyrylica), estoński, farerski, fidżijski, filipiński, fiński, francuski, friulski, gagauski (łaciński), galicyjski, niemiecki, gilberteński, gondi (Devanagiri), grenlandzki, gurung (Devanagiri), kreolski haitański, halbi (Devanagiri), Hani, Haryanvi, hawajski, hindi, Hmong Daw (łaciński), ho(Devanagiri), węgierski, islandzki, Inari Sami, indonezyjski, Interlingua, Inuktitut (łaciński), irlandzki, włoski, japoński, Jaunsari (Devanagiri), jawajski, Kabuverdianu, Kaczin (łac.), Kangri (Devanagiri), Karaczaj-Bałkar, Kara-Kalpak (cyrylica), Kara-Kalpak (łac.), kaszubski, kazachski (cyrylica), kazachski (łac.), Khaling, Khasi, K'iche', koreański, Korku, Koryak, Kosraean, Kumyk (cyrylica), kurdyjski (arabski), kurdyjski (łacina), kurukh (dewanagiri), kirgiski (cyrylica), lakota, łacina, litewski, dolnołużycki, lule sami, luksemburski, mahasu pahari (dewanagiri), malajski (łacina), maltański, malto (dewanagiri), manx, maoryski, marathi, mongolski (cyrylica), czarnogórski (cyrylica), czarnogórski (łaciński), neapolitański, nepalski, niueański, nogay, północny lapoński (łaciński), norweski, oksytański, osetyjski, paszto, perski, polski, portugalski, pendżabski (arabski), nadbrzeżny, rumuński, retoromański, rosyjski, sadri (devanagiri), samoański (łacina), sanskryt (dewanagari), santali (dewanagiri), szkocki, gaelicki szkocki, serbski (łacina), szerpa (devanagiri), sirmauri (devanagiri), skolt sami, słowacki, słoweński, somalijski (arabski), południowy lapoński, hiszpański, suahili (łaciński), szwedzki, tadżycki (cyrylica), tatarski (łacina), tetum, thangmi, tongijski, turecki, turkmeński (łacina), tuwiński, górnołużycki, urdu, ujgurski (arabski), uzbecki (arabski), uzbecki (arabski), uzbecki (cyrylica), uzbecki (łaciński), volapük, walser, walijski, zachodniofryzyjski, jukatecki majów, zhuang, zulu
  • Język tekstu odręcznego: angielski, chiński (uproszczony), francuski, niemiecki, włoski, japoński, koreański, portugalski, hiszpański
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Rozmiar: maksymalnie 20 MB
  • W przypadku dokumentów w formacie PDF przetwarzanych jest tylko pierwszych 2,000 stron.

Dane wyjściowe modelu

W przypadku wykrycia dokumentu model rozpoznawania tekstu wyświetli następujące informacje wyjściowe:

  • Wyniki: lista wierszy wyodrębnionych z tekstu wejściowego.
  • Tekst: ciągi zawierające wykryty wiersz tekstu.
  • BoundingBox: Cztery wartości reprezentujące pole ograniczenia, opisane przy użyciu pozycji górnej i lewej wraz z jego szerokością i wysokością.

Limity

Akcja Limit Okres odnowienia
Wywołania rozpoznawania tekstu (na środowisko) 480 60 s

Szkolenie: rozpoznawanie tekstu przy użyciu narzędzia AI Builder (moduł)