Vordefiniertes Texterkennungsmodell

Artikel
12/09/2024

Das vordefinierte Texterkennungsmodell extrahiert Wörter aus Dokumenten und Bildern in maschinell lesbare Zeichenströme. Verwendet wird dabei hochmoderne optische Zeichenerkennung (OCR), um in Bildern gedruckten und handgeschriebenen Text zu ermitteln.

Dieses Modell verarbeitet Bilder und Dokumentdateien, um die Zeilen des gedruckten oder handgeschriebenen Texts zu extrahieren.

In Power Apps verwenden

Das vordefinierte Texterkennungsmodell ist in Power Apps mithilfe der Texterkennungskomponente verfügbar. Weitere Informationen: Verwenden der Texterkennungskomponente in Power Apps

In Power Automate verwenden

Informationen zur Verwendung dieses Modells in Power Automate erhalten Sie unter Das vordefinierte Modell zur Texterkennung in Power Automate verwenden.

Unterstützte Sprache, Format und Größe

Die Dateien, die Sie mit dem Texterkennungsmodell überprüfen können, müssen diese Eigenschaften haben:

Sprache für gedruckte Texte: Afrikaans, Albanisch, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Aserbaidschanisch (Latein), Bagheli, Baskisch, Belarussisch (Kyrillisch), Belarussisch (Latein), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Latein), Brajbha, Bretonisch, Bulgarisch, Bundeli, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinesisch (vereinfacht), Chinesisch (traditionell), Kornisch, Korsisch, Krimtatarisch (Latein), Kroatisch, Tschechisch, Dänisch, Dari, Dhimal ( Devanagiri), Dogri (Devanagiri), Niederländisch, Englisch, Erzya (Kyrillisch), Estnisch, Färöisch, Fidschisch, Philippinisch, Finnisch, Französisch, Friaulisch, Gagausisch (Latein), Galizisch, Deutsch, Gilbertesisch, Gondi (Devanagiri), Grönländisch, Gurung (Devanagiri), Haitianisch-Kreolisch, Halbi (Devanagiri), Hani, Haryanvi, Hawaiianisch, Hindi, Hmong Daw (Lateinisch), Ho(Devanagiri), Ungarisch, Isländisch, Inarisamisch, Indonesisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Jaunsari (Devanagiri), Javanisch, Kabuverdianu, Kachin (Latein), Kangri (Devanagiri), Karatschai-Balkar, Kara-Kalpak (Kyrillisch), Kara-Kalpak (Latein), Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Latein), Khaling, Khasi, K'iche', Koreanisch, Korku, Koryak, Kosraean, Kumyk (Kyrillisch), Kurdisch (Arabisch), Kurdisch (Latein), Kurukh (Devanagiri), Kirgisisch (Kyrillisch), Lakota, Latein, Litauisch, Niedersorbisch, Lulesamisch, Luxemburgisch, Mahasu Pahari (Devanagiri), Malaiisch (Latein), Maltesisch, Malto (Devanagiri), Manx, Maori, Marathi, Mongolisch (Kyrillisch). ), Montenegrinisch (Kyrillisch), Montenegrinisch (Lateinisch), Neapolitanisch, Nepali, Niueanisch, Nogai, Nordsamisch (Latein), Norwegisch, Okzitanisch, Ossetisch, Paschtu, Persisch, Polnisch, Portugiesisch, Punjabi (Arabisch), Ripuarisch, Rumänisch, Rätoromanisch, Russisch, Sadri (Devanagiri), Samoanisch (Latein), Sanskrit (Devanagari), Santali (Devanagiri), Schottisch, Schottisch-Gälisch, Serbisch (Latein), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slowakisch, Slowenisch, Somali (Arabisch), Südsamisch, Spanisch, Suaheli (Latein), Schwedisch, Tadschikisch (Kyrillisch), Tatarisch (Latein), Tetum, Thangmi, Tongaisch, Türkisch, Turkmenisch (Latein), Tuwinisch, Obersorbisch, Urdu, Uigurisch (Arabisch), Usbekisch (Arabisch), Usbekisch (Kyrillisch), Usbekisch (Latein), Volapük, Walser, Walisisch, Westfriesisch, Yukatekisches Maya, Zhuang, Zulu
Sprache für handschriftlichen Text: Englisch, Chinesisch (vereinfacht), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Spanisch
Format:
- JPG
- PNG
- BMP
- PDF
Größe: maximal 20 MB
Bei PDF-Dokumenten werden nur die ersten 2,000 Seiten verarbeitet.

Modellausgabe

Wenn ein Dokument erkannt wird, gibt das Texterkennungsmodell die folgenden Informationen aus:

Ergebnisse: Eine Liste von Zeilen, die aus dem Eingabetext extrahiert wurden.
Text: Zeichenfolgen, die die erkannte Textzeile enthalten.
BoundingBox: Vier Werte, die den Begrenzungsrahmen darstellen, beschrieben durch die obere und linke Position sowie seine Breite und Höhe.

Grenzwerte

Aktion	Limit	Erneuerungszeitraum
Aufruf der Texterkennung (pro Umgebung)	480	60 Sekunden

Training: Text mit AI Builder erkennen (Modul)

Freigeben über

Vordefiniertes Texterkennungsmodell

In Power Apps verwenden

In Power Automate verwenden

Unterstützte Sprache, Format und Größe

Modellausgabe

Grenzwerte

Feedback

Zusätzliche Ressourcen

Freigeben über

Vordefiniertes Texterkennungsmodell

In Power Apps verwenden

In Power Automate verwenden

Unterstützte Sprache, Format und Größe

Modellausgabe

Grenzwerte

Verwandte Informationen

Feedback

Zusätzliche Ressourcen