Vordefiniertes Texterkennungsmodell
Das vordefinierte Texterkennungsmodell extrahiert Wörter aus Dokumenten und Bildern in maschinell lesbare Zeichenströme. Verwendet wird dabei hochmoderne optische Zeichenerkennung (OCR), um in Bildern gedruckten und handgeschriebenen Text zu ermitteln.
Dieses Modell verarbeitet Bilder und Dokumentdateien, um die Zeilen des gedruckten oder handgeschriebenen Texts zu extrahieren.
In Power Apps verwenden
Das vordefinierte Texterkennungsmodell ist in Power Apps mithilfe der Texterkennungskomponente verfügbar. Weitere Informationen: Verwenden der Texterkennungskomponente in Power Apps
In Power Automate verwenden
Informationen zur Verwendung dieses Modells in Power Automate erhalten Sie unter Das vordefinierte Modell zur Texterkennung in Power Automate verwenden.
Unterstützte Sprache, Format und Größe
Die Dateien, die Sie mit dem Texterkennungsmodell überprüfen können, müssen diese Eigenschaften haben:
- Sprache für Drucktext : Afrikaans, Albanisch, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Aserbaidschanisch (Latein), Bagheli, Baskisch, Belarussisch (Kyrillisch), Belarussisch (Latein), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Lateinisch), Brajbha, Bretonisch, Bulgarisch, Bundeli, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinesisch (vereinfacht), Chinesisch (traditionell), Kornisch, Korsisch, Krim Tatarisch (Latein), Kroatisch, Tschechisch, Dänisch, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Niederländisch, Englisch, Erzya (Kyrillisch), Estnisch, Färöisch, Fidschianisch, Philippinisch, Finnisch, Französisch, Friaulisch, Gagausisch (Latein), Galicisch, Deutsch, Gilbertese, Gondi (Devanagiri), Grönländisch, Gurung (Devanagiri), Haitianisches Kreolisch, Halbi (Devanagiri), Hani, Haryanvi, Hawaiianisch, Hindi, Hmong Daw (Lateinisch), Ho(Devanagiri), Ungarisch, Isländisch, Inari-Samisch, Indonesisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Jaunsari (Devanagiri), Javanisch, Kabuverdianu, Kachin (Latein), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Kyrillisch), Kara-Kalpak (Latein), Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Latein), Khaling, Khasi, K'iche', Koreanisch, Korku, Koryak, Kosraean, Kumyk (Kyrillisch), Kurdisch (Arabisch), Kurdisch (Latein), Kurukh (Devanagiri), Kirgisisch (Kyrillisch), Lakota, Latein, Litauisch, Niedersorbisch, Lulesami, Luxemburgisch, Mahasu Pahari (Devanagiri), Malaiisch (Latein), Maltesisch, Malto (Devanagiri), Manx, Maori, Marathi, Mongolisch (Kyrillisch), Montenegrinisch (Kyrillisch), Montenegrinisch (Lateinisch), Neapolitanisch, Nepali, Niuean, Nogay, Nordsamisch (Lateinisch), Norwegisch, Okzitanisch, Ossetisch, Paschtu, Persisch, Polnisch, Portugiesisch, Punjabi (Arabisch), Ripuarisch, Rumänisch, Rätoromanisch, Russisch, Sadri (Devanagiri), Samoanisch (Latein), Sanskrit (Devanagari), Santali (Devanagiri), Schottisch, Schottisches Gälisch, Serbisch (Latein), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skoltsamisch, Slowakisch, Slowenisch, Somali (Arabisch), Südsamisch, Spanisch, Suaheli (Lateinisch), Schwedisch, Tadschikisch (Kyrillisch), Tatarisch (Lateinisch), Tetum, Thangmi, Ton Gan, Türkisch, Turkmenisch (Lateinisch), Tuwinisch, Obersorbisch, Urdu, Uigurisch (Arabisch), Usbekisch (Arabisch), Usbekisch (Kyrillisch), Usbekisch (Lateinisch), Volapük, Walser, Walisisch, Westfriesisch, Yucatec Maya, Zhuang, Zulu-
- Sprache für handgeschriebenen Text : Englisch, Chinesisch (vereinfacht), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Spanisch
-
Format:
- JPG
- PNG
- BMP
- Größe: max. 20 MB
- Bei PDF-Dokumenten werden nur die ersten 2,000 Seiten verarbeitet.
Modellausgabe
Wenn ein Dokument erkannt wird, gibt das Texterkennungsmodell die folgenden Informationen aus:
- Ergebnisse: Eine Liste der aus dem Eingabetext extrahierten Zeilen.
- Text: Zeichenfolgen, welche die erkannten Textzeilen enthalten.
- BoundingBox: Vier Werte, die das umgebende Feld darstellen, das anhand der Positionen oben und links sowie der Breite und Höhe beschrieben wird
Grenzwerte
Action | Limit | Erneuerungszeitraum |
---|---|---|
Aufruf der Texterkennung (pro Umgebung) | 480 | 60 Sekunden |