Vordefiniertes Texterkennungsmodell
Das vordefinierte Texterkennungsmodell extrahiert Wörter aus Dokumenten und Bildern in maschinell lesbare Zeichenströme. Verwendet wird dabei hochmoderne optische Zeichenerkennung (OCR), um in Bildern gedruckten und handgeschriebenen Text zu ermitteln.
Dieses Modell verarbeitet Bilder und Dokumentdateien, um die Zeilen des gedruckten oder handgeschriebenen Texts zu extrahieren.
In Power Apps verwenden
Das vordefinierte Texterkennungsmodell ist in Power Apps mithilfe der Texterkennungskomponente verfügbar. Weitere Informationen: Verwenden der Texterkennungskomponente in Power Apps
In Power Automate verwenden
Informationen zur Verwendung dieses Modells in Power Automate erhalten Sie unter Das vordefinierte Modell zur Texterkennung in Power Automate verwenden.
Unterstützte Sprache, Format und Größe
Die Dateien, die Sie mit dem Texterkennungsmodell überprüfen können, müssen diese Eigenschaften haben:
- Sprache für gedruckte Texte: Afrikaans, Albanisch, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Aserbaidschanisch (Latein), Bagheli, Baskisch, Belarussisch (Kyrillisch), Belarussisch (Latein), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Latein), Brajbha, Bretonisch, Bulgarisch, Bundeli, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinesisch (vereinfacht), Chinesisch (traditionell), Kornisch, Korsisch, Krimtatarisch (Latein), Kroatisch, Tschechisch, Dänisch, Dari, Dhimal ( Devanagiri), Dogri (Devanagiri), Niederländisch, Englisch, Erzya (Kyrillisch), Estnisch, Färöisch, Fidschisch, Philippinisch, Finnisch, Französisch, Friaulisch, Gagausisch (Latein), Galizisch, Deutsch, Gilbertesisch, Gondi (Devanagiri), Grönländisch, Gurung (Devanagiri), Haitianisch-Kreolisch, Halbi (Devanagiri), Hani, Haryanvi, Hawaiianisch, Hindi, Hmong Daw (Lateinisch), Ho(Devanagiri), Ungarisch, Isländisch, Inarisamisch, Indonesisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Jaunsari (Devanagiri), Javanisch, Kabuverdianu, Kachin (Latein), Kangri (Devanagiri), Karatschai-Balkar, Kara-Kalpak (Kyrillisch), Kara-Kalpak (Latein), Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Latein), Khaling, Khasi, K'iche', Koreanisch, Korku, Koryak, Kosraean, Kumyk (Kyrillisch), Kurdisch (Arabisch), Kurdisch (Latein), Kurukh (Devanagiri), Kirgisisch (Kyrillisch), Lakota, Latein, Litauisch, Niedersorbisch, Lulesamisch, Luxemburgisch, Mahasu Pahari (Devanagiri), Malaiisch (Latein), Maltesisch, Malto (Devanagiri), Manx, Maori, Marathi, Mongolisch (Kyrillisch). ), Montenegrinisch (Kyrillisch), Montenegrinisch (Lateinisch), Neapolitanisch, Nepali, Niueanisch, Nogai, Nordsamisch (Latein), Norwegisch, Okzitanisch, Ossetisch, Paschtu, Persisch, Polnisch, Portugiesisch, Punjabi (Arabisch), Ripuarisch, Rumänisch, Rätoromanisch, Russisch, Sadri (Devanagiri), Samoanisch (Latein), Sanskrit (Devanagari), Santali (Devanagiri), Schottisch, Schottisch-Gälisch, Serbisch (Latein), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slowakisch, Slowenisch, Somali (Arabisch), Südsamisch, Spanisch, Suaheli (Latein), Schwedisch, Tadschikisch (Kyrillisch), Tatarisch (Latein), Tetum, Thangmi, Tongaisch, Türkisch, Turkmenisch (Latein), Tuwinisch, Obersorbisch, Urdu, Uigurisch (Arabisch), Usbekisch (Arabisch), Usbekisch (Kyrillisch), Usbekisch (Latein), Volapük, Walser, Walisisch, Westfriesisch, Yukatekisches Maya, Zhuang, Zulu
- Sprache für handschriftlichen Text: Englisch, Chinesisch (vereinfacht), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Spanisch
- Format:
- JPG
- PNG
- BMP
- Größe: maximal 20 MB
- Bei PDF-Dokumenten werden nur die ersten 2,000 Seiten verarbeitet.
Modellausgabe
Wenn ein Dokument erkannt wird, gibt das Texterkennungsmodell die folgenden Informationen aus:
- Ergebnisse: Eine Liste von Zeilen, die aus dem Eingabetext extrahiert wurden.
- Text: Zeichenfolgen, die die erkannte Textzeile enthalten.
- BoundingBox: Vier Werte, die den Begrenzungsrahmen darstellen, beschrieben durch die obere und linke Position sowie seine Breite und Höhe.
Grenzwerte
Aktion | Limit | Erneuerungszeitraum |
---|---|---|
Aufruf der Texterkennung (pro Umgebung) | 480 | 60 Sekunden |