文字辨識預建模型
文字辨識預建模型可從文件和影像中,將文字擷取到電腦可讀取的字元資料流。 其使用最先進的光學字元辨識 (OCR) 來偵測影像中的印刷與手寫文字。
此模型會處理影像與文件檔案,以擷取印刷或手寫文字的行。
在 Power Apps 中使用
您可以透過文字辨識器元件,在 Power Apps 中使用文字辨識預建模型。 其他資訊:在 Power Apps 中使用文字辨識器元件
在 Power Automate 中使用
如需如何在 Power Automate 中使用此模型的資訊,請參閱在 Power Automate 中使用文字辨識預建模型。
支援的語言、格式和大小
您可以使用文字辨識模型掃描的檔案須具備下列特性:
- 印刷文本語言:南非荷蘭語、阿爾巴尼亞語、安吉卡語 (Devanagiri)、阿拉伯語、阿斯圖里亞斯語、阿瓦迪 - 印地語 (Devanagiri)、亞塞拜然語 (拉丁語)、巴赫利語、巴斯克語、白俄羅斯語 (西里爾語)、白俄羅斯語 (拉丁語)、博傑普爾 - 印地語 (Devanagiri)、比斯拉馬語、博多語 (Devanagiri)、波斯尼亞語 (拉丁語)、布拉伊巴語、布列塔尼語、保加利亞文、邦德利語、布里亞特語 (西里爾語)、加泰羅尼亞語、宿務語、查姆林語、查莫羅語、恰蒂斯加爾希語 (Devanagiri)、中文 (簡體)、中文 (繁體)、康沃爾語、科西嘉語、克里米亞韃靼語 (拉丁語)、克羅埃西亞語、捷克語、丹麥語、達里語、迪瑪律語 (Devanagiri)、多格裡語 (Devanagiri)、荷蘭語、英語、Erzya (西里爾語)、愛沙尼亞語、法羅語、斐濟語、菲律賓文、芬蘭語、法語、弗留利安語、加告茲語 (拉丁語)、加利西亞語、德語、吉伯特語、貢迪語 (Devanagiri)、格陵蘭語、古隆語 (Devanagiri)、海地克里奧爾語、哈爾比語 (Devanagiri)、哈尼語、哈里亞維語、夏威夷語、印地語、苗語 (拉丁語)、Ho (Devanagiri)、匈牙利語、冰島語、伊納里薩米語、印尼語、國際語、因紐特語 (拉丁語)、愛爾蘭語、義大利語、日語、Jaunsari (Devanagiri)、爪哇語、卡布韋爾迪亞努、克欽語 (拉丁語)、康格裡語 (梵文)、卡拉恰伊 - 巴爾卡爾、卡拉 - 卡爾派克語 (西里爾文)、卡拉 - 卡爾派克語 (拉丁文)、卡舒比語、哈薩克語 (西裡爾文)、哈薩克語 (拉丁文)、哈林語、卡西語、基切語、韓文、科爾庫語、科里亞克語、科斯雷安語、庫梅克語 (西里爾文)、庫爾德語 (阿拉伯文)、庫爾德語 (拉丁文)、庫魯赫語 (梵文)、吉爾吉斯語 (西里爾文)、拉科塔語、拉丁文、立陶宛語、下索布語、呂勒薩米語、盧森堡語、馬哈蘇帕哈裡語 (梵文)、馬來語 (拉丁文)、馬爾他語、瑪律托語 (梵文)、馬恩島、毛利語、馬拉地語、蒙古語 (西里爾文)、黑山語 (西里爾文),黑山語 (拉丁文),那不勒斯語,尼泊爾語,紐埃語,諾蓋語,北薩米文 (拉丁語),挪威語,奧克西坦語,奧塞梯語,普什圖語,波斯語,波蘭語,葡萄牙語,旁遮普語 (阿拉伯文),里普亞語,羅馬尼亞語,羅曼什語,俄語,俄語,薩德里語 (Devanagiri),薩摩亞語 (拉丁語),梵語 (Devanagari),桑塔利語 (Devanagiri),蘇格蘭語,蘇格蘭蓋爾文,塞爾維亞文 (拉丁語),夏爾巴人 (Devanagiri),錫爾模里語 (Devanagiri),斯科爾特薩米語,斯洛伐克語,斯洛維尼亞語,索馬里文 (阿拉伯文),南薩米語,西班牙文,斯瓦希里語 (拉丁语),瑞典文,塔吉克語 (西里爾文)、韃靼語 (拉丁文)、泰頓語、唐米語、湯加語、土耳其語、土庫曼語 (拉丁文)、圖瓦語、上索布語、烏爾都語、維吾爾文 (阿拉伯文)、烏茲別克語 (阿拉伯文)、烏茲別克語 (西里爾文)、烏茲別克語 (拉丁文)、沃拉普克語、瓦爾瑟語、威爾士語、西弗里斯蘭語、尤卡坦瑪雅語、壯語、祖魯文
- 手寫文本語言:英語、中文 (簡體)、法語、德語、義大利語、日語、韓語、葡萄牙語、西班牙文
- 格式:
- JPG
- PNG
- BMP
- 大小:最大 20 MB
- 對於 PDF 文件,僅處理前 2,000 頁。
模型輸出
如果偵測到文件,文字辨識模型會輸出下列資訊:
- 結果:從輸入文本中提取的行清單。
- Text:包含檢測到的文本行的字串。
- BoundingBox:表示邊界框的四個值,使用頂部和左側位置及其寬度和高度進行描述。
限制
動作 | 限制 | 更新期間 |
---|---|---|
文字辨識呼叫 (每個環境) | 480 | 60 秒鐘 |