文本识别预生成模型
文本识别预生成模型将字词从文档和图像提取到计算机可读的字符流中。 它使用最先进的光学字符识别 (OCR) 来检测图像中的打印文本和手写文本。
此模型处理图像和文档文件,以提取打印文本或手写文本的各行。
在 Power Apps 中使用
可通过文本识别器组件在 Power Apps 中使用预生成的文本识别模型。 详细信息:在 Power Apps 中使用文本识别器组件
在 Power Automate 中使用
有关如何在 Power Automate 中使用此模型的信息,请参阅在 Power Automate 中使用文本识别预生成模型。
支持的语言、格式和大小
可以用文本识别模型扫描的文件必须具有以下特征:
- 印刷文本语言:南非荷兰语、阿尔巴尼亚语、安吉卡语(Devanagiri)、阿拉伯语、阿斯图里亚斯语、阿瓦迪 - 印地语(Devanagiri)、阿塞拜疆语(拉丁语)、巴赫利语、巴斯克语、白俄罗斯语(西里尔语)、白俄罗斯语(拉丁语)、博杰普尔 - 印地语(Devanagiri)、比斯拉马语、博多语(Devanagiri)、波斯尼亚语(拉丁语)、布拉伊巴语、布列塔尼语、保加利亚语、邦德利语、布里亚特语(西里尔语)、加泰罗尼亚语、宿务语、查姆林语、查莫罗语、恰蒂斯加尔希语(Devanagiri)、中文(简体)、中文(繁体)、康沃尔语、科西嘉语、克里米亚鞑靼语(拉丁语)、克罗地亚语、捷克语、丹麦语、达里语、迪马尔语(Devanagiri)、多格里语(Devanagiri)、荷兰语、英语、Erzya(西里尔语)、爱沙尼亚语、法罗语、斐济语、菲律宾语、芬兰语、法语、弗留利安语、加告兹语(拉丁语)、加利西亚语、德语、吉尔伯特语、贡迪语(Devanagiri)、格陵兰语、古隆语(Devanagiri)、海地克里奥尔语、哈尔比语(Devanagiri)、哈尼语、哈里亚维语、夏威夷语、印地语、苗语(拉丁语)、Ho(Devanagiri)、匈牙利语、冰岛语、伊纳里萨米语、印度尼西亚语、国际语、因纽特语(拉丁语)、爱尔兰语、意大利语、日语、Jaunsari(Devanagiri)、爪哇语、Kabuverdianu,克钦语(拉丁语),康格里语(Devanagiri),卡拉恰伊 - 巴尔卡尔,卡拉 - 卡尔帕克语(西里尔语),Kara-Kalpak(拉丁语),卡舒比语,哈萨克语(西里尔语),哈萨克语(拉丁语),哈灵语,卡西语,K'iche',朝鲜语,科尔库语,高里亚克语,科斯雷安语,库梅克语(西里尔字母),库尔德语(阿拉伯语),库尔德语(拉丁语),库鲁克语(梵文),吉尔吉斯语(西里尔文),拉科塔语,拉丁文,立陶宛语,下索布语,吕勒萨米语,卢森堡语,马哈苏帕哈里语(梵文),马来语(拉丁文),Maltese,Malto(梵文),马恩岛,毛利语,马拉地语,蒙古语(西里尔语)、黑山语(西里尔语)、黑山语(拉丁语)、那不勒斯语、尼泊尔语、纽埃语、诺盖语、北萨米语(拉丁语)、挪威语、奥克西坦语、奥塞梯语、普什图语、波斯语、波兰语、葡萄牙语、旁遮普语(阿拉伯语)、里普亚语、罗马尼亚语、罗曼什语、俄语、萨德里语(Devanagiri)、萨摩亚语(拉丁语)、梵语(Devanagari)、桑塔利语(Devanagiri)、苏格兰语、苏格兰盖尔语、塞尔维亚语(拉丁语)、夏尔巴语(Devanagiri)、锡尔毛里语(Devanagiri)、斯科尔特萨米语、斯洛伐克语、斯洛文尼亚语、索马里语(阿拉伯语)、南萨米语、西班牙语、斯瓦希里语(拉丁语)、瑞典语、塔吉克语(西里尔文)、鞑靼语(拉丁语)、德顿语、唐米语、汤加语、土耳其语、土库曼语(拉丁语)、图瓦语、上索布语、乌尔都语、维吾尔语(阿拉伯语)、乌兹别克语(阿拉伯语)、乌兹别克语(西里尔语)、乌兹别克语(拉丁语)、沃拉普克语、瓦尔瑟语、威尔士语、西弗里斯兰语、尤卡特克玛雅语、壮语、祖鲁语
- 手写文本语言:英语、中文(简体)、法语、德语、意大利语、日语、韩语、葡萄牙语、西班牙语
- 格式:
- JPG
- PNG
- BMP
- 大小:最大 20 MB
- 对于 PDF 文档,将仅处理前 2,000 个页面。
模型输出
如果检测到文档,文本识别模型将输出以下信息:
- 结果:从输入文本中提取的行列表。
- Text:包含检测到的文本行的字符串。
- BoundingBox:表示边界框的四个值,使用顶部和左侧位置及其宽度和高度进行描述。
限额
操作 | 限制 | 续订期 |
---|---|---|
文本识别调用(每个环境) | 480 | 60 秒 |