Предварительно созданная модель для распознавания текста

Статья
12/09/2024

Предварительно созданная модель распознавания текста извлекает распознаваемые слова из документов и изображений в потоки машиночитаемых символов. Для обнаружения печатных и рукописных текстов на изображениях используется современный механизм оптического распознавания символов (OCR).

Эта модель обрабатывает изображения и файлы документов для извлечения строк печатного или рукописного текста.

Использование в Power Apps

Предварительно созданную модель распознавания текста можно использовать в Power Apps с помощью компонента "Распознаватель текста". Дополнительные сведения: Использование компонента распознавания текста в Power Apps

Использование в Power Automate

О том, как использовать эту модель в Power Automate см. в статье Использование предварительно созданной модели распознавания текстов в Power Automate.

Поддерживаемый язык, формат и размер

Файлы, которые можно проверить с помощью модели распознавания текста, должны обладать следующими характеристиками:

Язык печатного текста: африкаанс, албанский, ангика (деванагири), арабский, астурийский, авади-хинди (деванагири), азербайджанский (латиница), багели, баскский, белорусский (кириллица), белорусский (латиница), Бходжпури-хинди (деванагири), бислама, бодо (деванагири), боснийский (латиница), браджбха, бретонский, болгарский, бундели, бурятский (кириллица), каталанский, кебуанский, чамлинг, чаморро, чхаттисгархи (деванагири), китайский (упрощенный), китайский (традиционный), корнуэльский, корсиканский, крымскотатарский (латиница), хорватский, чешский, датский, Дари, Дхимал (Деванагири), Догри (Деванагири), голландский, английский, эрзя (кириллица), Эстонский, фарерский, фиджийский, филиппинский, финский, французский, фриульский, гагаузский (латиница), галисийский, немецкий, гилбертский, гонди (деванагири), гренландский, гурунг (деванагири), гаитянский креольский, халби (деванагири), хани, харианви, гавайский, хинди, хмонг до (латиница), Хо (деванагири), венгерский, исландский, саамский инари, индонезийский, интерлингва, Инуктитут (латиница), ирландский, итальянский, японский, яунсари (деванагири), яванский, кабувердиану, качин (латиница), кангри (деванагири), карачаево-балкарский, кара-калпакский (кириллица), кара-калпакский (латиница), кашубский, Казахский (кириллица), Казахский (латиница), Халинг, Хаси, Киче, Корейский, Корку, Корякский, косраский, кумыкский (кириллица), курдский (арабский), курдский (латиница), курух (деванагири), киргизский (кириллица), лакота, латынь, литовский, нижнелужейский, саамский луле, люксембургский, махасу пахари (деванагири), малайский (латиница), мальтийский, мальтийский (деванагири), мэнский, маори, маратхи, монгольский (кириллица), черногорский (кириллица), Черногорский (латиница), неаполитанский, непальский, ниуэйский, ногайский, северносаамский (латиница), норвежский, окситанский, осетинский, пушту, персидский, польский, португальский, пенджабский (арабский), прибрежный, румынский, ретороманский, русский, садри (деванагири), самоанский (латиница), санскрит (деванагари), сантали (деванагири), шотландский, шотландский гэльский, Сербский (латиница), Шерпа (Деванагири), Сирмаури (Деванагири), Сколт-саамский, словацкий, словенский, сомалийский (арабский), южносаамский, испанский, суахили (латиница), шведский, таджикский (кириллица), татарский (латиница), тетум, тхангми, тонганский, турецкий, туркменский (латиница), тувинский, верхнеяпонский Лужицкий, урду, уйгурский (арабский), узбекский (арабский), узбекский (кириллица), узбекский (латиница), волапюк, вальсерский, валлийский, западно-фризский, юкатекский (майя), чжуанский, зулусский
Язык рукописного текста: английский, китайский (упрощенный), французский, немецкий, итальянский, японский, корейский, португальский, испанский
Формат:
- JPG
- PNG
- BMP
- PDF
Размер: максимум 20 МБ
Для документов PDF обрабатываются только первые 2000 страниц.

Выходные данные модели

При обнаружении документа модель распознавания текста выводит следующую информацию:

Результаты: Список строк, извлеченных из входного текста.
Текст: строки, содержащие обнаруженную строку текста.
BoundingBox: четыре значения, представляющие ограничивающий прямоугольник, описываемые с использованием верхнего и левого положений, а также его ширины и высоты.

Ограничения

Действие	Ограничение	Период возобновления действия
Вызовы распознавания текста (на среду)	480	60 секунд

Обучение. Распознавание текста с помощью AI Builder (модуль)

Поделиться через