Изучение параметров распознавания искусственного интеллекта Azure для чтения текста
Azure AI предоставляет две различные функции, которые считывают текст из документов и изображений, один из них в Службе визуального распознавания ИИ Azure, а другой — в Azure AI Document Intelligence. Существует перекрытие того, что предоставляет каждая служба, однако каждая из них оптимизирована для результатов в зависимости от того, что такое входные данные.
- Оптическое распознавание символов анализа изображений (OCR):
- Используйте эту функцию для общих неструктурированных документов с меньшим количеством текста или изображений, содержащих текст.
- Результаты возвращаются немедленно (синхронно) из одного вызова API.
- Имеет функции для анализа изображений после извлечения текста, включая обнаружение объектов, описание или классификацию изображения, создание смарт-обрезанных эскизов и многое другое.
- Примеры: уличные знаки, рукописные заметки и знаки магазина.
- Аналитика документов:
- Эта служба используется для чтения небольших и больших объемов текста из изображений и ДОКУМЕНТОВ PDF.
- Эта служба использует контекст и структуру документа для повышения точности.
- Начальный вызов функции возвращает идентификатор асинхронной операции, который необходимо использовать в последующем вызове для получения результатов.
- Примеры: квитанции, статьи и счета.
Вы можете получить доступ к обеим технологиям через REST API или клиентскую библиотеку. В этом модуле мы сосредоточимся на функции OCR в анализе изображений. Если вы хотите узнать больше о аналитике документов, ознакомьтесь с этим модулем.