Изучение параметров распознавания искусственного интеллекта Azure для чтения текста

Завершено

Azure AI предоставляет две различные функции, которые считывают текст из документов и изображений, один из них в Службе визуального распознавания ИИ Azure, а другой — в Azure AI Document Intelligence. Существует перекрытие того, что предоставляет каждая служба, однако каждая из них оптимизирована для результатов в зависимости от того, что такое входные данные.

  • Оптическое распознавание символов анализа изображений (OCR):
    • Используйте эту функцию для общих неструктурированных документов с меньшим количеством текста или изображений, содержащих текст.
    • Результаты возвращаются немедленно (синхронно) из одного вызова API.
    • Имеет функции для анализа изображений после извлечения текста, включая обнаружение объектов, описание или классификацию изображения, создание смарт-обрезанных эскизов и многое другое.
    • Примеры: уличные знаки, рукописные заметки и знаки магазина.
  • Аналитика документов:
    • Эта служба используется для чтения небольших и больших объемов текста из изображений и ДОКУМЕНТОВ PDF.
    • Эта служба использует контекст и структуру документа для повышения точности.
    • Начальный вызов функции возвращает идентификатор асинхронной операции, который необходимо использовать в последующем вызове для получения результатов.
    • Примеры: квитанции, статьи и счета.

Вы можете получить доступ к обеим технологиям через REST API или клиентскую библиотеку. В этом модуле мы сосредоточимся на функции OCR в анализе изображений. Если вы хотите узнать больше о аналитике документов, ознакомьтесь с этим модулем.