Поделиться через


Использование распознавания содержимого в Azure AI Foundry

Azure AI Foundry — это комплексная платформа для разработки и развертывания создаваемых приложений ИИ и API. Azure AI Content Understanding — это новая созданная служба ИИ Azure, которая анализирует файлы из различных модальности и извлекает структурированные выходные данные в пользовательском формате полей. Источники входных данных включают документ, видео, изображение и звуковые данные. В этом руководстве показано, как создать и проверить анализатор распознавания содержимого в ИИ Foundry. Затем можно использовать извлеченные данные в любом приложении или процессе, который вы создаете с помощью простого вызова REST API. Анализаторы анализа содержимого полностью настраиваются. Вы можете создать анализатор, создав собственную схему с нуля или используя предлагаемый шаблон анализатора, предлагаемый для решения распространенных сценариев для каждого типа данных.

Снимок экрана: рабочий процесс

Необходимые компоненты

Чтобы приступить к работе, убедитесь, что у вас есть следующие ресурсы и разрешения:

  • Подписка Azure. Если у вас еще нет подписки Azure, создайте бесплатную учетную запись, прежде чем начинать работу.

  • Центр Azure AI Foundry необходим для управления ресурсами, подготовленными в проекте "Понимание содержимого", и он должен быть создан в одном из следующих поддерживаемых регионов: westus, swedencentral или australiaeast. Если вы впервые создаете центр, см. статью "Как создать и управлять центром Azure AI Foundry", чтобы узнать больше. Важно отметить, что вам нужны необходимые разрешения для создания концентратора, или администратор может создать его для вас.

    • Если ваша роль является участником или владельцем, вы можете продолжить создание собственного концентратора.

    • Если ваша роль является разработчиком ИИ Azure, центр должен быть создан, прежде чем завершить работу с этим кратким руководством. Роль пользователя должна быть разработчиком, участником или владельцем Azure AI в центре. Подробнее см. в статьях Концентраторы и Роли Azure AI.

Внимание

Если в вашей организации требуется настроить безопасность ресурсов хранения, ai Foundry в настоящее время не предоставляет все функции, которые можно настроить. Ознакомьтесь с ключами доступа к API служб ИИ Azure, чтобы создать ресурсы, соответствующие требованиям организации, с помощью портал Azure. Политика, применяемая в Azure в области концентратора, применяется ко всем проектам, управляемым под ним. Чтобы узнать, как использовать управляемые клиентом ключи, обратитесь к хранилищу зашифрованных данных на стороне службы при использовании ключей, управляемых клиентом. Вернитесь сюда при создании ресурсов.

Создание первого проекта "Понимание содержимого" в ИИ Foundry

Примечание.

Тип проекта Content Understanding отличается от типа проекта Generative AI, который также доступен в Ai Foundry.

Чтобы попробовать службу "Распознавание содержимого" в ИИ Foundry, необходимо создать проект "Понимание содержимого". Вы можете получить доступ к службе "Основные сведения о содержимом" из:

На странице "Основные сведения о содержимом" выберите Create a new Content Understanding Project:

Снимок экрана: страница

Выполните действия в мастере создания проекта и начните с выбора уже созданного концентратора. Когда центр был создан, он должен подготовить ресурс служб ИИ и контейнер хранилища BLOB-объектов, выбранный по умолчанию. Можно также создать его с помощью мастера или портал Azure. На следующей схеме показана роль центров, ресурсов и проектов в ИИ Foundry.

Схема архитектуры концентратора, проекта и ресурса.

После завершения действий по настройке выберите Create project.

Предоставление общего доступа к проекту по пониманию содержимого

Чтобы предоставить общий доступ к созданному проекту "Понимание содержимого" и управлять ими, перейдите в Центр управления, расположенный в нижней части навигации проекта:

Снимок экрана: расположение центра управления.

Вы можете управлять пользователями и отдельными ролями здесь:

Снимок экрана: раздел

Создание первого анализатора

Теперь, когда все настроено для начала, мы можем пошаговые инструкции по созданию первого анализатора, начиная со сборки схемы. Схема — это настраиваемая платформа, которая позволяет анализатору извлекать аналитические сведения из данных. В этом примере схема создается для извлечения ключевых данных из документа счета, но вы можете привести любые типы данных, а шаги остаются неизменными. Полный список поддерживаемых типов файлов см . в ограничениях входных файлов.

  1. Отправьте пример файла документа счета или любые другие данные, относящиеся к вашему сценарию.

    Снимок экрана: шаг отправки в пользовательском интерфейсе.

  2. Затем служба "Распознавание содержимого" предлагает шаблоны анализаторов на основе типа контента. Ознакомьтесь с шаблонами анализаторов, предлагаемыми с помощью Службы " Понимание содержимого", чтобы получить полный список всех шаблонов, предлагаемых для каждого модальности. В этом примере выберите анализ документов, чтобы создать собственную схему, адаптированную к сценарию счета. При использовании собственных данных выберите шаблон анализатора, который лучше всего соответствует вашим потребностям, или создайте собственный. Полный список доступных шаблонов см . в шаблонах анализатора.

  3. Нажмите кнопку создания.

    Снимок экрана: шаблоны анализаторов.

  4. Добавьте поля в схему:

    • Укажите четкие и простые имена полей. Некоторые примеры полей могут включать имя поставщика, элементы, цену.

    • Укажите тип значения для каждого поля (строки, даты, числа, списки, группы). Дополнительные сведения см. в разделеподдерживаемых типов полей.

    • [Необязательно] Предоставьте описания полей, чтобы объяснить требуемое поведение, включая любые исключения или правила.

    • Укажите метод для создания значения для каждого поля.

  5. Выберите Сохранить.

    Снимок экрана: завершенная схема.

  6. После завершения схемы служба Content Understanding теперь создает выходные данные в примерах данных. На этом шаге можно добавить дополнительные данные для проверки точности анализатора или внесения изменений в схему при необходимости.

    Снимок экрана: шаг тестирования схемы.

  7. Когда вы удовлетворены качеством выходных данных, выберите анализатор сборки. Это действие создает идентификатор анализатора, который можно интегрировать в собственные приложения, что позволяет вызывать анализатор из кода.

    Снимок экрана: встроенный анализатор.

Теперь вы успешно создали первый анализатор анализа содержимого и готовы к извлечению аналитических сведений из данных. Ознакомьтесь с кратким руководством. ИНТЕРФЕЙСы REST API службы "Распознавание содержимого ИИ Azure", чтобы использовать REST API для вызова анализатора.

Следующие шаги

  • В этом кратком руководстве вы узнали, как создать анализатор распознавания контента с помощью Azure AI Foundry. Сведения об использовании REST API для распознавания содержимого см. в кратком руководстве по REST API.