Поделиться через


Начало работы: Document Intelligence Studio

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии:синяя галочка флажок v3.1 (GA) версии 3.0 (GA) синяя галочка

Document Intelligence Studio — это онлайн-средство для визуального изучения, понимания и интеграции функций из службы аналитики документов в приложениях. Чтобы приступить к работе, ознакомьтесь с предварительно обученными моделями с примерами или собственными документами. Кроме того, вы можете создавать проекты для формирования пользовательских моделей шаблонов и ссылаться на модели в приложениях, используя пакет SDK для Python и другие краткие руководства.

Предварительные требования для новых пользователей

Чтобы использовать Document Intelligence Studio, вам потребуются следующие ресурсы и параметры:

Совет

Создайте ресурс служб искусственного интеллекта Azure, если вы планируете получить доступ к нескольким службам ИИ Azure в рамках одной конечной точки или ключа. Только для доступа к аналитике документов создайте ресурс аналитики документов. Обратите внимание, что если вы планируете использовать проверку подлинности Microsoft Entra, вам потребуется один ресурс службы.

Аналитика документов теперь поддерживает проверку подлинности маркера AAD, дополнительную к локальной (на основе ключа) аутентификации при доступе к ресурсам аналитики документов и учетным записям хранения. Обязательно следуйте приведенным ниже инструкциям по настройке правильных ролей доступа, особенно если ресурсы применяются с DisableLocalAuth политикой.

  • Правильное назначение ролей Azure для анализа документов и предварительно созданных моделей, для различных сценариев требуются следующие назначения ролей.

    • Базовый ✔️ пользователь Cognitive Services: эта роль необходима для ресурса аналитики документов или служб искусственного интеллекта Azure для ввода страницы анализа.

    • Расширенный ✔️ участник: эта роль необходима для создания группы ресурсов, службы аналитики документов или ресурса служб ИИ Azure.

      Дополнительные сведения об авторизации см. в политиках авторизации Document Intelligence Studio.

      Примечание.

      Если локальная (на основе ключа) проверка подлинности отключена для ресурса службы аналитики документов, обязательно получите роль пользователя Cognitive Services и маркер AAD будет использоваться для проверки подлинности запросов в Document Intelligence Studio. Роль участника позволяет только перечислять ключи, но не дает разрешения на использование ресурса при отключении доступа к ключам.

  • После настройки ресурса можно попробовать различные модели, предлагаемые Document Intelligence Studio. На первой странице выберите любую модель аналитики документов, чтобы попытаться использовать без кода.

  • Чтобы протестировать любую из предварительно созданных моделей или анализа документов, выберите модель и используйте один из примеров документов или отправьте собственный документ для анализа. Результат анализа отображается справа в окне содержимого-результирующий код.

  • Пользовательские модели должны быть обучены в документах. Общие сведения о пользовательских моделях см . в обзоре пользовательских моделей.

Проверка подлинности

Перейдите в Студию аналитики документов. Если вы впервые войт в систему, появится всплывающее окно с запросом на настройку ресурса службы. В соответствии с политикой организации у вас есть один или два варианта:

  • Проверка подлинности Microsoft Entra: доступ по ресурсу (рекомендуется).

    • Выберите существующую подписку.

    • Выберите уже имеющуюся в подписке группу ресурсов или создайте новую.

    • Выберите существующий ресурс аналитики документов или служб ИИ Azure.

      Снимок экрана: настройка формы ресурса службы из Студии аналитики документов.

  • Локальная проверка подлинности: доступ к конечной точке и ключу API.

    • Получите конечную точку и ключ на портале Azure.

    • Перейдите на страницу обзора ресурса и выберите Ключи и конечная точка на панели навигации слева.

    • Введите значения в соответствующих полях.

      Снимок экрана: страница ключей и конечной точки в портал Azure.

  • После проверки сценария в Студии аналитики документов используйте клиентские библиотеки Java, Java, JavaScript или Python или REST API, чтобы приступить к включению моделей аналитики документов в собственные приложения.

Дополнительные сведения о каждой модели см . на страницах концепции.

Просмотр сведений о ресурсе

Чтобы просмотреть сведения о ресурсе, например имя и ценовую категорию, щелкните значок "Параметры " в правом верхнем углу домашней страницы Document Intelligence Studio и перейдите на вкладку "Ресурс ". Если у вас есть доступ к другим ресурсам, можно также переключить ресурсы.

Добавлены предварительные требования для пользовательских проектов

Помимо учетной записи Azure и ресурса аналитики документов или служб ИИ Azure, вам потребуется:

Контейнер хранилища BLOB-объектов Azure

Учетная запись Хранилища BLOB-объектов Azure с производительностью уровня "Стандартный". Вы создаете контейнеры для хранения и упорядочивания документов обучения в учетной записи хранения. Если вы не знаете, как создать учетную запись хранения Azure с контейнером, обратитесь к следующим кратким руководствам:

  • Создание учетной записи хранения. При создании учетной записи хранения выберите уровень производительности Стандартный в поле Сведения об экземпляре → Производительность.
  • Создание контейнера. При создании контейнера в окне Создание контейнера установите для поля Уровень общего доступа значение Контейнер (анонимный доступ на чтение для контейнеров и BLOB-объектов).

Назначения ролей Azure

Для пользовательских проектов для различных сценариев требуются следующие назначения ролей.

  • Базовая

    • Пользователь Cognitive Services. Для обучения пользовательской модели или анализа с обученными моделями требуется эта роль для аналитики документов или служб искусственного интеллекта Azure.
    • Участник данных BLOB-объектов хранилища. Эта роль необходима для создания проекта и меток данных учетной записи хранения.
  • Расширенные

    • Участник учетной записи хранения. Эта роль необходима для настройки параметров CORS учетной записи хранения (это одноразовая попытка при повторном использовании той же учетной записи хранения).
    • Участник. Для создания группы ресурсов и ресурсов требуется эта роль.

    Примечание.

    Если локальная (на основе ключа) проверка подлинности отключена для ресурса службы аналитики документов и учетной записи хранения, обязательно получите роли участника данных пользователей и blob-объектов Cognitive Services соответственно, поэтому у вас достаточно разрешений на использование Document Intelligence Studio. Роли участника и участника учетной записи хранения позволяют перечислять ключи, но не дают разрешения на использование ресурсов при отключении доступа к ключам.

Настройка CORS

CORS (общий доступ к ресурсам между источниками) необходимо настроить в учетной записи хранения Azure, чтобы она была доступна в Студии аналитики документов. Чтобы настроить CORS в портал Azure, необходимо получить доступ к вкладке CORS учетной записи хранения.

  1. Выберите вкладку CORS для учетной записи хранения.

    Снимок экрана: меню параметров CORS на портале Azure.

  2. Начните с создания записи CORS в службе BLOB-объектов.

  3. В поле Разрешенные источники введите https://documentintelligence.ai.azure.com.

    Снимок экрана, на котором показана конфигурация CORS для учетной записи хранения.

    Совет

    Можно не указывать домен, а воспользоваться подстановочным знаком *, чтобы разрешить всем исходным доменам делать запросы через CORS.

  4. Выберите все доступные 8 параметров для разрешенных методов.

  5. Утвердите все допустимые и предоставляемые заголовки, введя * в каждом поле.

  6. Установите для параметра Максимальный возраст 120 секунд или любое допустимое значение.

  7. Чтобы сохранить изменения, нажмите кнопку сохранения в верхней части страницы.

ТЕПЕРЬ CORS следует настроить для использования учетной записи хранения из Document Intelligence Studio.

Набор примеров документов

  1. Войдите в портал Azure и перейдите к контейнерам хранилища данных учетной записи>хранения.>

    Снимок экрана: меню хранилища данных в портал Azure.

  2. Выберите контейнер из списка.

  3. В меню в верхней части страницы нажмите кнопку Отправить.

    Снимок экрана: кнопка отправки контейнера в портал Azure.

  4. Появится окно Отправить BLOB-объект.

  5. Выберите файлы для отправки.

    Снимок экрана: окно отправки BLOB-объектов в портал Azure.

Примечание.

По умолчанию Студия будет использовать документы, расположенные в корне контейнера. Однако можно использовать данные, упорядоченные в папки, указав путь к папке в пошаговом процессе создания настраиваемой формы. См. раздел Упорядочение данных во вложенных папках

Использование функций Document Intelligence Studio

Автоматические документы с предварительно созданными моделями или одной из собственных моделей

  • На странице меток модели извлечения можно автоматически пометить документы с помощью одной из предварительно созданных моделей или обученных моделей.

    Анимированный снимок экрана: автоматическая маркировка в Студии.

  • Для некоторых документов возможны повторяющиеся метки после запуска автоматической метки. Обязательно измените метки таким образом, чтобы на странице маркировки не было повторяющихся меток.

    Снимок экрана: предупреждение о дублировании меток после автоматического добавления меток.

Автоматические таблицы меток

  • На странице маркировки пользовательской модели извлечения теперь можно автоматически пометить таблицы в документе без необходимости пометить таблицы вручную.

    Анимированный снимок экрана: автоматическая метка таблицы в Студии.

Добавление тестовых файлов непосредственно в обучающий набор данных

  • Обучив пользовательскую модель извлечения, используйте тестовую страницу для улучшения качества модели, отправив тестовые документы в обучающий набор данных при необходимости.

  • Если для некоторых меток возвращается оценка достоверности с низким уровнем достоверности, убедитесь, что вы правильно помечаете содержимое. Если нет, добавьте их в набор данных обучения и перенастройте их для улучшения качества модели.

    Анимированный снимок экрана, показывающий, как добавить тестовые файлы в набор данных для обучения.

Использование параметров списка документов и фильтров в пользовательских проектах

  • Используйте страницу меток модели пользовательского извлечения, чтобы легко перемещаться по учебным документам, используя поиск, фильтрацию и сортировку по функциям.

  • Используйте представление сетки для предварительного просмотра документов или используйте представление списка для упрощения прокрутки документов.

    Снимок экрана: параметры представления списка документов и фильтры.

Общий доступ к проекту

Удобно использовать пользовательские проекты извлечения. Дополнительные сведения см. в разделе "Общий доступ к проекту" с пользовательскими моделями.

Следующие шаги

Начало работы с Студией аналитики документов.