Поделиться через


Создание модели прогнозного кодирования (предварительная версия)

Важно!

Эта статья относится только к классическому интерфейсу обнаружения электронных данных. Классический интерфейс обнаружения электронных данных будет прекращен в августе 2025 г. и не будет доступен в качестве возможности на портале Microsoft Purview после прекращения использования.

Рекомендуется планировать этот переход рано и использовать новый интерфейс обнаружения электронных данных на портале Microsoft Purview. Дополнительные сведения об использовании последних возможностей и функций обнаружения электронных данных см. в статье Сведения об обнаружении электронных данных.

Важно!

Прогнозное кодирование прекращено с 31 марта 2024 г. и недоступно в новых случаях обнаружения электронных данных. Для существующих случаев с обученными моделями прогнозного кодирования можно продолжать применять существующие фильтры оценки для проверки наборов. Однако вы не можете создавать или обучать новые модели.

Первым шагом в использовании возможностей машинного обучения прогнозного программирования в eDiscovery (премиум) является создание модели прогнозного кодирования. После создания модели вы можете обучить ее определять релевантное и не релевантное содержимое в наборе для проверки.

Сведения о рабочем процессе прогнозирования см . в статье Сведения о прогнозном кодировании в eDiscovery (премиум)

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас в центре пробных версий Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Перед созданием модели

  • Для создания модели прогнозного кодирования в наборе для проверки должно быть не менее 2000 элементов.
  • Перед созданием модели обязательно зафиксируйте все коллекции в наборе для проверки. Элементы, добавленные в набор проверки после создания модели, не будут обрабатываться и назначаться оценка прогнозирования, созданная моделью.
  • Любой элемент в наборе для проверки, который не содержит текст, не будет обработан моделью или назначена оценка прогнозирования. Элементы с текстом будут включены в набор элементов управления или обучающий набор.

Создание модели

Примечание.

В течение ограниченного времени классический интерфейс обнаружения электронных данных доступен на новом портале Microsoft Purview. Включите классический интерфейс обнаружения электронных данных на портале Purview в параметрах интерфейса обнаружения электронных данных, чтобы отобразить классический интерфейс на новом портале Microsoft Purview.

  1. На портале Microsoft Purview откройте дело обнаружения электронных данных (премиум) и выберите вкладку Просмотр наборов данных.

  2. Откройте набор для проверки и выберите Аналитика>Управление прогнозным кодом (предварительная версия).

    Выберите раскрывающееся меню Анализ в наборе проверки, чтобы перейти на страницу Прогнозное кодирование.

  3. На странице Модели прогнозного кодирования (предварительная версия) выберите Новая модель.

  4. На всплывающей странице введите имя модели и необязательное описание.

  5. При необходимости можно настроить дополнительные параметры (выбрав Дополнительные параметры на всплывающей странице), связанные с уровнем достоверности и погрешностью. Эти параметры влияют на количество элементов, включенных в набор элементов управления. Набор элементов управления используется в процессе обучения для оценки прогнозов, которые модель присваивает элементам с метками, выполняемыми во время циклов обучения. Если в вашей организации есть рекомендации по уровню достоверности и погрешности для проверки документов, укажите их в соответствующих полях. В противном случае используйте параметры по умолчанию.

  6. Нажмите кнопку Сохранить , чтобы создать модель.

    Подготовка модели системой занимает несколько минут. После того как он будет готов, вы можете выполнить первый раунд обучения.

Что происходит после создания модели

После создания модели в фоновом режиме во время создания и подготовки модели происходит следующее:

  • Система вычисляет количество элементов для набора элементов управления. Этот размер зависит от количества элементов в наборе для проверки и параметров для уровня достоверности и погрешности. Элементы для набора элементов управления выбираются случайным образом и назначаются как элементы набора элементов управления. Система включает в себя 10 элементов из набора элементов управления в первом раунде обучения.
  • Система случайным образом выбирает 40 элементов из набора для проверки, которые будут включены в обучающий набор для первого раунда обучения. Таким образом, первый раунд обучения включает 50 элементов для маркировки: 40 элементов из обучающего набора и 10 элементов из набора элементов управления.

Дальнейшие действия

После создания модели для набора для проверки следующим шагом является выполнение раундов обучения, чтобы "обучить" модель выявлению содержимого, относящееся к вашему исследованию. Дополнительные сведения см. в разделе Обучение модели прогнозного кодирования.