Поделиться через


Создание модели прогнозного кодирования (предварительная версия)

Совет

Обнаружение электронных данных (предварительная версия) теперь доступно на новом портале Microsoft Purview. Дополнительные сведения об использовании нового интерфейса обнаружения электронных данных см. в статье Сведения об обнаружении электронных данных (предварительная версия).

Важно!

Прогнозное кодирование прекращено с 31 марта 2024 г. и недоступно в новых случаях обнаружения электронных данных. Для существующих случаев с обученными моделями прогнозного кодирования можно продолжать применять существующие фильтры оценки для проверки наборов. Однако вы не можете создавать или обучать новые модели.

Первым шагом в использовании возможностей машинного обучения прогнозного программирования в eDiscovery (премиум) является создание модели прогнозного кодирования. После создания модели вы можете обучить ее определять релевантное и не релевантное содержимое в наборе для проверки.

Сведения о рабочем процессе прогнозирования см . в статье Сведения о прогнозном кодировании в eDiscovery (премиум)

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас в центре пробных версий Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Перед созданием модели

  • Для создания модели прогнозного кодирования в наборе для проверки должно быть не менее 2000 элементов.
  • Перед созданием модели обязательно зафиксируйте все коллекции в наборе для проверки. Элементы, добавленные в набор проверки после создания модели, не будут обрабатываться и назначаться оценка прогнозирования, созданная моделью.
  • Любой элемент в наборе для проверки, который не содержит текст, не будет обработан моделью или назначена оценка прогнозирования. Элементы с текстом будут включены в набор элементов управления или обучающий набор.

Создание модели

Примечание.

В течение ограниченного времени этот классический интерфейс обнаружения электронных данных также доступен на новом портале Microsoft Purview. Включите классический интерфейс eDiscovery портала соответствия требованиям в параметрах интерфейса обнаружения электронных данных (предварительная версия) для отображения классического интерфейса на новом портале Microsoft Purview.

  1. В Портал соответствия требованиям Microsoft Purview откройте дело обнаружения электронных данных (премиум) и выберите вкладку Проверка наборов данных.

  2. Откройте набор для проверки и выберите Аналитика>Управление прогнозным кодом (предварительная версия).

    Выберите раскрывающееся меню Анализ в наборе проверки, чтобы перейти на страницу Прогнозное кодирование.

  3. На странице Модели прогнозного кодирования (предварительная версия) выберите Новая модель.

  4. На всплывающей странице введите имя модели и необязательное описание.

  5. При необходимости можно настроить дополнительные параметры (выбрав Дополнительные параметры на всплывающей странице), связанные с уровнем достоверности и погрешностью. Эти параметры влияют на количество элементов, включенных в набор элементов управления. Набор элементов управления используется в процессе обучения для оценки прогнозов, которые модель присваивает элементам с метками, выполняемыми во время циклов обучения. Если в вашей организации есть рекомендации по уровню достоверности и погрешности для проверки документов, укажите их в соответствующих полях. В противном случае используйте параметры по умолчанию.

  6. Нажмите кнопку Сохранить , чтобы создать модель.

    Подготовка модели системой занимает несколько минут. После того как он будет готов, вы можете выполнить первый раунд обучения.

Что происходит после создания модели

После создания модели в фоновом режиме во время создания и подготовки модели происходит следующее:

  • Система вычисляет количество элементов для набора элементов управления. Этот размер зависит от количества элементов в наборе для проверки и параметров для уровня достоверности и погрешности. Элементы для набора элементов управления выбираются случайным образом и назначаются как элементы набора элементов управления. Система включает в себя 10 элементов из набора элементов управления в первом раунде обучения.
  • Система случайным образом выбирает 40 элементов из набора для проверки, которые будут включены в обучающий набор для первого раунда обучения. Таким образом, первый раунд обучения включает 50 элементов для маркировки: 40 элементов из обучающего набора и 10 элементов из набора элементов управления.

Дальнейшие действия

После создания модели для набора для проверки следующим шагом является выполнение раундов обучения, чтобы "обучить" модель выявлению содержимого, относящееся к вашему исследованию. Дополнительные сведения см. в разделе Обучение модели прогнозного кодирования.