Создание модели прогнозного кодирования (предварительная версия)
Совет
Обнаружение электронных данных (предварительная версия) теперь доступно на новом портале Microsoft Purview. Дополнительные сведения об использовании нового интерфейса обнаружения электронных данных см. в статье Сведения об обнаружении электронных данных (предварительная версия).
Важно!
Прогнозное кодирование прекращено с 31 марта 2024 г. и недоступно в новых случаях обнаружения электронных данных. Для существующих случаев с обученными моделями прогнозного кодирования можно продолжать применять существующие фильтры оценки для проверки наборов. Однако вы не можете создавать или обучать новые модели.
Первым шагом в использовании возможностей машинного обучения прогнозного программирования в eDiscovery (премиум) является создание модели прогнозного кодирования. После создания модели вы можете обучить ее определять релевантное и не релевантное содержимое в наборе для проверки.
Сведения о рабочем процессе прогнозирования см . в статье Сведения о прогнозном кодировании в eDiscovery (премиум)
Совет
Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас в центре пробных версий Microsoft Purview. Сведения о регистрации и условиях пробной версии.
Перед созданием модели
- Для создания модели прогнозного кодирования в наборе для проверки должно быть не менее 2000 элементов.
- Перед созданием модели обязательно зафиксируйте все коллекции в наборе для проверки. Элементы, добавленные в набор проверки после создания модели, не будут обрабатываться и назначаться оценка прогнозирования, созданная моделью.
- Любой элемент в наборе для проверки, который не содержит текст, не будет обработан моделью или назначена оценка прогнозирования. Элементы с текстом будут включены в набор элементов управления или обучающий набор.
Создание модели
Примечание.
В течение ограниченного времени этот классический интерфейс обнаружения электронных данных также доступен на новом портале Microsoft Purview. Включите классический интерфейс eDiscovery портала соответствия требованиям в параметрах интерфейса обнаружения электронных данных (предварительная версия) для отображения классического интерфейса на новом портале Microsoft Purview.
В Портал соответствия требованиям Microsoft Purview откройте дело обнаружения электронных данных (премиум) и выберите вкладку Проверка наборов данных.
Откройте набор для проверки и выберите Аналитика>Управление прогнозным кодом (предварительная версия).
На странице Модели прогнозного кодирования (предварительная версия) выберите Новая модель.
На всплывающей странице введите имя модели и необязательное описание.
При необходимости можно настроить дополнительные параметры (выбрав Дополнительные параметры на всплывающей странице), связанные с уровнем достоверности и погрешностью. Эти параметры влияют на количество элементов, включенных в набор элементов управления. Набор элементов управления используется в процессе обучения для оценки прогнозов, которые модель присваивает элементам с метками, выполняемыми во время циклов обучения. Если в вашей организации есть рекомендации по уровню достоверности и погрешности для проверки документов, укажите их в соответствующих полях. В противном случае используйте параметры по умолчанию.
Нажмите кнопку Сохранить , чтобы создать модель.
Подготовка модели системой занимает несколько минут. После того как он будет готов, вы можете выполнить первый раунд обучения.
Что происходит после создания модели
После создания модели в фоновом режиме во время создания и подготовки модели происходит следующее:
- Система вычисляет количество элементов для набора элементов управления. Этот размер зависит от количества элементов в наборе для проверки и параметров для уровня достоверности и погрешности. Элементы для набора элементов управления выбираются случайным образом и назначаются как элементы набора элементов управления. Система включает в себя 10 элементов из набора элементов управления в первом раунде обучения.
- Система случайным образом выбирает 40 элементов из набора для проверки, которые будут включены в обучающий набор для первого раунда обучения. Таким образом, первый раунд обучения включает 50 элементов для маркировки: 40 элементов из обучающего набора и 10 элементов из набора элементов управления.
Дальнейшие действия
После создания модели для набора для проверки следующим шагом является выполнение раундов обучения, чтобы "обучить" модель выявлению содержимого, относящееся к вашему исследованию. Дополнительные сведения см. в разделе Обучение модели прогнозного кодирования.