Поделиться через


Настройка режима обучения персонализации

Внимание

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора отменяется 1 октября 2026 года.

Режим ученика формирует доверие к службе Персонализатора и ее способностям машинного обучения, а также гарантирует, что служба отправляет учебную информацию без риска для сетевого трафика.

Настройка режима области

  1. Войдите в портал Azure для ресурса персонализации.

  2. На странице "Настройка" на вкладке "Параметры модели" выберите режим ученика и нажмите кнопку "Сохранить".

Снимок экрана: настройка поведения обучения в режиме области на портале Azure

Изменения в существующем приложении

В существующем приложении не должно быть изменений, как оно выбирает действия для отображения или как приложение определяет значение, а также его вознаграждение. Единственным изменением в приложении может быть порядок действий, отправленных в API ранжирования Персонализатора. Действие, отображаемое в настоящее время приложением, отправляется как первое действие в списке действий. API ранжирования использует это первое действие для обучения модели персонализации.

Настройка приложения для вызова API ранжирования

Чтобы добавить в приложение персонализацию, необходимо вызвать API ранжирования и наград.

  1. Добавьте вызов ранжирования API после точки в существующей логике приложения, где определяется список действий и их функций. Первым действием в списке действий должно быть действие, выбранное существующей логикой.

  2. Настройте код, чтобы отобразить действие, связанное с идентификатором действия награды для ответа API ранжирования.

Настройка приложения для вызова API-интерфейса наград

Примечание.

Вызовы API вознаграждения не влияют на обучение в режиме ученика. Служба учится, сопоставляя текущую логику приложения или действия по умолчанию. Однако реализация вызовов вознаграждения на этом этапе помогает обеспечить плавный переход в онлайн режим позже с помощью простого переключателя на портале Azure. Кроме того, награды будут записаны в журнал, что позволяет проанализировать, насколько хорошо выполняется текущая логика и сколько вознаграждений получено.

  1. Используйте существующую бизнес-логику, чтобы вычислить вознаграждение отображаемого действия. Значение должно находиться в диапазоне от 0 до 1. Отправьте эту награду в персонализацию с помощью API-интерфейса наград. Значение наград не ожидается сразу, и его можно отложить на период времени, в зависимости от бизнес-логики.

  2. Если вы не вернете вознаграждение в течение настроенного времени ожидания, вместо него будет зарегистрировано вознаграждение по умолчанию.

Оценка режима области

На портал Azure на странице "Монитор" ресурса Персонализатора просмотрите производительность сопоставления.

Снимок экрана с оценочным поведением обучения в режиме области на портале Azure

Режим ученика предоставляет следующие метрики оценки:

  • Базовый уровень — среднее вознаграждение: средние вознаграждения по умолчанию для приложения (базовый уровень).
  • Персонализатор — среднее вознаграждение: среднее из общего числа вознаграждений, которые потенциально мог бы получить Персонализатор.
  • Отношение достижений к 1000 последних событий: отношение "Базовый" и "Персонализатор" — нормализовано по тысяче последних событий.

Переключение режима работы в режим "в сети"

При определении персонализации в среднем в 75–85 % скользящего среднего модель готова к переключению в оперативный режим.

В портал Azure для ресурса Персонализатора на вкладке "Параметры модели" на вкладке "Параметры модели" выберите *Режим "Онлайн" и нажмите кнопку "Сохранить".

Нет необходимости вносить изменения в вызовы API ранжирования и награды.

Следующие шаги