Машинное обучение-оценка
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
в этом разделе перечислены модули, предоставляемые в Машинное обучение Studio (классическая модель) для оценки.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Оценка также называется прогнозом и представляет собой процесс создания значений на основе обученной модели машинного обучения с учетом новых входных данных. Создаваемые значения или показатели могут представлять прогнозы будущих значений, но они также могут представлять вероятную категорию или результат. Значение оценки зависит от типа предоставляемых данных и от типа созданной модели.
создание и использование моделей в Машинное обучение Studio (классическая модель)
Типичный рабочий процесс для машинного обучения включает следующие этапы.
- Выбор подходящего алгоритма и Установка начальных параметров.
- Обучение модели на совместимость данных.
- Создание прогнозов с использованием новых данных на основе закономерностей в модели.
- Оценка модели для определения точности прогнозов, количества ошибок и наличия чрезмерного перегонки.
Машинное обучение Studio (классическая модель) поддерживает гибкую настраиваемую платформу для машинного обучения. Каждая задача в этом процессе выполняется модулем определенного типа, который можно изменить, добавить или удалить, не нарушая остальную часть эксперимента.
Модули в этом разделе включают средства для оценки. На этом этапе машинного обучения к новым данным применяется обученная модель для создания прогнозов. Можно либо отправить эти прогнозы в приложение, которое использует результаты машинного обучения, либо воспользоваться результатами оценки для оценки точности и полезности модели.
Дополнительные сведения о оценке
Оценка широко используется в машинном обучении, что означает процесс создания новых значений с учетом модели и некоторых новых входных данных. Используется универсальный термин "Оценка", а не "прогноз", поскольку процесс оценки может создавать так много различных типов значений:
- Список рекомендуемых элементов и показатель подобия.
- Числовые значения для моделей временных рядов и моделей регрессии.
- Значение вероятности, указывающее вероятность того, что новые входные данные принадлежат к некоторой существующей категории.
- Имя категории или кластера, в котором наиболее похож новый элемент.
- Прогнозируемый класс или результат для моделей классификации.
Примечание
Возможно, вы также слышали слово Оценка , используемая для обозначения веса или значения, назначенного в результате анализа данных. однако в Машинное обучение Studio (классическая модель) оценка обычно обозначает процесс создания прогнозируемых значений из новых данных.
При добавлении одного из этих модулей в эксперимент необходимо присоединить уже обученную модель машинного обучения и некоторые новые данные. При запуске эксперимента или выбранного модуля модуль оценки принимает новые данные, вычисляет оценки на основе модели и возвращает результаты в виде таблицы.
Данные, используемые для оценки
Новые данные, указываемые в качестве входных данных, обычно должны иметь те же столбцы, которые использовались для обучения модели, за исключением столбца метки или результата.
Столбцы, используемые исключительно как идентификаторы, обычно исключаются при обучении модели и поэтому должны быть исключены при оценке. Однако идентификаторы, такие как первичные ключи, можно легко объединить с набором данных для оценки позже, используя модуль Добавление столбцов . Этот модуль работает без указания ключа подключения, если размер набора данных не изменился.
Перед выполнением оценки для набора данных всегда проверяйте отсутствующие значения и значение null. Если данные, используемые в качестве входных данных для оценки, не имеют значений, отсутствующие значения используются в качестве входных. Поскольку значения NULL распространяются, результатом обычно является отсутствующее значение.
Список модулей оценки
Машинное обучение Studio (классическая модель) предоставляет множество различных модулей оценки. Выберите один из них в зависимости от типа используемой модели или типа выполняемой задачи оценки.
Применить преобразование: применяет хорошо заданное преобразование данных к набору данных.
Используйте этот модуль, чтобы применить сохраненный процесс к набору данных.
Назначение данных кластерам. назначение данных кластерам с помощью существующей обученной модели кластеризации.
Используйте этот модуль, если требуется кластеризация новых данных на основе существующей модели кластеризации с K-средних.
Этот модуль заменяет модуль Assign To Clusters (не рекомендуется), который является устаревшим, но по-прежнему доступен для использования в существующих экспериментах.
Matchbox рекомендация: Оценкапрогнозов для набора данных с помощью рекомендации Matchbox.
Используйте этот модуль, если вы хотите создать рекомендации, найти связанные элементы или пользователей или спрогнозировать рейтинги.
Модель оценки: прогнозы оценок для обученной модели классификации или регрессии.
Этот модуль используется для всех других моделей регрессии и классификации, а также для некоторых моделей обнаружения аномалий.
Связанные задачи
- Для Vowpal Wabbit предоставляются специальные модули оценки. см. Анализ текста.
- Вы можете оценить специальные классы изображений в предварительно обученных моделях с помощью библиотеки OpenCV.
- Модуль обнаружения аномалий временных рядов формирует оценки, которые представляют потенциальные отклонения от тенденции.
Примеры
Эти примеры в Коллекция решений ии Azure демонстрируют процесс оценки, от базовых до сложных сценариев:
Двоичная классификация для прямого маркетинга: демонстрирует базовый рабочий процесс для оценки в случае, когда прогнозируемое значение является ответом клиента на маркетинговую кампанию.
Прогнозирование просмотров книги: Оценка текстовых данных. Использует модель логистической регрессии.
Обучение с подсчетами: показывает, как использовать добавление признаков на основе счетчиков для выполнения прогнозов.
пакетная оценка без использования кода с Logic Apps и Машинное обучение: иллюстрирует комплексный процесс обучения и оценки, автоматизированный с помощью Logic Apps функции Служба приложений Azure.
В следующих статьях приведены реальные примеры использования модели машинного обучения для оценки.