модули машинного обучения в модулях ML Studio (классические)
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Типичный рабочий процесс для машинного обучения включает несколько этапов:
Определение проблемы, которую необходимо решить, и метрику для измерения результатов.
Поиск, очистка и подготовка соответствующих данных.
Определение лучших функций и проектирование новых функций.
Создание, оценка и настройка моделей.
Использование моделей для создания прогнозов, рекомендаций и других результатов.
Модули в этом разделе содержат средства для финальных этапов машинного обучения, в которых для обучения модели применяется алгоритм. На этих заключительных этапах вы также создаете оценки, а затем оцениваете точность и полезность модели.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Список задач машинного обучения по категориям
-
Выберите один из множества настраиваемых алгоритмов машинного обучения, включая модели кластеризации, регрессии, классификациии обнаружения аномалий .
-
Предоставьте свои данные настроенной модели для изучения шаблонов и создания статистики, которую можно использовать для прогнозов.
-
Создание прогнозов с помощью обученных моделей.
-
Измерьте точность обученной модели или Сравните несколько моделей.
Подробное описание этого экспериментального рабочего процесса см. в пошаговом руководстве по решению кредитных рисков.
Предварительные требования
Прежде чем приступить к забавной части создания модели, необходимо выполнить массовую подготовку. в этом разделе приводятся ссылки на средства в Машинное обучение Studio (классическая модель), которые могут помочь в очистке данных, повышении качества ввода и предотвращении ошибок во время выполнения.
Исследование данных и качество данных
Убедитесь, что данные имеют правильный тип данных, правильное количество и качество для выбранного алгоритма. Изучите объем данных и их распределение. Существуют выбросы? Как они были созданы и что они означают? Существуют ли какие-либо повторяющиеся записи?
Обработку отсутствующих значений
Отсутствующие значения могут повлиять на результаты различными способами. Например, почти все статистические методы отбрасывают случаи с отсутствующими значениями. по умолчанию Машинное обучение следует этим правилам при обнаружении строк с отсутствующими значениями:
Если данные, используемые для обучения модели, имеют отсутствующие значения, пропускаются все строки с отсутствующими значениями.
Если данные, используемые в качестве входных данных при вычислении показателя для модели, не имеют значений, отсутствующие значения используются в качестве входных данных, но передаются значения NULL. Обычно это означает, что в результаты вместо допустимого прогноза вставляется значение null.
Обязательно проверьте данные перед обучением модели. Чтобы аппроксимация недостающие значения или исправить данные, используйте следующий модуль:
Выбор компонентов и уменьшение размерности
Машинное обучение Studio (классическая модель) поможет вам необходимости просеивания данные, чтобы найти наиболее полезные атрибуты.
Для определения столбцов данных с наибольшей степенью прогнозной мощности используются такие средства, как анализ Discriminantного линейного анализа или Выбор компонентов на основе фильтра . Эти средства также могут определять столбцы, которые должны быть удалены из-за утечки данных.
Создайте или спроектируйте функции из существующих данных. Нормализация данных или группирования данных в ячейки для создания новых группирований данных или стандартизации диапазона числовых значений перед анализом.
Уменьшите размерность путем группирования значений категорий, с помощью анализа основных компонентовили выборки.
Примеры
Примеры машинного обучения в действии см. в Коллекция решений ии Azure.
Советы и пошаговое руководство по типовым задачам препратион данных см. в разделе Пошаговые руководства по выполнению процесса обработки и анализа данных группы.