Поделиться через


модули машинного обучения в модулях ML Studio (классические)

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Типичный рабочий процесс для машинного обучения включает несколько этапов:

  • Определение проблемы, которую необходимо решить, и метрику для измерения результатов.

  • Поиск, очистка и подготовка соответствующих данных.

  • Определение лучших функций и проектирование новых функций.

  • Создание, оценка и настройка моделей.

  • Использование моделей для создания прогнозов, рекомендаций и других результатов.

Модули в этом разделе содержат средства для финальных этапов машинного обучения, в которых для обучения модели применяется алгоритм. На этих заключительных этапах вы также создаете оценки, а затем оцениваете точность и полезность модели.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Список задач машинного обучения по категориям

Подробное описание этого экспериментального рабочего процесса см. в пошаговом руководстве по решению кредитных рисков.

Предварительные требования

Прежде чем приступить к забавной части создания модели, необходимо выполнить массовую подготовку. в этом разделе приводятся ссылки на средства в Машинное обучение Studio (классическая модель), которые могут помочь в очистке данных, повышении качества ввода и предотвращении ошибок во время выполнения.

Исследование данных и качество данных

Убедитесь, что данные имеют правильный тип данных, правильное количество и качество для выбранного алгоритма. Изучите объем данных и их распределение. Существуют выбросы? Как они были созданы и что они означают? Существуют ли какие-либо повторяющиеся записи?

Обработку отсутствующих значений

Отсутствующие значения могут повлиять на результаты различными способами. Например, почти все статистические методы отбрасывают случаи с отсутствующими значениями. по умолчанию Машинное обучение следует этим правилам при обнаружении строк с отсутствующими значениями:

  • Если данные, используемые для обучения модели, имеют отсутствующие значения, пропускаются все строки с отсутствующими значениями.

  • Если данные, используемые в качестве входных данных при вычислении показателя для модели, не имеют значений, отсутствующие значения используются в качестве входных данных, но передаются значения NULL. Обычно это означает, что в результаты вместо допустимого прогноза вставляется значение null.

Обязательно проверьте данные перед обучением модели. Чтобы аппроксимация недостающие значения или исправить данные, используйте следующий модуль:

Выбор компонентов и уменьшение размерности

Машинное обучение Studio (классическая модель) поможет вам необходимости просеивания данные, чтобы найти наиболее полезные атрибуты.

Примеры

Примеры машинного обучения в действии см. в Коллекция решений ии Azure.

Советы и пошаговое руководство по типовым задачам препратион данных см. в разделе Пошаговые руководства по выполнению процесса обработки и анализа данных группы.

См. также раздел