Преобразование данных — масштабирование и уменьшение
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
в этой статье описываются модули в Машинное обучение Studio (классическая модель), которые могут помочь в работе с числовыми данными. Для машинного обучения распространенные задачи с данными включают отсечение, группирования и нормализацию числовых значений. Другие модули поддерживают уменьшение размерности.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Моделирование числовых данных
Такие задачи, как нормализация, группирования или распространение числовых переменных, являются важной частью подготовки данных для машинного обучения. Модули в этой группе поддерживают следующие задачи подготовки данных:
- Группирование данных в ячейки разного размера или распределения.
- Удаление выбросов или изменение их значений.
- Нормализация набора числовых значений в заданный диапазон.
- Создание компактного набора столбцов функций из набора данных с высоким значением измерения.
Связанные задачи
- Выберите важные и полезные функции для использования при построении модели. Используйте модули " Выбор компонентов " или " Discriminant Analysis ".
- выберите компоненты на основе количества значений: используйте модуль Обучение с подсчетами .
- Удалить или заменить отсутствующие значения: используйте модуль очистки отсутствующих данных .
- Замените значения категорий на числовые значения, которые являются производными от вычислений: используйте модуль замены дискретных значений .
- Вычисление вероятности распределения для дискретных или числовых столбцов: используйте модуль Evaluate-Function .
- Фильтрация и преобразование цифровых сигналов и форм аудио: использование модуля фильтра .
Список модулей
Эта категория преобразования данных — масштаб и сокращение включает следующие модули:
- Значения обрезки: выявляет выбросы, а затем вырезает или заменяет их значения.
- Группирование данных в ячейки: помещает в ячейки числовые данные.
- Нормализация данных: масштабирует числовые данные, чтобы ограничить значения набора данных стандартным диапазоном.
- Анализ основных компонентов: позволяет вычислить набор функций с уменьшенной размерностью для более эффективного обучения.