Поделиться через


Преобразование данных — масштабирование и уменьшение

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

в этой статье описываются модули в Машинное обучение Studio (классическая модель), которые могут помочь в работе с числовыми данными. Для машинного обучения распространенные задачи с данными включают отсечение, группирования и нормализацию числовых значений. Другие модули поддерживают уменьшение размерности.

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Моделирование числовых данных

Такие задачи, как нормализация, группирования или распространение числовых переменных, являются важной частью подготовки данных для машинного обучения. Модули в этой группе поддерживают следующие задачи подготовки данных:

  • Группирование данных в ячейки разного размера или распределения.
  • Удаление выбросов или изменение их значений.
  • Нормализация набора числовых значений в заданный диапазон.
  • Создание компактного набора столбцов функций из набора данных с высоким значением измерения.
  • Выберите важные и полезные функции для использования при построении модели. Используйте модули " Выбор компонентов " или " Discriminant Analysis ".
  • выберите компоненты на основе количества значений: используйте модуль Обучение с подсчетами .
  • Удалить или заменить отсутствующие значения: используйте модуль очистки отсутствующих данных .
  • Замените значения категорий на числовые значения, которые являются производными от вычислений: используйте модуль замены дискретных значений .
  • Вычисление вероятности распределения для дискретных или числовых столбцов: используйте модуль Evaluate-Function .
  • Фильтрация и преобразование цифровых сигналов и форм аудио: использование модуля фильтра .

Список модулей

Эта категория преобразования данных — масштаб и сокращение включает следующие модули:

См. также раздел