Преобразование данных — манипуляции
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
в этой статье описываются модули в Машинное обучение Studio (классическая модель), которые можно использовать для базовых операций с данными.
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Машинное обучение Studio (классическая модель) поддерживает задачи, относящиеся к машинному обучению, такие как нормализация или выбор компонентов. Модули в этой категории предназначены для более общих задач.
Задачи обработки данных
модули в этой категории предназначены для поддержки основных задач управления данными, которые, возможно, потребуется выполнить в Машинное обучение Studio (классическая модель). Следующие задачи являются примерами основных задач управления данными.
- Объедините два набора данных: с помощью соединений или путем слияния столбцов или строк.
- Создание новых категорий для группирования данных.
- Изменение заголовков столбцов, изменение типов данных столбцов или пометка столбцов как компонентов или меток.
- Проверьте отсутствующие значения и замените их соответствующими значениями.
Связанные задачи
- Выполните выборку или разделите набор данных на обучающий и проверочный наборы: используйте модули преобразования данных-Sample и Split .
- Масштабирование чисел, нормализация данных или помещение числовых значений в ячейки: используйте модули преобразования данных — масштабирование и уменьшение .
- Выполнение вычислений с полями числовых данных или создание часто используемой статистики: использование средств в статистических функциях.
Примеры
Примеры работы со сложными данными в экспериментах машинного обучения см. в следующих примерах в Коллекция решений ии Azure:
- Обработка и анализ данных: демонстрирует ключевые средства и процессы.
- Обнаружение рака молочной железы: показывает, как секционировать наборы данных, а затем применить специальную обработку к каждой секции.
Модули в этой категории
Категория управления преобразованием данных включает следующие модули:
- Добавить столбцы: добавляет набор столбцов из одного набора данных в другой.
- Добавить строки: добавляет набор строк из входного набора данных в конец другого набора данных.
- преобразование "применить SQL": выполняет запрос SQLite к входным наборам данных, чтобы преобразовать данные.
- Очистить отсутствующие данные: определяет способ управления значениями, отсутствующими в наборе данных. Этот модуль заменяет собой очистку отсутствующих значений, что является устаревшим.
- Преобразовать в значения индикатора: преобразует значения категорий в столбцы в значения индикаторов.
- Изменить метаданные: изменяет метаданные, связанные со столбцами в наборе данных.
- Группирование значенийпо категориям: группирует данные из нескольких категорий в новую категорию.
- Объединение данных: соединяет два набора данных.
- Удалить дублирующиеся строки: удаляет дублирующиеся строки из набора данных.
- Выбор столбцов в наборе данных: Выбор столбцов для включения в набор данных или исключение из набора данных в операции.
- Выбор столбцов преобразование: создает преобразование, которое выбирает то же подмножество столбцов, что и в указанном наборе данных.
- Смоте: увеличивает количество примеров с низкими недостатками в наборе данных с использованием искусственной избыточной доли миноритария.