Поделиться через


Преобразование "Выбор столбцов"

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Создает преобразование, которое выбирает то же подмножество столбцов, что и в заданном наборе данных

Категория: Преобразование или управление данными

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

в этой статье описывается использование модуля преобразования Select columns в Машинное обучение Studio (классическая модель). Целью модуля преобразования Select Columns является обеспечение того, что в последующих операциях машинного обучения всегда используется прогнозируемый, последовательный набор столбцов.

Этот модуль особенно полезен для таких задач, как оценка, для которой требуются определенные столбцы. Изменения в доступных столбцах могут привести к нарушению эксперимента или изменению результатов.

Используйте Преобразование выбор столбцов для создания и сохранения набора столбцов. Затем используйте модуль Применить преобразование, чтобы применить эти параметры к новым данным.

Использование преобразования "Выбор столбцов"

В этом сценарии предполагается, что вы планируете использовать выбор компонентов для создания динамического набора столбцов, который будет использоваться для обучения модели. Чтобы убедиться, что выбранные столбцы одинаковы для процесса оценки, используйте модуль Преобразование выбор столбцов , чтобы записать выбор столбцов и применить их в любом расположении эксперимента.

  1. Добавьте входной набор данных в эксперимент в студии (классическая модель).

  2. Добавьте экземпляр параметра Выбор компонентов с помощью фильтра.

  3. Подключение модули и настройте модуль выбора компонентов, чтобы автоматически найти некоторое количество лучших функций во входном наборе данных.

  4. Добавьте экземпляр параметра Обучение модели и используйте выходные данные параметра Выбор компонентов с помощью фильтра в качестве входных данных для обучения.

    Важно!

    Поскольку важность признаков зависит от значений в столбце, невозможно заранее выяснить, какие столбцы могут быть доступны для обучения модели.

  5. Теперь присоедините экземпляр модуля преобразования Select Columns .

    При этом в качестве преобразования выбирается столбец, который можно сохранить или применить к другим наборам данных. Этот шаг гарантирует, что столбцы, идентифицируемые выбором компонентов, будут сохранены для повторного использования другими модулями.

  6. Добавьте модуль Оценка модели.

    Не подключайте входной набор данных.

    Вместо этого добавьте модуль Применить преобразование и подключите выход преобразования "Выбор компонентов".

    Важно!

    Невозможно применить Выбор компонентов на основе фильтра к набору данных оценки и получить те же результаты. Поскольку выбор компонентов основан на значениях, он может выбрать другой набор столбцов, что приведет к сбою операции оценки.

  7. Запустите эксперимент.

Этот процесс сохранения и применения выбора столбцов гарантирует, что одна и та же схема данных будет доступна для обучения и оценки.

Примеры

Примеры использования этого модуля см. в Коллекция решений ии Azure:

Ожидаемые входные данные

Имя Тип Описание
Набор данных с нужными столбцами Таблица данных Набор данных, содержащий нужный набор столбцов

Выходные данные

Имя Тип Описание
Преобразование «выбор столбцов» Интерфейс ITransform Преобразование, которое выбирает то же подмножество столбцов, что и в заданном наборе данных.

Исключения

Исключение Описание
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.

См. также раздел

Оперирование
Выбор столбцов в наборе данных