Объединение преобразования счетчиков
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Создает набор признаков на основе таблицы счетчиков.
категория: Обучение с количеством
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается использование модуля преобразования числа слиянием в Машинное обучение Studio (классическая модель) для объединения двух наборов функций на основе количества. Объединяя два набора связанных счетчиков и функций, вы потенциально можете улучшить покрытие и распределение функций.
Обучение от счетчиков особенно удобно использовать в больших наборах данных с функциями высокой кратности. Возможность объединения нескольких наборов данных в наборы функций на основе счетчиков без необходимости повторной обработки наборов данных упрощает сбор статистики по очень большим наборам данных и их применение к новым наборам данных. Например, таблицы подсчета можно использовать для получения информации за терабайтами данных. Эти статистические данные можно повторно использовать для повышения точности прогнозных моделей на небольших наборах данных.
Чтобы объединить два набора функций на основе счетчика, эти функции должны быть созданы с помощью таблиц, имеющих одну и ту же схему: то есть оба набора должны использовать одни и те же столбцы и иметь одинаковые имена и типы данных.
Настройка преобразования числа слиянием
Чтобы использовать Преобразование «Подсчет числа слияний», необходимо создать по крайней мере одно преобразование на основе количества, которое должно присутствовать в рабочей области. Если вы сохранили преобразование на основе количества из другого эксперимента, Просмотрите группу преобразования . Если преобразование было создано в текущем эксперименте, подключите выходные данные следующих модулей:
Преобразование подсчета сборок. Создает новое преобразование на основе счетчика из исходных данных.
Изменение параметров таблицы подсчета. Принимает существующее преобразование Count в качестве входных данных и выводит обновленное преобразование.
Импорт таблицы подсчета. Этот модуль поддерживает обратную совместимость со старыми экспериментами, в которых использовалось обучение на основе количества. Если для анализа распределения значений в наборе данных и преобразования значений в функции с помощью модуля нерекомендуемого счетчика Характеризатора используется Импорт таблицы подсчета , то для преобразования результатов в преобразование используйте таблицу счетчика импорта .
Добавьте модуль преобразования «подсчет слияния » в эксперимент и Соедините преобразование с каждым входом.
Совет
Второе преобразование — необязательный ввод. Вы можете подключать одно и то же преобразование дважды или не подключать ничего ко второму порту ввода.
Если вы не хотите, чтобы второй набор данных был одинаково взвешен с первым, укажите значение фактора Decay. Введенное значение указывает, как должен быть взвешен набор компонентов второго преобразования.
Например, значение по умолчанию 1 веса одинаково определяет оба набора функций. Значение 0,5 означает, что функции во втором наборе будут иметь половину веса в первом наборе.
При необходимости добавьте экземпляр модуля Apply преобразование и примените преобразование к набору данных.
Примеры
Примеры использования этого модуля см. в Коллекция решений ии Azure:
Обучение с количеством: двоичная классификация: демонстрируется использование модулей обучения с подсчетами для создания функций из столбцов значений категорий для модели двоичной классификации.
Обучение со счетчиками: многоклассовая классификация с данными нью такси: демонстрируется использование модулей Learning с счетчиками для выполнения многоклассовой классификации в общедоступном наборе данных нью такси. В примере используется Многоклассовый источник логистической регрессии для моделирования этой проблемы.
Обучение со счетчиками: двоичная классификация с данными о такси нью: демонстрируется использование модулей Learning с счетчиками для выполнения двоичной классификации в общедоступном наборе данных нью такси. В примере для моделирования проблемы используется источник логистической регрессии с двумя классами.
Ожидаемые входные данные
Имя | Тип | Описание |
---|---|---|
Предыдущее преобразование подсчета | Интерфейс ITransform | Изменяемое преобразование |
Новое преобразование подсчета | Интерфейс ITransform | Добавляемое преобразование подсчета (необязательно) |
Параметры модуля
Имя | Type | Диапазон | Необязательно | Описание | Значение по умолчанию |
---|---|---|---|---|---|
Коэффициент Decay | Float | Обязательно | – | Коэффициент Decay, который умножается на преобразование подсчета по правому порту ввода |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Объединенное преобразование подсчета | Интерфейс ITransform | Объединенное преобразование |
Исключения
Исключение | Описание |
---|---|
Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
Ошибка 0086 | Возникает исключение при недопустимом преобразовании подсчета. |