Поделиться через


Оценка Vowpal Wabbit версии 7-10

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Оценка данных с использованием системы машинного обучения Vowpal Wabbit из интерфейса командной строки

категория: Анализ текста

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается использование модуля Vowpal Wabbit версии 7-10 в Машинное обучение Studio (классическая модель) для формирования оценок набора входных данных с использованием существующей модели Vowpal Wabbit.

Этот модуль использует версию 7-10 платформы Vowpal Wabbit. Используйте этот модуль для оценки данных с помощью обученной модели, сохраненной в формате 7-10.

При наличии существующих моделей, созданных с помощью более ранней версии, используйте следующие модули:

Для получения последней версии Vowpal Wabbit используйте:

Настройка оценки Vowpal Wabbit версии 7-10

  1. Добавьте в эксперимент модуль Score Vowpal Wabbit версии 7-10 .

  2. Добавьте обученную модель Vowpal Wabbit и подключите ее к левому порту ввода. Вы можете использовать обученную модель, созданную в том же эксперименте, или нахождение сохраненной модели в группе обученные модели в левой области навигации Studio (классическая модель).

    Ограничения

    модель должна быть доступна в Машинное обучение Studio (классической); вы не можете напрямую загрузить модель из службы хранилища Azure.

    Поддерживаются только модели Vowpal Wabbit 7-10; невозможно подключить сохраненные модели, которые были обучены с помощью других алгоритмов, и нельзя использовать модели, обученные в более ранних и более поздних версиях.

  3. В текстовом поле VW arguments (Аргументы VW) введите набор допустимых аргументов командной строки в исполняемый файл Vowpal Wabbit.
    сведения о том, какие аргументы Wabbit Vowpal поддерживаются и не поддерживаются в Машинное обучение, см. в разделе технические примечания .

  4. Щелкните указать тип данныхи выберите один из поддерживаемых типов данных из списка.

    Для оценки требуется один столбец данных, совместимых с VW.

    если у вас уже есть файл, созданный в форматах SVMLight или VW, его можно загрузить в рабочую область Azure ML в качестве нового набора данных в одном из следующих форматов: универсальный CSV без заголовка, TSV без заголовка.

    Параметр VW требует наличия метки, но она не используется в вычислениях, за исключением сравнения.

  5. Добавьте модуль Импорт данных и подключите его к правому порту ввода Score Vowpal Wabbit версии 7-10. Настройте данные импорта для доступа к входным данным.

    Входные данные для оценки должны быть заранее подготовлены в одном из поддерживаемых форматов и сохранены в хранилище BLOB-объектов Azure.

  6. Выберите параметр Include an extra column containing labels (Включить дополнительный столбец, содержащий метки), если вместе с оценками нужно выводить метки.

    Как правило, при обработке текстовых данных Vowpal Wabbit не требует меток и возвращает только оценки для каждой строки данных.

  7. Выберите параметр использовать кэшированные результаты, если требуется повторно использовать результаты предыдущего запуска, предполагая, что выполняются следующие условия.

    • Существует допустимый кэш из предыдущего запуска.

    • Параметры входных данных и параметров модуля не были изменены с момента предыдущего запуска.

    В противном случае процесс импорта повторяется каждый раз при запуске эксперимента.

  8. Запустите эксперимент.

Результаты

После завершения обучения:

Выходные данные содержат оценку прогноза, нормализованную от 0 до 1.

Примеры

Примеры того, как Vowpal Wabbit можно использовать в машинном обучении, см. в Коллекция решений ии Azure:

  • Пример Wabbit Vowpal

    В этом эксперименте демонстрируется подготовка данных, обучение и эксплуатация модели VW.

В следующем видео представлено пошаговое руководство по процессу обучения и оценки для Vowpal Wabbit:

https://azure.microsoft.com/documentation/videos/text-analytics-and-vowpal-wabbit-in-azure-ml-studio/

Технические примечания

В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.

Параметры

В Vowpal Wabbit есть множество параметров командной строки для выбора и настройки алгоритмов. Мы не можем привести здесь полное описание всех этих параметров, поэтому рекомендуем перейти на вики-страницу Vowpal Wabbit.

следующие параметры не поддерживаются в Машинное обучение Studio (классическая модель).

  • Параметры ввода-вывода, указанные на странице https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Эти свойства автоматически настраивает модуль.

  • Кроме того, запрещены любые параметры, которые создают несколько выводов или принимают несколько вводов. Это операторы --cbt , --lda , а также --wap .

  • Поддерживаются только контролируемые алгоритмы обучения. Это позволяет запретить следующие варианты: –active , --rank и --search т. д.

Все аргументы, отличные от описанных выше, являются разрешенными.

Ожидаемые входные данные

Имя Тип Описание
Обученная модель Интерфейс ILearner Обученный ученик
Dataset Таблица данных Оцениваемый набор данных

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Аргументы VW Любой Строка нет Введите аргументы Vowpal Wabbit.

Следующие аргументы не поддерживаются:

- -i
- -p или
- -t
Включить дополнительный столбец, содержащий метки Истина/ложь Логическое false Укажите, должен ли ZIP-файл включать метки с прогнозами
Укажите тип данных VW

SVMLight
DataType VW Указывает, каким является формат файла: SVMLight или Vowpal Wabbit

Выходные данные

Имя Тип Описание
Набор данных результатов Таблица данных Набор данных с результатами прогноза

Исключения

Исключение Описание
Ошибка 0001 Исключение возникает, если не удалось найти один или несколько столбцов указанного набора данных.
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0004 Исключение возникает, если параметр меньше или равен определенному значению.
Ошибка 0017 Исключение возникает, если один или несколько указанных столбцов относятся к типу, который не поддерживается в текущем модуле.

список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.

список исключений API см. в разделе Машинное обучение REST API коды ошибок.

См. также раздел

Анализ текста
Хэширование признаков
Распознавание именованных сущностей
Оценка модели Vowpal Wabbit 7-4
Обучение модели Vowpal Wabbit 7-4
Обучение модели Vowpal Wabbit 7-10
Список модулей в алфавитном порядке