Поделиться через


Машинное обучение и средства обработки и анализа данных на виртуальных машинах Azure для обработки и анализа данных

В Виртуальная машина для обработки и анализа данных Azure (DSVMs) есть широкий набор средств и библиотек для машинного обучения. Эти ресурсы доступны на популярных языках, таких как Python, R и Джулия.

DSVM поддерживает следующие средства и библиотеки машинного обучения:

Пакет SDK для Машинного обучения Azure для Python

Полный справочник см. в пакете SDK Машинное обучение Azure для Python.

Категория Значение
Что это такое? Вы можете использовать облачную службу Машинное обучение Azure для разработки и развертывания моделей машинного обучения. Пакет SDK для Python можно использовать для отслеживания моделей при создании, обучении, масштабировании и управлении ими. Разверните модели как контейнеры и запустите их в облаке, локальной среде или в Azure IoT Edge.
Поддерживаемые выпуски Windows (среда Conda: AzureML), Linux (среда Conda: py36)
Распространенные способы применения Платформа машинного обучения общего назначения
Настройка и установка Установлена с поддержкой GPU.
Запуск и использование Как пакет SDK для Python и в Azure CLI. Активируйте среду AzureML conda в выпуске Windows или активируйте его py36 в выпуске Linux.
Ссылка на примеры Найдите пример записных книжек Jupyter в каталоге AzureML в разделе записных книжек.

H2O

Категория Значение
Что это такое? Платформа искусственного интеллекта с открытым исходным кодом, поддерживающая распределенное, быстрое, в памяти масштабируемое машинное обучение.
Поддерживаемые версии Linux
Распространенные способы применения Универсальное распределенное и масштабируемое машинное обучение
Настройка и установка H2O устанавливается в /dsvm/tools/h2o.
Запуск и использование Подключитесь к виртуальной машине с помощью X2Go. Запустите новый терминал и выполните java -jar /dsvm/tools/h2o/current/h2o.jar. Затем запустите веб-браузер и подключитесь к http://localhost:54321нему.
Ссылка на примеры Найдите примеры на виртуальной машине в Jupyter в каталоге h2o .

Существует несколько других библиотек машинного обучения на виртуальных машинах DSVMs, например популярный пакет, scikit-learn который является частью дистрибутива Python Anaconda для dsVMs. Чтобы получить список пакетов, доступных в Python, R и Julia, запустите соответствующие диспетчеры пакетов.

LightGBM

Категория Значение
Что это такое? Это быстродействующая, распределенная и высокопроизводительная платформа для градиентного бустинга (GBDT, GBRT, GBM или MART), основанная на алгоритмах дерева решений. Задачи машинного обучения — ранжирование, классификация и т. д. — используйте его.
Поддерживаемые версии Windows, Linux
Распространенные способы применения Универсальная платформа градиентного бустинга
Настройка и установка LightGBM устанавливается как пакет Python в Windows. В Linux исполняемый файл командной строки находится в /opt/LightGBM/lightgbm. Пакет R устанавливается и устанавливаются пакеты Python.
Ссылка на примеры Руководство по LightGBM

Rattle

Категория Значение
Что это такое? Графический пользовательский интерфейс для интеллектуального анализа данных, использующего R.
Поддерживаемые выпуски Windows, Linux
Распространенные способы применения Универсальное средство пользовательского интерфейса для интеллектуального анализа данных для R
Запуск и использование Как средство пользовательского интерфейса. В Windows откройте окно командной строки, запустите R, а затем внутри R выполните rattle(). В Linux подключитесь к X2Go, запустите терминал, запустите R, а затем внутри R выполните rattle().
Ссылка на примеры Rattle

Vowpal Wabbit

Категория Значение
Что это такое? Это быстродействующая библиотека внешнего обучения с открытым исходным кодом
Поддерживаемые выпуски Windows, Linux
Распространенные способы применения Библиотека для машинного обучения общего назначения
Настройка и установка Windows: установщик MSI
Linux: apt-get
Запуск и использование В качестве программы командной строки пути (/usr/bin/vw в Linux и C:\Program Files\VowpalWabbit\vw.exe в Windows).
Ссылка на примеры Примеры Vowpal Wabbit

Weka

Категория Значение
Что это такое? Это коллекция алгоритмов машинного обучения для задач интеллектуального анализа данных. Вы можете напрямую применять алгоритмы или вызывать их из собственного кода Java. Weka содержит средства для предварительной обработки данных, классификации, регрессии, кластеризации, правил взаимосвязей и визуализации.
Поддерживаемые выпуски Windows, Linux
Распространенные способы применения Средство для машинного обучения общего назначения
Запуск и использование В Windows выполните поиск Weka в меню Пуск. В Linux войдите с помощью X2Go, а затем перейдите к Applications (Приложения)>Development (Разработка)>Weka.
Ссылка на примеры Примеры Weka

XGBoost

Категория Значение
Что это такое? Это быстродействующая, расширяемая и распределенная библиотека градиентного бустинга (GBDT, GBRT или GBM) для Python, R, Java, Scala, C++ и других языков программирования. Выполняется на одном компьютере, а также на Apache Hadoop и Spark.
Поддерживаемые выпуски Windows, Linux
Распространенные способы применения Библиотека для машинного обучения общего назначения
Настройка и установка Установлена с поддержкой GPU.
Запуск и использование В качестве библиотеки Python (2.7 и 3.6+), пакета R и программы командной строки пути (C:\dsvm\tools\xgboost\bin\xgboost.exe для Windows, /dsvm/tools/xgboost/xgboost для Linux)
Ссылки на примеры Примеры включены на виртуальной машине (/dsvm/tools/xgboost/demo в Linux и C:\dsvm\tools\xgboost\demo в Windows).