Машинное обучение и средства обработки и анализа данных на виртуальных машинах Azure для обработки и анализа данных
Статья
В Виртуальная машина для обработки и анализа данных Azure (DSVMs) есть широкий набор средств и библиотек для машинного обучения. Эти ресурсы доступны на популярных языках, таких как Python, R и Джулия.
DSVM поддерживает следующие средства и библиотеки машинного обучения:
Вы можете использовать облачную службу Машинное обучение Azure для разработки и развертывания моделей машинного обучения. Пакет SDK для Python можно использовать для отслеживания моделей при создании, обучении, масштабировании и управлении ими. Разверните модели как контейнеры и запустите их в облаке, локальной среде или в Azure IoT Edge.
Поддерживаемые выпуски
Windows (среда Conda: AzureML), Linux (среда Conda: py36)
Распространенные способы применения
Платформа машинного обучения общего назначения
Настройка и установка
Установлена с поддержкой GPU.
Запуск и использование
Как пакет SDK для Python и в Azure CLI. Активируйте среду AzureML conda в выпуске Windows или активируйте его py36 в выпуске Linux.
Ссылка на примеры
Найдите пример записных книжек Jupyter в каталоге AzureML в разделе записных книжек.
H2O
Категория
Значение
Что это такое?
Платформа искусственного интеллекта с открытым исходным кодом, поддерживающая распределенное, быстрое, в памяти масштабируемое машинное обучение.
Поддерживаемые версии
Linux
Распространенные способы применения
Универсальное распределенное и масштабируемое машинное обучение
Настройка и установка
H2O устанавливается в /dsvm/tools/h2o.
Запуск и использование
Подключитесь к виртуальной машине с помощью X2Go. Запустите новый терминал и выполните java -jar /dsvm/tools/h2o/current/h2o.jar. Затем запустите веб-браузер и подключитесь к http://localhost:54321нему.
Ссылка на примеры
Найдите примеры на виртуальной машине в Jupyter в каталоге h2o .
Существует несколько других библиотек машинного обучения на виртуальных машинах DSVMs, например популярный пакет, scikit-learn который является частью дистрибутива Python Anaconda для dsVMs. Чтобы получить список пакетов, доступных в Python, R и Julia, запустите соответствующие диспетчеры пакетов.
LightGBM
Категория
Значение
Что это такое?
Это быстродействующая, распределенная и высокопроизводительная платформа для градиентного бустинга (GBDT, GBRT, GBM или MART), основанная на алгоритмах дерева решений. Задачи машинного обучения — ранжирование, классификация и т. д. — используйте его.
Поддерживаемые версии
Windows, Linux
Распространенные способы применения
Универсальная платформа градиентного бустинга
Настройка и установка
LightGBM устанавливается как пакет Python в Windows. В Linux исполняемый файл командной строки находится в /opt/LightGBM/lightgbm. Пакет R устанавливается и устанавливаются пакеты Python.
Графический пользовательский интерфейс для интеллектуального анализа данных, использующего R.
Поддерживаемые выпуски
Windows, Linux
Распространенные способы применения
Универсальное средство пользовательского интерфейса для интеллектуального анализа данных для R
Запуск и использование
Как средство пользовательского интерфейса. В Windows откройте окно командной строки, запустите R, а затем внутри R выполните rattle(). В Linux подключитесь к X2Go, запустите терминал, запустите R, а затем внутри R выполните rattle().
Это коллекция алгоритмов машинного обучения для задач интеллектуального анализа данных. Вы можете напрямую применять алгоритмы или вызывать их из собственного кода Java. Weka содержит средства для предварительной обработки данных, классификации, регрессии, кластеризации, правил взаимосвязей и визуализации.
Поддерживаемые выпуски
Windows, Linux
Распространенные способы применения
Средство для машинного обучения общего назначения
Запуск и использование
В Windows выполните поиск Weka в меню Пуск. В Linux войдите с помощью X2Go, а затем перейдите к Applications (Приложения)>Development (Разработка)>Weka.
Это быстродействующая, расширяемая и распределенная библиотека градиентного бустинга (GBDT, GBRT или GBM) для Python, R, Java, Scala, C++ и других языков программирования. Выполняется на одном компьютере, а также на Apache Hadoop и Spark.
Поддерживаемые выпуски
Windows, Linux
Распространенные способы применения
Библиотека для машинного обучения общего назначения
Настройка и установка
Установлена с поддержкой GPU.
Запуск и использование
В качестве библиотеки Python (2.7 и 3.6+), пакета R и программы командной строки пути (C:\dsvm\tools\xgboost\bin\xgboost.exe для Windows, /dsvm/tools/xgboost/xgboost для Linux)
Ссылки на примеры
Примеры включены на виртуальной машине (/dsvm/tools/xgboost/demo в Linux и C:\dsvm\tools\xgboost\demo в Windows).