Herramientas de aprendizaje automático y ciencia de datos en Azure Data Science Virtual Machines
Artículo
Las máquinas virtuales de Ciencia de datos de Azure (DSVM) disponen de un amplio conjunto de herramientas y bibliotecas para el aprendizaje automático. Estos recursos están disponibles en lenguajes populares, como Python, R y Julia.
DSVM admite estas bibliotecas y herramientas de aprendizaje automático:
Puede usar el servicio en la nube de Azure Machine Learning para desarrollar e implementar modelos de aprendizaje automático. Puede usar el SDK de Python para realizar un seguimiento de los modelos a medida que compila, entrena, escala y administra los modelos. Implemente modelos como contenedores y ejecútelos en la nube, de forma local o en Azure IoT Edge.
Ediciones compatibles
Windows (entorno de conda: AzureML), Linux (entorno de conda: py36)
Usos típicos
Plataforma de aprendizaje automático general
¿Cómo se configura o instala?
Se instala con la compatibilidad de GPU
¿Cómo se usa o ejecuta?
Como un SDK de Python y en la CLI de Azure. Activar al entorno conda AzureML en la edición Windows o activar la edición py36 a en la edición Linux.
Vínculos a ejemplos
Busque cuadernos de Jupyter Notebook de ejemplo en el directorio AzureML, en cuadernos.
H2O
Category
Value
¿Qué es?
Una plataforma de inteligencia artificial de código abierto que admite el aprendizaje automático escalable distribuido, rápido, en memoria.
Versiones compatibles
Linux
Usos típicos
Aprendizaje automático escalable y distribuido de uso general
¿Cómo se configura o instala?
H2O se instala en /dsvm/tools/h2o.
¿Cómo se usa o ejecuta?
Conéctese a la máquina virtual con X2Go. Inicie un nuevo terminal y ejecute java -jar /dsvm/tools/h2o/current/h2o.jar. Luego, inicie un explorador web y conéctese a http://localhost:54321.
Vínculos a ejemplos
Busque ejemplos en la máquina virtual en Jupyter, en el directorio h2o.
Hay otras bibliotecas de aprendizaje automático en DSVM; por ejemplo, el popular paquete scikit-learn que forma parte de la distribución de Python de Anaconda para DSVM. Para obtener una lista de los paquetes disponibles en Python, R y Julia, ejecute los administradores de paquetes respectivos.
LightGBM
Category
Value
¿Qué es?
Un marco de potenciación del gradiente (GBDT, GBRT, GBM o MART) rápido, distribuido y de alto rendimiento, basado en algoritmos de árbol de decisión. Tareas de aprendizaje automático: clasificación, clasificación, etc., úsela.
Versiones compatibles
Windows, Linux
Usos típicos
Marco de potenciación del gradiente de uso general
¿Cómo se configura o instala?
LightGBM se instala como un paquete de Python en Windows. En Linux, el ejecutable de la línea de comandos se encuentra en /opt/LightGBM/lightgbm. El paquete de R está instalado y se instalan los paquetes de Python.
Interfaz gráfica de usuario para la minería de datos que usa R.
Ediciones compatibles
Windows, Linux
Usos típicos
Herramienta general de minería de datos de la IU para R
¿Cómo se usa o ejecuta?
Como herramienta de interfaz de usuario. En Windows, inicie un símbolo del sistema, ejecute R y, dentro de R, ejecute rattle(). En Linux, conéctese a X2Go, inicie un terminal, ejecute R y, dentro de R, ejecute rattle().
Una colección de algoritmos de aprendizaje automático para las tareas de minería de datos. Puede aplicar los algoritmos directamente o llamarlos desde su propio código Java. Weka contiene herramientas para el preprocesamiento, la clasificación, la regresión, la agrupación en clústeres, las reglas de asociación y la visualización de datos.
Ediciones compatibles
Windows, Linux
Usos típicos
Herramienta de aprendizaje automático general
¿Cómo se usa o ejecuta?
En Windows, busque Weka en el menú Inicio. En Linux, inicie sesión con X2Go y, a continuación, vaya a Applications (Aplicaciones)>Development (Desarrollo)>Weka.
Una biblioteca de potenciación del gradiente (GBDT, GBRT o GBM) rápida, portátil y distribuida para Python, R, Java, Scala, C++, etc. Se ejecuta en una única máquina, y en Apache Hadoop y Spark.
Ediciones compatibles
Windows, Linux
Usos típicos
Biblioteca de aprendizaje automático general
¿Cómo se configura o instala?
Se instala con la compatibilidad de GPU
¿Cómo se usa o ejecuta?
Como biblioteca de Python (2.7 y 3.6+), paquete de R y en la herramienta de línea de comandos de ruta de acceso (C:\dsvm\tools\xgboost\bin\xgboost.exe para Windows y /dsvm/tools/xgboost/xgboost para Linux)
Vínculos a ejemplos
Se incluyen ejemplos en la máquina virtual, en /dsvm/tools/xgboost/demo en Linux y C:\dsvm\tools\xgboost\demo en Windows.