Compartilhar via


Ferramentas de ciência de dados e machine learning em máquinas virtuais de ciência de dados do Azure

As Máquinas Virtuais de Ciência de Dados do Azure (DSVMs) possuem um rico conjunto de ferramentas e bibliotecas para aprendizado de máquina. Esses recursos estão disponíveis em linguagens populares, como Python, R e Julia.

O DSVM oferece suporte a estas ferramentas e bibliotecas de aprendizado de máquina:

SDK do Azure Machine Learning para Python

Para obter uma referência completa, visite SDK do Azure Machine Learning para Python.

Categoria Valor
O que é? Você pode usar o serviço de nuvem Azure Machine Learning para desenvolver e implantar modelos de aprendizado de máquina. Você pode usar o Python SDK para rastrear seus modelos à medida que você os cria, treina, dimensiona e gerencia. Implante modelos como contêineres e execute-os na nuvem, no local ou no Azure IoT Edge.
Edições compatíveis Windows (ambiente do conda: AzureML), Linux (ambiente do conda: py36)
Usos típicos Plataforma de machine learning geral
Como é configurado ou instalado? Instalada com o suporte a GPU
Como usá-lo ou executá-lo Como um SDK do Python e na CLI do Azure. Ative para o ambiente conda AzureML na edição Windows ou ative para py36 na edição Linux.
Link para exemplos Encontre exemplos de notebooks Jupyter no diretório AzureML, em notebooks.

H2O

Categoria Valor
O que é? Uma plataforma de IA de código aberto que oferece suporte ao aprendizado de máquina distribuído, rápido, na memória e escalável.
Versões com suporte Linux
Usos típicos Machine learning de uso geral, escalonável e distribuído
Como é configurado ou instalado? O H2O é instalado em /dsvm/tools/h2o.
Como usá-lo ou executá-lo Conecte-se à VM com X2Go. Inicie um novo terminal e execute java -jar /dsvm/tools/h2o/current/h2o.jar. Em seguida, inicie um navegador da web e conecte-se ao http://localhost:54321.
Link para exemplos Encontre amostras na VM no Jupyter, no diretório h2o.

Existem várias outras bibliotecas de aprendizado de máquina em DSVMs - por exemplo, o popular pacote scikit-learn que faz parte da distribuição Anaconda Python para DSVMs. Para obter uma lista de pacotes disponíveis em Python, R e Julia, execute os respectivos gerenciadores de pacotes.

LightGBM

Categoria Valor
O que é? Uma estrutura de gradient boosting (GBDT, GBRT, GBM ou MART) rápida, distribuída e de alto desempenho com base em algoritmos de árvore de decisão. Tarefas de aprendizado de máquina - classificação, classificação, etc. - use-o.
Versões com suporte Windows, Linux
Usos típicos Estrutura de aumento de gradiente de finalidade geral
Como é configurado ou instalado? LightGBM é instalado como um pacote Python no Windows. No Linux, o executável da linha de comando está localizado em /opt/LightGBM/lightgbm. O pacote R é instalado e os pacotes Python são instalados.
Link para exemplos Guia LightGBM

Rattle

Categoria Valor
O que é? Uma interface gráfica de usuário para mineração de dados que usa R.
Edições compatíveis Windows, Linux
Usos típicos Ferramenta de mineração de dados da Interface do Usuário geral para R
Como usá-lo ou executá-lo Como uma ferramenta de interface do usuário. No Windows, inicie um prompt de comando, execute o R e, em seguida, dentro do R, execute rattle(). No Linux, conecte-se ao X2Go, inicie um terminal, execute o R e, em seguida, dentro do R, execute rattle().
Link para exemplos Rattle

Vowpal Wabbit

Categoria Valor
O que é? Uma biblioteca de sistema de aprendizado rápida, de software livre e fora do núcleo
Edições compatíveis Windows, Linux
Usos típicos Biblioteca de machine learning geral
Como é configurado ou instalado? Windows: instalador MSI
Linux: apt-get
Como usá-lo ou executá-lo Como uma ferramenta de linha de comando no caminho (C:\Program Files\VowpalWabbit\vw.exe no Windows, /usr/bin/vw no Linux)
Link para exemplos Exemplos de VowPal Wabbit

Weka

Categoria Valor
O que é? Uma coleção de algoritmos de machine learning para tarefas de mineração de dados. Você pode aplicar os algoritmos diretamente ou chamá-los de seu próprio código Java. Weka contém ferramentas para o pré-processamento, classificação, regressão, clustering, regras de associação e visualização de dados.
Edições compatíveis Windows, Linux
Usos típicos Ferramenta de machine learning geral
Como usá-lo ou executá-lo No Windows, pesquise Weka no menu Iniciar. No Linux, entre com X2Go e, em seguida, vá para Aplicativos>Desenvolvimento>Weka.
Link para exemplos Exemplos de Weka

XGBoost

Categoria Valor
O que é? Uma biblioteca de aumento de gradiente rápida, portátil e distribuída (GBDT, GBRT ou GBM) para Python, R, Java, Scala, C++ e outros. Executa em apenas um computador, no Apache Hadoop e no Spark.
Edições compatíveis Windows, Linux
Usos típicos Biblioteca de machine learning geral
Como é configurado ou instalado? Instalada com o suporte a GPU
Como usá-lo ou executá-lo Como uma biblioteca Python (2.7 e 3.6+), pacote R e em ferramenta de linha de comando do caminho (C:\dsvm\tools\xgboost\bin\xgboost.exe para Windows e /dsvm/tools/xgboost/xgboost para Linux)
Links para exemplos Exemplos são incluídos na VM, em /dsvm/tools/xgboost/demo no Linux e em C:\dsvm\tools\xgboost\demo no Windows.