Ferramentas de ciência de dados e machine learning em máquinas virtuais de ciência de dados do Azure
Artigo
As Máquinas Virtuais de Ciência de Dados do Azure (DSVMs) possuem um rico conjunto de ferramentas e bibliotecas para aprendizado de máquina. Esses recursos estão disponíveis em linguagens populares, como Python, R e Julia.
O DSVM oferece suporte a estas ferramentas e bibliotecas de aprendizado de máquina:
Você pode usar o serviço de nuvem Azure Machine Learning para desenvolver e implantar modelos de aprendizado de máquina. Você pode usar o Python SDK para rastrear seus modelos à medida que você os cria, treina, dimensiona e gerencia. Implante modelos como contêineres e execute-os na nuvem, no local ou no Azure IoT Edge.
Edições compatíveis
Windows (ambiente do conda: AzureML), Linux (ambiente do conda: py36)
Usos típicos
Plataforma de machine learning geral
Como é configurado ou instalado?
Instalada com o suporte a GPU
Como usá-lo ou executá-lo
Como um SDK do Python e na CLI do Azure. Ative para o ambiente conda AzureML na edição Windows ou ative para py36 na edição Linux.
Link para exemplos
Encontre exemplos de notebooks Jupyter no diretório AzureML, em notebooks.
H2O
Categoria
Valor
O que é?
Uma plataforma de IA de código aberto que oferece suporte ao aprendizado de máquina distribuído, rápido, na memória e escalável.
Versões com suporte
Linux
Usos típicos
Machine learning de uso geral, escalonável e distribuído
Como é configurado ou instalado?
O H2O é instalado em /dsvm/tools/h2o.
Como usá-lo ou executá-lo
Conecte-se à VM com X2Go. Inicie um novo terminal e execute java -jar /dsvm/tools/h2o/current/h2o.jar. Em seguida, inicie um navegador da web e conecte-se ao http://localhost:54321.
Link para exemplos
Encontre amostras na VM no Jupyter, no diretório h2o.
Existem várias outras bibliotecas de aprendizado de máquina em DSVMs - por exemplo, o popular pacote scikit-learn que faz parte da distribuição Anaconda Python para DSVMs. Para obter uma lista de pacotes disponíveis em Python, R e Julia, execute os respectivos gerenciadores de pacotes.
LightGBM
Categoria
Valor
O que é?
Uma estrutura de gradient boosting (GBDT, GBRT, GBM ou MART) rápida, distribuída e de alto desempenho com base em algoritmos de árvore de decisão. Tarefas de aprendizado de máquina - classificação, classificação, etc. - use-o.
Versões com suporte
Windows, Linux
Usos típicos
Estrutura de aumento de gradiente de finalidade geral
Como é configurado ou instalado?
LightGBM é instalado como um pacote Python no Windows. No Linux, o executável da linha de comando está localizado em /opt/LightGBM/lightgbm. O pacote R é instalado e os pacotes Python são instalados.
Uma interface gráfica de usuário para mineração de dados que usa R.
Edições compatíveis
Windows, Linux
Usos típicos
Ferramenta de mineração de dados da Interface do Usuário geral para R
Como usá-lo ou executá-lo
Como uma ferramenta de interface do usuário. No Windows, inicie um prompt de comando, execute o R e, em seguida, dentro do R, execute rattle(). No Linux, conecte-se ao X2Go, inicie um terminal, execute o R e, em seguida, dentro do R, execute rattle().
Uma coleção de algoritmos de machine learning para tarefas de mineração de dados. Você pode aplicar os algoritmos diretamente ou chamá-los de seu próprio código Java. Weka contém ferramentas para o pré-processamento, classificação, regressão, clustering, regras de associação e visualização de dados.
Edições compatíveis
Windows, Linux
Usos típicos
Ferramenta de machine learning geral
Como usá-lo ou executá-lo
No Windows, pesquise Weka no menu Iniciar. No Linux, entre com X2Go e, em seguida, vá para Aplicativos>Desenvolvimento>Weka.
Uma biblioteca de aumento de gradiente rápida, portátil e distribuída (GBDT, GBRT ou GBM) para Python, R, Java, Scala, C++ e outros. Executa em apenas um computador, no Apache Hadoop e no Spark.
Edições compatíveis
Windows, Linux
Usos típicos
Biblioteca de machine learning geral
Como é configurado ou instalado?
Instalada com o suporte a GPU
Como usá-lo ou executá-lo
Como uma biblioteca Python (2.7 e 3.6+), pacote R e em ferramenta de linha de comando do caminho (C:\dsvm\tools\xgboost\bin\xgboost.exe para Windows e /dsvm/tools/xgboost/xgboost para Linux)
Links para exemplos
Exemplos são incluídos na VM, em /dsvm/tools/xgboost/demo no Linux e em C:\dsvm\tools\xgboost\demo no Windows.