Quais ferramentas a Máquina Virtual de Ciência de Dados do Azure inclui?
Você pode usar a DSVM (Máquina Virtual de Ciência de Dados) para explorar facilmente os dados e lidar com o aprendizado de máquina na nuvem. Uma DSVM é pré-configurada com patches de segurança, drivers, software popular de ciência de dados e desenvolvimento e um sistema operacional completo. Você pode escolher o ambiente de hardware que funciona para você, desde máquinas centradas em CPU de baixo custo até máquinas poderosas com várias GPUs, armazenamento NVMe e grandes quantidades de memória. Para computadores com GPUs, todos os drivers são instalados e todas as estruturas de aprendizado de máquina são compatíveis com a versão para compatibilidade com GPU. Além disso, a aceleração é habilitada em todos os softwares de aplicativos compatíveis com GPUs.
A DSVM vem com as ferramentas de ciência de dados mais úteis pré-instaladas.
Crie soluções de aprendizado profundo e aprendizado de máquina
Ferramenta | DSVM do Windows Server 2019 | Windows Server 2022 DSVM | DSVM do Ubuntu 20.04 | Observações de uso |
---|---|---|---|---|
CUDA, cuDNN, driver NVIDIA | ✅ | ✅ | ✅ |
CUDA, cuDNN, Driver NVIDIA no DSVM |
Horovod | ❌ | ❌ | ✅ | Horovod no DSVM |
Interface de Gerenciamento do Sistema NVIDIA (nvidia-smi) | ✅ | ✅ | ✅ | nvidia-smi no DSVM |
PyTorch | ✅ | ✅ | ✅ | PyTorch no DSVM |
TensorFlow | ✅ | ✅ |
✅ | TensorFlow no DSVM |
Integração ao Azure Machine Learning (Python) | ✅ (SDK do Python, amostras) |
✅ (SDK do Python, amostras) |
✅ (SDK do Python, CLI, amostras) |
SDK do Azure Machine Learning |
XGBoost | ✅ (Suporte a CUDA) |
✅ (Suporte a CUDA) |
✅ (Suporte a CUDA) |
XGBoost no DSVM |
Vowpal Wabbit | ✅ | ✅ | ✅ |
Vowpal Wabbit no DSVM |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (Suporte a GPU, MPI) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Contêineres do Windows apenas) |
✅ (Contêineres do Windows apenas) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
Armazenar, recuperar e manipular dados
Ferramenta | DSVM do Windows Server 2019 | Windows Server 2022 DSVM | DSVM do Ubuntu 20.04 | Observações de uso |
---|---|---|---|---|
Bancos de dados relacionais | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server no DSVM |
Ferramentas de Banco de Dados | SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQuirreL SQL (ferramenta de consulta), bcp, sqlcmd Drivers ODBC/JDBC |
|
Gerenciador de Armazenamento do Azure | ✅ |
✅ |
||
CLI do Azure | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | Azcopy no DSVM |
Driver FUSE do blob | ❌ | ❌ | ❌ |
blobfuse no DSVM |
Ferramenta de Migração de Dados do Azure Cosmos DB | ✅ | ✅ | ❌ | Azure Cosmos DB no DSVM |
Ferramentas de linha de comando UNIX/Linux | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (autônomo) | ✅ | ✅ | ✅ |
Programa em Python, R, Julia e Node.js
Ferramenta | DSVM do Windows Server 2019 | Windows Server 2022 DSVM | DSVM do Ubuntu 20.04 | Observações de uso |
---|---|---|---|---|
CRAN-R com pacotes populares pré-instalados | ✅ | ✅ | ✅ | |
Anaconda Python com pacotes populares pré-instalados | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub (servidor de notebooks multiusuário) | ❌ | ❌ | ✅ | |
JupyterLab (servidor de notebooks multiusuário) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
Servidor do Jupyter Notebook com os kernels a seguir: | ✅ |
✅ |
✅ | Exemplos do Jupyter Notebook |
R | Exemplos do Jupyter no R | |||
Python | Exemplos do Jupyter no Python | |||
Julia | Exemplos do Jupyter no Julia | |||
PySpark | Exemplos do Jupyter no pySpark |
A DSVM do Ubuntu 20.04, a DSVM do Windows Server 2019 e a DSVM do Windows Server 2022 têm estes kernels Jupyter:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7: Spark (local)
- Julia 1.6.0
- R Spark: HDInsight
- Scala Spark: HDInsight
- Python 3 Spark – HDInsight
A DSVM do Ubuntu 20.04, a DSVM do Windows Server 2019 e a DSVM do Windows Server 2022 têm os seguintes ambientes conda:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
Use seu editor ou seu IDE preferido
Ferramenta | DSVM do Windows Server 2019 | Windows Server 2022 DSVM | DSVM do Ubuntu 20.04 | Observações de uso |
---|---|---|---|---|
Bloco de Notas++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | Visual Studio no DSVM |
Visual Studio Code | ✅ |
✅ |
✅ |
Visual Studio Code no DSVM |
PyCharm Community Edition | ✅ |
✅ |
✅ |
PyCharm no DSVM |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git e Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
SDK do Azure | ✅ |
✅ | ✅ |
Organize e apresente resultados
Ferramenta | DSVM do Windows Server 2019 | Windows Server 2022 DSVM | DSVM do Ubuntu 20.04 | Observações de uso |
---|---|---|---|---|
Microsoft 365 (Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Equipes da Microsoft | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Navegador Microsoft Edge | ✅ | ✅ | ✅ |