Exemplos de treinamento de modelo
Esta seção inclui exemplos que mostram como treinar os modelos de machine learning no Azure Databricks usando muitas bibliotecas de software livre populares.
Você também pode usar o AutoML, que prepara automaticamente um conjunto de dados para treinamento de modelo, executa um conjunto de avaliações usando bibliotecas de software livre (como scikit-learn e XGBoost) e cria um notebook Python com o código-fonte de cada execução de avaliação para que você possa examinar, reproduzir e modificar o código.
Exemplos de machine learning
Pacote | Notebook(s) | Recursos |
---|---|---|
scikit-learn | Tutorial de aprendizado de máquina | Catálogo do Unity, modelo de classificação, MLflow, ajuste automatizado de hiperparâmetro com Hyperopt e MLflow |
scikit-learn | Exemplo de ponta a ponta | Catálogo do Unity, modelo de classificação, MLflow, ajuste automatizado de hiperparâmetro com Hyperopt e MLflow, XGBoost |
MLlib | Exemplos de MLlib | Classificação binária, árvores de decisão, regressão GBT, fluxo estruturado, transformador personalizado |
xgboost | Exemplos de XGBoost | Python, PySpark e Scala, cargas de trabalho de nó único e treinamento distribuído |
Exemplos de ajuste de hiperparâmetro
Para obter informações gerais sobre o ajuste de hiperparâmetro no Azure Databricks, confira o Ajuste do Hiperparâmetro.
Pacote | Notebook | Recursos |
---|---|---|
Optuna | Introdução ao Optuna | Optuna, Optuna distribuído, scikit-learn, MLflow |
Hyperopt | Hyperopt distribuído | Hyperopt distribuído, scikit-learn, MLflow |
Hyperopt | Comparar modelos | Usar o hyperopt distribuído para pesquisar espaço de hiperparâmetro para diferentes tipos de modelo simultaneamente |
Hyperopt | Algoritmos de treinamento distribuído e hyperopt | Hyperopt, MLlib |
Hyperopt | Práticas recomendadas do Hyperopt | Práticas recomendadas para conjuntos de dados de diferentes tamanhos |