Ejemplos de entrenamiento de modelos
En esta sección se incluyen ejemplos que muestran cómo entrenar modelos de Machine Learning en Azure Databricks mediante muchas bibliotecas de código abierto conocidas.
También puede usar AutoML, que prepara automáticamente un conjunto de datos para el entrenamiento del modelo, realiza una set de pruebas mediante bibliotecas de código abierto, como scikit-learn y XGBoost, y crea un cuaderno de Python con el código fuente de cada ejecución de prueba para que pueda revisar, reproducir y modificar el código.
Ejemplos de aprendizaje automático
Paquete | Cuadernos | Características |
---|---|---|
scikit-learn | Tutorial sobre aprendizaje automático | Unity Catalog, modelo de clasificación, MLflow, ajuste automatizado de hiperparámetros con Hyperopt y MLflow |
scikit-learn | Acceso de un extremo a otro | Unity Catalog, modelo de clasificación, MLflow, ajuste automatizado de hiperparámetros con Hyperopt y MLflow, XGBoost |
MLlib | Ejemplos de MLlib | Clasificación binaria, árboles de decisión, regresión de GBT, Structured Streaming, transformador personalizado |
xgboost | Ejemplos de XGBoost | Python, PySpark y Scala, cargas de trabajo de un solo nodo y entrenamiento distribuido |
Ejemplo de ajuste de hiperparámetros
Para obtener información general sobre el ajuste de hiperparámetros en Azure Databricks, consulte Ajuste de hiperparámetros.
Paquete | Notebook | Características |
---|---|---|
Optuna | Get comenzó con Optuna | Optuna, Optuna distribuido, Scikit-learn, MLflow |
Hyperopt | Hyperopt distribuido | Hyperopt distribuido, scikit-learn, MLflow |
Hyperopt | Comparación de modelos | Use Hyperopt distribuido para buscar espacio de hiperparámetros para diferentes tipos de modelo simultáneamente |
Hyperopt | Algoritmos de entrenamiento distribuido e Hyperopt | Hyperopt, MLlib |
Hyperopt | Procedimientos recomendados de Hyperopt | Procedimientos recomendados para conjuntos de datos de diferentes tamaños |