Compartir a través de


Uso de scikit-learn en Azure Databricks

En esta página se proporcionan ejemplos de cómo puede usar el paquete de scikit-learn para entrenar modelos de aprendizaje automático en Azure Databricks. scikit-learn es una de las bibliotecas de Python más populares para machine learning de un solo nodo y se incluye en Databricks Runtime y Databricks Runtime ML. Consulte Notas de la versión de Databricks Runtime para ver la versión de la biblioteca de scikit-learn que se incluye en el entorno de ejecución del clúster.

Puede importar estos cuadernos y ejecutarlos en el área de trabajo de Azure Databricks.

Para obtener cuadernos de ejemplo adicionales para empezar a trabajar rápidamente con Azure Databricks, consulte Tutoriales: Introducción a IA y aprendizaje automático.

Ejemplo básico con scikit-learn

En este cuaderno se proporciona información general rápida sobre el entrenamiento del modelo de aprendizaje automático en Azure Databricks. Usa el paquete de scikit-learn para entrenar un modelo de clasificación simple. También muestra el uso de MLflow para realizar un seguimiento del proceso de desarrollo del modelo y Optuna para automatizar el ajuste de hiperparámetros.

Si el área de trabajo está habilitada para Unity Catalog, use esta versión del cuaderno:

Cuaderno de clasificación scikit-learn (Unity Catalog)

Obtener el cuaderno

Si el área de trabajo no está habilitada para Unity Catalog, use esta versión del cuaderno:

Cuaderno de clasificación de Scikit-learn

Obtener el cuaderno

ejemplo de un extremo a otro mediante scikit-learn en Azure Databricks

En este cuaderno se utiliza scikit-learn para ilustrar un ejemplo completo para ver cómo cargar datos, entrenar un modelo, ajustar hiperparámetros distribuidos e inferir modelos. También muestra la administración del ciclo de vida del modelo mediante el Registro de modelos de MLflow para registrar y registrar el modelo.

Si el área de trabajo está habilitada para Unity Catalog, use esta versión del cuaderno:

Uso de scikit-learn con la integración de MLflow en Databricks (Unity Catalog)

Obtener el cuaderno

Si el área de trabajo no está habilitada para Unity Catalog, use esta versión del cuaderno:

Uso de scikit-learn con la integración de MLflow en Databricks

Obtener el cuaderno