Guía de migración de canalizaciones de aprendizaje profundo

Artículo
12/19/2024

Importante

Esta documentación se ha retirado y es posible que no se actualice. Los productos, servicios o tecnologías mencionados en este contenido ya no se admiten. Consulta IA y aprendizaje automático en Databricks.

En esta página, se incluyen sugerencias relacionadas con el proceso de migración desde el paquete Deep Learning Pipelines de código abierto que se incluía en Databricks Runtime 6.6 ML y las versiones anteriores. Las partes de la biblioteca de canalizaciones de aprendizaje profundo sparkdl se quitaron en Databricks Runtime 7.0 ML (EoS), en concreto, los transformadores y estimadores usados en canalizaciones de Apache Spark ML.

Esta página no constituye un recurso de información general sobre las canalizaciones de aprendizaje profundo de Azure Databricks.

Lectura de imágenes

El paquete de canalizaciones de aprendizaje profundo incluye un lector de imágenes sparkdl.image.imageIO, el que se quitó en Databricks Runtime 7.0 ML (EoS).

En su lugar, use el origen de datos de imágenes o el origen de datos de archivos binarios de Apache Spark. Muchos de los cuadernos de ejemplo en Carga de datos para el aprendizaje automático y el aprendizaje profundo muestran casos de uso de estos dos orígenes de datos.

Transferencia de aprendizaje

El paquete Deep Learning Pipelines incluye un transformador sparkdl.DeepImageFeaturizer de Spark ML para facilitar el aprendizaje por transferencia con modelos de aprendizaje profundo. DeepImageFeaturizer se quitó en Databricks Runtime 7.0 ML (EoS).

En su lugar, utilice UDF de Pandas para realizar la caracterización con modelos de aprendizaje profundo. Las UDF de Pandas (y su variante más reciente, las UDF de Pandas de iterador escalar) ofrecen API más flexibles, admiten más bibliotecas de aprendizaje profundo y ofrecen un mejor rendimiento.

Si necesita ejemplos de aprendizaje por transferencia con UDF de Pandas, consulte Caracterización para el aprendizaje por transferencia.

Ajuste distribuido de hiperparámetros

El paquete Deep Learning Pipelines incluye un estimador sparkdl.KerasImageFileEstimator de Spark ML para ajustar hiperparámetros mediante las utilidades de ajuste de Spark ML. KerasImageFileEstimator se quitó en Databricks Runtime 7.0 ML (EoS).

En su lugar, utilice Hyperopt para distribuir el ajuste de hiperparámetros para modelos de aprendizaje profundo.

Inferencia distribuida

El paquete de canalizaciones de aprendizaje profundo incluye varios transformadores Spark ML, que se muestran a continuación, para distribuir los procesos de inferencia que se habían quitado por completo en Databricks Runtime 7.0 ML (EoS):

DeepImagePredictor
TFImageTransformer
KerasImageFileTransformer
TFTransformer
KerasTransformer

En su lugar, utilice UDF de Pandas para ejecutar inferencia en DataFrames de Spark y siga los ejemplos que aparecen en Implementación de modelos para inferencia y predicción.

Compartir vía

Guía de migración de canalizaciones de aprendizaje profundo

Lectura de imágenes

Transferencia de aprendizaje

Ajuste distribuido de hiperparámetros

Inferencia distribuida

Comentarios

Recursos adicionales