Guia de migração do Deep Learning Pipelines
Importante
Esta documentação foi desativada e pode não ser atualizada. Os produtos, serviços ou tecnologias mencionados neste conteúdo não são mais suportados. Veja IA e aprendizado de máquina no Databricks.
Esta página inclui dicas para migrar do pacote de código aberto Deep Learning Pipelines que foi incluído no Databricks Runtime 6.6 ML e abaixo. Partes da biblioteca sparkdl
Deep Learning Pipelines foram removidas no Databricks Runtime 7.0 ML (EoS), especificamente, os Transformers e Estimadores usados nos pipelines Apache Spark ML.
Esta página não é um recurso para obter informações gerais sobre pipelines de aprendizagem profunda no Azure Databricks.
Ler imagens
O pacote Deep Learning Pipelines inclui um leitor sparkdl.image.imageIO
de imagens, que foi removido no Databricks Runtime 7.0 ML (EoS).
Em vez disso, use a fonte de dados de imagem ou a fonte de dados de arquivo binário do Apache Spark. Muitos dos blocos de anotações de exemplo em Carregar dados para aprendizado de máquina e aprendizado profundo mostram casos de uso dessas duas fontes de dados.
Transferir aprendizagem
O pacote Deep Learning Pipelines inclui um Spark ML Transformer sparkdl.DeepImageFeaturizer
para facilitar a aprendizagem de transferência com modelos de aprendizagem profunda.
DeepImageFeaturizer
foi removido no Databricks Runtime 7.0 ML (EoS).
Em vez disso, use pandas UDFs para executar a featurização com modelos de aprendizagem profunda. Os pandas UDFs e a sua variante mais recente Scalar Iterator pandas UDFs oferecem APIs mais flexíveis, suportam mais bibliotecas de aprendizagem profunda e proporcionam um melhor desempenho.
Veja Featurization for transfer learning para exemplos de aprendizagem de transferência com pandas UDFs.
Ajuste distribuído de hiperparâmetros
O pacote Deep Learning Pipelines inclui um Spark ML Estimator sparkdl.KerasImageFileEstimator
para ajustar hiperparâmetros usando utilitários de ajuste Spark ML.
KerasImageFileEstimator
foi removido no Databricks Runtime 7.0 ML (EoS).
Em vez disso, use o Hyperopt para distribuir o ajuste de hiperparâmetros para modelos de aprendizado profundo.
Inferência distribuída
O pacote Deep Learning Pipelines inclui vários Transformadores Spark ML para distribuição de inferência, todos os quais foram removidos no Databricks Runtime 7.0 ML (EoS):
DeepImagePredictor
TFImageTransformer
KerasImageFileTransformer
TFTransformer
KerasTransformer
Em vez disso, use pandas UDFs para executar inferência em Spark DataFrames, seguindo os exemplos em Implantar modelos para inferência e previsão em lote.