Parametrisatie voor kennisoverdracht
Dit artikel bevat een voorbeeld van het uitvoeren van featurization voor het overdragen van leren met pandas UDF's.
Featurization voor overdrachtsleer in DL-modellen
Azure Databricks ondersteunt parametrisatie met deep learning-modellen. Vooraf getrainde Deep Learning-modellen kunnen worden gebruikt om functies te berekenen voor gebruik in andere downstreammodellen. Azure Databricks ondersteunt parametrisatie op schaal en verdeelt de berekening over een cluster. U kunt featurization uitvoeren met deep learning-bibliotheken die zijn opgenomen in Databricks Runtime ML, waaronder TensorFlow en PyTorch.
Azure Databricks ondersteunt ook kennisoverdracht, een techniek die nauw samenhangt met parametrisatie. Met kennisoverdracht kunt u de kennis van een bepaald probleemdomein in een gerelateerd domein hergebruiken. Parametrisatie is op zichzelf een eenvoudige en krachtige methode voor kennisoverdracht: rekenfuncties die gebruik maken van een vooraf getraind deep learning-model dragen kennis over goede functies over van het oorspronkelijke domein.
Stappen voor het berekenen van functies voor overdrachtsleer
In dit artikel wordt gedemonstreerd hoe u functies voor overdrachtsleer kunt berekenen met behulp van een vooraf getraind TensorFlow-model met behulp van de volgende werkstroom:
- Begin met een vooraf getraind deep learning-model, in dit geval een afbeeldingsclassificatiemodel van
tensorflow.keras.applications
. - De laatste laag(en) van het model afkappen. Het gewijzigde model produceert een tensor van functies als uitvoer, in plaats van een voorspelling.
- Pas dat model toe op een nieuwe afbeeldingsgegevensset uit een ander probleemdomein, computerfuncties voor de installatiekopieën.
- Gebruik deze functies om een nieuw model te trainen. In het volgende notitieblok wordt deze laatste stap weggelaten. Zie AI- en ML-modellen trainen voor voorbeelden van het trainen van een eenvoudig model, zoals logistieke regressie.
Voorbeeld: Pandas UDF's gebruiken voor featurization
In het volgende notebook worden pandas UDF's gebruikt om de featurization-stap uit te voeren. pandas UDF's en hun nieuwere variant Scalar Iterator pandas UDF's, bieden flexibele API's, ondersteunen elke deep learning-bibliotheek en bieden hoge prestaties.