Implementera en maskininlärningslösning med Azure Databricks

Medel
Data Scientist
Azure Databricks

Azure Databricks är en plattform i molnskala för dataanalys och maskininlärning. Dataforskare och maskininlärningstekniker kan använda Azure Databricks för att implementera maskininlärningslösningar i stor skala.

Förutsättningar

Den här utbildningsvägen förutsätter att du har erfarenhet av att använda Python för att utforska data och träna maskininlärningsmodeller med vanliga öppen källkod ramverk som Scikit-Learn, PyTorch och TensorFlow. Överväg att slutföra utbildningsvägen Skapa maskininlärningsmodeller innan du startar den här.

Moduler i den här utbildningsvägen

Azure Databricks är en molntjänst som tillhandahåller en skalbar plattform för dataanalys med Apache Spark.

Azure Databricks bygger på Apache Spark och gör det möjligt för datatekniker och analytiker att köra Spark-jobb för att transformera, analysera och visualisera data i stor skala.

Maskininlärning innebär att använda data för att träna en förutsägelsemodell. Azure Databricks stöder flera vanliga maskininlärningsramverk som du kan använda för att träna modeller.

MLflow är en öppen källkod plattform för att hantera maskininlärningslivscykeln som stöds internt i Azure Databricks.

Justering av hyperparametrar är en viktig del av maskininlärning. I Azure Databricks kan du använda Hyperopt-biblioteket för att optimera hyperparametrar automatiskt.

AutoML i Azure Databricks förenklar processen med att skapa en effektiv maskininlärningsmodell för dina data.

Djupinlärning använder neurala nätverk för att träna mycket effektiva maskininlärningsmodeller för komplex prognostisering, visuellt innehåll, bearbetning av naturligt språk och andra AI-arbetsbelastningar.

Maskininlärning möjliggör datadrivet beslutsfattande och automatisering, men det är svårt att distribuera modeller till produktion för insikter i realtid. Azure Databricks förenklar den här processen genom att tillhandahålla en enhetlig plattform för att skapa, träna och distribuera maskininlärningsmodeller i stor skala, vilket främjar samarbete mellan dataforskare och tekniker.