Introduction
Le Machine Learning est la base de la plupart des solutions d’intelligence artificielle et fonctionne en utilisant de grandes quantités de données pour entraîner des modèles prédictifs.
Pour entraîner un modèle prédictif, vous utilisez une infrastructure Machine Learning pour déterminer une relation entre les caractéristiques des entités et les étiquettes que vous souhaitez prédire pour celles-ci. Par exemple, vous pouvez entraîner un modèle pour prédire le prix attendu d’une maison en fonction de caractéristiques comme la taille de la propriété, le nombre de chambres, le code postal, etc.
Azure Databricks fournit une plateforme de traitement des données basée sur Apache Spark qui prend en charge plusieurs infrastructures de Machine Learning populaires ; notamment Scikit-Learn, PyTorch, TensorFlow et d’autres. Ce module utilise l’infrastructure Machine Learning Spark MLlib pour présenter des exemples, mais les principes qu’il décrit s’appliquent à tous les frameworks de Machine Learning.