Bases de la science des données pour le machine learning

Parcours d’apprentissage
14 Modules

Débutant

Intermédiaire

Ingénieur IA

Data Scientist

Développeur

Étudiant

Azure

Microsoft Learn propose plusieurs moyens interactifs d’obtenir une introduction au machine learning classique. À eux seuls, ces parcours d’apprentissage vous permettront de devenir productifs et constituent également une excellente base pour passer aux sujets du deep learning.

Des modèles Machine Learning classiques les plus basiques à l’analyse exploratoire des données et à la personnalisation des architectures, Vous serez guidé par un contenu conceptuel facile à comprendre et des cahiers interactifs Jupyter, le tout sans quitter votre navigateur.

Choisissez votre propre parcours en fonction de votre cursus et de vos centres d’intérêt.

✔ Option 1 : Le cours complet : Bases de la science des données pour le machine learning

C’est l’option recommandée pour le plus grand nombre. Il présente les mêmes modules que les deux autres parcours d’apprentissage avec un flux personnalisé qui optimise le renforcement des concepts. Si vous souhaitez apprendre à la fois les concepts sous-jacents et comment créer des modèles avec les outils de machine learning les plus courants, ce parcours est pour vous. C’est également le parcours idéal si vous prévoyez d’aller plus loin que le machine learning classique et que vous voulez vous former au deep learning et aux réseaux neuronaux, dont vous ne trouverez qu’une introduction ici.

✔ Vous êtes actuellement sur ce parcours, faites défiler vers le bas pour démarrer.

Option 2 : Le parcours d’apprentissage Comprendre la science des données pour le machine learning

Si vous souhaitez comprendre comment fonctionne le machine learning alors que vous n’avez pas véritablement de cursus mathématique, ce parcours est pour vous. Il ne fait aucune supposition sur l’éducation antérieure (autre qu’une familiarité légère avec les concepts de codage) et enseigne avec du code, des métaphores et des visuels qui vous donneront l’illumination. Il est d’ordre pratique, mais se concentre plus sur la compréhension des bases et moins sur la puissance des outils et bibliothèques disponibles.

Option 3 : Le parcours d’apprentissage Créer des modèles Machine Learning

Si vous avez déjà une idée de ce qu’est le machine learning ou si vous avez un solide cursus mathématique, vous préférerez peut-être vous plonger directement dans le parcours d’apprentissage Créer des modèles Machine Learning. Ces modules vous apprennent certains concepts de machine learning, mais avancent vite pour pouvoir arriver à l’utilisation d’outils tels que scikit-learn, TensorFlow et PyTorch. Ce parcours d’apprentissage est aussi celui qui vous conviendra le mieux si vous cherchez juste à vous familiariser avec le sujet pour comprendre des exemples de machine learning avec des produits comme Azure ML ou Azure Databricks.

Prérequis

Aucun

Modules de ce parcours d’apprentissage

Introduction au machine learning

Une vue d’ensemble du machine learning pour les personnes qui ont peu ou pas de connaissance de la science informatique et des statistiques. Vous allez apprendre quelques concepts de base, explorer des données et parcourir de façon interactive le cycle de vie du Machine Learning, en utilisant Python pour entraîner, enregistrer et utiliser un modèle de Machine Learning, tout comme dans la vraie vie.

Créer des modèles Machine Learning classiques avec un apprentissage supervisé

L’apprentissage supervisé est une forme de machine learning où un algorithme apprend à partir d’exemples de données. Nous dessinons progressivement une image de la façon dont l’apprentissage supervisé génère automatiquement un modèle qui peut faire des prédictions sur le monde réel. Nous parlons également de la façon dont ces modèles sont testés et des difficultés qui peuvent survenir lors de leur entraînement.

Présentation des données pour le Machine Learning

La puissance des modèles Machine Learning provient des données utilisées pour les entraîner. À travers le contenu et les exercices, nous explorons comment comprendre vos données, comment les encoder pour que l’ordinateur puisse les interpréter correctement, comment corriger les erreurs, et des conseils qui vous aideront à créer des modèles de haute performance.

Explorer et analyser des données avec Python

L’exploration et l’analyse de données sont au cœur de la science des données. Les scientifiques des données ont besoin de compétences en langages de programmation comme Python pour explorer, visualiser et manipuler les données.

Effectuer l'apprentissage et comprendre les modèles de régression dans le cadre du Machine Learning

La régression est probablement la technique de Machine Learning la plus courante sur laquelle reposent les découvertes scientifiques, la planification d'entreprise et l'analyse boursière. Ce document de formation se penche sur certaines analyses de régression courantes, simples ou plus complexes, et fournit des indications sur l'évaluation des performances des modèles.

Affinement et tests des modèles Machine Learning

Avec le Machine Learning, nous nous concentrons souvent sur le processus d’apprentissage. Or, un petit travail de préparation avant ce processus peut non seulement accélérer et améliorer l’apprentissage, mais également donner confiance dans le bon fonctionnement des modèles une fois confrontés à des données encore jamais rencontrées.

Effectuer l’apprentissage et évaluer des modèles de régression

La régression est un type d’apprentissage automatique couramment utilisé pour la prédiction de valeurs numériques.

Créer et comprendre les modèles de classification en apprentissage automatique

La classification consiste à classer les éléments dans des catégories et elle peut également être considérée comme une prise de décision automatique. Nous présentons ici les modèles de classification par régression logistique, en vous fournissant un tremplin vers des méthodes de classification plus complexes et passionnantes.

Sélectionner et personnaliser des architectures et des hyperparamètres à l’aide d’une forêt aléatoire

Il est souvent possible de personnaliser manuellement les modèles plus complexes pour améliorer leur efficacité. Grâce aux exercices et au contenu explicatif, nous découvrons comment la modification de l’architecture de modèles plus complexes peut apporter des résultats plus probants.

Matrice de confusion et déséquilibres de données

Comment savoir si un modèle est correct ou non pour classer nos données ? La façon dont les ordinateurs évaluent les performances du modèle peut parfois être difficile à comprendre. Elle a également tendance à trop simplifier la manière dont le modèle peut se comporter dans la vraie vie. Pour créer des modèles qui fonctionnent correctement, nous devons trouver des méthodes intuitives pour les évaluer et comprendre comment ces mesures peuvent biaiser notre opinion.

Mesurer et optimiser les performances de modèle avec ROC et AUC

Les courbes Receiver Operator Characteristic sont un moyen puissant d’évaluer et d’ajuster les modèles de classification formés. Nous présentons et expliquons l’utilité de ces courbes par le biais du contenu d’apprentissage et des exercices pratiques.

Effectuer l'apprentissage et l’évaluation de modèles de classification

La classification est une méthode d’apprentissage automatique utilisée pour catégoriser des éléments en classes.

Effectuer l’apprentissage et évaluer des modèles de clustering

Le clustering est une forme de Machine Learning utilisé pour regrouper des éléments similaires en clusters.

Entraîner et évaluer des modèles de Machine Learning

Le Deep Learning est une forme avancée de Machine Learning qui imite la manière dont le cerveau humain apprend via les réseaux de neurones connectés.