Bases de la science des données pour le machine learning

Débutant
Intermédiaire
Ingénieur IA
Data Scientist
Développeur
Étudiant
Azure

Microsoft Learn propose plusieurs moyens interactifs d’obtenir une introduction au machine learning classique. À eux seuls, ces parcours d’apprentissage vous permettront de devenir productifs et constituent également une excellente base pour passer aux sujets du deep learning.

Des modèles Machine Learning classiques les plus basiques à l’analyse exploratoire des données et à la personnalisation des architectures, Vous serez guidé par un contenu conceptuel facile à comprendre et des cahiers interactifs Jupyter, le tout sans quitter votre navigateur.

Choisissez votre propre parcours en fonction de votre cursus et de vos centres d’intérêt.

✔ Option 1 : Le cours complet : Bases de la science des données pour le machine learning

C’est l’option recommandée pour le plus grand nombre. Il présente les mêmes modules que les deux autres parcours d’apprentissage avec un flux personnalisé qui optimise le renforcement des concepts. Si vous souhaitez apprendre à la fois les concepts sous-jacents et comment créer des modèles avec les outils de machine learning les plus courants, ce parcours est pour vous. C’est également le parcours idéal si vous prévoyez d’aller plus loin que le machine learning classique et que vous voulez vous former au deep learning et aux réseaux neuronaux, dont vous ne trouverez qu’une introduction ici.

✔ Vous êtes actuellement sur ce parcours, faites défiler vers le bas pour démarrer.

Option 2 : Le parcours d’apprentissage Comprendre la science des données pour le machine learning

Si vous souhaitez comprendre comment fonctionne le machine learning alors que vous n’avez pas véritablement de cursus mathématique, ce parcours est pour vous. Il ne fait aucune supposition sur l’éducation antérieure (autre qu’une familiarité légère avec les concepts de codage) et enseigne avec du code, des métaphores et des visuels qui vous donneront l’illumination. Il est d’ordre pratique, mais se concentre plus sur la compréhension des bases et moins sur la puissance des outils et bibliothèques disponibles.

Option 3 : Le parcours d’apprentissage Créer des modèles Machine Learning

Si vous avez déjà une idée de ce qu’est le machine learning ou si vous avez un solide cursus mathématique, vous préférerez peut-être vous plonger directement dans le parcours d’apprentissage Créer des modèles Machine Learning. Ces modules vous apprennent certains concepts de machine learning, mais avancent vite pour pouvoir arriver à l’utilisation d’outils tels que scikit-learn, TensorFlow et PyTorch. Ce parcours d’apprentissage est aussi celui qui vous conviendra le mieux si vous cherchez juste à vous familiariser avec le sujet pour comprendre des exemples de machine learning avec des produits comme Azure ML ou Azure Databricks.

Prérequis

Aucun

Modules de ce parcours d’apprentissage

Une vue d’ensemble du machine learning pour les personnes qui ont peu ou pas de connaissance de la science informatique et des statistiques. Vous allez apprendre quelques concepts de base, explorer des données et parcourir de façon interactive le cycle de vie du Machine Learning, en utilisant Python pour entraîner, enregistrer et utiliser un modèle de Machine Learning, tout comme dans la vraie vie.

L’apprentissage supervisé est une forme de machine learning où un algorithme apprend à partir d’exemples de données. Nous dessinons progressivement une image de la façon dont l’apprentissage supervisé génère automatiquement un modèle qui peut faire des prédictions sur le monde réel. Nous parlons également de la façon dont ces modèles sont testés et des difficultés qui peuvent survenir lors de leur entraînement.

La puissance des modèles Machine Learning provient des données utilisées pour les entraîner. À travers le contenu et les exercices, nous explorons comment comprendre vos données, comment les encoder pour que l’ordinateur puisse les interpréter correctement, comment corriger les erreurs, et des conseils qui vous aideront à créer des modèles de haute performance.

L’exploration et l’analyse de données sont au cœur de la science des données. Les scientifiques des données ont besoin de compétences en langages de programmation comme Python pour explorer, visualiser et manipuler les données.

La régression est probablement la technique de Machine Learning la plus courante sur laquelle reposent les découvertes scientifiques, la planification d'entreprise et l'analyse boursière. Ce document de formation se penche sur certaines analyses de régression courantes, simples ou plus complexes, et fournit des indications sur l'évaluation des performances des modèles.

Avec le Machine Learning, nous nous concentrons souvent sur le processus d’apprentissage. Or, un petit travail de préparation avant ce processus peut non seulement accélérer et améliorer l’apprentissage, mais également donner confiance dans le bon fonctionnement des modèles une fois confrontés à des données encore jamais rencontrées.

La régression est un type d’apprentissage automatique couramment utilisé pour la prédiction de valeurs numériques.

La classification consiste à classer les éléments dans des catégories et elle peut également être considérée comme une prise de décision automatique. Nous présentons ici les modèles de classification par régression logistique, en vous fournissant un tremplin vers des méthodes de classification plus complexes et passionnantes.

Il est souvent possible de personnaliser manuellement les modèles plus complexes pour améliorer leur efficacité. Grâce aux exercices et au contenu explicatif, nous découvrons comment la modification de l’architecture de modèles plus complexes peut apporter des résultats plus probants.

Comment savoir si un modèle est correct ou non pour classer nos données ? La façon dont les ordinateurs évaluent les performances du modèle peut parfois être difficile à comprendre. Elle a également tendance à trop simplifier la manière dont le modèle peut se comporter dans la vraie vie. Pour créer des modèles qui fonctionnent correctement, nous devons trouver des méthodes intuitives pour les évaluer et comprendre comment ces mesures peuvent biaiser notre opinion.

Les courbes Receiver Operator Characteristic sont un moyen puissant d’évaluer et d’ajuster les modèles de classification formés. Nous présentons et expliquons l’utilité de ces courbes par le biais du contenu d’apprentissage et des exercices pratiques.

La classification est une méthode d’apprentissage automatique utilisée pour catégoriser des éléments en classes.

Le clustering est une forme de Machine Learning utilisé pour regrouper des éléments similaires en clusters.

Le Deep Learning est une forme avancée de Machine Learning qui imite la manière dont le cerveau humain apprend via les réseaux de neurones connectés.