Exercice - Effectuer une régression linéaire avec Scikit Learn

Effectué

Autre bibliothèque Python connue et très utilisée dans le domaine de la recherche, scikit-learn convient parfaitement à la création de modèles Machine Learning pour extraire des informations des données. Dans cet exercice, vous allez utiliser scikit-learn (qui a déjà été importé dans l’unité 2) afin de calculer une courbe de tendance pour les données climatiques de la NASA.

  1. Placez le curseur dans la cellule vide en bas du notebook. Remplacez le type de cellule par Markdown et entrez « Effectuer une régression linéaire avec scikit-learn » comme texte.

  2. Ajoutez une cellule Code et ajoutez-la dans le code suivant.

    # Pick the Linear Regression model and instantiate it
    model = LinearRegression(fit_intercept=True)
    
    # Fit/build the model
    model.fit(yearsBase[:, np.newaxis], meanBase)
    mean_predicted = model.predict(yearsBase[:, np.newaxis])
    
    # Generate a plot like the one in the previous exercise
    plt.scatter(yearsBase, meanBase)
    plt.plot(yearsBase, mean_predicted)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
    print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
    
  3. Maintenant, exécutez la cellule pour afficher un nuage de points avec une ligne de régression.

    Nuage de points avec ligne de régression calculée par scikit-learn.

    Nuage de points avec ligne de régression calculée par scikit-learn

La sortie est presque identique à la sortie de l’exercice précédent. La différence est que scikit-learn a fait davantage de travail pour vous. En effet, vous n’avez pas eu à coder une fonction de ligne comme vous avez dû le faire avec NumPy ; la fonction LinearRegression de scikit-learn l’a fait pour vous. scikit-learn prend en charge de nombreux types de régression, ce qui se révèle pratique lors de la création de modèles Machine Learning sophistiqués.