Cvičení – provedení lineární regrese pomocí knihovny scikit-learn

Dokončeno

Další oblíbenou knihovnou Pythonu, která se široce používá v komunitě výzkumu, je knihovna scikit-learn. Je vynikající při vytváření modelů strojového učení, kdy pomáhá extrahovat z dat informace. Knihovnu scikit-learn (která už byla importována v 2. lekci) v tomto cvičení použijete k výpočtu trendové přímky pro data o klimatu z NASA.

  1. Umístěte kurzor do prázdné buňky v dolní části poznámkového bloku. Změňte typ buňky na Markdown a zadejte do ní text „Perform linear regression with scikit-learn" (Provedení lineární regrese pomocí knihovny scikit–learn).

  2. Přidejte buňku typu Code a vložte do ní následující kód.

    # Pick the Linear Regression model and instantiate it
    model = LinearRegression(fit_intercept=True)
    
    # Fit/build the model
    model.fit(yearsBase[:, np.newaxis], meanBase)
    mean_predicted = model.predict(yearsBase[:, np.newaxis])
    
    # Generate a plot like the one in the previous exercise
    plt.scatter(yearsBase, meanBase)
    plt.plot(yearsBase, mean_predicted)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
    print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
    
  3. Teď buňku spusťte. Zobrazí se bodový graf s regresní přímkou.

    Bodový graf s regresní přímkou vypočítanou pomocí sckikit-learn

    Bodový graf s regresní přímkou – vypočítanou knihovnou sckikit-learn

Výstup je téměř stejný jako výstup v předchozím cvičení. Rozdíl je v tom, že knihovna scikit-learn za vás udělala víc práce. Konkrétně jste nemuseli programovat funkci přímky, jako jste to dělali u knihovny NumPy – funkce LinearRegression z knihovny scikit-learn odvedla práci za vás. Knihovna scikit-learn podporuje mnoho různých typů regrese, což se hodí při vytváření sofistikovaných modelů strojového učení.