Cvičení – provedení lineární regrese pomocí knihovny scikit-learn
Další oblíbenou knihovnou Pythonu, která se široce používá v komunitě výzkumu, je knihovna scikit-learn. Je vynikající při vytváření modelů strojového učení, kdy pomáhá extrahovat z dat informace. Knihovnu scikit-learn (která už byla importována v 2. lekci) v tomto cvičení použijete k výpočtu trendové přímky pro data o klimatu z NASA.
Umístěte kurzor do prázdné buňky v dolní části poznámkového bloku. Změňte typ buňky na Markdown a zadejte do ní text „Perform linear regression with scikit-learn" (Provedení lineární regrese pomocí knihovny scikit–learn).
Přidejte buňku typu Code a vložte do ní následující kód.
# Pick the Linear Regression model and instantiate it model = LinearRegression(fit_intercept=True) # Fit/build the model model.fit(yearsBase[:, np.newaxis], meanBase) mean_predicted = model.predict(yearsBase[:, np.newaxis]) # Generate a plot like the one in the previous exercise plt.scatter(yearsBase, meanBase) plt.plot(yearsBase, mean_predicted) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show() print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
Teď buňku spusťte. Zobrazí se bodový graf s regresní přímkou.
Bodový graf s regresní přímkou – vypočítanou knihovnou sckikit-learn
Výstup je téměř stejný jako výstup v předchozím cvičení. Rozdíl je v tom, že knihovna scikit-learn za vás udělala víc práce. Konkrétně jste nemuseli programovat funkci přímky, jako jste to dělali u knihovny NumPy – funkce LinearRegression
z knihovny scikit-learn odvedla práci za vás. Knihovna scikit-learn podporuje mnoho různých typů regrese, což se hodí při vytváření sofistikovaných modelů strojového učení.