Exercício – Executar a regressão linear com o Scikit-learn
Outra biblioteca popular do Python que é amplamente usada na comunidade de pesquisas é o Scikit-learn, que se destaca na criação de modelos de machine learning para ajudar a extrair informações de dados. Neste exercício, você usará o Scikit-learn (que já foi importado na Unidade 2 para calcular uma linha de tendência para os dados de clima da NASA).
Coloque o cursor na célula vazia na parte inferior do notebook. Altere o tipo de célula para Markdown e insira "Executar regressão linear com o Scikit-learn" como o texto.
Adicione uma célula de Código e cole o código a seguir.
# Pick the Linear Regression model and instantiate it model = LinearRegression(fit_intercept=True) # Fit/build the model model.fit(yearsBase[:, np.newaxis], meanBase) mean_predicted = model.predict(yearsBase[:, np.newaxis]) # Generate a plot like the one in the previous exercise plt.scatter(yearsBase, meanBase) plt.plot(yearsBase, mean_predicted) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show() print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
Agora, execute a célula para exibir um gráfico de dispersão com uma linha de regressão.
Gráfico de dispersão com linha de regressão calculada pelo Scikit-learn
A saída é quase idêntica à saída do exercício anterior. A diferença é que o Scikit-learn fez a maior parte do trabalho para você. Especificamente, você não precisou codificar uma função de linha como fez com o NumPy; a função LinearRegression
do Scikit-learn fez isso para você. O Scikit-learn é compatível com muitos diferentes tipos regressão, que são úteis na criação de modelos de machine learning sofisticados.