Exercício – Analisar Dados com a Seaborn

Concluído

Uma das melhores coisas do Azure Notebooks, e do Python em geral, é que existem milhares de bibliotecas open source das quais pode tirar partido para realizar tarefas complexas sem escrever muito código. Nesta unidade, irá utilizar a Seaborn, uma biblioteca para visualização de estatísticas, para desenhar o segundo conjunto de dados que carregou, que abrange os anos de 1882 a 2014. A Seaborn consegue criar uma linha de regressão com uma projeção que mostra onde os pontos de dados devem recair, com base na regressão com uma chamada de função simples.

  1. Coloque o cursor numa célula vazia na parte inferior do bloco de notas. Altere o tipo da célula para Markdown e introduza "Perform linear regression with Seaborn" ("Efetuar uma regressão linear com a Seaborn") como o texto.

  2. Adicione uma célula do tipo Code (Código) e cole o seguinte código.

    plt.scatter(years, mean)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    sns.regplot(yearsBase, meanBase)
    plt.show()
    
  3. Execute a célula de código para produzir um gráfico de dispersão com uma linha de regressão e uma representação visual do intervalo nos quais os pontos de dados deverão recair.

    Comparação de valores reais e valores previstos gerados com Seaborn.

    Comparação de valores reais e valores previstos gerados com a Seaborn

Repare como os pontos de dados nos primeiros 100 anos estão em conformidade com os valores previstos, mas os pontos de dados a partir de 1980 já não estão. São modelos como este que induzem os cientistas a acreditar que as alterações climáticas estão a acelerar.