Oefening: gegevens analyseren met Seaborn

Voltooid

Het leuke van Azure Notebooks, en Python in het algemeen, is dat u gebruik kunt maken van duizenden open source-bibliotheken om complexe taken uit te voeren zonder veel code te schrijven. In dit gedeelte gebruiken we Seaborn, een bibliotheek voor statistische visualisatie, om de tweede van de twee gegevenssets te plotten die u hebt geladen. Deze gegevens hebben betrekking hebben op de jaren 1882 tot 2014. U kunt met Seaborn een regressielijn maken en daar met één eenvoudig functieaanroep een projectie aan toevoegen die op basis van de regressie laat zien waar de gegevenspunten zouden moeten vallen.

  1. Plaats de muisaanwijzer in de lege cel onderaan het notebook. Wijzig het type cel in Markdown en voer de tekst 'Lineaire regressie met Seaborn uitvoeren' in.

  2. Voeg een codecel toe en plak hier de volgende code in.

    plt.scatter(years, mean)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    sns.regplot(yearsBase, meanBase)
    plt.show()
    
  3. Voer de codecel uit om een spreidingsdiagram met een regressielijn en een visuele representatie van het bereik te maken waarin de gegevenspunten naar verwachting moeten vallen.

    Vergelijking van werkelijke waarden en voorspelde waarden die zijn gegenereerd met Seaborn.

    Vergelijking van de werkelijke waarden en de voorspelde waarden die zijn gegenereerd met Seaborn

U ziet hoe de gegevenspunten voor de eerste 100 jaar mooi overeenkomen met de voorspelde waarden, maar de gegevenspunten vanaf ongeveer 1980 doen dit niet. Het zijn modellen als deze die wetenschappers doen geloven dat de klimaatverandering steeds sneller verloopt.