Cvičení – nahrání dat a vytvoření bodového grafu
Poznámkové bloky Jupyter se skládají z buněk. Každá buňka má přiřazený jeden ze tří typů:
- Markdown pro vložení textu ve formátu markdown
- Code pro vložení kódu, který běží interaktivně
- Raw NBConvert pro vložení dat inline
Kód vložený do buněk typu Code je prováděný jádrem, což poznámkovému bloku poskytuje izolované prostředí, ve kterém běží. Oblíbené jádro IPython podporuje kód napsaný v jazyce Python, ale k dispozici jsou desítky jiných jader, která podporují další jazyky. Poznámkové bloky služby Azure Notebooks přímo podporují jazyky Python, R a F#. Podporují také instalaci mnoha balíčků a knihoven, které se běžně používají ve výzkumu.
V editoru poznámkového bloku se momentálně zobrazuje prázdná buňka. V tomto cvičení přidáte do této buňky obsah a přidáte další buňky pro importování balíčků Pythonu, jako je NumPy, načtete dva datové soubory NASA obsahující data o klimatu a vytvoříte z těchto dat bodový graf.
V první buňce nastavte typ buňky na Markdown a do samotné buňky zadejte text „Azure Notebook Climate Change Analysis“ (Poznámkový blok Azure – analýza změny klimatu):
Definování buňky markdown
Kliknutím na tlačítko + na panelu nástrojů přidejte novou buňku. Zajistěte, aby typ buňky byl Code, a pak do buňky vložte následující kód v jazyku Python:
import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression import seaborn as sns; sns.set()
Přidání buňky s kódem
Kliknutím na tlačítko Run (Spustit) buňku s kódem spustíte a naimportujete balíčky zadané v příkazech
import
. Upozornění, která se zobrazí, ignorujte, protože prostředí se připravuje poprvé.Upozornění se můžete zbavit tak, že vyberete buňku s kódem a znovu ji spustíte.
Spuštění buňky s kódem
V nabídce v horní části stránky klikněte na File (Soubor) a v rozevírací nabídce vyberte Upload (Nahrát). Potom nahrajte soubory s názvem 5-year-mean-1951-1980.csv a 5-year-mean-1882-2014.csv.
Nahrání dat do poznámkového bloku
Jako Destination Folder (cílovou složku) vyberte /project, abyste zajistili zachování vašich souborů. Nahrávání souborů spustíte kliknutím na Start Upload (Spustit nahrávání). Po jejich úspěšném nahrání klikněte na OK.
Výběr cílové složky pro data
Umístěte kurzor do prázdné buňky v dolní části poznámkového bloku. Zadejte do buňky text „Import data“ (Import dat) a změňte typ buňky na Markdown.
Teď přidejte buňku typu Code a vložte do ní následující kód.
yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True) years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
Kliknutím na tlačítko Run (Spustit) buňku spustíte a použijete funkci
loadtxt
z knihovny NumPy k načtení dat, která jste nahráli. Data jsou teď v paměti a můžou být použitá aplikací.Načtení dat
Umístěte kurzor do prázdné buňky v dolní části poznámkového bloku. Změňte typ buňky na Markdown a zadejte do ní text „Create a scatter plot“ (Vytvoření bodového grafu).
Přidejte buňku typu Code a vložte do ní následující kód, který používá knihovnu Matplotlib k vytvoření bodového grafu.
plt.scatter(yearsBase, meanBase) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show()
Kliknutím na tlačítko Run (Spustit) buňku spustíte a vytvoříte bodový graf.
Bodový graf vytvořený pomocí knihovny Matplotlib
Datová sada, kterou jste načetli, používá 30letý průměr mezi roky 1951 a 1980 k výpočtu základní teploty pro toto období a pak používá 5leté průměrné teploty k výpočtu rozdílu mezi 5letým průměrem a 30letým průměrem pro každý rok. Bodový graf ukazuje roční teplotní rozdíly.