练习 - 上传数据并创建散点图
Jupyter 笔记本由单元格组成。 每个单元格都属于以下三种类型之一:
- Markdown,用于以 markdown 格式输入文本
- Code,用于输入以交互方式运行的代码
- Raw NBConvert,用于以内联方式输入数据
输入代码单元格中的代码由内核执行,它为笔记本提供了一个独立的运行环境。 常用的 IPython 内核支持使用 Python 编写的代码,但数十个其他内核可支持其他语言。 Azure Notebooks 自带 Python、R 和 F# 支持。 还支持安装许多研究中常用的包和库。
笔记本编辑器当前显示空白单元格。 在本练习中,你将内容添加到单元格并添加其他单元格,以导入 Python 包(例如 NumPy),加载包含气候数据的 NASA 数据文件对,并从数据中创建一个散点图。
在第一个单元格中,将单元格类型设置为 Markdown 并在单元格中输入“Azure Notebook 气候变化分析”:
定义 markdown 单元格
单击工具栏中的 + 按钮添加新单元格。 请确保该单元格类型为 Code,然后在单元格中输入以下 Python 代码:
import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression import seaborn as sns; sns.set()
添加代码单元格
现在,单击“运行”按钮运行代码单元格并导入
import
语句中指定的包。 第一次准备环境时请忽略显示的任何警告。可以通过选择代码单元格并再次运行该单元格来删除警告。
运行代码单元格
请在页面顶部的菜单中单击“文件”,再在下拉菜单中选择“上传”。 然后上传名为“5-year-mean-1951-1980.csv”和“5-year-mean-1882-2014.csv”的文件。
将数据上传到笔记本
选择 /project 作为“目标文件夹”以确保文件得到保存。 单击“开始上传”上传文件,并在上传成功后单击“确定”。
选择数据的目标文件夹
将光标放在笔记本底部的空白单元格中。 输入文本“导入数据”并将单元格类型更改为 Markdown。
现在添加 Code 单元格并将下列代码粘贴到其中。
yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True) years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
单击“运行”按钮运行单元格并使用 NumPy 的
loadtxt
函数加载已上传的数据。 数据现位于内存中,可供应用程序使用。加载数据
将光标放在笔记本底部的空白单元格中。 将单元格类型更改为 Markdown 并输入文本“创建散点图”。
添加一个 Code 单元格并将下列代码粘贴到其中,该代码使用 Matplotlib 创建散点图。
plt.scatter(yearsBase, meanBase) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show()
单击“运行”可运行该单元格并创建散点图。
Matplotlib 生成的散点图
加载的数据集使用 1951 年和 1980 年这 30 年的平均值来计算这段期间的基准温度,然后使用 5 年平均温度计算每一年的 5 年平均值和 30 年平均值之差。 散点图显示年温差。