练习 - 上传数据并创建散点图

已完成

Jupyter 笔记本由单元格组成。 每个单元格都属于以下三种类型之一:

  • Markdown,用于以 markdown 格式输入文本
  • Code,用于输入以交互方式运行的代码
  • Raw NBConvert,用于以内联方式输入数据

输入代码单元格中的代码由内核执行,它为笔记本提供了一个独立的运行环境。 常用的 IPython 内核支持使用 Python 编写的代码,但数十个其他内核可支持其他语言。 Azure Notebooks 自带 Python、R 和 F# 支持。 还支持安装许多研究中常用的包和库。

笔记本编辑器当前显示空白单元格。 在本练习中,你将内容添加到单元格并添加其他单元格,以导入 Python 包(例如 NumPy),加载包含气候数据的 NASA 数据文件对,并从数据中创建一个散点图。

  1. 在第一个单元格中,将单元格类型设置为 Markdown 并在单元格中输入“Azure Notebook 气候变化分析”:

    定义 Markdown 单元格。

    定义 markdown 单元格

  2. 单击工具栏中的 + 按钮添加新单元格。 请确保该单元格类型为 Code,然后在单元格中输入以下 Python 代码:

    import matplotlib.pyplot as plt
    import numpy as np
    from sklearn.linear_model import LinearRegression
    import seaborn as sns; sns.set()
    

    添加代码单元格。

    添加代码单元格

  3. 现在,单击“运行”按钮运行代码单元格并导入 import 语句中指定的包。 第一次准备环境时请忽略显示的任何警告。

    可以通过选择代码单元格并再次运行该单元格来删除警告。

    运行代码单元格。

    运行代码单元格

  4. 请在页面顶部的菜单中单击“文件”,再在下拉菜单中选择“上传”。 然后上传名为“5-year-mean-1951-1980.csv”和“5-year-mean-1882-2014.csv”的文件。

    将数据上传到笔记本。

    将数据上传到笔记本

  5. 选择 /project 作为“目标文件夹”以确保文件得到保存。 单击“开始上传”上传文件,并在上传成功后单击“确定”。

    选择数据的目标文件夹。

    选择数据的目标文件夹

  6. 将光标放在笔记本底部的空白单元格中。 输入文本“导入数据”并将单元格类型更改为 Markdown。

  7. 现在添加 Code 单元格并将下列代码粘贴到其中。

    yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True)
    years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
    
  8. 单击“运行”按钮运行单元格并使用 NumPy 的 loadtxt 函数加载已上传的数据。 数据现位于内存中,可供应用程序使用。

    正在加载数据。

    加载数据

  9. 将光标放在笔记本底部的空白单元格中。 将单元格类型更改为 Markdown 并输入文本“创建散点图”。

  10. 添加一个 Code 单元格并将下列代码粘贴到其中,该代码使用 Matplotlib 创建散点图。

    plt.scatter(yearsBase, meanBase)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
  11. 单击“运行”可运行该单元格并创建散点图。

    Matplotlib 生成的散点图。

    Matplotlib 生成的散点图

加载的数据集使用 1951 年和 1980 年这 30 年的平均值来计算这段期间的基准温度,然后使用 5 年平均温度计算每一年的 5 年平均值和 30 年平均值之差。 散点图显示年温差。