Упражнение. Передача данных и создание точечной диаграммы
Записные книжки Jupyter состоят из ячеек. Каждой ячейке назначается один из трех типов:
- Markdown для ввода текста в формате markdown
- Код для ввода кода, который выполняется в интерактивном режиме
- Необработанный NBConvert для ввода данных во встроенном режиме
Код, введенный в ячейки кода, выполняется ядром, которое обеспечивает изолированную среду для выполнения записной книжки. Популярное ядро IPython поддерживает код, написанный на языке Python, но есть десятки других ядер с поддержкой других языков. Записные книжки Azure поддерживают Python, R и F# без дополнительной настройки. Они также поддерживают установку многих пакетов и библиотек, которые обычно используются в исследованиях.
Сейчас в редакторе записной книжки отображается пустая ячейка. В этом упражнении вы добавите содержимое к этой ячейке и другие ячейки для импорта пакетов Python, таких как NumPy, загрузите пару файлов с данными NASA по климату и создадите точечную диаграмму на основе этих данных.
В первой ячейке задайте тип ячейки Markdown и введите в нее "Анализ изменений климата в записной книжке Azure":
Определение ячейки Markdown
Нажмите на панели инструментов кнопку +, чтобы добавить новую ячейку. Убедитесь, что тип ячейки Код, а затем введите следующий код Python в ячейку:
import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression import seaborn as sns; sns.set()
Добавление ячейки кода
Теперь щелкните кнопку Запуск, чтобы запустить ячейку кода и импортировать пакеты, указанные в инструкциях
import
. Игнорируйте любые предупреждения, поскольку среда подготавливается в первый раз.Предупреждения можно удалить, выбрав ячейку кода и запустив ее еще раз.
Запуск ячейки кода
Нажмите Файл в меню в верхней части страницы и выберите Отправить в раскрывающемся меню. Затем отправьте файлы 5-year-mean-1951-1980.csv и 5-year-mean-1882-2014.csv.
Передача данных в записную книжку
Выберите /project в качестве папки назначения, чтобы файл не потерялся. Нажмите Начать отправку для передачи файлов, и ОК, когда передача завершится.
Выбор папки назначения для данных
Поместите курсор в пустую ячейку внизу записной книжки. Введите "Импорт данных" как текст и измените тип ячейки на Markdown.
Теперь добавьте ячейку для кода и вставьте следующий код.
yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True) years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
Нажмите кнопку Запуск, чтобы выполнить ячейку и использовать функцию NumPy
loadtxt
для загрузки отправленных данных. Данные находятся в памяти и могут использоваться приложением.Загрузка данных
Поместите курсор в пустую ячейку внизу записной книжки. Измените тип ячейки на Markdown и введите "Создать точечную диаграмму" как текст.
Добавьте ячейку кода и вставьте следующий код, который использует библиотеку Matplotlib, чтобы создать точечную диаграмму.
plt.scatter(yearsBase, meanBase) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show()
Нажмите Запуск, чтобы выполнить ячейку и создать точечную диаграмму.
Точечная диаграмма, созданная Matplotlib
Загруженный вами набор данных использует средние значения за 30 лет между 1951 и 1980 годами для вычисления базовой температуры за этот период, а затем на основе средних температур за 5 лет рассчитывает разницу между средними значениями за 5 и за 30 лет для каждого года. Точечная диаграмма показывает различия годовой температуры.