연습 - 데이터를 업로드하고 산점도 만들기

완료됨

Jupyter Notebook은 로 구성됩니다. 각 셀에는 다음 세 가지 형식 중 하나가 할당됩니다.

  • markdown 형식으로 텍스트를 입력하기 위한 Markdown
  • 대화형으로 실행되는 코드를 입력하기 위한 코드
  • 인라인으로 데이터를 입력하기 위한 원시 NBConvert

코드 셀에 입력된 코드는 커널을 통해 실행되며, 커널은 Notebook을 실행하기 위한 격리된 환경을 제공합니다. 인기 있는 IPython 커널은 Python으로 작성된 코드를 지원하지만, 다른 언어를 지원하는 수십 가지 다른 커널도 사용할 수 있습니다. Azure Notebooks는 Python, R 및 F#을 기본적으로 제공합니다. 이 연구에 일반적으로 사용되는 여러 패키지 및 라이브러리 설치도 지원합니다.

현재는 Notebook 편집기가 빈 셀을 보여주고 있습니다. 이 연습에서는 해당 셀에 콘텐츠를 추가하고, NumPy 같은 Python 패키지를 가져오는 다른 셀을 추가하고, 기후 데이터를 포함하고 있는 NASA 데이터 파일 쌍을 로드하고, 데이터로 산점도를 만들겠습니다.

  1. 첫 번째 셀에서는 셀 형식을 Markdown으로 설정하고 셀 자체에 "Azure Notebook 기후 변화 분석"이라고 입력합니다.

    markdown 셀을 정의합니다.

    markdown 셀 정의

  2. 도구 모음에서 + 단추를 클릭하여 새 셀을 추가합니다. 셀 형식이 코드인지 확인하고, 다음 Python 코드를 셀에 입력합니다.

    import matplotlib.pyplot as plt
    import numpy as np
    from sklearn.linear_model import LinearRegression
    import seaborn as sns; sns.set()
    

    코드 셀을 추가 중입니다.

    코드 셀 추가

  3. 이제 실행 단추를 클릭하여 코드 셀을 실행하고 import 문에 지정된 패키지를 가져옵니다. 환경이 처음으로 준비될 때 표시되는 모든 경고를 무시합니다.

    코드 셀을 선택하고 다시 실행하면 경고를 제거할 수 있습니다.

    코드 셀을 실행 중입니다.

    코드 셀 실행

  4. 페이지 맨 위에 있는 메뉴에서 파일을 클릭하고, 드롭 다운 메뉴에서 업로드를 선택합니다. 5-year-mean-1951-1980.csv5-year-mean-1882-2014.csv라는 파일을 업로드합니다.

    Notebook에 데이터를 업로드 중입니다.

    Notebook에 데이터 업로드

  5. 파일이 유지되도록 대상 폴더/project를 선택합니다. 업로드 시작을 클릭하여 파일을 업로드하고, 업로드가 완료되면 확인을 클릭합니다.

    데이터의 대상 폴더를 선택하는 중입니다.

    데이터의 대상 폴더 선택

  6. Notebook 하단의 빈 셀에 커서를 놓습니다. 텍스트로 "데이터 가져오기"를 입력하고 셀 형식을 Markdown으로 변경합니다.

  7. 이제 코드 셀을 추가하고 다음 코드를 붙여넣습니다.

    yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True)
    years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)
    
  8. 실행 단추를 클릭하여 셀을 실행하고, NumPy의 loadtxt 함수를 사용하여 앞에서 업로드한 데이터를 로드합니다. 이제 데이터가 메모리에 있으며 애플리케이션에서 데이터를 사용할 수 있습니다.

    데이터를 로드합니다.

    데이터 로드

  9. Notebook 하단의 빈 셀에 커서를 놓습니다. 셀 형식을 Markdown으로 변경하고 텍스트로 "산점도 만들기"를 입력합니다.

  10. 코드 셀을 추가하고, Matplotlib를 사용하여 산점도를 만드는 다음 코드를 붙여넣습니다.

    plt.scatter(yearsBase, meanBase)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
  11. 실행을 클릭하여 셀을 실행하고 산점도 만듭니다.

    Matplotlib에서 만든 산점도.

    Matplotlib에서 만든 산점도

로드된 데이터 세트는 1951년부터 1980년까지 30년의 평균값을 사용하여 해당 기간의 기준 온도를 계산한 다음, 5년 평균값을 사용하여 각 연도의 5년 평균값과 30년 평균값의 차이를 계산합니다. 산점도는 연간 온도 차이를 보여줍니다.