연습 - Seaborn으로 데이터 분석
Azure Notebooks(그리고 일반적으로 Python)의 장점 중 하나는 수많은 코드를 작성하지 않고도 복잡한 작업을 수행하는 데 활용할 수 있는 수천 개의 오픈 소스 라이브러리가 있다는 것입니다. 이 단원에서는 통계 시각화를 위한 라이브러리인 Seaborn을 사용하여 앞에서 로드한 두 데이터 세트의 두 번째 그래프(1882~2014년)를 그려보겠습니다. Seaborn은 프로젝션에 동반되는 회귀선을 만들 수 있으며, 이 회귀선은 간단한 함수 호출을 사용하여 데이터 포인트를 배치해야 하는 위치를 보여줍니다.
Notebook 하단의 빈 셀에 커서를 놓습니다. 셀 형식을 Markdown으로 변경하고 텍스트로 "Seaborn을 사용하여 선형 회귀 수행"을 입력합니다.
코드 셀을 추가하고 다음 코드를 붙여넣습니다.
plt.scatter(years, mean) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) sns.regplot(yearsBase, meanBase) plt.show()
회귀선이 포함된 분산형 차트 그리고 데이터 포인트가 배치될 것으로 예상되는 범위의 시각적 표현을 작성하는 코드 셀을 실행합니다.
실제 값과 Seaborn이 생성한 예상 값 비교
처음 100년 동안은 데이터 포인트가 예상 값과 일치했지만, 약 1980년부터는 일치하지 않습니다. 과학자들은 이러한 모델을 근거로 기후 변화 속도가 점점 빨라지고 있다고 믿습니다.