소개
Python은 세계에서 가장 인기 있는 프로그래밍 언어 중 하나입니다. 데이터 과학 커뮤니티에서 기계 학습과 통계 분석을 위해 광범위하게 사용되고 있습니다. 인기 있는 이유 중 하나로 NumPy, Pandas, Matplotlib 및 Scikit-learn과 같은 수천 개의 오픈 소스 라이브러리를 사용할 수 있으므로 프로그래머와 연구원이 모두 데이터를 검색, 변환, 분석 및 시각화할 수 있습니다.
Azure Notebooks는 Jupyter Notebook을 빌드하고 실행하는 클라우드 기반 플랫폼입니다. Jupyter는 Python 및 다른 프로그래밍 언어를 사용하여 대화형 프로그래밍 및 데이터 분석을 용이하게 하는 IPython 기반의 환경입니다. Azure Notebooks는 Jupyter를 체험 서비스로 제공합니다. Jupyter 서버를 설치하고 관리할 필요 없이 Python 코드를 작성할 수 있는 편리한 방법입니다. 또한 웹 기반이므로 온라인 공동 작업에 적합한 솔루션입니다.
이 모듈에서는 Azure Notebook을 만들고, 미국 주요 항공사의 정시 도착 정보가 포함된 데이터 세트를 가져와 데이터 세트를 Notebook에 로드합니다. 그런 다음, Pandas를 사용하여 데이터 세트를 정리하고, Scikit-learn을 사용하여 기계 학습 모델을 작성하고, Matplotlib를 사용하여 모델의 출력을 시각화합니다.
학습 목표
이 모듈에서는 다음을 수행합니다.
- Jupyter Notebook을 Azure Notebooks에 만들고, 데이터를 가져오고, Notebook에 로드된 데이터를 봅니다.
- Pandas를 사용하여 기계 학습 모델에 사용할 데이터를 정리하고 준비합니다.
- Scikit-learn을 사용하여 기계 학습 모델을 만듭니다.
- Matplotlib를 사용하여 모델의 성능을 시각화합니다.