빠른 시작: Linux(Ubuntu)용 Data Science Virtual Machine 설정
Ubuntu 20.04 DSVM(Data Science Virtual Machine) 및 PyTorch용 Azure DSVM을 사용하여 시작하고 실행합니다.
필수 조건
Ubuntu 20.04 Data Science Virtual Machine 또는 PyTorch용 Azure DSVM을 만들려면 Azure 구독이 필요합니다. Azure 평가판 체험하기.
Azure 체험 계정은 GPU 지원 VM(가상 머신) SKU를 지원하지 않습니다.
Linux용 데이터 과학 Virtual Machine 만들기
Ubuntu 20.04 DSVM 또는 PyTorch용 Azure DSVM의 인스턴스를 만들려면 다음을 수행합니다.
Azure Portal로 이동합니다. 아직 로그인하지 않은 경우 Azure 계정에 로그인하라는 메시지가 표시될 수 있습니다.
데이터 과학 가상 머신을 입력하여 VM 목록을 찾습니다. 그런 다음, Data Science Virtual Machine- Ubuntu 20.04 또는 PyTorch용 Azure DSVM을 선택합니다.
만들기를 실행합니다.
가상 머신 만들기 창에서 기본 사항 탭을 채웁니다.
구독: 둘 이상의 구독이 있는 경우 머신이 만들어지고 청구되는 구독을 선택합니다. 이 구독에 대한 리소스 만들기 권한이 있어야 합니다.
리소스 그룹: 새 그룹을 만들거나 기존 그룹을 사용합니다.
가상 머신 이름: VM의 이름을 입력합니다. 이 이름은 Azure Portal에서 사용됩니다.
지역: 가장 적절한 데이터 센터를 선택합니다. 가장 빠른 네트워크 액세스의 경우 대부분의 데이터를 호스팅하거나 실제 위치에 가장 가까운 데이터 센터가 가장 적합합니다. 자세한 내용은 Azure 지역을 방문 하세요.
이미지: 기본값을 변경하지 마세요.
크기: 이 옵션은 일반 워크로드에 적합한 크기로 자동 채워집니다. 자세한 내용은 Azure에서 Linux VM 크기를 참조하세요.
인증 유형: 더 빠른 설정을 위해 암호를 선택합니다.
참고 항목
JupyterHub를 사용하려는 경우 JupyterHub가 SSH(Secure Shell) 프로토콜 공개 키를 사용하도록 구성되지 않았기 때문에 암호를 선택해야 합니다.
사용자 이름: 관리자 사용자 이름을 입력합니다. 이 사용자 이름을 사용하여 VM에 로그인합니다. Azure 사용자 이름과 일치할 필요는 없습니다. 대문자를 사용하지 마세요.
Important
사용자 이름에 대문자를 사용하면 JupyterHub가 작동하지 않으며 500 내부 서버 오류가 발생합니다.
암호: VM에 로그인하는 데 사용할 암호를 입력합니다.
검토 + 만들기를 선택합니다.
검토 + 만들기 창에서 다음을 수행합니다.
- 입력한 모든 정보가 올바른지 확인합니다.
- 만들기를 실행합니다.
프로비전 프로세스는 약 5분이 걸립니다. Azure Portal에서 VM의 상태를 볼 수 있습니다.
Ubuntu Data Science Virtual Machine에 액세스
다음 네 가지 방법 중 하나로 Ubuntu DSVM에 액세스할 수 있습니다.
- 터미널 세션에 대한 SSH
- 그래픽 세션에 대한 xrdp
- 그래픽 세션에 대한 X2Go
- Jupyter Notebook용 JupyterHub 및 JupyterLab
SSH
SSH 인증을 사용하여 VM을 구성한 경우 텍스트 셸 인터페이스에 대해 4단계의 기본 사항 섹션에서 만든 계정 자격 증명을 사용하여 로그인할 수 있습니다. 자세한 내용은 Linux VM에 연결하는 방법에 대해 자세히 알아보기를 참조하세요.
xrdp
Linux 그래픽 세션에 액세스하기 위한 표준 도구는 xrdp입니다. 배포에는 기본적으로 이 도구가 포함되지 않지만 이러한 지침에서는 설치 방법을 설명합니다.
X2Go
참고 항목
테스트 결과 X2Go 클라이언트의 성능이 X11 전달보다 더 우수했습니다. 그래픽 데스크톱 인터페이스에서는 X2Go 클라이언트를 사용하는 것이 좋습니다.
X2Go 서버를 사용해 Linux VM이 이미 프로비저닝되었으며 클라이언트 연결을 수락할 준비가 되었습니다. Linux VM 그래픽 데스크톱에 연결하려면 클라이언트에서 다음 절차를 완료합니다.
사용 중인 클라이언트 플랫폼용 X2Go 클라이언트를 X2Go에서 다운로드하여 설치합니다.
VM의 공용 IP 주소를 적어둡니다. Azure Portal에서 사용자가 만든 VM을 열어 이 정보를 찾습니다.
X2Go Client를 실행합니다. 새 세션 창이 자동으로 열리지 않으면 새 세션 세션을>선택합니다.
결과 구성 창에서 다음 구성 매개 변수를 입력합니다.
- 세션:
- Host: 앞에서 기록해 둔 VM의 IP 주소를 입력합니다.
- 로그인: Linux VM에서 사용자 이름을 입력합니다.
- SSH 포트: 기본값 22를 그대로 사용합니다.
- 세션 유형: 값을 XFCE로 변경합니다. 현재 Linux VM은 XFCE 데스크톱만 지원합니다.
- 미디어: 사운드 지원 및 클라이언트 인쇄를 사용하지 않으려면 해제할 수 있습니다.
- 공유 폴더: 이 탭을 사용하여 VM에 탑재하려는 클라이언트 컴퓨터 디렉터리를 추가합니다.
- 세션:
확인을 선택합니다.
VM에 대한 로그인 창을 표시하려면 X2Go 창의 오른쪽 창에서 상자를 선택합니다.
VM의 암호를 입력합니다.
확인을 선택합니다.
연결 프로세스를 완료하려면 방화벽을 우회할 수 있는 X2Go 권한을 부여해야 할 수 있습니다.
이제 Ubuntu DSVM의 그래픽 인터페이스가 표시됩니다.
JupyterHub 및 JupyterLab
Ubuntu DSVM은 다중 사용자 Jupyter 서버인 JupyterHub를 실행합니다. 연결하려면 다음 단계를 따릅니다.
VM의 공용 IP 주소를 확인합니다. 이 값을 찾으려면 다음 스크린샷과 같이 Azure Portal에서 VM을 검색하고 선택합니다.
로컬 컴퓨터에서 웹 브라우저를 열고
https://your-vm-ip:8000
로 이동합니다. your-vm-ip를 앞서 기록해 둔 IP 주소로 바꿉니다.브라우저에서 창을 직접 열지 못할 수 있습니다. 인증서 오류가 있음을 알 수 있습니다. DSVM은 자체 서명된 인증서를 사용하여 보안을 제공합니다. 대부분의 브라우저는 이 경고 후에 선택할 수 있습니다. 대부분의 브라우저는 웹 세션 전체에서 인증서에 대한 일종의 시각적 경고를 계속 제공합니다.
브라우저에
ERR_EMPTY_RESPONSE
오류 메시지가 표시되면 HTTPS 프로토콜을 명시적으로 사용하여 컴퓨터에 액세스해야 합니다. 이 단계에서는 HTTP나 웹 주소만으로는 작동하지 않습니다. 주소 줄에 없는https://
웹 주소를 입력하면 대부분의 브라우저가 기본값으로http
설정되고 오류가 표시됩니다.이 스크린샷과 같이 VM을 만드는 데 사용한 사용자 이름 및 암호를 입력하고 로그인합니다.
이 단계에서 500 오류가 발생하면 사용자 이름에 대문자를 사용했을 것입니다. 이 문제는 JupyterHub와 사용하는 PAM 인증자 간의 알려진 상호 작용입니다.
이 페이지 오류에 도달할 수 없는 경우 NSG(네트워크 보안 그룹) 권한을 조정해야 할 수 있습니다. Azure Portal에서 리소스 그룹 내의 NSG 리소스를 찾습니다. 공용 인터넷에서 JupyterHub에 액세스하려면 포트 8000이 열려 있어야 합니다. (이미지는 이 VM이 Just-In-Time 액세스를 위해 구성되어 있음을 보여 하며, 권장됩니다. 자세한 내용은 Just-In-Time 액세스를 사용하여 관리 포트 보안을 방문하세요.)
사용 가능한 샘플 Notebook을 찾아봅니다.
Jupyter 노트북의 차세대 JupyterLab 및 JupyterHub도 제공됩니다. 액세스하려면 JupyterHub에 로그인합니다. 그런 다음, URL https://your-vm-ip:8000/user/your-username/lab
으로 이동합니다. your-username을 VM을 구성할 때 선택한 사용자 이름으로 바꿉니다. 다시 말하지만, 잠재적인 인증서 오류는 처음에 사이트에 액세스하지 못하도록 차단할 수 있습니다.
JupyterLab을 기본 노트북 서버로 설정하려면 다음 줄을 /etc/jupyterhub/jupyterhub_config.py
에 추가합니다.
c.Spawner.default_url = '/lab'
다음 단계
- Linux용 데이터 과학 Virtual Machine 연습의 데이터 과학을 방문하여 여기에 프로비전된 Linux DSVM을 사용하여 몇 가지 일반적인 데이터 과학 작업을 수행하는 방법을 알아봅니다.
- 이 문서에서 설명하는 도구를 사용하여 DSVM의 다양한 데이터 과학 도구를 살펴보세요. VM 내의 셸에서
dsvm-more-info
를 실행하여 VM에 설치된 도구에 대한 기본 소개 및 자세한 정보에 대한 포인터를 확인할 수도 있습니다. - 팀 데이터 과학 프로세스를 사용하여 분석 솔루션을 체계적으로 빌드하는 방법을 알아봅니다.
- 이 VM에 대한 적절한 참조 설명서를 방문하세요.