Konfigurowanie laboratorium do uczenia języka R w systemie Linux
Ważne
Usługa Azure Lab Services zostanie wycofana 28 czerwca 2027 r. Aby uzyskać więcej informacji, zobacz przewodnik po wycofaniu.
Uwaga
Ten artykuł odwołuje się do funkcji dostępnych w planach laboratorium, które zastąpiły konta laboratorium.
R to język open source używany do obliczeń statystycznych i grafiki. Jest on używany w analizie statystycznej genetyki do przetwarzania języka naturalnego w celu analizowania danych finansowych. Język R zapewnia interaktywne środowisko wiersza polecenia. RStudio to interaktywne środowisko projektowe (IDE) dostępne dla języka R. Bezpłatna wersja udostępnia narzędzia do edycji kodu, zintegrowane środowisko debugowania i narzędzia programistyczne pakietów.
Ten artykuł koncentruje się wyłącznie na RStudio i R jako bloku konstrukcyjnym dla klasy, która wymaga użycia obliczeń statystycznych. Typy klas uczenia głębokiego i języka Python i notesów Jupyter Notebooks konfigurują program RStudio inaczej. W każdym artykule opisano sposób używania obrazu platformy handlowej Nauka o danych Virtual Machine for Linux (Ubuntu), który zawiera wiele narzędzi związanych z nauką o danych, w tym RStudio, wstępnie zainstalowanych.
Konfiguracja laboratorium
Aby skonfigurować to laboratorium, potrzebujesz subskrypcji platformy Azure i planu laboratorium, aby rozpocząć pracę. Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Konfiguracja zasobów zewnętrznych
Niektóre klasy wymagają, aby pliki, takie jak duże pliki danych, przechowywane zewnętrznie.
Jeśli zdecydujesz się mieć udostępniony serwer R Server dla uczniów, przed utworzeniem laboratorium należy skonfigurować serwer. Aby uzyskać więcej informacji na temat konfigurowania serwera udostępnionego, zobacz jak utworzyć laboratorium z udostępnionym zasobem w usługach Azure Lab Services. Aby uzyskać instrukcje dotyczące tworzenia programu RStudio Server, zobacz Pobieranie programu RStudio Server dla systemu Debian & Ubuntu i uzyskiwanie dostępu do oprogramowania RStudio Server Open Source.
Jeśli zdecydujesz się korzystać z jakichkolwiek zasobów zewnętrznych, musisz połączyć się z siecią wirtualną w usłudze Azure Lab Services przy użyciu planu laboratorium.
Ważne
Zaawansowana sieć musi być włączona podczas tworzenia planu laboratorium. Nie można go dodać później.
Ustawienia planu laboratorium
Po uzyskaniu subskrypcji platformy Azure możesz utworzyć nowy plan laboratorium w usłudze Azure Lab Services. Aby uzyskać więcej informacji na temat tworzenia nowego planu laboratorium, zobacz samouczek dotyczący konfigurowania planu laboratorium. Możesz również użyć istniejącego planu laboratorium.
Włącz ustawienia planu laboratorium zgodnie z opisem w poniższej tabeli. Aby uzyskać więcej informacji na temat włączania obrazów witryny Azure Marketplace, zobacz Określanie obrazów witryny Azure Marketplace dostępnych dla twórców laboratorium.
Ustawienie planu laboratorium | Instrukcje |
---|---|
Obrazy z witryny Marketplace | Włącz obraz systemu Ubuntu Server 18.04 LTS . |
Ustawienia laboratorium
Aby uzyskać instrukcje dotyczące tworzenia laboratorium, zobacz Samouczek: konfigurowanie laboratorium. Podczas tworzenia laboratorium użyj następujących ustawień.
Ustawienie laboratorium | Wartość i opis |
---|---|
Rozmiar maszyny wirtualnej | Mały procesor GPU (obliczenia) |
Obraz maszyny wirtualnej | Ubuntu Server 18.04 LTS |
Włączanie połączenia pulpitu zdalnego | To ustawienie powinno być włączone, jeśli zdecydujesz się używać protokołu RDP. To ustawienie nie jest potrzebne, jeśli wybierzesz pozycję X2Go, aby nawiązać połączenie z maszynami laboratoryjnymi. |
Jeśli zamiast tego zdecydujesz się używać protokołu RDP, musisz połączyć się z maszyną wirtualną z systemem Linux przy użyciu protokołu SSH i zainstalować pakiety RDP i GUI przed opublikowaniem laboratorium. Następnie uczniowie mogą połączyć się z maszyną wirtualną z systemem Linux przy użyciu protokołu RDP później. Aby uzyskać więcej informacji, zobacz Włączanie graficznego pulpitu zdalnego dla maszyn wirtualnych z systemem Linux.
Konfigurowanie szablonu
Po utworzeniu maszyny szablonu uruchom maszynę i połącz się z nią, aby zainstalować oprogramowanie R, RStudio Desktop i opcjonalnie X2Go Server.
Najpierw zaktualizujmy apt i uaktualnijmy istniejące pakiety na maszynie.
sudo apt update
sudo apt upgrade
Instalowanie serwera X2Go
Jeśli zdecydujesz się korzystać z rozwiązania X2Go, zainstaluj serwer. Najpierw musisz nawiązać połączenie z maszyną wirtualną laboratorium z systemem Linux przy użyciu protokołu SSH , aby zainstalować składnik serwera. Po zakończeniu pozostałej części konfiguracji można ukończyć po nawiązaniu połączenia przy użyciu klienta X2Go.
Domyślna instalacja narzędzia X2Go nie jest zgodna z programem RStudio. Aby obejść ten problem, zaktualizuj plik opcji x2goagent.
Edytuj
/etc/x2go/x2goagent.options
plik. Nie zapomnij edytować pliku jako sudo.- Usuń komentarz z wiersza, który stwierdza:
X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
- Oznacz jako komentarz wiersz, który stwierdza:
X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
- Usuń komentarz z wiersza, który stwierdza:
Uruchom ponownie serwer X2Go, aby były używane nowe opcje.
sudo systemctl restart x2goserver
Alternatywnie możesz utworzyć wymagane biblioteki, postępując zgodnie z instrukcjami w temacie OBEJŚcie GLX dla rozwiązania X2Go.
Instalowanie języka R
Istnieje kilka sposobów instalowania języka R na maszynie wirtualnej. Język R jest instalowany z repozytorium kompleksowej sieci archiwum języka R (CRAN). Udostępnia najbardziej aktualne wersje języka R. Po dodaniu tego repozytorium do maszyny można zainstalować język R i wiele innych powiązanych pakietów.
Musimy dodać repozytorium CRAN. Polecenia są modyfikowane z instrukcji dostępnych w temacie Pakiety Ubuntu, aby uzyskać krótkie instrukcje języka R.
#download helper packages
sudo apt install --no-install-recommends software-properties-common dirmngr
# download and add the signing key (by Michael Rutter) for these repos
sudo wget -q "https://cloud.r-project.org/bin/linux/ubuntu/marutter_pubkey.asc" -O /etc/apt/trusted.gpg.d/cran_ubuntu_key.asc
#add repository
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/"
Teraz możemy zainstalować język R, uruchamiając następujące polecenie:
sudo apt install r-base
Instalowanie programu RStudio
Po zainstalowaniu języka R lokalnie możemy zainstalować środowisko IDE programu RStudio. Instalujemy bezpłatną wersję programu RStudio Desktop. Aby zapoznać się ze wszystkimi dostępnymi wersjami, zobacz Pliki do pobrania programu RStudio.
Zaimportuj klucz podpisywania kodu dla programu RStudio.
sudo gpg --keyserver keyserver.ubuntu.com --recv-keys 3F32EE77E331692F
Pobierz plik pakietu Debian Linux (.deb) dla programu R Studio dla systemu Ubuntu. Plik ma format
rstudio-{version}-amd64.deb
. Na przykład:export rstudiover="1.4.1717" wget --quiet -O rstudio.deb https://download1.rstudio.org/desktop/bionic/amd64/rstudio-$rstudiover-amd64.deb
Zainstaluj program RStudio za pomocą narzędzia gdebi. Pamiętaj, aby użyć ścieżki pliku, aby wskazać, czy plik lokalny został zainstalowany.
sudo apt install gdebi-core echo "y" | gdebi rstudio.deb –quiet
Pakiety CRAN
Teraz nadszedł czas na zainstalowanie dowolnych pakietów CRAN. Najpierw dodaj bieżące repozytorium R 4.0 lub nowsze "c2d4u".
sudo add-apt-repository ppa:c2d4u.team/c2d4u4.0+
install.packages(“package name”)
Użyj polecenia w interakcyjnej sesji języka R, jak pokazano na szybkiej liście przydatnych pakietów języka R. Alternatywnie użyj elementu menu Narzędzia —> zainstaluj pakiety w programie RStudio.
Jeśli potrzebujesz pomocy w znalezieniu pakietu, zobacz listę pakietów według zadań lub alfabetycznej listy pakietów.
Następne kroki
Obraz szablonu można teraz opublikować w laboratorium. Aby uzyskać więcej informacji, zobacz Publikowanie maszyny wirtualnej szablonu.
Podczas konfigurowania laboratorium zapoznaj się z następującymi artykułami: