在 Linux 上设置实验室来讲授 R

重要

Azure 实验室服务将于 2027 年 6 月 28 日停用。 有关详细信息,请参阅停用指南

注意

本文引用了实验室计划中可用的功能,该计划取代了实验室帐户。

R 是一种用于统计计算和图形的开源语言。 它被运用于遗传学统计分析、自然语言处理和金融数据数据分析等领域。 R 提供了一种交互式命令行体验。 RStudio 是可用于 R 语言的交互式开发环境 (IDE)。 免费版提供代码编辑工具、集成调试体验和包开发工具。

本文重点介绍仅 RStudio 和 R 作为需要使用统计计算的类的构建基块。 深度学习以及 Python 和 Jupyter Notebook 课程类型通过不同的方式设置 RStudio。 每篇文章介绍如何使用适用于 Linux (Ubuntu) 的 Data Science Virtual Machine 市场映像,该映像有许多数据科学相关工具,包括预安装 RStudio。

实验室配置

若要设置此实验室,需要有 Azure 订阅和实验室计划才能开始。 如果没有 Azure 订阅,请在开始之前创建一个免费帐户

外部资源配置

某些课程需要将文件(例如大型数据文件)存储在外部。

如果选择让学生拥有共享 R Server,则应在创建实验室之前设置服务器。 若要详细了解如何设置共享服务器,请参阅如何在 Azure 实验室服务中创建具有共享资源的实验室。 有关创建 RStudio 服务器的说明,请参阅下载适用于 Debian 和 Ubuntu 的 RStudio 服务器访问 RStudio 服务器开源代码

如果选择使用任何外部资源,则需要使用实验室计划连接到 Azure 实验室服务中的虚拟网络

重要

必须在创建实验室计划期间启用高级网络。 创建后无法添加此功能。

实验室计划设置

在获取 Azure 订阅后,就可以在 Azure 实验室服务中创建新的实验室计划。 若要详细了解如何新建实验室计划,请参阅有关如何设置实验室计划的教程。 也可以使用现有实验室计划。

如下表所述启用实验室计划设置。 若要详细了解如何启用 Azure 市场映像,请参阅指定可供实验室创建者使用的 Azure 市场映像

实验室计划设置 Instructions
市场映像 启用“Ubuntu Server 18.04 LTS”映像。

实验室设置

有关如何创建实验室的说明,请参阅教程:设置实验室。 创建实验室时,请使用以下设置。

实验室设置 值和描述
虚拟机大小 小型 GPU (计算)
VM 映像 Ubuntu Server 18.04 LTS
启用远程桌面连接 选择使用 RDP 时,应启用此设置。 如果选择使用 X2Go 连接到实验室计算机,则不需要此设置。

如果选择改用 RDP,则需要使用 SSH 连接到 Linux VM,并在发布实验室之前安装 RDP 和 GUI 包。 以后,学生可以使用 RDP 连接到 Linux VM。 有关详细信息,请参阅为 Linux VM 启用图形远程桌面

模板配置

在创建模板计算机后,启动计算机并连接到它,以安装 RRStudio Desktop,并根据需要安装 X2Go 服务器

首先,更新 apt 并升级计算机上的现有包。

sudo apt update 
sudo apt upgrade

安装 X2Go 服务器

如果选择使用 X2Go,请安装服务器。 首先需要使用 SSH 连接到 Linux 实验室 VM 来安装服务器组件。 完成后,可在使用 X2Go 客户端进行连接之后完成其余设置。

X2Go 的默认安装与 RStudio 不兼容。 若要解决此问题,请更新 x2goagent 选项文件。

  1. 编辑 /etc/x2go/x2goagent.options 文件。 别忘了将文件编辑为 sudo。

    1. 取消注释行:X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
    2. 注释行:X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
  2. 重启 X2Go 服务器以使用新选项。

    sudo systemctl restart x2goserver
    

或者,可以按照 X2Go GLX 解决方法中的说明生成所需的库。

安装 R

可通过多种方式在 VM 上安装 R。 从综合 R 存档网络 (CRAN) 存储库安装 R。 它提供 R 的最新版本。将此存储库添加到计算机后,可以安装 R 和其他许多相关包。

需要添加 CRAN 存储库。 命令是根据适用于 R 的 Ubuntu 包的简要说明一文中的说明修改的。

#download helper packages
sudo apt install --no-install-recommends software-properties-common dirmngr
# download and add the signing key (by Michael Rutter) for these repos
sudo wget -q "https://cloud.r-project.org/bin/linux/ubuntu/marutter_pubkey.asc" -O /etc/apt/trusted.gpg.d/cran_ubuntu_key.asc
#add repository
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/"

现在可运行以下命令来安装 R:

sudo apt install r-base

安装 RStudio

现在已在本地安装 R,接下来可以安装 RStudio IDE。 我们将安装 RStudio Desktop 的免费版本。 有关所有可用版本,请参阅 RStudio 下载

  1. 为 RStudio 导入代码签名密钥

    sudo gpg --keyserver keyserver.ubuntu.com  --recv-keys 3F32EE77E331692F
    
  2. 下载适用于 Ubuntu 的 R Studio 的 Debian Linux 软件包文件 (.deb)。 文件采用 rstudio-{version}-amd64.deb 格式。 例如:

    export rstudiover="1.4.1717"
    wget --quiet -O rstudio.deb https://download1.rstudio.org/desktop/bionic/amd64/rstudio-$rstudiover-amd64.deb
    
  3. 使用 gdebi 安装 RStudio。 确保使用文件路径向 apt 指示正在安装本地文件。

    sudo apt install gdebi-core 
    echo "y" | gdebi rstudio.deb –quiet
    

CRAN 包

现在可安装所需的任何 CRAN 包。 首先,添加当前 R 4.0 或更高版本的“c2d4u”存储库

sudo add-apt-repository ppa:c2d4u.team/c2d4u4.0+

在 R 交互式会话中使用 install.packages(“package name”) 命令,如有用的 R 包快速列表一文中所示。 也可使用 RStudio 中的“工具”->“安装包”菜单项。

如果在查找包时需要帮助,请参阅按任务列出的包列表按字母顺序排列的包列表

后续步骤

现在可以将模板映像发布到实验室。 有关详细信息,请参阅发布模板 VM

设置实验室时,请参阅以下文章: