使用 Azure 实验室服务在 Windows 上设置实验室以讲授 R

重要

Azure 实验室服务将于 2027 年 6 月 28 日停用。 有关详细信息,请参阅停用指南

注意

本文引用了实验室计划中可用的功能,该计划取代了实验室帐户。

本文介绍如何在 Azure 实验室服务中设置课程以讲授 R 和 RStudio。

R 是一种用于统计计算和图形的开源语言。 R 语言被运用于遗传学统计分析、自然语言处理和金融数据数据分析等领域。 R 提供了一种交互式命令行体验。 RStudio 是可用于 R 语言的交互式开发环境 (IDE)。 免费版提供代码编辑工具、集成调试体验和包开发工具。

本文重点介绍如何使用 R 和 RStudio 进行统计计算。 [深度学习] (class-type-deep-learning-natural-language-processing.md) 以及 Python 和 Jupyter Notebook 课程类型通过不同的方式设置 RStudio。 每篇文章都介绍了如何使用适用于 Linux (Ubuntu) 的 Data Science Virtual Machine 市场映像,该映像预先安装了许多与数据科学相关的工具,包括 RStudio。

先决条件

若要设置此实验室,你需要能够访问 Azure 订阅。 与组织的管理员讨论,了解是否可以访问现有的 Azure 订阅。 如果没有 Azure 订阅,请在开始之前创建一个免费帐户

实验室配置

外部资源配置

某些课程需要将文件(例如大型数据文件)存储在外部。

如果选择让学生拥有共享 R Server,则应在创建实验室之前设置服务器。 若要详细了解如何设置共享服务器,请参阅如何在 Azure 实验室服务中创建具有共享资源的实验室。 有关创建 RStudio 服务器的说明,请参阅下载适用于 Debian 和 Ubuntu 的 RStudio 服务器访问 RStudio 服务器开源代码

如果选择使用任何外部资源,则需要使用实验室计划连接到 Azure 实验室服务中的虚拟网络

重要

必须在创建实验室计划期间启用高级网络。 创建后无法添加此功能。

实验室计划设置

获取 Azure 订阅后,可以在 Azure 实验室服务中创建实验室计划。 有关创建新实验室计划的详细信息,请参阅快速入门:设置资源以创建实验室。 也可以使用现有实验室计划。

实验室设置

有关如何创建实验室的说明,请参阅教程:设置实验室。 创建实验室时,请使用以下设置。

实验室设置 值和描述
虚拟机大小 小型 GPU (计算)
VM 映像 Windows 10 专业版

模板配置

创建模板虚拟机后,请执行以下步骤来配置实验室:

  1. 启动模板虚拟机,并使用 RDP 连接到计算机。

  2. 在模板 VM 中安装 R

  3. 在模板 VM 中安装 RStudio

安装 R

若要在模板虚拟机中安装 R,请执行以下操作:

  1. 下载适用于 Windows 的 R 的最新安装程序

    有关可用版本的完整列表,请参阅适用于 Windows 的 R 下载页面

  2. 运行安装程序。

    1. 对于“选择设置语言”提示,选择所需的语言,然后选择“确定”
    2. 在安装程序的“信息”页上,阅读许可协议。 选择“下一步”,接受协议并继续。
    3. 在“选择目标位置”页面上,接受默认安装位置,然后选择“下一步” 。
    4. 在“选择组件”页面上,选择性地取消选中“32 位文件”选项 。 有关同时运行 32 位和 62 位版本的 R 的详细信息,请参阅可以将 32 位和 64 位的 R 安装在同一台计算机上吗?常见问题解答。
    5. 在“启动选项”页面上,将启动选项设置为“否(接受默认值)” 。 如果希望 R 图形用户界面 (GUI) 使用单独的窗口 (SDI) 或纯文本帮助,请选择“是(自定义启动)”单选按钮,并将以下启动选项更改为向导页面。
    6. 在“选择开始菜单文件夹”页上,选择“下一步”。
    7. 在“选择其他任务”页面上,选择“创建桌面快捷方式”(可选) 。 选择“下一页”。
    8. 在“正在安装”页上,等待安装完成。
    9. 在“完成适用于 Windows 的 R”页面上,选择“完成” 。

也可使用 PowerShell 来安装 R。 以下代码示例显示如何在没有 32 位组件的情况下安装 R 并为最新版本的 R 添加桌面图标。若要查看安装程序命令行选项的完整列表,请参阅设置命令行参数

#Avoid prompt to setup Internet Explorer if we must parse download page
Set-ItemProperty -Path "HKLM:\SOFTWARE\Microsoft\Internet Explorer\Main" -Name "DisableFirstRunCustomize" -Value 2

$outputfile = "R-win.exe"

$result = Invoke-WebRequest "https://cran.r-project.org/bin/windows/base/release.html" -OutFile $outputfile -PassThru

#Check if we need to parse the result ourselves, to find the latest version of R
if ($result.StatusCode -eq '200' -and $result.Headers["Content-Type"] -eq 'text/html')
{
    $metaTag = $result.ParsedHtml.Head.children | Where-Object {$_.nodeName -eq 'META'}
    if ($metaTag.content  -match "R-\d+\.\d+\.\d+-win.exe"){
        $outputfile = $Matches.0

        #Download latest version
        Invoke-WebRequest "https://cran.r-project.org/bin/windows/base/$outputfile" -OutFile $outputfile
    }else{
        Write-Error "Unable to find latest version of R installer.  Go to https://cran.r-project.org/bin/windows/base/release.html to download manually."
    }
}

#Install Silently
$installPath = Get-Item -Path $outputfile
Start-Process -FilePath $installPath.FullName -ArgumentList "/VERYSILENT /LOG=r-install.log /NORESTART /COMPONENTS=""main,x64,translations"" /MERGETASKS=""desktopicon"" /LANG=""en""" -NoNewWindow -Wait

安装 RStudio

在模板 VM 中安装 R 后,请安装 RStudio IDE。 在本文中,你将安装免费版本的 RStudio Desktop。 有关所有可用版本,请参阅 RStudio 下载

  1. 下载适用于 Windows 10 的 R Studio 安装程序。 安装程序文件的格式为 rstudio-{version}.exe

  2. 运行 RStudio 安装程序。

    1. 在“RStudio 设置”向导的“欢迎使用 RStudio 设置”页面上,选择“下一步” 。
    2. 在“选择安装位置”页面上,选择“下一步” 。
    3. 在“选择开始菜单文件夹”页面上,选择“安装” 。
    4. 在“正在安装”页上,等待安装完成。
    5. 在“完成 RStudio 设置”页面上,选择“完成” 。

若要使用 PowerShell 执行 RStudio 安装步骤,请运行以下命令。 在执行命令之前,请参阅 RStudio 下载以验证 RStudio 版本是否可用。

$rstudiover="1.4.1717"
$outputfile = "RStudio-$rstudiover.exe"

#Download installer executable
Invoke-WebRequest "https://download1.rstudio.org/desktop/windows/RStudio-$rstudiover.exe" -OutFile $outputfile

#Install RStudio silently
$installPath = Get-Item -Path $outputfile
Start-Process -FilePath $installPath.FullName -ArgumentList "/S" -NoNewWindow -Wait

安装 CRAN 包

Comprehensive R Archive Network (CRAN) 是 R 的中央软件存储库。 其中,存储库包含 R 包,这些包可用于扩展 R 程序。

若要在模板虚拟机中安装 CRAN 包,请执行以下操作:

  • 在 R 交互式会话中使用 install.packages(“package name”) 命令,如有用的 R 包快速列表一文中所示。

  • 也可使用 RStudio 中的“工具”>“安装包”菜单项

请参阅按任务列出的包列表按字母顺序排列的包列表

后续步骤

现在可以将模板映像发布到实验室。 有关详细信息,请参阅发布模板 VM

设置实验室时,请参阅以下文章: