你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
导出或删除机器学习服务工作区数据
在 Azure 机器学习中,可以使用门户图形界面或 Python SDK 导出或删除工作区数据。 本文介绍这两种选项。
注意
若要了解如何查看或删除个人数据,请参阅 GDPR 的常规数据主体请求、GDPR 的 Azure 数据主体请求或 GDPR 的 Windows 数据主体请求,具体取决于实际领域和需求。 有关 GDPR 的详细信息,请参阅 Microsoft 信任中心的 GDPR 部分和服务信任门户的 GDPR 部分。
注意
本文介绍如何删除设备或服务中的个人数据,并且可用于为 GDPR 下的义务提供支持。 有关 GDPR 的常规信息,请参阅 Microsoft 信任中心的 GDPR 部分和服务信任门户的 GDPR 部分。
控制工作区数据
Azure 机器学习存储可供导出和删除的产品内数据。 可以使用 Azure 机器学习工作室、CLI 或 SDK 导出和删除数据。 此外,还可以通过 Azure 隐私门户访问遥测数据。
在 Azure 机器学习中,个人数据包括作业历史记录文档中的用户信息。
Azure 工作区依赖于资源组来保存 Azure 解决方案的相关资源。 创建工作区时,可以使用现有资源组,也可以创建新的资源组。 有关 Azure 资源组的详细信息,请访问此资源。
使用门户删除高级资源
创建工作区时,Azure 在资源组中创建若干资源:
- 工作区本身
- 一个存储帐户
- 容器注册表
- Application Insights 实例
- 密钥保管库
要删除这些资源,请从列表中选择它们,然后选择“删除”:
重要
如果资源配置为软删除,则实际上不会删除数据,除非选择永久删除资源。 有关详细信息,请参阅以下资源:
此时会打开一个确认对话框,可在其中确认选择。
作业历史记录文档可能包含个人用户信息。 这些文档存储在 Blob 存储中的存储帐户中,位于 /azureml
子文件夹中。 可以从门户下载并删除数据。 首先,在 Azure 门户中选择“存储帐户”Azure 服务,如以下屏幕截图所示:
在“存储帐户”页上,选择相关的存储帐户,如以下屏幕截图所示:
选择“容器”,如以下屏幕截图所示:
选择特定容器,如以下屏幕截图所示:
在该容器中,选择并删除要删除的资源,如以下屏幕截图所示:
使用 Azure 机器学习工作室导出和删除机器学习资源
Azure 机器学习工作室提供机器学习资源(如数据资产、模型、笔记本和作业)的统一视图。 Azure 机器学习工作室强调保留数据和试验的记录。 可以在浏览器中删除计算性资源–管道和计算资源。 对于这些资源,请导航到相关资源然后选择“删除”。
可以注销数据资产和存档作业,但这些操作不会删除数据。 若要完全删除数据,数据资产和作业数据需要在存储级别删除。 如前所述,在门户中进行存储级别删除。 Azure 机器学习工作室可以处理单个删除。 作业删除会删除该作业的数据。
作业的项目和日志下载
Azure 机器学习工作室可以处理试验作业中的训练项目和日志下载。 在 Azure 机器学习工作室主页上,选择“作业”,如以下屏幕截图所示:
若要显示可用作业,请选择“所有作业”选项卡,如以下屏幕截图所示:
选择特定作业,如以下屏幕截图所示:
选择“全部下载,如以下屏幕截图所示:
下载已注册的模型
若要下载已注册的模型,请选择“模型”以在 Azure 机器学习工作室中打开“模型列表”,然后选择特定模型,如以下屏幕截图所示:
选择“全部”以启动模型下载过程,如以下屏幕截图所示:
使用 Python SDK 导出和删除资源
可以使用以下内容来下载特定作业的输出:
# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')
metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)
可以使用 Python SDK 删除这些机器学习资源:
类型 | 函数调用 | 说明 |
---|---|---|
Workspace |
delete |
使用 delete-dependent-resources 来级联删除 |
Model |
delete |
|
ComputeTarget |
delete |
|
WebService |
delete |