数据输入和输出
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
本文列出了可用于在机器学习 Studio (经典) 中导入和导出数据和模型的模块。
除了使用模块以外,还可以直接从计算机或网络上的本地文件上载和下载数据集。 有关详细信息,请参阅将现有数据 Upload 到机器学习试验中。
下面是一些可用于在机器学习 Studio (经典) 中导入和导出数据和模型的源:
- 从云中的源中获取数据,例如 Azure SQL 数据库、Azure SQL Data Warehouse、Azure 存储和 Azure Cosmos DB。 你还可以导入作为公共 web URL 提供的数据、使用 Hive 查询从 Hadoop 获取数据或查询本地 SQL 服务器。
- 从 Azure Blob 存储加载图像集合以在映像分类任务中使用。
- 从上载到机器学习的压缩文件中提取数据。 可以在试验中使用数据集。
- 通过在机器学习 Studio (经典) UI 中键入来创建小型数据集。 这对于创建小型测试数据集非常有用。
- 将结果或中间数据保存到 Azure 表存储、Blob 存储、SQL 数据库或 Hive 查询。
- 从 URL 或 Blob 存储获取定型模型,然后在试验中使用它。
注意
此组中的模块只会将数据移入或移出机器学习 Studio (经典) 。 在导入或导出过程中,不能使用模块来筛选、转换或转换数据。
若要详细了解如何转换和筛选机器学习 Studio 中的数据 (经典) ,请参阅数据转换。
资源
以下文章介绍了机器学习中的常见数据方案:
入门
了解如何在云中管理机器学习数据。 本文中的信息基于简洁的行业标准。 本文提供了端到端演练,演示如何将机器学习与云数据解决方案(例如 Azure HDInsight 和 SQL 数据库)集成。
本文介绍如何将数据导入 Azure,然后创建试验。
高级数据科学
了解如何安装机器学习 Python 客户端库,然后使用它来访问元数据和处理数据集。
示例试验
模块列表
" 数据输入和输出 " 类别包括以下模块:
- 手动输入数据:允许通过键入值来创建小型数据集。
- 导出数据:将数据集写入 web url 或 Azure 中的各种形式的基于云的存储,如表、blob 或 SQL 数据库。
- 导入数据:从 web 上的外部源和 Azure 中的各种形式的基于云的存储加载数据,如表存储、Blob 存储、SQL 数据库、SQL Data Warehouse、Azure Cosmos DB 或 Hive 查询。 你还可以从本地 SQL Server 数据库导入数据。
- 负载定型模型:从 URL 或 Blob 存储获取定型模型,以便在评分实验中使用。
- 解压缩压缩数据集:解压缩以压缩格式存储的数据集,然后将数据集添加到工作区。