数据输入和输出

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

注意

适用于:仅限机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

本文列出了可用于在机器学习 Studio (经典) 中导入和导出数据和模型的模块。

除了使用模块以外,还可以直接从计算机或网络上的本地文件上载和下载数据集。 有关详细信息,请参阅将现有数据 Upload 到机器学习试验中

下面是一些可用于在机器学习 Studio (经典) 中导入和导出数据和模型的源:

  • 从云中的源中获取数据,例如 Azure SQL 数据库、Azure SQL Data Warehouse、Azure 存储和 Azure Cosmos DB。 你还可以导入作为公共 web URL 提供的数据、使用 Hive 查询从 Hadoop 获取数据或查询本地 SQL 服务器。
  • 从 Azure Blob 存储加载图像集合以在映像分类任务中使用。
  • 从上载到机器学习的压缩文件中提取数据。 可以在试验中使用数据集。
  • 通过在机器学习 Studio (经典) UI 中键入来创建小型数据集。 这对于创建小型测试数据集非常有用。
  • 将结果或中间数据保存到 Azure 表存储、Blob 存储、SQL 数据库或 Hive 查询。
  • 从 URL 或 Blob 存储获取定型模型,然后在试验中使用它。

注意

此组中的模块只会将数据移入或移出机器学习 Studio (经典) 。 在导入或导出过程中,不能使用模块来筛选、转换或转换数据。

若要详细了解如何转换和筛选机器学习 Studio 中的数据 (经典) ,请参阅数据转换

资源

以下文章介绍了机器学习中的常见数据方案:

入门

了解如何在云中管理机器学习数据。 本文中的信息基于简洁的行业标准。 本文提供了端到端演练,演示如何将机器学习与云数据解决方案(例如 Azure HDInsight 和 SQL 数据库)集成。

本文介绍如何将数据导入 Azure,然后创建试验。

高级数据科学

了解如何安装机器学习 Python 客户端库,然后使用它来访问元数据和处理数据集。

示例试验

模块列表

" 数据输入和输出 " 类别包括以下模块:

  • 手动输入数据:允许通过键入值来创建小型数据集。
  • 导出数据:将数据集写入 web url 或 Azure 中的各种形式的基于云的存储,如表、blob 或 SQL 数据库。
  • 导入数据:从 web 上的外部源和 Azure 中的各种形式的基于云的存储加载数据,如表存储、Blob 存储、SQL 数据库、SQL Data Warehouse、Azure Cosmos DB 或 Hive 查询。 你还可以从本地 SQL Server 数据库导入数据。
  • 负载定型模型:从 URL 或 Blob 存储获取定型模型,以便在评分实验中使用。
  • 解压缩压缩数据集:解压缩以压缩格式存储的数据集,然后将数据集添加到工作区。

另请参阅