你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

数据网格清单入门

在云规模分析的数据之旅中,你会发现采用生命周期中存在多个阶段。 本部分提供了快速入门清单,可帮助你分阶段采用方案。 这些阶段包括:

  • 阶段 1:第一个登陆区域
  • 阶段 2:其他数据域
  • 阶段 3:改善消耗准备情况
  • 阶段 4:关键治理组件

阶段 1 - 首次登陆区域

  • 定义你的第一个用例
  • 部署第一个数据管理登陆区域
  • 部署第一个数据登陆区域
  • 定义第一个引入模式(例如批处理 parquet)
  • 开发第一个数据产品(引入原始数据,提取到产品)
  • 确定“适度”的治理
  • 定义元数据要求(应用程序信息、架构元数据)
  • 注册第一个数据使用者(手动过程)

阶段 2 - 其他数据域

  • 优化目标体系结构
  • 部署更多数据着陆区
  • 扩展第二、第三和第四个数据产品
  • 建立数据产品元数据存储库(数据库或 Excel)
  • 实现第一组控制(数据质量、架构验证)
  • 实现使用管道(将输入作为输出)
  • 建立数据所有权

阶段 3 - 提高消耗准备情况

  • 实现自助注册和元数据汇入
  • 提供其他转换模式(转换框架、ETL 工具等)
  • 扩充提供程序端的控制(术语表、世系、链接)
  • 实现使用过程:审批、用例元数据、手动部署安全视图
  • 建立数据管理控制板

阶段 4 - 关键治理组件

  • 应用自动化(自动安全视图预配)
  • 部署强大的数据治理,设置争议处理机构
  • 完成数据产品指南
  • 定义额外的互操作性标准
  • 开发自助服务数据使用过程
  • 开发数据查询、自助服务、目录、世系功能等。
  • 开发更多数据市场功能

总结

通过这四个开发阶段,你可以在第一阶段设置一个最小可行产品,然后学习和迭代进入第二阶段。 在整个分阶段的方法中,随着自助服务、可缩放治理平台的创建日益成熟而成长。

后续步骤