在湖屋中探索和转换数据
转换和加载数据
大多数数据需要转换才能加载到表中。 可以先将原始数据直接引入数据湖屋中,然后进一步转换并加载到表中。 无论 ETL 设计如何,都可以使用相同的工具来引入数据,从而简化转换和加载数据的过程。 转换后的数据可以作为文件或 Delta 表加载。
- 笔记本更受熟悉 PySpark、SQL 和 Scala 等不同编程语言的数据工程师青睐。
- 数据流 Gen2 非常适合熟悉 Power BI 或 Excel 的开发人员,因为它们使用 PowerQuery 接口。
- 管道提供了一个可视化界面来执行和协调 ETL 过程。 根据需要,管道可以很简单,也可以很复杂。
分析和可视化湖屋中的数据
数据经过引入、转换和加载后,便可供其他人使用。 Fabric 项为每个组织提供了所需的灵活性,你可以使用适合自己的工具。
- 数据科学家可以使用笔记本或数据整理器来探索和训练用于 AI 的机器学习模型。
- 报表开发人员可以使用语义模型创建 Power BI 报表。
- 分析人员可以使用 SQL 分析终结点来查询、筛选、聚合,并浏览数据湖屋表中的数据。
通过将 Power BI 的数据可视化功能与数据湖屋的集中式存储和表格架构相结合,可以在单个平台上实现端到端分析解决方案。