跨环境和工作区重用数据流的最佳做法

本文讨论了有效高效地重用数据流的最佳做法集合。 阅读本文,避免在开发数据流以供重复使用时出现设计缺陷和潜在性能问题。

将数据转换数据流与暂存/提取数据流分开

如果数据流执行所有操作,则很难在其他数据流或其他用途中重复使用其表。 要重复使用的最佳数据流是仅执行一些操作的数据流。 创建专门处理一个特定任务的数据流是重复使用它们的最佳方法之一。 如果将一组数据流用作暂存数据流,则数据流的唯一操作是从源系统按原样提取数据。 可以在多个其他数据流中重复使用这些数据流。

如果有数据转换数据流,则可以将它们拆分为执行常见转换的数据流。 每个数据流只需执行一些操作。 每个数据流的这些操作可确保该数据流的输出可由其他数据流重复使用。

数据流只执行一些操作。

将数据从数据源提取到暂存数据流的图像,其中表存储在 Dataverse 或 Azure Data Lake Storage 中。 然后,数据将被转移到转换数据流中,在那里数据被转化为数据仓库结构。 最后,将数据加载到 Power BI 语义模型。

使用多个工作区

每个工作区(或环境)仅适用于该工作区的成员。 如果在一个工作区中生成所有数据流,则可以最大程度地减少数据流的重用。 您可以为处理全公司范围表的数据流设置一些通用型工作区。 还可以为数据流提供一些工作区,以处理多个部门中的表格。 此外,还可以为数据流提供一些工作区,这些工作区只能在特定部门中使用。

显示单独的工作区的图像。

在工作区上设置正确的访问级别

要允许在其他工作区中访问数据流以使用某个工作区中的数据流输出,您只需在该工作区中授予他们查看权限。 若要详细了解 Power BI 工作区中的其他角色,请转到新工作区中 角色

显示如何访问 Power BI 工作区的屏幕截图。

Power BI 中数据流的认可

租户组织中可以创建许多数据流,用户很难知道哪些数据流最可靠。 数据流的作者或具有编辑访问权限的用户可以在三个级别认可数据流:不认可、提升或认证。

这些级别的认可可帮助用户更轻松地更快地找到可靠的数据流。 首先会显示具有较高认可级别的数据流。 Power BI 管理员可以将批准数据流达到认证级别的权限委派给其他人。 详细信息:认可 - 推广和认证 Power BI 内容

Power Query 导航器的屏幕截图,其中显示了具体数据流上的“已升级”和“已认证”认可标签。

在多个数据流中分隔表

一个数据流中可以有多个表。 在多个数据流中拆分表的原因之一是本文前面介绍的关于分隔数据引入和数据转换数据流的信息。 在多个数据流中使用表的另一个好理由是,当您希望这些表与其他表有不同的刷新时间表时。

在下图所示的示例中,需要每隔四小时刷新一次销售表。 日期表需要每天刷新一次才能使当前日期记录保持更新。 产品映射表只需每周刷新一次。 如果一个数据流中有所有这些表,则只有一个全部刷新选项。 但是,如果将这些表拆分为多个数据流,则可以单独计划每个数据流的刷新。

显示各种刷新计划的数据流的图像。

数据流表的良好表候选项

在桌面版工具中使用 Power Query 开发解决方案时,你可能会问自己:哪些表是适合迁移到数据流的? 要移动到数据流的最佳表是需要在多个解决方案或多个环境或服务中使用的表。 例如,下图中显示的 Date 表需要在两个单独的 Power BI 文件中使用。 可以在数据流中建立该表,然后在这些 Power BI 文件中重用它,而不是在每个文件中复制该表。

显示数据流中使用的共享表的图像。