Power BI 使用方案:自助式实时分析
备注
本文是 Power BI 实现规划系列文章中的一篇。 本系列着重介绍 Microsoft Fabric 中的 Power BI 体验。 有关该系列的介绍,请参阅 Power BI 实施规划。
此使用方案侧重于业务分析师如何生成实时 Power BI 报表。 实时意味着数据始终是最新的,报表使用者不需要与可视化效果交互。 数据可视化效果应自动进行刷新,以始终显示最新数据。
使用实时报表,组织可以根据最新数据进行监视并做出自信的决策。
注意
在本文中,术语实时实际上表示准实时。 准实时意味着,由于数据处理和网络传输需要时间,因此始终存在一定程度的延迟。
若要开发自助式实时分析,业务分析师首先需要创建 DirectQuery 语义模型(或连接到)。 然后,他们可以生成报表并设置其自动页面刷新设置。 设置完成后,Power BI 会自动刷新报表页以显示当前数据。
提示
你还可以使用推送数据集在 Power BI 中实现实时分析。 但是,此主题不在该自助式实时使用方案的范围内,因为它面向的是开发人员。 推送数据集通常涉及开发编程解决方案。
要全面了解 Power BI 实时分析,请使用使用 Power BI 实时监视数据学习路径。
方案示意图
下图简要概述了支持自助式实时分析的最常见用户操作和 Power BI 组件。 主要目标是创建 DirectQuery 模型和生成使用自动页面刷新的 Power BI 报表。
提示
如果想要将方案图嵌入演示文稿、文档或博客文章,或者将其打印为墙上海报,建议下载方案图。 由于它是可缩放矢量图形 (SVG) 图像,因此可以放大或缩小它,而不会造成任何质量损失。
上面的示意图描绘了以下用户操作、工具和功能:
项目 | 描述 |
---|---|
内容创建者使用 Power BI Desktop 创建 DirectQuery 模型。 | |
Power BI Desktop 将本机查询发送到基础数据源,以便检索当前数据。 | |
内容创建者通过启用和设置自动页面刷新来生成显示准实时更新的报表。 | |
准备就绪后,内容创建者将其 Power BI Desktop 文件 (.pbix) 或 Power BI 项目文件 (.pbip) 发布到 Power BI 服务或 Fabric 门户中的工作区。 | |
发布后,工作区将包含新报表和 DirectQuery 语义模型。 如果工作区是个人或 Pro 工作区,则最小自动页面刷新间隔为 30 分钟(即使报表创建者设置了较低的间隔)。 | |
当报表使用者打开启用了自动页面刷新的报表页时,数据可视化将自动刷新以显示当前数据。 | |
某些数据源(例如驻留在专用组织网络中的数据源)可能需要本地数据网关或 VNet 网关来进行数据刷新。 | |
自动页面刷新页上的每个视觉对象都会查询语义模型,以从基础数据源检索当前数据。 | |
当自动页面刷新报表存储在使用 Fabric 容量、 高级容量或 Premium Per User 许可证模式的工作区中时,Power BI 可以按一分钟或多分钟的间隔自动刷新。 也可使用更改检测刷新类型,这样 Power BI 就可以避免不必要的刷新。 设置更改检测刷新类型后,在每个刷新间隔内,Power BI 都会发送更改检测查询,以确定自上次自动刷新后数据是否发生了更改。 当 Power BI 检测到更改时,它将刷新页面上的所有视觉对象。 | |
报表使用者可通过工作区或 Power BI 应用查看最新内容。 | |
容量管理员可以启用或禁用自动页面刷新功能。 禁用该功能后,对于存储在分配给该容量的工作区中的任何报表,自动页面刷新将不起作用。 容量管理员还可以设置最小刷新间隔和最小执行间隔。 这些最小间隔将替代任何使用较低间隔的报表页设置。 | |
Fabric 管理员会在 Fabric 门户中监督和监视活动。 |
重要
有时本文指的是 Power BI Premium 或其容量订阅 (P SKU)。 请注意,Microsoft 目前正在合并购买选项并停用 Power BI Premium Per Capacity SKU。 新客户和现有客户应考虑改为购买 Fabric 容量订阅 (F SKU)。
有关详细信息,请参阅 Power BI Premium 许可即将进行的重要更新和 Power BI Premium 常见问题解答。
要点
下面是关于自助式实时分析方案需要强调的一些要点。
支持的数据源
对于连接到导入模型的报表,自动页面刷新功能不起作用,其中所有表都使用导入存储模式。 该功能仅在 Power BI 报表连接到以下语义模型时才有效:
- 包括 DirectQuery 存储模式表。
- 使用增量刷新,通过 DirectQuery 实时获取最新数据。 本主题稍后将介绍此功能。
- 已实时连接到 Azure Analysis Services (AAS) 或 SQL Server Analysis Services (SSAS) 中的表格模型。
- 推送数据集。 有关详细信息,请参阅将数据推送到数据集。
DirectQuery 模型是导入模型的替代方法。 在 DirectQuery 模式下开发的模型不会导入数据。 相反,它们只包含定义模型结构的元数据。 查询模型时,本机查询用于从基础数据源中检索数据。
从自助服务的角度来看,业务分析师可以在 Power BI Desktop 中将 DirectQuery 存储表添加到其模型中,前提是数据源支持此存储模式。 通常,DirectQuery 支持关系数据库。 有关支持 DirectQuery 的数据源的完整列表,请参阅 DirectQuery 支持的数据源。
业务分析师还可以通过设置增量刷新来增强导入模型。 通过启用“使用 DirectQuery 实时获取最新数据”选项(仅高级工作区支持),Power BI Desktop 添加了一个 DirectQuery 分区,以确保检索到最新数据。 有关详细信息,请参阅语义模型的增量刷新和实时数据。
业务分析师还可以创建与包含 DirectQuery 存储模式表的现有表格模型的实时连接。
涉及数据源所有者
在发布自动页面刷新报表之前,最好先与数据源所有者讨论实时要求。 这是因为自动页面刷新会给数据源带来很大的工作量。
请考虑使用设置为每隔五分钟刷新一次且包含两个视觉对象的报表页。 当报表页面打开时,Power BI 将每小时至少向基础数据源发送 24 个查询(12 次刷新乘以两个视觉对象)。 现在考虑 10 个报表使用者同时打开同一个报表页。 在这种情况下,Power BI 将每小时发送 240 个查询。
讨论实时要求很重要,包括报表页上的视觉对象数量和所需的刷新间隔。 如果用例合理,数据源所有者可以通过纵向扩展数据源资源来采取主动步骤。 他们还可以通过添加有用的索引和具体化视图来优化数据源。 有关详细信息,请参阅 Power BI Desktop 中的 DirectQuery 模型指南。
刷新类型
自动页面刷新功能支持两种刷新类型。
- 固定间隔:根据固定的间隔(从一秒到数日)更新所有页面视觉对象。
- 更改检测:如果源数据自上次自动刷新以来发生更改,则更新所有页面视觉对象。 它可以避免不必要的刷新,从而有助于减少 Power BI 服务和基础数据源的资源消耗。 Power BI 仅支持针对高级工作区和 Power BI 托管的数据模型的此刷新类型。 不支持托管在 AAS 或 SSAS 中的远程数据模型。
若要设置更改检测,必须创建一个称作“更改检测度量值”的特殊类型的度量值。 例如,更改检测度量值可能会查询最大销售订单号。 Power BI 使用更改检测度量值来查询数据源。 Power BI 每次都会存储查询结果,以便可将它与下一个结果进行比较(根据设置的刷新间隔)。 如果结果不同,Power BI 将刷新页面。
一个模型只能有一个更改检测度量值,每个租户最多只能有 10 个更改检测度量值。
有关详细信息,请参阅刷新层。
容量管理
当将工作区附加到高级容量时,容量管理员可以启用或禁用容量的自动页面刷新功能。 禁用该功能后,对于存储在任何附加工作区中的任何报表,自动页面刷新将不不起作用。
容量管理员还可以设置最小刷新间隔(默认五分钟)和最小执行间隔(默认五分钟)。 执行间隔确定更改检测查询的频率。 如果报表页间隔小于容量最小间隔,Power BI 将使用容量最小间隔。
注意
最小间隔不适用于在 Power BI Desktop 中打开的报表。
当存在与自动页面刷新相关的性能问题时,容量管理员可以:
- 将容量纵向扩展到更大的高级 SKU。
- 提高最小间隔。
有关详细信息,请参阅页面刷新间隔。
网关设置
通常,在访问驻留在专用组织网络或虚拟网络中的数据源时需要一个数据网关。 网关支持 DirectQuery 操作(视觉对象查询和更改检测查询)。
系统监督
活动日志记录 Power BI 服务中发生的用户活动。 Power BI 管理员可以使用收集的活动日志数据来执行审核,以帮助他们了解使用模式和采用情况。
使用管理员可用的 Premium Capacity Metrics 应用,可以可视化低优先级查询使用的容量大小。 低优先级查询包括自动页面刷新查询和模型刷新查询。 更改检测查询的优先级并不低。
相关内容
有关可帮助你做出 Power BI 实施决策的其他有用方案,请参阅 Power BI 使用方案一文。