本地数据网关大小调整
本文面向需要安装和管理本地数据网关的 Power BI 管理员。
当 Power BI 必须访问无法直接通过 Internet 访问的数据时,就需要网关。 它可以安装在本地服务器上,也可以安装在 VM 托管的基础结构即服务 (IaaS) 上。
网关工作负载
本地数据网关支持两种工作负载。 首先务必要了解这些工作负载,然后再讨论网关大小调整和建议。
缓存的数据工作负载
缓存 的数据 工作负荷检索和转换源数据,以便加载到 Power BI 语义模型中。 它通过三个步骤完成:
- 连接:网关连接到源数据。
- 数据检索和转换:检索数据,并在必要时对其进行转换。 只要有可能,Power Query 混合引擎就会将转换步骤推送到数据源,这称为查询折叠。 如果无法进行转换,则必须由网关完成转换。 在这种情况下,网关会占用更多 CPU 和内存资源。
- 传输:将数据传输到 Power BI 服务—可靠且快速的 Internet 连接非常重要,尤其是对于大型数据卷而言。
实时连接和 DirectQuery 工作负载
“实时连接和 DirectQuery”工作负载主要在传递模式下工作。 Power BI 服务发送查询,网关则响应查询结果。 通常,查询结果的大小很小。
- 有关实时连接的详细信息,请参阅 Power BI 服务中的语义模型(外部托管模型)。
- 有关 DirectQuery 的详细信息,请参阅 Power BI 服务中的语义模型模式(DirectQuery 模式)。
此工作负载需要 CPU 资源来路由查询和查询结果。 通常,CPU 需求要低于缓存数据工作负载所需的 CPU,特别是在需要转换数据以进行缓存时。
可靠、快速且一致的连接对于确保报表用户具有响应体验非常重要。
调整大小注意事项
确定针对网关计算机的正确大小调整取决于以下变量:
- 对于缓存数据工作负载:
- 并发语义模型刷新次数
- 数据源类型(关系数据库、分析数据库、数据馈送或文件)
- 要从数据源检索的数据量
- 需要由 Power Query 混合引擎完成的任何转换
- 要传输到 Power BI 服务的数据量
- 对于实时连接和 DirectQuery 工作负载:
- 并发报表用户数
- 报表页上的视觉对象数(每个视觉对象发送至少一个查询)
- Power BI 仪表板查询缓存更新的频率
- 使用自动页面刷新功能的实时报表数
- 语义模型是否强制实施行级别安全性 (RLS)
通常,实时连接和 DirectQuery 工作负载需要足够的 CPU,而缓存数据工作负载需要更多的 CPU 和内存。 这两个工作负载都依赖于与 Power BI 服务和数据源之间的良好连接。
注意
Power BI 容量对模型刷新并行度、实时连接和 DirectQuery 吞吐量施加限制。 除了 Power BI 服务支持的内容以外,没有必要对网关大小进行调整以提供更多内容。 高级 SKU(以及相同大小的 A SKU)的限制有所不同。 有关详细信息,请参阅 Microsoft Fabric 容量许可证和什么是 Power BI Premium?(容量节点)。
重要
有时本文指的是 Power BI Premium 或其容量订阅 (P SKU)。 请注意,Microsoft 目前正在合并购买选项并停用 Power BI Premium Per Capacity SKU。 新客户和现有客户应考虑改为购买 Fabric 容量订阅 (F SKU)。
有关详细信息,请参阅 Power BI Premium 许可即将进行的重要更新和 Power BI Premium 常见问题解答。
建议
网关大小建议取决于多个变量。 在本部分中,我们将提供可纳入考虑的一般建议。
初始大小调整
可能很难准确地估计合适的大小。 建议从至少具有 8 个 CPU 内核、8 GB RAM 和多个千兆位网络适配器的计算机开始。 然后,可以通过记录 CPU 和内存系统计数器来度量典型的网关工作负载。 有关详细信息,请参阅监视和优化本地数据网关性能。
连接
尽可能规划 Power BI 服务和网关、网关和数据源之间的最佳连接。
- 尽量实现可靠、快速和一致的低延迟性。
- 消除(或减少)网关和数据源之间的计算机跃点数。
- 删除防火墙代理层施加的任何网络限制。 有关 Power BI 终结点的详细信息,请参阅将 Power BI URL 添加到允许列表。
- 设置 Azure ExpressRoute 以建立到 Power BI 的专用托管连接。
- 对于 Azure VM 中的数据源,请确保 VM 与 Power BI 服务并置。
- 对于涉及动态 RLS 的 SQL Server Analysis Services (SSAS) 的实时连接工作负载,请确保网关计算机和本地 Active Directory 之间良好连接。
聚类
对于大规模部署,可以创建具有多个群集成员的网关。 群集可避免单一故障点,并可跨网关实现流量负载均衡。 你可以:
- 在群集中安装一个或多个网关。
- 将工作负载隔离到独立网关或网关服务器群集。
有关详细信息,请参阅管理本地数据网关的高可用性群集和负载均衡。
语义模型设计和设置
语义模型设计及其设置可能会影响网关工作负载。 为了减少网关工作负载,可以考虑执行以下操作。
对于导入语义模型:
对于 DirectQuery 语义模型:
- 优化数据源、模型和报表设计;有关详细信息,请参阅 Power BI Desktop 中的 DirectQuery 模型指南。
- 创建聚合缓存更高级的结果以减少 DirectQuery 请求数目。
- 限制报表设计和容量设置中的自动页面刷新间隔。
- 尤其是在强制执行动态 RLS 时,限制仪表板缓存的更新频率。
- 特别是对于较小的数据卷或非易失性数据,将设计转换为导入或复合模型。
对于实时连接语义模型:
- 尤其是在强制执行动态 RLS 时,限制仪表板缓存的更新频率。
相关内容
有关本文的详细信息,请参阅以下资源: