总结
项目 | 说明 |
---|---|
发布状态 | 正式版 |
产品 | Excel Power BI(语义模型) Power BI(数据流) Fabric(数据流 Gen2) Power Apps(数据流) Dynamics 365 Customer Insights |
支持的身份验证类型 | 匿名(联机) 基本(联机) 组织帐户(联机) Windows(联机) |
函数参考文档 | Pdf.Tables |
注意
由于部署计划和特定于主机的功能,某些功能可能只存在于一个产品中。
注意
Power BI Premium 中不支持 PDF。
先决条件
无。
支持的功能
- 导入
从 Power Query Desktop 连接到 PDF 文件
要从 Power Query Desktop 建立连接:
在连接器选择中选择 PDF 选项。
浏览到并选择要上传的 PDF 文件。 然后选择“打开”。
如果 PDF 文件处于联机状态,请使用 Web 连接器连接到该文件。
在导航器中,选择所需的文件信息,然后选择加载以加载数据,或是选择转换数据以继续在 Power Query 编辑器中转换数据。
从 Power Query Online 连接到 PDF 文件
要从 Power Query Online 建立连接:
在连接器选择中选择 PDF 选项。
在出现的 PDF 对话框中,提供 PDF 文件位置的文件路径或 URL。 如果要加载本地文件,也可以选择上传文件(预览),以浏览到本地文件或拖放文件。
如有必要,选择本地数据网关,以访问 PDF 文件。
如果这是首次访问此 PDF 文件,请选择身份验证类型并登录到帐户(如果需要)。
在导航器中,选择所需的文件信息,然后选择转换数据以继续在 Power Query 编辑器中转换数据。
限制和注意事项
访问大型 PDF 文件
访问大型 PDF 文件时,可以使用以下策略来提高性能和减少超时。 这些策略要求在编辑栏或高级编辑器中编辑 Pdf.Tables 函数的用法。
- 尝试使用
StartPage
或EndPage
选项一次选择多个页面,或者一次选择一个小范围,根据需要迭代整个文档。 - 如果 PDF 文档是单个大型表,则
MultiPageTables
此选项可能会收集非常大的中间值,因此将其禁用可能会有所帮助。
在 Pdf.Tables 中可找到可用选项的完整列表。
处理多行行
如果无法正确标识多行行,则可能可使用 UI 操作或自定义 M 代码清理数据。 例如,可以使用 Table.FillDown 将不对齐的数据复制到相邻行,或者使用 Table.Group 对相邻行进行分组和合并。
高级容量中的 Power BI 数据流
在高级容量的数据流上使用 PDF 连接器时,PDF 连接器无法正确建立连接。 要使 PDF 连接器能够处理高级容量中的数据流,请将该数据流配置为使用网关,并确认与该数据流的连接经过网关。