Parquet
总结
项目 | 说明 |
---|---|
发布状态 | 正式版 |
支持的产品 | Power BI(语义模型) Power BI(数据流) Fabric(数据流 Gen2) Power Apps(数据流) Dynamics 365 Customer Insights |
支持的身份验证类型 | 匿名(联机) 帐户密钥(联机) 基本(联机) 组织帐户(联机) 共享访问签名 (SAS)(联机) Web API(联机) Windows(联机) |
函数参考文档 | — |
注意
由于部署计划和特定于主机的功能,某些功能可能只存在于一个产品中。
支持的功能
- 导入
- Basic
- 高级
从 Power Query Desktop 连接到 Parquet 文件
要从 Power Query Desktop 连接到 Parquet 文件,请执行以下步骤:
在“获取数据”体验中选择“Parquet”。 Power Query Desktop 中的“获取数据”体验因应用而异。 要详细了解适用于你的应用的 Power Query Desktop“获取数据”体验,请转到在何处获取数据。
在 Parquet 中,提供 Parquet 文件位置的 URL。 如果要连接到本地文件,则输入路径和文件名。 还可以选择高级并从部件生成 URL。 在本文中使用的示例中,Parquet 文件位于 Azure Blob 存储中。
选择“确定”。
如果这是首次连接到此数据源,请选择身份验证类型,输入凭据,然后选择应用身份验证设置的级别。 然后选择“连接”。
从 Power Query Desktop 中,选择以下身份验证方法之一:
- 匿名
- 要解决这个问题,必须更新服务委托人的secret。
- 共享访问签名 (SAS)
有关身份验证方法的详细信息,请转到使用数据源进行身份验证。
在导航器中,选择所需的数据库信息,然后选择加载以加载数据,或是选择转换数据以继续在 Power Query 编辑器中转换数据。
从 Power Query Online 连接到 Parquet 文件
要从 Power Query Online 连接到 Parquet 文件,请执行以下步骤:
在“获取数据”体验中选择“Parquet”选项。 不同的应用通过不同的方式来使用 Power Query Online“获取数据”体验。 要详细了解如果从你的应用访问 Power Query Online“获取数据”体验,请转到在何处获取数据。
在 Parquet 中,提供服务器和数据库的名称。 或者,如果要连接到本地文件,则输入路径和文件名。
如果要连接到本地文件,则选择本地数据网关的名称。 如果数据处于联机状态,则不需要提供本地数据网关。
如果这是首次连接到此数据源,请选择身份验证类型并输入凭据。 从 Power Query Online 中,选择以下身份验证类型之一:
- 匿名(联机)
- 帐户密钥(联机)
- Windows(本地文件)
选择下一步,以转到 Power Query 编辑器,然后可以在其中开始转换数据。
已知问题和限制
Power Query Parquet 连接器仅支持从本地文件系统、Azure Blob 存储和 Azure Data Lake Storage Gen2 读取文件。
可能可使用 Binary.Buffer 函数从其他源读取小文件,以将文件缓冲到内存中。 但是,如果文件太大,则可能会收到以下错误:
Error: Parquet.Document cannot be used with streamed binary values.
以这种方式使用 Binary.Buffer
函数,也可能会影响性能。