将数据导出到 SFTP 主机(预览)
[本文为预发布文档,可能会发生变化。]
将第三方应用程序中的客户数据导出到安全文件传输协议 (SFTP) 位置,以使用这些数据。
小费
Dataverse 的 Azure Synapse Link 是一项正式发布的服务,提供从 Microsoft Dataverse 到 Azure Data Lake 无缝、连续复制数据的功能 我们建议您使用 Dataverse 的 Azure Synapse Link,而不是 Customer Insights 数据输出导出来进一步处理 Customer Insights 生成的表,如:
- 统一客户配置文件 (msdynci_customerprofile)
- 统一活动 (msdynci_unifiedactivity)
- 客户细分成员身份 (msdynci_segmentmembership)
- 客户属性度量 (msdynci_customermeasure)
- 扩充数据安全 (msdynci_enrichment)
- 预测模型输出 (msdynci_prediction)
有关表架构的详细信息,请参阅 Customer Insights - Data 中的表
先决条件
- SFTP 主机的可用性和相应的凭据。
已知限制
- 防火墙后的 SFTP 目标当前不受支持。
- 导出的运行时间取决于系统性能。 建议将两个 CPU 内核和 1 GB 内存作为服务器的最低配置。
- 此导出仅对 CSV 格式的文件有效。
- 在使用建议的两个 CPU 内核和 1 GB 内存这种最低配置时最多导出 1 亿个客户配置文件,可能需要 90 分钟。
- 如果您使用 SSH 密钥进行身份验证,请确保以 PEM 或 SSH.COM 格式创建您的私钥。 如果您使用的是 Putty,请通过导出为 Open SSH 来转换您的私钥。 支持以下私钥格式:
- OpenSSL PEM 和 ssh.com 格式的 RSA
- OpenSSL PEM 和 ssh.com 格式的 DSA
- OpenSSL PEM 格式的 ECDSA 256/384/521
- OpenSSH 密钥格式的 ED25519 和 RSA
设置与 SFTP 的连接
您必须是 Customer Insights - Data 中的管理员才能添加连接。
转到设置>连接。
选择添加连接并选择 SFTP。
在显示名称字段中为连接指定易于识别的名称。 连接的名称和类型描述了此连接。 我们建议选择一个名称来解释此连接的用途和目标。
选择可使用此连接的人员。 默认情况下,仅限管理员。 有关更多信息,请参阅允许参与者使用连接进行导出。
选择是否要通过 SSH 或连接的用户名/密码进行身份验证,并提供必要的详细信息。 如果您使用 SSH 密钥进行身份验证,请确保以 PEM 或 SSH.COM 格式创建您的私钥。 如果您使用的是 Putty,请通过导出为 Open SSH 来转换您的私钥。 支持以下私钥格式:
- OpenSSL PEM 和 ssh.com 格式的 RSA
- OpenSSL PEM 和 ssh.com 格式的 DSA
- OpenSSL PEM 格式的 ECDSA 256/384/521
- OpenSSH 密钥格式的 ED25519 和 RSA
输入主机名,并在 FTP 服务器上指定导出文件夹。 导出文件夹必须小写。 系统不区分大小写,即使您在文件夹名称中使用大写字母,也会以小写形式创建文件夹名称。
查看数据隐私和合规性,并选择我同意。
选择保存以完成连接。
配置导出
要配置此导出,您必须具有此连接类型的权限。
转到数据>导出。
选择添加导出。
在导出连接字段中,从 SFTP 部分选择连接。 如果没有连接可用,请联系管理员。
为导出输入名称。
选择要为导出的文件导出已进行 gzip 压缩的数据还是已解压缩的数据,以及是否导出字段分隔符。
选择要导出的表,如客户细分。
选择下一步,确定是否要发送所选表中的所有字段。 默认情况下,会导出选定表中的所有字段。 清除不想导出的字段旁边的复选框。
备注
导出后,每个选定表最多将拆分成五个输出文件。
选择保存。
保存导出不会立即运行导出。 每次进行预定的刷新 时,都会运行导出。 您也可以按需导出数据。
小费
导出包含大量数据的表可能会导致每次导出在同一文件夹中生成多个 CSV 文件。 出于性能原因拆分导出以最大程度地减少导出完成所需的时间。