HDFS 文件源

适用范围:SQL Server Azure 数据工厂中的 SSIS Integration Runtime

“HDFS 文件源”组件允许 SSIS 包从 HDFS 文件中读取数据。 支持的文件格式有文本和 Avro。 (不支持 ORC 源。)

若要配置“HDFS 文件源”,请将“HDFS 文件源”拖放到数据流设计器中,然后双击该组件打开编辑器。

HDFS 文件源编辑器

选项

在“Hadoop 文件源编辑器” 对话框的“常规” 选项卡上配置以下选项。

字段 说明
Hadoop 连接 指定现有的一个 Hadoop 连接管理器,或新建一个 Hadoop 连接管理器。 此连接管理器指明 HDFS 文件的托管位置。
文件路径 指定 HDFS 文件的文件名。
文件格式 指定 HDFS 文件的格式。 可用选项为文本和 Avro。 (不支持 ORC 源。)
列分隔符字符 如果你选择文本格式,请指定列分隔符字符。
第一个数据行中的列名称 如果你选择文本格式,请指定文件中的第一行是否包含列名称。

配置这些选项后,选择“列” 选项卡,将源列映射到数据流中的目标列。

另请参阅

Hadoop 连接管理器
HDFS 文件目标