HDFS 文件源
适用范围:SQL Server Azure 数据工厂中的 SSIS Integration Runtime
“HDFS 文件源”组件允许 SSIS 包从 HDFS 文件中读取数据。 支持的文件格式有文本和 Avro。 (不支持 ORC 源。)
若要配置“HDFS 文件源”,请将“HDFS 文件源”拖放到数据流设计器中,然后双击该组件打开编辑器。
选项
在“Hadoop 文件源编辑器” 对话框的“常规” 选项卡上配置以下选项。
字段 | 说明 |
---|---|
Hadoop 连接 | 指定现有的一个 Hadoop 连接管理器,或新建一个 Hadoop 连接管理器。 此连接管理器指明 HDFS 文件的托管位置。 |
文件路径 | 指定 HDFS 文件的文件名。 |
文件格式 | 指定 HDFS 文件的格式。 可用选项为文本和 Avro。 (不支持 ORC 源。) |
列分隔符字符 | 如果你选择文本格式,请指定列分隔符字符。 |
第一个数据行中的列名称 | 如果你选择文本格式,请指定文件中的第一行是否包含列名称。 |
配置这些选项后,选择“列” 选项卡,将源列映射到数据流中的目标列。