HDFS-Dateiziel
Gilt für: SQL Server SSIS Integration Runtime in Azure Data Factory
Die HDFS-Dateizielkomponente ermöglicht einem SSIS-Paket das Schreiben von Daten in eine HDFS-Datei. Die unterstützten Dateiformate sind Text, Avro und ORC.
Um das HDFS-Dateiziel zu konfigurieren, ziehen Sie die HDFS-Dateiquelle in den Datenfluss-Designer, und doppelklicken Sie auf die Komponente, um den Editor zu öffnen.
Optionen
Konfigurieren Sie die folgenden Optionen auf der Registerkarte Allgemein im Dialogfeld Dateiziel-Editor für Hadoop .
Feld | BESCHREIBUNG |
---|---|
Hadoop-Verbindung | Geben Sie einen vorhandenen Hadoop-Verbindungs-Manager an, oder erstellen Sie einen neuen. Dieser Verbindungs-Manager gibt an, wo die HDFS-Dateien gehostet werden. |
Dateipfad | Geben Sie den Namen der HDFS-Datei an. |
Dateiformat | Geben Sie das Format für die HDFS-Datei an. Die verfügbaren Optionen sind Text, Avro und ORC. |
Spaltentrennzeichen | Wenn Sie das Textformat auswählen, geben Sie das Spaltentrennzeichen an. |
Spaltennamen in der ersten Datenzeile | Wenn Sie das Textformat auswählen, geben Sie an, ob die erste Zeile in der Datei Spaltennamen enthält. |
Nachdem Sie diese Optionen konfiguriert haben, wählen Sie die Registerkarte Spalten aus, um Quellspalten zu Zielspalten im Datenfluss zuzuordnen.
Voraussetzung für das ORC-Dateiformat
Zur Verwendung des ORC-Dateiformats ist Java erforderlich. Die Architektur (32/64 Bit) des Java-Builds muss mit der der zu verwendenden SSIS-Runtime übereinstimmen. Die folgenden Java-Builds wurden getestet.
Einrichten von OpenJDK für Zulu
- Laden Sie das ZIP-Paket für die Installation herunter, und extrahieren Sie es.
- Führen Sie über die Eingabeaufforderung
sysdm.cpl
aus. - Klicken Sie auf der Registerkarte Erweitert auf Umgebungsvariablen.
- Klicken Sie im Abschnitt Systemvariablen auf Neu.
- Geben Sie
JAVA_HOME
für den Variablennamen ein. - Klicken Sie auf Verzeichnis durchsuchen, navigieren Sie zum extrahierten Ordner, und wählen Sie den Unterordner
jre
aus. Wählen Sie anschließend OK aus. Daraufhin wird der Variablenwert automatisch aufgefüllt. - Klicken Sie auf OK, um das Dialogfeld New System Variable (Neue Systemvariable) zu schließen.
- Klicken Sie auf OK, um das Dialogfeld Umgebungsvariablen zu schließen.
- Klicken Sie auf OK, um das Dialogfeld Systemeigenschaften zu schließen.
Einrichten von Oracle Java SE Runtime Environment
- Laden Sie das EXE-Installationsprogramm herunter, und führen Sie es aus.
- Führen Sie die Installationsanweisungen aus, um das Setup abzuschließen.