ORC-format i Data Factory i Microsoft Fabric
Denne artikkelen beskriver hvordan du konfigurerer ORC-format i datasamlebåndet til Data Factory i Microsoft Fabric.
Støttede funksjoner
ORC-format støttes for følgende aktiviteter og koblinger som kilde og mål.
Kategori | Kobling/aktivitet |
---|---|
Støttet kobling | Amazon S3 |
Amazon S3-kompatibel | |
Azure Blob-lagring | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Filsystem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Støttet aktivitet | Kopier aktivitet (kilde/mål) |
Oppslagsaktivitet | |
GetMetadata-aktivitet | |
Slett dataaktivitet |
ORC-format i kopieringsaktivitet
Hvis du vil konfigurere ORC-format, velger du tilkoblingen i kilden eller målet for datasamlebåndkopiaktivitet, og deretter velger du ORC i rullegardinlisten i Filformat. Velg Innstillinger for videre konfigurasjon av dette formatet.
ORC-format som kilde
Når du har valgt Innstillinger i Filformat-delen, vises følgende egenskaper i dialogboksen innstillinger for popup-filformat.
- Komprimeringstype: Velg komprimeringskodek som brukes til å lese ORC-filer i rullegardinlisten. Du kan velge mellom Ingen, zlib eller snappy.
ORC-format som mål
Når du har valgt Innstillinger, vises følgende egenskaper i dialogboksen innstillinger for popup-filformat.
- Komprimeringstype: Velg komprimeringskodek som brukes til å skrive ORC-filer i rullegardinlisten. Du kan velge mellom Ingen, zlib eller snappy.
Under Avanserte innstillinger på Mål-fanen vises følgende ORC-formatrelaterte egenskaper.
- Maksimalt antall rader per fil: Når du skriver data inn i en mappe, kan du velge å skrive til flere filer og angi maksimalt antall rader per fil. Angi maksimalt antall rader du vil skrive per fil.
- Filnavnprefiks: Gjelder når maksimalt antall rader per fil er konfigurert. Angi filnavnprefikset når du skriver data til flere filer, resulterte i dette mønsteret:
<fileNamePrefix>_00000.<fileExtension>
. Hvis ikke angitt, genereres filnavnprefikset automatisk. Denne egenskapen gjelder ikke når kilden er et filbasert lager eller et partisjonsalternativ aktivert datalager.
Tabellsammendrag
ORC som kilde
Følgende egenskaper støttes i delen kilde for kopieringsaktivitet når du bruker ORC-format.
Name | Beskrivelse | Verdi | Kreves | JSON-skriptegenskap |
---|---|---|---|---|
Filformat | Filformatet du vil bruke. | ORK | Ja | type (under datasetSettings ):Ork |
Komprimeringstype | Komprimeringskodecen som brukes til å lese ORC-filer. | None zlib irritabel |
No | orcCompressionCodec: Ingen zlib irritabel |
ORC som mål
Følgende egenskaper støttes i målinndelingen for kopieringsaktivitet når du bruker ORC-formatet.
Name | Beskrivelse | Verdi | Kreves | JSON-skriptegenskap |
---|---|---|---|---|
Filformat | Filformatet du vil bruke. | ORK | Ja | type (under datasetSettings ):Ork |
Komprimeringstype | Komprimeringskodecen som brukes til å skrive ORC-filer. | None zlib irritabel |
No | orcCompressionCodec: Ingen zlib irritabel |
Maksimalt antall rader per fil | Når du skriver data inn i en mappe, kan du velge å skrive til flere filer og angi maksimalt antall rader per fil. Angi maksimalt antall rader du vil skrive per fil. | <maksimalt antall rader per fil> | No | maxRowsPerFile |
Filnavnprefiks | Gjelder når maksimalt antall rader per fil er konfigurert. Angi filnavnprefikset når du skriver data til flere filer, resulterte i dette mønsteret: <fileNamePrefix>_00000.<fileExtension> . Hvis ikke angitt, genereres filnavnprefikset automatisk. Denne egenskapen gjelder ikke når kilden er et filbasert lager eller et partisjonsalternativ aktivert datalager. |
<filnavnprefikset> | No | fileNamePrefix |