Del via


ORC-format i Data Factory i Microsoft Fabric

Denne artikkelen beskriver hvordan du konfigurerer ORC-format i datasamlebåndet til Data Factory i Microsoft Fabric.

Støttede funksjoner

ORC-format støttes for følgende aktiviteter og koblinger som kilde og mål.

Kategori Kobling/aktivitet
Støttet kobling Amazon S3
Amazon S3-kompatibel
Azure Blob-lagring
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Filsystem
FTP
Google Cloud Storage
HTTP
Lakehouse Files
Oracle Cloud Storage
SFTP
Støttet aktivitet Kopier aktivitet (kilde/mål)
Oppslagsaktivitet
GetMetadata-aktivitet
Slett dataaktivitet

ORC-format i kopieringsaktivitet

Hvis du vil konfigurere ORC-format, velger du tilkoblingen i kilden eller målet for datasamlebåndkopiaktivitet, og deretter velger du ORC i rullegardinlisten i Filformat. Velg Innstillinger for videre konfigurasjon av dette formatet.

Skjermbilde som viser filformatinnstillinger.

ORC-format som kilde

Når du har valgt Innstillinger i Filformat-delen, vises følgende egenskaper i dialogboksen innstillinger for popup-filformat.

Skjermbilde som viser ORC-filformatkilde.

  • Komprimeringstype: Velg komprimeringskodek som brukes til å lese ORC-filer i rullegardinlisten. Du kan velge mellom Ingen, zlib eller snappy.

ORC-format som mål

Når du har valgt Innstillinger, vises følgende egenskaper i dialogboksen innstillinger for popup-filformat.

Skjermbilde som viser målet for ORC-filformatet.

  • Komprimeringstype: Velg komprimeringskodek som brukes til å skrive ORC-filer i rullegardinlisten. Du kan velge mellom Ingen, zlib eller snappy.

Under Avanserte innstillinger på Mål-fanen vises følgende ORC-formatrelaterte egenskaper.

  • Maksimalt antall rader per fil: Når du skriver data inn i en mappe, kan du velge å skrive til flere filer og angi maksimalt antall rader per fil. Angi maksimalt antall rader du vil skrive per fil.
  • Filnavnprefiks: Gjelder når maksimalt antall rader per fil er konfigurert. Angi filnavnprefikset når du skriver data til flere filer, resulterte i dette mønsteret: <fileNamePrefix>_00000.<fileExtension>. Hvis ikke angitt, genereres filnavnprefikset automatisk. Denne egenskapen gjelder ikke når kilden er et filbasert lager eller et partisjonsalternativ aktivert datalager.

Tabellsammendrag

ORC som kilde

Følgende egenskaper støttes i delen kilde for kopieringsaktivitet når du bruker ORC-format.

Name Beskrivelse Verdi Kreves JSON-skriptegenskap
Filformat Filformatet du vil bruke. ORK Ja type (under datasetSettings):
Ork
Komprimeringstype Komprimeringskodecen som brukes til å lese ORC-filer. None
zlib
irritabel
No orcCompressionCodec:
Ingen
zlib
irritabel

ORC som mål

Følgende egenskaper støttes i målinndelingen for kopieringsaktivitet når du bruker ORC-formatet.

Name Beskrivelse Verdi Kreves JSON-skriptegenskap
Filformat Filformatet du vil bruke. ORK Ja type (under datasetSettings):
Ork
Komprimeringstype Komprimeringskodecen som brukes til å skrive ORC-filer. None
zlib
irritabel
No orcCompressionCodec:
Ingen
zlib
irritabel
Maksimalt antall rader per fil Når du skriver data inn i en mappe, kan du velge å skrive til flere filer og angi maksimalt antall rader per fil. Angi maksimalt antall rader du vil skrive per fil. <maksimalt antall rader per fil> No maxRowsPerFile
Filnavnprefiks Gjelder når maksimalt antall rader per fil er konfigurert. Angi filnavnprefikset når du skriver data til flere filer, resulterte i dette mønsteret: <fileNamePrefix>_00000.<fileExtension>. Hvis ikke angitt, genereres filnavnprefikset automatisk. Denne egenskapen gjelder ikke når kilden er et filbasert lager eller et partisjonsalternativ aktivert datalager. <filnavnprefikset> No fileNamePrefix