Sdílet prostřednictvím


Formát ORC ve službě Data Factory v Microsoft Fabric

Tento článek popisuje, jak nakonfigurovat formát ORC v datovém kanálu služby Data Factory v Microsoft Fabric.

Podporované funkce

Formát ORC je podporovaný pro následující aktivity a konektory jako zdroj a cíl.

Kategorie Konektor nebo aktivita
Podporovaný konektor Amazon S3
Kompatibilní s Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Systém souborů
FTP
Cloudové úložiště Googlu
HTTP
Soubory Lakehouse
Oracle Cloud Storage
SFTP
Podporovaná aktivita aktivita Copy (zdroj/cíl)
Aktivita Lookup
Aktivita GetMetadata
Aktivita odstranění dat

Formát ORC v aktivitě kopírování

Pokud chcete nakonfigurovat formát ORC, zvolte připojení ve zdroji nebo cíli aktivity kopírování datového kanálu a pak v rozevíracím seznamu formát souboru vyberte ORC. Vyberte Nastavení pro další konfiguraci tohoto formátu.

Snímek obrazovky s nastavením formátu souboru

Formát ORC jako zdroj

Po výběru Nastavení v části Formát souboru se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.

Snímek obrazovky se zdrojem formátu souboru ORC

  • Typ komprese: Zvolte kodek komprese použitý ke čtení souborů ORC v rozevíracím seznamu. Můžete si vybrat z nabídky Žádné, zlib nebo snappy.

Formát ORC jako cíl

Po výběru možnosti Nastavení se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.

Snímek obrazovky znázorňující cíl formátu souboru ORC

  • Typ komprese: Zvolte kodek komprese použitý k zápisu souborů ORC v rozevíracím seznamu. Můžete si vybrat z nabídky Žádné, zlib nebo snappy.

V části Upřesnit nastavení na kartě Cíl se zobrazí následující vlastnosti související s formátem ORC.

  • Maximální počet řádků na soubor: Při zápisu dat do složky se můžete rozhodnout zapisovat do více souborů a zadat maximální počet řádků na soubor. Zadejte maximální počet řádků, které chcete zapisovat na soubor.
  • Předpona názvu souboru: Platí při konfiguraci maximálního počtu řádků na soubor . Při zápisu dat do více souborů zadejte předponu názvu souboru, výsledkem je tento vzor: <fileNamePrefix>_00000.<fileExtension>. Pokud není zadána, automaticky se vygeneruje předpona názvu souboru. Tato vlastnost se nevztahuje, pokud zdrojem je úložiště založené na souborech nebo možnost oddílu s povoleným úložištěm dat.

Souhrn tabulky

ORC jako zdroj

Následující vlastnosti jsou podporovány v části Zdroj aktivity kopírování při použití formátu ORC.

Název Popis Hodnota Požaduje se Vlastnost skriptu JSON
Formát souboru Formát souboru, který chcete použít. ORC Ano type (v části datasetSettings):
Orc
Typ komprese Komprimační kodek používaný ke čtení souborů ORC. Nic
zlib
kousavý
No orcCompressionCodec:
Žádná
zlib
kousavý

ORC jako cíl

Následující vlastnosti jsou podporovány v části Cíl aktivity kopírování při použití formátu ORC.

Název Popis Hodnota Požaduje se Vlastnost skriptu JSON
Formát souboru Formát souboru, který chcete použít. ORC Ano type (v části datasetSettings):
Orc
Typ komprese Komprimační kodek používaný k zápisu souborů ORC. Nic
zlib
kousavý
No orcCompressionCodec:
Žádná
zlib
kousavý
Maximální počet řádků na soubor Při zápisu dat do složky se můžete rozhodnout zapisovat do více souborů a zadat maximální počet řádků na soubor. Zadejte maximální počet řádků, které chcete zapisovat na soubor. <maximální počet řádků na soubor> No maxRowsPerFile
Předpona názvu souboru Platí pro konfiguraci maximálního počtu řádků na soubor . Při zápisu dat do více souborů zadejte předponu názvu souboru, výsledkem je tento vzor: <fileNamePrefix>_00000.<fileExtension>. Pokud není zadána, automaticky se vygeneruje předpona názvu souboru. Tato vlastnost se nevztahuje, pokud zdrojem je úložiště založené na souborech nebo možnost oddílu s povoleným úložištěm dat. <předpona názvu souboru> No fileNamePrefix