Formát ORC ve službě Data Factory v Microsoft Fabric
Tento článek popisuje, jak nakonfigurovat formát ORC v datovém kanálu služby Data Factory v Microsoft Fabric.
Podporované funkce
Formát ORC je podporovaný pro následující aktivity a konektory jako zdroj a cíl.
Kategorie | Konektor nebo aktivita |
---|---|
Podporovaný konektor | Amazon S3 |
Kompatibilní s Amazon S3 | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Systém souborů | |
FTP | |
Cloudové úložiště Googlu | |
HTTP | |
Soubory Lakehouse | |
Oracle Cloud Storage | |
SFTP | |
Podporovaná aktivita | aktivita Copy (zdroj/cíl) |
Aktivita Lookup | |
Aktivita GetMetadata | |
Aktivita odstranění dat |
Formát ORC v aktivitě kopírování
Pokud chcete nakonfigurovat formát ORC, zvolte připojení ve zdroji nebo cíli aktivity kopírování datového kanálu a pak v rozevíracím seznamu formát souboru vyberte ORC. Vyberte Nastavení pro další konfiguraci tohoto formátu.
Formát ORC jako zdroj
Po výběru Nastavení v části Formát souboru se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.
- Typ komprese: Zvolte kodek komprese použitý ke čtení souborů ORC v rozevíracím seznamu. Můžete si vybrat z nabídky Žádné, zlib nebo snappy.
Formát ORC jako cíl
Po výběru možnosti Nastavení se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.
- Typ komprese: Zvolte kodek komprese použitý k zápisu souborů ORC v rozevíracím seznamu. Můžete si vybrat z nabídky Žádné, zlib nebo snappy.
V části Upřesnit nastavení na kartě Cíl se zobrazí následující vlastnosti související s formátem ORC.
- Maximální počet řádků na soubor: Při zápisu dat do složky se můžete rozhodnout zapisovat do více souborů a zadat maximální počet řádků na soubor. Zadejte maximální počet řádků, které chcete zapisovat na soubor.
- Předpona názvu souboru: Platí při konfiguraci maximálního počtu řádků na soubor . Při zápisu dat do více souborů zadejte předponu názvu souboru, výsledkem je tento vzor:
<fileNamePrefix>_00000.<fileExtension>
. Pokud není zadána, automaticky se vygeneruje předpona názvu souboru. Tato vlastnost se nevztahuje, pokud zdrojem je úložiště založené na souborech nebo možnost oddílu s povoleným úložištěm dat.
Souhrn tabulky
ORC jako zdroj
Následující vlastnosti jsou podporovány v části Zdroj aktivity kopírování při použití formátu ORC.
Název | Popis | Hodnota | Požaduje se | Vlastnost skriptu JSON |
---|---|---|---|---|
Formát souboru | Formát souboru, který chcete použít. | ORC | Ano | type (v části datasetSettings ):Orc |
Typ komprese | Komprimační kodek používaný ke čtení souborů ORC. | Nic zlib kousavý |
No | orcCompressionCodec: Žádná zlib kousavý |
ORC jako cíl
Následující vlastnosti jsou podporovány v části Cíl aktivity kopírování při použití formátu ORC.
Název | Popis | Hodnota | Požaduje se | Vlastnost skriptu JSON |
---|---|---|---|---|
Formát souboru | Formát souboru, který chcete použít. | ORC | Ano | type (v části datasetSettings ):Orc |
Typ komprese | Komprimační kodek používaný k zápisu souborů ORC. | Nic zlib kousavý |
No | orcCompressionCodec: Žádná zlib kousavý |
Maximální počet řádků na soubor | Při zápisu dat do složky se můžete rozhodnout zapisovat do více souborů a zadat maximální počet řádků na soubor. Zadejte maximální počet řádků, které chcete zapisovat na soubor. | <maximální počet řádků na soubor> | No | maxRowsPerFile |
Předpona názvu souboru | Platí pro konfiguraci maximálního počtu řádků na soubor . Při zápisu dat do více souborů zadejte předponu názvu souboru, výsledkem je tento vzor: <fileNamePrefix>_00000.<fileExtension> . Pokud není zadána, automaticky se vygeneruje předpona názvu souboru. Tato vlastnost se nevztahuje, pokud zdrojem je úložiště založené na souborech nebo možnost oddílu s povoleným úložištěm dat. |
<předpona názvu souboru> | No | fileNamePrefix |