Formát JSON ve službě Data Factory v Microsoft Fabric
Tento článek popisuje, jak nakonfigurovat formát JSON v datovém kanálu služby Data Factory v Microsoft Fabric.
Podporované funkce
Formát JSON je podporovaný pro následující aktivity a konektory jako zdroj a cíl.
Kategorie | Konektor nebo aktivita |
---|---|
Podporovaný konektor | Amazon S3 |
Kompatibilní s Amazon S3 | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Systém souborů | |
FTP | |
Cloudové úložiště Googlu | |
HTTP | |
Soubory Lakehouse | |
Oracle Cloud Storage | |
SFTP | |
Podporovaná aktivita | aktivita Copy (zdroj/cíl) |
Aktivita Lookup | |
Aktivita GetMetadata | |
Aktivita odstranění |
Formát JSON v aktivitě kopírování
Pokud chcete nakonfigurovat formát JSON, zvolte připojení ve zdroji nebo cíli aktivity kopírování datového kanálu a pak v rozevíracím seznamu ve formátu Souboru vyberte JSON. Vyberte Nastavení pro další konfiguraci tohoto formátu.
Formát JSON jako zdroj
Po výběru Nastavení v části Formát souboru se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.
Typ komprese: V rozevíracím seznamu zvolte komprimační kodek použitý ke čtení souborů JSON. Můžete si vybrat z none, bzip2, gzip, deflate, ZipDeflate, TarGzip nebo tar.
Pokud jako typ komprese vyberete ZipDeflate , zachovejte název souboru ZIP jako složku v části Upřesnit nastavení na kartě Zdroj .
- Zachovat název souboru ZIP jako složku: Označuje, zda má být během kopírování zachován název zdrojového souboru ZIP jako struktura složek.
- Pokud je toto políčko zaškrtnuté (výchozí), služba zapíše rozbalené soubory do
<specified file path>/<folder named as source zip file>/
. - Pokud toto políčko není zaškrtnuté, služba zapíše rozbalené soubory přímo do
<specified file path>
. Ujistěte se, že v různých zdrojových souborech ZIP nemáte duplicitní názvy souborů, abyste se vyhnuli závodnímu nebo neočekávanému chování.
- Pokud je toto políčko zaškrtnuté (výchozí), služba zapíše rozbalené soubory do
Pokud jako typ komprese vyberete TarGzip/tar , zachová se název souboru komprese jako složka v části Upřesnit nastavení na kartě Zdroj .
- Zachovat název komprimovaného souboru jako složku: Označuje, jestli se má během kopírování zachovat zdrojový komprimovaný název souboru jako struktura složek.
- Pokud je toto políčko zaškrtnuté (výchozí), služba zapíše dekomprimované soubory do
<specified file path>/<folder named as source compressed file>/
. - Pokud toto políčko není zaškrtnuté, služba zapíše dekomprimované soubory přímo do
<specified file path>
. Ujistěte se, že v různých zdrojových souborech nemáte duplicitní názvy souborů, abyste se vyhnuli závodnímu nebo neočekávanému chování.
- Pokud je toto políčko zaškrtnuté (výchozí), služba zapíše dekomprimované soubory do
- Zachovat název souboru ZIP jako složku: Označuje, zda má být během kopírování zachován název zdrojového souboru ZIP jako struktura složek.
Úroveň komprese: Poměr komprese. Můžete si vybrat z nejrychlejšího nebo optimálního.
Nejrychlejší: Operace komprese by se měla co nejrychleji dokončit, i když výsledný soubor není optimálně komprimovaný.
Optimální: Operace komprese by měla být optimálně komprimována, i když dokončení operace trvá delší dobu. Další informace najdete v článku Úrovně komprese.
Kódování: Zadejte typ kódování použitý ke čtení testovacích souborů. V rozevíracím seznamu vyberte jeden typ. Výchozí hodnota je UTF-8.
Formát JSON jako cíl
Po výběru možnosti Nastavení se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.
Typ komprese: Zvolte kodek komprese použitý k zápisu souborů JSON v rozevíracím seznamu. Můžete si vybrat z none, bzip2, gzip, deflate, ZipDeflate, TarGzip nebo tar.
Úroveň komprese: Poměr komprese. Můžete si vybrat z optimálního nebo nejrychlejšího.
Nejrychlejší: Operace komprese by se měla co nejrychleji dokončit, i když výsledný soubor není optimálně komprimovaný.
Optimální: Operace komprese by měla být optimálně komprimována, i když dokončení operace trvá delší dobu. Další informace najdete v článku Úrovně komprese.
Kódování: Zadejte typ kódování použitý k zápisu testovacích souborů. V rozevíracím seznamu vyberte jeden typ. Výchozí hodnota je UTF-8.
V části Upřesnit nastavení na kartě Cíl se zobrazí následující vlastnosti související s formátem JSON.
- Vzor souboru: Zadejte vzor dat uložených v každém souboru JSON. Povolené hodnoty jsou: Sada objektů (řádky JSON) a pole objektů. Výchozí hodnota je Set of objects. Podrobné informace o těchto vzorech najdete v tématu Vzory souborů JSON.
Vzory souborů JSON
Při kopírování dat ze souborů JSON může aktivita kopírování automaticky zjišťovat a parsovat následující vzory souborů JSON. Při zápisu dat do souborů JSON můžete nakonfigurovat vzor souboru pro cíl aktivity kopírování.
Typ I: setOfObjects
Každý soubor obsahuje jeden objekt, řádky JSON nebo zřetězené objekty.
Příklad JSON s jedním objektem
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }
Řádky JSON (výchozí pro cíl)
{"time":"2015-04-29T07:12:20.9100000Z","callingimsi":"466920403025604","callingnum1":"678948008","callingnum2":"567834760","switch1":"China","switch2":"Germany"} {"time":"2015-04-29T07:13:21.0220000Z","callingimsi":"466922202613463","callingnum1":"123436380","callingnum2":"789037573","switch1":"US","switch2":"UK"} {"time":"2015-04-29T07:13:21.4370000Z","callingimsi":"466923101048691","callingnum1":"678901578","callingnum2":"345626404","switch1":"Germany","switch2":"UK"}
Příklad JSON se zřetězením
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" } { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" } { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" }
Typ II: arrayOfObjects
Každý soubor obsahuje pole objektů.
[ { "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }, { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" }, { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" } ]
Souhrn tabulky
JSON jako zdroj
Následující vlastnosti jsou podporovány v části Zdroj aktivity kopírování při použití formátu JSON.
Název | Popis | Hodnota | Požaduje se | Vlastnost skriptu JSON |
---|---|---|---|---|
Formát souboru | Formát souboru, který chcete použít. | JSON | Ano | typ (v části datasetSettings ):JSON |
Typ komprese | Kodek komprese používaný ke čtení souborů JSON. | Můžete vybrat: Nic bzip2 gzip vyfouknout ZipDeflate TarGzip dehet |
No | typ (v části compression ): bzip2 gzip vyfouknout ZipDeflate TarGzip dehet |
Úroveň komprese | Poměr komprese. | Nejrychlejší Optimální |
No | úroveň (v části compression ): Nejrychlejší Optimální |
Kódování | Typ kódování používaný ke čtení testovacích souborů. | "UTF-8" (ve výchozím nastavení),"UTF-8 bez BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Ne | encodingName |
Zachovat název souboru ZIP jako složku | Určuje, zda se má během kopírování zachovat název zdrojového souboru ZIP jako struktura složek. | Vybraná (výchozí) nebo zrušit výběr | No | preserveZipFileNameAsFolder (pod compressionProperties ->type jako ZipDeflateReadSettings ):true (výchozí) nebo false |
Zachování názvu komprimačního souboru jako složky | Určuje, zda se má během kopírování zachovat zdrojový komprimovaný název souboru jako struktura složek. | Vybraná (výchozí) nebo zrušit výběr | No | preserveCompressionFileNameAsFolder (pod -> compressionProperties type jako TarGZipReadSettings nebo TarReadSettings ):true (výchozí) nebo false |
JSON jako cíl
Následující vlastnosti jsou podporovány v části Cíl aktivity kopírování při použití formátu JSON.
Název | Popis | Hodnota | Požaduje se | Vlastnost skriptu JSON |
---|---|---|---|---|
Formát souboru | Formát souboru, který chcete použít. | JSON | Ano | typ (v části datasetSettings ):JSON |
Typ komprese | Komprimační kodek použitý k zápisu souborů JSON. | Můžete vybrat: Nic bzip2 gzip vyfouknout ZipDeflate TarGzip dehet |
No | typ (v části compression ): bzip2 gzip vyfouknout ZipDeflate TarGzip dehet |
Úroveň komprese | Poměr komprese. | Nejrychlejší Optimální |
No | úroveň (v části compression ): Nejrychlejší Optimální |
Kódování | Typ kódování použitý k zápisu testovacích souborů. | "UTF-8" (ve výchozím nastavení),"UTF-8 bez BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Ne | encodingName |
Vzor souboru | Určete vzor dat uložených v jednotlivých souborech JSON. | Sada objektů Pole objektů |
No | filePattern: setOfObjects arrayOfObjects |