Sdílet prostřednictvím


Formát JSON ve službě Data Factory v Microsoft Fabric

Tento článek popisuje, jak nakonfigurovat formát JSON v datovém kanálu služby Data Factory v Microsoft Fabric.

Podporované funkce

Formát JSON je podporovaný pro následující aktivity a konektory jako zdroj a cíl.

Kategorie Konektor nebo aktivita
Podporovaný konektor Amazon S3
Kompatibilní s Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Systém souborů
FTP
Cloudové úložiště Googlu
HTTP
Soubory Lakehouse
Oracle Cloud Storage
SFTP
Podporovaná aktivita aktivita Copy (zdroj/cíl)
Aktivita Lookup
Aktivita GetMetadata
Aktivita odstranění

Formát JSON v aktivitě kopírování

Pokud chcete nakonfigurovat formát JSON, zvolte připojení ve zdroji nebo cíli aktivity kopírování datového kanálu a pak v rozevíracím seznamu ve formátu Souboru vyberte JSON. Vyberte Nastavení pro další konfiguraci tohoto formátu.

Snímek obrazovky s nastavením formátu souboru

Formát JSON jako zdroj

Po výběru Nastavení v části Formát souboru se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.

Snímek obrazovky zobrazující zdroj formátu souboru JSON

  • Typ komprese: V rozevíracím seznamu zvolte komprimační kodek použitý ke čtení souborů JSON. Můžete si vybrat z none, bzip2, gzip, deflate, ZipDeflate, TarGzip nebo tar.

    Pokud jako typ komprese vyberete ZipDeflate , zachovejte název souboru ZIP jako složku v části Upřesnit nastavení na kartě Zdroj .

    • Zachovat název souboru ZIP jako složku: Označuje, zda má být během kopírování zachován název zdrojového souboru ZIP jako struktura složek.
      • Pokud je toto políčko zaškrtnuté (výchozí), služba zapíše rozbalené soubory do <specified file path>/<folder named as source zip file>/.
      • Pokud toto políčko není zaškrtnuté, služba zapíše rozbalené soubory přímo do <specified file path>. Ujistěte se, že v různých zdrojových souborech ZIP nemáte duplicitní názvy souborů, abyste se vyhnuli závodnímu nebo neočekávanému chování.

    Pokud jako typ komprese vyberete TarGzip/tar , zachová se název souboru komprese jako složka v části Upřesnit nastavení na kartě Zdroj .

    • Zachovat název komprimovaného souboru jako složku: Označuje, jestli se má během kopírování zachovat zdrojový komprimovaný název souboru jako struktura složek.
      • Pokud je toto políčko zaškrtnuté (výchozí), služba zapíše dekomprimované soubory do <specified file path>/<folder named as source compressed file>/.
      • Pokud toto políčko není zaškrtnuté, služba zapíše dekomprimované soubory přímo do <specified file path>. Ujistěte se, že v různých zdrojových souborech nemáte duplicitní názvy souborů, abyste se vyhnuli závodnímu nebo neočekávanému chování.
  • Úroveň komprese: Poměr komprese. Můžete si vybrat z nejrychlejšího nebo optimálního.

    • Nejrychlejší: Operace komprese by se měla co nejrychleji dokončit, i když výsledný soubor není optimálně komprimovaný.

    • Optimální: Operace komprese by měla být optimálně komprimována, i když dokončení operace trvá delší dobu. Další informace najdete v článku Úrovně komprese.

  • Kódování: Zadejte typ kódování použitý ke čtení testovacích souborů. V rozevíracím seznamu vyberte jeden typ. Výchozí hodnota je UTF-8.

Formát JSON jako cíl

Po výběru možnosti Nastavení se v automaticky otevíraných nastaveních formátu souboru zobrazí následující vlastnosti.

Snímek obrazovky znázorňující cíl formátu souboru JSON

  • Typ komprese: Zvolte kodek komprese použitý k zápisu souborů JSON v rozevíracím seznamu. Můžete si vybrat z none, bzip2, gzip, deflate, ZipDeflate, TarGzip nebo tar.

  • Úroveň komprese: Poměr komprese. Můžete si vybrat z optimálního nebo nejrychlejšího.

    • Nejrychlejší: Operace komprese by se měla co nejrychleji dokončit, i když výsledný soubor není optimálně komprimovaný.

    • Optimální: Operace komprese by měla být optimálně komprimována, i když dokončení operace trvá delší dobu. Další informace najdete v článku Úrovně komprese.

  • Kódování: Zadejte typ kódování použitý k zápisu testovacích souborů. V rozevíracím seznamu vyberte jeden typ. Výchozí hodnota je UTF-8.

V části Upřesnit nastavení na kartě Cíl se zobrazí následující vlastnosti související s formátem JSON.

  • Vzor souboru: Zadejte vzor dat uložených v každém souboru JSON. Povolené hodnoty jsou: Sada objektů (řádky JSON) a pole objektů. Výchozí hodnota je Set of objects. Podrobné informace o těchto vzorech najdete v tématu Vzory souborů JSON.

Vzory souborů JSON

Při kopírování dat ze souborů JSON může aktivita kopírování automaticky zjišťovat a parsovat následující vzory souborů JSON. Při zápisu dat do souborů JSON můžete nakonfigurovat vzor souboru pro cíl aktivity kopírování.

  • Typ I: setOfObjects

    Každý soubor obsahuje jeden objekt, řádky JSON nebo zřetězené objekty.

    • Příklad JSON s jedním objektem

      {
          "time": "2015-04-29T07:12:20.9100000Z",
          "callingimsi": "466920403025604",
          "callingnum1": "678948008",
          "callingnum2": "567834760",
          "switch1": "China",
          "switch2": "Germany"
      }
      
    • Řádky JSON (výchozí pro cíl)

      {"time":"2015-04-29T07:12:20.9100000Z","callingimsi":"466920403025604","callingnum1":"678948008","callingnum2":"567834760","switch1":"China","switch2":"Germany"}
      {"time":"2015-04-29T07:13:21.0220000Z","callingimsi":"466922202613463","callingnum1":"123436380","callingnum2":"789037573","switch1":"US","switch2":"UK"}
      {"time":"2015-04-29T07:13:21.4370000Z","callingimsi":"466923101048691","callingnum1":"678901578","callingnum2":"345626404","switch1":"Germany","switch2":"UK"}
      
    • Příklad JSON se zřetězením

      {
          "time": "2015-04-29T07:12:20.9100000Z",
          "callingimsi": "466920403025604",
          "callingnum1": "678948008",
          "callingnum2": "567834760",
          "switch1": "China",
          "switch2": "Germany"
      }
      {
          "time": "2015-04-29T07:13:21.0220000Z",
          "callingimsi": "466922202613463",
          "callingnum1": "123436380",
          "callingnum2": "789037573",
          "switch1": "US",
          "switch2": "UK"
      }
      {
          "time": "2015-04-29T07:13:21.4370000Z",
          "callingimsi": "466923101048691",
          "callingnum1": "678901578",
          "callingnum2": "345626404",
          "switch1": "Germany",
          "switch2": "UK"
      }
      
  • Typ II: arrayOfObjects

    Každý soubor obsahuje pole objektů.

    [
        {
            "time": "2015-04-29T07:12:20.9100000Z",
            "callingimsi": "466920403025604",
            "callingnum1": "678948008",
            "callingnum2": "567834760",
            "switch1": "China",
            "switch2": "Germany"
        },
        {
            "time": "2015-04-29T07:13:21.0220000Z",
            "callingimsi": "466922202613463",
            "callingnum1": "123436380",
            "callingnum2": "789037573",
            "switch1": "US",
            "switch2": "UK"
        },
        {
            "time": "2015-04-29T07:13:21.4370000Z",
            "callingimsi": "466923101048691",
            "callingnum1": "678901578",
            "callingnum2": "345626404",
            "switch1": "Germany",
            "switch2": "UK"
        }
    ]
    

Souhrn tabulky

JSON jako zdroj

Následující vlastnosti jsou podporovány v části Zdroj aktivity kopírování při použití formátu JSON.

Název Popis Hodnota Požaduje se Vlastnost skriptu JSON
Formát souboru Formát souboru, který chcete použít. JSON Ano typ (v části datasetSettings):
JSON
Typ komprese Kodek komprese používaný ke čtení souborů JSON. Můžete vybrat:
Nic
bzip2
gzip
vyfouknout
ZipDeflate
TarGzip
dehet
No typ (v části compression):

bzip2
gzip
vyfouknout
ZipDeflate
TarGzip
dehet
Úroveň komprese Poměr komprese. Nejrychlejší
Optimální
No úroveň (v části compression):
Nejrychlejší
Optimální
Kódování Typ kódování používaný ke čtení testovacích souborů. "UTF-8" (ve výchozím nastavení),"UTF-8 bez BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Ne encodingName
Zachovat název souboru ZIP jako složku Určuje, zda se má během kopírování zachovat název zdrojového souboru ZIP jako struktura složek. Vybraná (výchozí) nebo zrušit výběr No preserveZipFileNameAsFolder
(pod compressionProperties->type jako ZipDeflateReadSettings):
true (výchozí) nebo false
Zachování názvu komprimačního souboru jako složky Určuje, zda se má během kopírování zachovat zdrojový komprimovaný název souboru jako struktura složek. Vybraná (výchozí) nebo zrušit výběr No preserveCompressionFileNameAsFolder
(pod ->compressionPropertiestype jako TarGZipReadSettings nebo TarReadSettings):
true (výchozí) nebo false

JSON jako cíl

Následující vlastnosti jsou podporovány v části Cíl aktivity kopírování při použití formátu JSON.

Název Popis Hodnota Požaduje se Vlastnost skriptu JSON
Formát souboru Formát souboru, který chcete použít. JSON Ano typ (v části datasetSettings):
JSON
Typ komprese Komprimační kodek použitý k zápisu souborů JSON. Můžete vybrat:
Nic
bzip2
gzip
vyfouknout
ZipDeflate
TarGzip
dehet
No typ (v části compression):

bzip2
gzip
vyfouknout
ZipDeflate
TarGzip
dehet
Úroveň komprese Poměr komprese. Nejrychlejší
Optimální
No úroveň (v části compression):
Nejrychlejší
Optimální
Kódování Typ kódování použitý k zápisu testovacích souborů. "UTF-8" (ve výchozím nastavení),"UTF-8 bez BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Ne encodingName
Vzor souboru Určete vzor dat uložených v jednotlivých souborech JSON. Sada objektů
Pole objektů
No filePattern:
setOfObjects
arrayOfObjects