JSON-indeling in Data Factory in Microsoft Fabric
In dit artikel wordt beschreven hoe u de JSON-indeling configureert in de gegevenspijplijn van Data Factory in Microsoft Fabric.
Ondersteunde mogelijkheden
JSON-indeling wordt ondersteund voor de volgende activiteiten en connectors als bron en doel.
Categorie | Connector/activiteit |
---|---|
Ondersteunde connector | Amazon S3 |
Amazon S3 compatibel | |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Bestandssysteem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Ondersteunde activiteit | Copy-activiteit (bron/doel) |
Activiteit Lookup | |
GetMetadata-activiteit | |
Activiteit verwijderen |
JSON-indeling in kopieeractiviteit
Als u de JSON-indeling wilt configureren, kiest u de verbinding in de bron of het doel van de kopieeractiviteit van de gegevenspijplijn en selecteert u vervolgens JSON in de vervolgkeuzelijst met de bestandsindeling. Selecteer Instellingen voor verdere configuratie van deze indeling.
JSON-indeling als bron
Nadat u Instellingen in de sectie Bestandsindeling hebt geselecteerd, worden de volgende eigenschappen weergegeven in het dialoogvenster Instellingen voor bestandsindeling.
Compressietype: kies de compressiecodec die wordt gebruikt voor het lezen van JSON-bestanden in de vervolgkeuzelijst. U kunt kiezen uit None, bzip2, gzip, deflate, ZipDeflate, TarGzip of tar.
Als u ZipDeflate selecteert als het compressietype, wordt de naam van het zip-bestand behouden als map weergegeven onder de geavanceerde instellingen op het tabblad Bron.
- Naam van zip-bestand behouden als map: Geeft aan of de naam van het zip-bronbestand moet worden bewaard als een mapstructuur tijdens het kopiëren.
- Als dit selectievakje is ingeschakeld (standaard), schrijft de service uitgepakte bestanden naar
<specified file path>/<folder named as source zip file>/
. - Als dit selectievakje is uitgeschakeld, schrijft de service uitgepakte bestanden rechtstreeks naar
<specified file path>
. Zorg ervoor dat u geen dubbele bestandsnamen in verschillende zip-bronbestanden hebt om racen of onverwacht gedrag te voorkomen.
- Als dit selectievakje is ingeschakeld (standaard), schrijft de service uitgepakte bestanden naar
Als u TarGzip/tar als het compressietype selecteert, blijft de bestandsnaam van het compressiebestand behouden als map wordt weergegeven onder de geavanceerde instellingen op het tabblad Bron.
- Compressiebestandsnaam behouden als map: Geeft aan of de gecomprimeerde bronbestandsnaam behouden moet blijven als mapstructuur tijdens het kopiëren.
- Als dit selectievakje is ingeschakeld (standaard), schrijft de service gedecomprimeerde bestanden naar
<specified file path>/<folder named as source compressed file>/
. - Als dit selectievakje is uitgeschakeld, schrijft de service gedecomprimeerde bestanden rechtstreeks naar
<specified file path>
. Zorg ervoor dat u geen dubbele bestandsnamen in verschillende bronbestanden hebt om racen of onverwacht gedrag te voorkomen.
- Als dit selectievakje is ingeschakeld (standaard), schrijft de service gedecomprimeerde bestanden naar
- Naam van zip-bestand behouden als map: Geeft aan of de naam van het zip-bronbestand moet worden bewaard als een mapstructuur tijdens het kopiëren.
Compressieniveau: de compressieverhouding. U kunt kiezen uit Snelste of Optimaal.
Snelste: De compressiebewerking moet zo snel mogelijk worden voltooid, zelfs als het resulterende bestand niet optimaal is gecomprimeerd.
Optimaal: De compressiebewerking moet optimaal worden gecomprimeerd, zelfs als het langer duurt om de bewerking te voltooien. Ga naar het artikel Compressieniveau voor meer informatie.
Codering: geef het coderingstype op dat wordt gebruikt om testbestanden te lezen. Selecteer één type in de vervolgkeuzelijst. De standaardwaarde is UTF-8.
JSON-indeling als doel
Nadat u Instellingen hebt geselecteerd, worden de volgende eigenschappen weergegeven in het dialoogvenster Instellingen voor bestandsindeling.
Compressietype: Kies de compressiecodec die wordt gebruikt voor het schrijven van JSON-bestanden in de vervolgkeuzelijst. U kunt kiezen uit None, bzip2, gzip, deflate, ZipDeflate, TarGzip of tar.
Compressieniveau: de compressieverhouding. U kunt kiezen uit Optimale of Snelste.
Snelste: De compressiebewerking moet zo snel mogelijk worden voltooid, zelfs als het resulterende bestand niet optimaal is gecomprimeerd.
Optimaal: De compressiebewerking moet optimaal worden gecomprimeerd, zelfs als het langer duurt om de bewerking te voltooien. Ga naar het artikel Compressieniveau voor meer informatie.
Codering: geef het coderingstype op dat wordt gebruikt om testbestanden te schrijven. Selecteer één type in de vervolgkeuzelijst. De standaardwaarde is UTF-8.
Onder Geavanceerde instellingen op het tabblad Bestemming worden de volgende eigenschappen voor de JSON-indeling weergegeven.
- Bestandspatroon: Geef het patroon op van gegevens die zijn opgeslagen in elk JSON-bestand. Toegestane waarden zijn: Set objecten (JSON-lijnen) en Matrix van objecten. De standaardwaarde is Set objecten. Zie het gedeelte JSON-bestandpatronen voor meer informatie over deze patronen.
JSON-bestandpatronen
Bij het kopiëren van gegevens uit JSON-bestanden kan de kopieeractiviteit automatisch de volgende patronen van JSON-bestanden detecteren en parseren. Wanneer u gegevens naar JSON-bestanden schrijft, kunt u het bestandspatroon configureren op de bestemming van de kopieeractiviteit.
Type I: setOfObjects
Elk bestand bevat één object, JSON-regels of samengevoegde objecten.
voorbeeld van JSON-bestand met één object
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }
JSON-regels (standaard voor doel)
{"time":"2015-04-29T07:12:20.9100000Z","callingimsi":"466920403025604","callingnum1":"678948008","callingnum2":"567834760","switch1":"China","switch2":"Germany"} {"time":"2015-04-29T07:13:21.0220000Z","callingimsi":"466922202613463","callingnum1":"123436380","callingnum2":"789037573","switch1":"US","switch2":"UK"} {"time":"2015-04-29T07:13:21.4370000Z","callingimsi":"466923101048691","callingnum1":"678901578","callingnum2":"345626404","switch1":"Germany","switch2":"UK"}
voorbeeld van JSON-bestand met samengevoegde objecten
{ "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" } { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" } { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" }
Type II: arrayOfObjects
Elk bestand bevat een matrix met objecten.
[ { "time": "2015-04-29T07:12:20.9100000Z", "callingimsi": "466920403025604", "callingnum1": "678948008", "callingnum2": "567834760", "switch1": "China", "switch2": "Germany" }, { "time": "2015-04-29T07:13:21.0220000Z", "callingimsi": "466922202613463", "callingnum1": "123436380", "callingnum2": "789037573", "switch1": "US", "switch2": "UK" }, { "time": "2015-04-29T07:13:21.4370000Z", "callingimsi": "466923101048691", "callingnum1": "678901578", "callingnum2": "345626404", "switch1": "Germany", "switch2": "UK" } ]
Tabelsamenvatting
JSON als bron
De volgende eigenschappen worden ondersteund in de sectie Bron van kopieeractiviteit wanneer u de JSON-indeling gebruikt.
Name | Beschrijving | Waarde | Vereist | JSON-scripteigenschap |
---|---|---|---|---|
Bestandsindeling | De bestandsindeling die u wilt gebruiken. | JSON | Ja | type (onder datasetSettings ):JSON |
Compressietype | De compressiecodec die wordt gebruikt om JSON-bestanden te lezen. | Kies uit de volgende mogelijkheden: Geen bzip2 gzip Deflate ZipDeflate TarGzip teer |
Nee | type (onder compression ): bzip2 gzip Deflate ZipDeflate TarGzip teer |
Compressieniveau | De compressieverhouding. | Snelst Optimaal |
Nee | niveau (onder compression ): Snelst Optimaal |
Codering | Het coderingstype dat wordt gebruikt om testbestanden te lezen. | "UTF-8" (standaard),"UTF-8 zonder BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255"2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nee | encodingName |
Zip-bestandsnaam behouden als map | Geeft aan of de naam van het zip-bronbestand moet worden bewaard als een mapstructuur tijdens het kopiëren. | Geselecteerd (standaard) of selectie opheffen | Nee | preserveZipFileNameAsFolder (onder compressionProperties ->type als ZipDeflateReadSettings ):waar (standaard) of onwaar |
Compressiebestandsnaam behouden als map | Hiermee wordt aangegeven of de gecomprimeerde bronbestandsnaam tijdens het kopiëren moet worden bewaard als een mapstructuur. | Geselecteerd (standaard) of selectie opheffen | Nee | preserveCompressionFileNameAsFolder (onder compressionProperties ->type als TarGZipReadSettings of TarReadSettings ):waar (standaard) of onwaar |
JSON als doel
De volgende eigenschappen worden ondersteund in de sectie Doel van de kopieeractiviteit wanneer u de JSON-indeling gebruikt.
Name | Beschrijving | Waarde | Vereist | JSON-scripteigenschap |
---|---|---|---|---|
Bestandsindeling | De bestandsindeling die u wilt gebruiken. | JSON | Ja | type (onder datasetSettings ):JSON |
Compressietype | De compressiecodec die wordt gebruikt voor het schrijven van JSON-bestanden. | Kies uit de volgende mogelijkheden: Geen bzip2 gzip Deflate ZipDeflate TarGzip teer |
Nee | type (onder compression ): bzip2 gzip Deflate ZipDeflate TarGzip teer |
Compressieniveau | De compressieverhouding. | Snelst Optimaal |
Nee | niveau (onder compression ): Snelst Optimaal |
Codering | Het coderingstype dat wordt gebruikt om testbestanden te schrijven. | "UTF-8" (standaard),"UTF-8 zonder BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255"2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nee | encodingName |
Bestandspatroon | Hiermee geeft u het patroon aan van gegevens die zijn opgeslagen in elk JSON-bestand. | Set objecten Matrix van objecten |
Nee | filePattern: setOfObjects arrayOfObjects |