XML-format i Data Factory i Microsoft Fabric
I denne artikel beskrives det, hvordan du konfigurerer XML-format i datapipelinen for Data Factory i Microsoft Fabric.
Understøttede funktioner
XML-format understøttes for følgende aktiviteter og forbindelser som kilde.
Kategori | Connector/aktivitet |
---|---|
Understøttet connector | Amazon S3 |
Amazon S3-kompatibel | |
Azure Blob Storage | |
Azure Data Lake-lagring Gen1 | |
Azure Data Lake Storage Gen2 | |
Azure Files | |
Filsystem | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse-filer | |
Oracle Cloud Storage | |
SFTP | |
Understøttet aktivitet | Kopiér aktivitet (kilde/-) |
Opslagsaktivitet | |
GetMetadata-aktivitet | |
Slet aktivitet |
XML-format i kopiaktivitet
Hvis du vil konfigurere XML-format, skal du vælge din forbindelse i kilden til kopieringsaktiviteten for datapipelinen og derefter vælge XML på rullelisten i Filformat. Vælg Indstillinger for yderligere konfiguration af dette format.
XML som kilde
Når du har valgt Indstillinger i afsnittet Filformat, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.
Komprimeringstype: Den komprimeringscodec, der bruges til at læse XML-filer. Du kan vælge mellem Ingen, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tjæretype på rullelisten.
Hvis du vælger ZipDeflate som komprimeringstype, vises Bevar zip-filnavnet som mappe under Avancerede indstillinger under fanen Kilde.
- Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til
<specified file path>/<folder named as source zip file>/
. - Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten ikke-pakkede filer direkte til
<specified file path>
. Sørg for, at du ikke har duplikerede filnavne i forskellige kilde zip-filer for at undgå væddeløb eller uventet funktionsmåde.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til
Hvis du vælger TarGZip/tar som komprimeringstype, vises Bevar komprimeringsfilnavnet som mappe under avancerede indstillinger under fanen Kilde.
- Bevar komprimeringsfilnavnet som mappe: Angiver, om det komprimerede kildefilnavn skal bevares som en mappestruktur under kopiering.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til
<specified file path>/<folder named as source compressed file>/
. - Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten dekomprimerede filer direkte til
<specified file path>
. Sørg for, at du ikke har duplikerede filnavne i forskellige kildefiler for at undgå væddeløb eller uventet funktionsmåde.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til
- Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
Komprimeringsniveau: Angiv komprimeringsforholdet, når du vælger en komprimeringstype. Du kan vælge mellem Hurtigste eller Optimal.
- Hurtigst: Komprimeringshandlingen skal fuldføres så hurtigt som muligt, selvom den resulterende fil ikke komprimeres optimalt.
- Optimal: Komprimeringshandlingen skal komprimeres optimalt, selvom handlingen tager længere tid at fuldføre. Du kan få flere oplysninger under Emnet Komprimeringsniveau.
Kodning: Angiv den kodningstype, der skal bruges til at skrive testfiler. Vælg én type på rullelisten. Standardværdien er UTF-8.
Null-værdi: Angiver strengrepræsentationen af null-værdien. Standardværdien er en tom streng.
Under Avancerede indstillinger under fanen Kilde vises følgende egenskaber for XML-format.
Valideringstilstand: Angiver, om XML-skemaet skal valideres. Vælg én tilstand på rullelisten.
- Ingen: Vælg dette for ikke at bruge valideringstilstand.
- xsd: Vælg dette for at validere XML-skemaet ved hjælp af XSD.
- dtd: Vælg dette for at validere XML-skemaet ved hjælp af DTD.
Navneområder: Angiv, om navneområdet skal aktiveres, når XML-filerne fortolkes. Den er valgt som standard.
Præfikspar for navneområde: Hvis navneområder er aktiveret, skal du vælge + Ny og angive URL-adressen og præfikset. Du kan tilføje flere par ved at vælge + Ny.
URI for navneområde til præfikstilknytning bruges til at navngive felter, når XML-filen fortolkes. Hvis en XML-fil har navneområde, og navneområdet er aktiveret, er feltnavnet som standard det samme som i XML-dokumentet. Hvis der er defineret et element for navneområde-URI'en i denne tilknytning, erprefix:fieldName
feltnavnet .Registrer datatype: Angiv, om der skal registreres heltals-, dobbelt- og booleske datatyper. Den er valgt som standard.
Tabeloversigt
XML som kilde
Følgende egenskaber understøttes i afsnittet kopiaktivitetskilde, når du bruger XML-format.
Navn | Beskrivelse | Værdi | Kræves | JSON-scriptegenskab |
---|---|---|---|---|
Filformat | Det filformat, du vil bruge. | XML | Ja | type (under datasetSettings ):Xml |
Komprimeringstype | Den komprimeringscodec, der bruges til at læse XML-filer. | Ingen bzip2 gzip Deflatere ZipDeflate TarGZip tjære |
Nr. | type (under compression ): bzip2 gzip Deflatere ZipDeflate TarGZip tjære |
Komprimeringsniveau | Komprimeringsforholdet. | Hurtigste Optimal |
Nej | niveau (under compression ): Hurtigste Optimal |
Kodning | Den kodningstype, der bruges til at læse testfiler. | "UTF-8" (som standard),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM 869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nej | encodingName |
Bevar zip-filnavnet som mappe | Angiver, om zip-kildefilnavnet skal bevares som en mappestruktur under kopiering. | Markeret (standard) eller fravælg | Nr. | preserveZipFileNameAsFolder (under compressionProperties ->type som ZipDeflateReadSettings ):true (standard) eller false |
Bevar komprimering af filnavnet som mappe | Angiver, om kildens komprimerede filnavn skal bevares som en mappestruktur under kopiering. | Markeret (standard) eller fravælg | Nr. | preserveCompressionFileNameAsFolder (under compressionProperties ->type som TarGZipReadSettings eller TarReadSettings ):true (standard) eller false |
Null-værdi | Strengrepræsentationen af null-værdien. | <din null-værdi> tom streng (som standard) |
Nej | nullValue |
Valideringstilstand | Angiver, om XML-skemaet skal valideres. | Ingen xsd Dtd |
Nr. | validationMode: xsd Dtd |
Navneområder | Angiver, om navneområdet skal aktiveres, når XML-filerne fortolkes. | Markeret (standard) eller ikke markeret | Nr. | navneområder: true (standard) eller false |
Præfikspar for navneområde | URI for navneområde til præfikstilknytning, som bruges til at navngive felter, når XML-filen fortolkes. Hvis en XML-fil har navneområde, og navneområdet er aktiveret, er feltnavnet som standard det samme som i XML-dokumentet. Hvis der er defineret et element for navneområde-URI'en i denne tilknytning, er prefix:fieldName feltnavnet . |
< url >:< præfiks > | Nr. | namespacePrefixes: < url >:< præfiks > |
Registrer datatype | Angiver, om der skal registreres heltals-, dobbelt- og booleske datatyper. | Markeret (standard) eller ikke markeret | Nr. | detectDataType: true (standard) eller false |