Formato XML in Data Factory in Microsoft Fabric
Questo articolo spiega come configurare il formato XML nella pipeline di dati di Data Factory in Microsoft Fabric.
Funzionalità supportate
Il formato XML è supportato per le seguenti attività e connettori come origine.
Categoria | Connettore/attività |
---|---|
Connettori supportati | Amazon S3 |
Amazon S3 Compatibile | |
Archiviazione BLOB di Azure | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
File di Azure | |
File system | |
FTP | |
Google Cloud Storage | |
HTTP | |
File Lakehouse | |
Archiviazione in Oracle Cloud | |
SFTP | |
Attività supportata | Attività di copia (origine/-) |
Attività Lookup | |
Attività GetMetadata | |
Attività Delete |
Formato XML nell'attività Copy
Per configurare il formato XML, scegliere la connessione nell'origine dell'attività Copy della pipeline di dati e poi selezionare XML nell'elenco a discesa Formato file. Selezionare Impostazioni per configurare ulteriormente questo formato.
XML come origine
Dopo aver selezionato Impostazioni nella sezione Formato file, nella finestra di dialogo Impostazioni formato file vengono visualizzate le seguenti proprietà.
Tipo di compressione: codec di compressione usato per leggere i file XML. Nell’elenco a discesa è possibile scegliere tra i tipi None, bzip2, gzip, deflate, ZipDeflate, TarGzip oppure tar.
Se si seleziona ZipDeflate come tipo di compressione, nelle impostazioni Avanzate nella scheda Origine viene visualizzato Mantenere il nome del file ZIP come cartella.
- Mantenere il nome del file ZIP come cartella: indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia.
- Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in
<specified file path>/<folder named as source zip file>/
. - Se questa casella non è spuntata, il servizio scrive i file decompressi direttamente in
<specified file path>
. Assicurarsi di non avere nomi di file duplicati in file ZIP di origine diversi per evitare corse o comportamenti imprevisti.
- Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in
Se si seleziona TarGzip/tar come tipo di compressione, nelle impostazioni Avanzate nella scheda Origine viene visualizzato Mantenere il nome del file di compressione come cartella.
- Mantenere il nome del file di compressione come cartella: indica se mantenere il nome del file compresso di origine come struttura di una cartella durante la copia.
- Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in
<specified file path>/<folder named as source compressed file>/
. - Se questa casella non è spuntata, il servizio scrive i file decompressi direttamente in
<specified file path>
. Assicurarsi di non avere nomi di file duplicati in file di origine diversi per evitare corse o comportamenti imprevisti.
- Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in
- Mantenere il nome del file ZIP come cartella: indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia.
Livello di compressione: Specificare il rapporto di compressione quando si seleziona un tipo di compressione. È possibile scegliere tra Fastest o Ottimale.
- Fastest: l'operazione di compressione deve essere completata il più rapidamente possibile, anche se il file risultante non viene compresso in modo ottimale.
- Optimal: l'operazione di compressione deve comprimere il file in modo ottimale, anche se il completamento richiede più tempo. Per maggiori informazioni, vedere l'argomento relativo al livello di compressione .
Codifica: specificare il tipo di codifica utilizzato per scrivere i file di test. Selezionare un tipo dall’elenco a discesa. Il valore predefinito è UTF-8.
Valore Null: Specifica la rappresentazione di stringa del valore Null. Il valore predefinito è stringa vuota.
In Impostazioni avanzate nella scheda Origine vengono visualizzate le seguenti proprietà correlate al formato XML.
Modalità di convalida: Specifica se convalidare lo schema XML. Selezionare una modalità dall'elenco a discesa.
- Nessuna: selezionare questa opzione per non usare la modalità di convalida.
- xsd: selezionare questa opzione per convalidare lo schema XML tramite XSD.
- dtd: selezionare questa opzione per convalidare lo schema XML tramite DTD.
Spazi dei nomi: specificare se abilitare lo spazio dei nomi durante l'analisi dei file XML. È selezionato per impostazione predefinita.
Abbinare prefissi e spazio dei nomi: se lo spazio dei nomi è abilitato, selezionare + Nuovo e specificare l'URL e il Prefisso. È possibile aggiungere altri abbinamenti selezionando + Nuovo.
L'URI dello spazio dei nomi per il mapping dei prefissi viene usato per denominare i campi durante l'analisi del file XML. Se uno spazio dei nomi e lo spazio dei nomi di un file XML è abilitato, per impostazione predefinita, il nome del campo corrisponde a quello nel documento XML. Se nella mappa è definito un elemento per l'URI dello spazio dei nomi, il nome del campo èprefix:fieldName
.Rilevare il tipo di dati: Specificare se rilevare i tipi di dati interi, doppi e booleani. È selezionato per impostazione predefinita.
Tabella riepilogativa
XML come origine
Le seguenti proprietà sono supportate nella sezione Origine dell'attività di copia quando si utilizza il formato XML.
Nome | Descrizione | Valore | Richiesti | Proprietà script JSON |
---|---|---|---|---|
Formato di file | Formato che si desidera usare. | XML | Sì | tipo (in datasetSettings ):XML |
Tipo di compressione | Codec di compressione usato per leggere file di XML. | Nessuno bzip2 gzip deflate ZipDeflate TarGzip tar |
No | tipo (in compression ): bzip2 gzip deflate ZipDeflate TarGzip tar |
Livello di compressione | Rapporto di compressione. | Il più rapido Ottimale |
No | livello (in compression ): Il più rapido Ottimale |
Encoding | Tipo di codifica usato per leggere file di test. | "UTF-8" (predefinito),"UTF-8 senza BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | No | encodingName |
Mantenere il nome del file ZIP come cartella | Indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia. | selezionato (impostazione predefinita) o deselezionato | No | preserveZipFileNameAsFolder (in compressionProperties ->type come ZipDeflateReadSettings ):true (valore predefinito) o false |
Mantenere il nome del file di compressione come cartella | Indica se mantenere il nome del file compresso di origine come struttura di una cartella durante la copia. | selezionato (impostazione predefinita) o deselezionato | No | preserveCompressionFileNameAsFolder (in compressionProperties ->type come TarGZipReadSettings o TarReadSettings ):true (valore predefinito) o false |
valore NULL | Rappresentazione in forma di stringa del valore null. | <valore Null> stringa vuota (impostazione predefinita) |
No | nullValue |
Modalità di convalida | Indica se convalidare lo schema XML. | Nessuno xsd dtd |
No | validationMode: xsd dtd |
Namespaces (Spazi dei nomi) | Specificare se abilitare lo spazio dei nomi durante l'analisi dei file XML. | Sselezionato (impostazione predefinita) o non selezionato | No | spazi dei nomi: true (valore predefinito) o false |
Coppie prefissi spazio nomi | L'URI dello spazio dei nomi per il mapping dei prefissi, che viene usato per denominare i campi durante l'analisi del file XML. Se uno spazio dei nomi e lo spazio dei nomi di un file XML è abilitato, per impostazione predefinita, il nome del campo corrisponde a quello nel documento XML. Se nella mappa è definito un elemento per l'URI dello spazio dei nomi, il nome del campo è prefix:fieldName . |
< url >:< prefisso > | No | namespacePrefixes: < url >:< prefisso > |
Rileva tipo di dati | Specificare se rilevare i tipi di dati interi, doppi e booleani. | Sselezionato (impostazione predefinita) o non selezionato | No | detectDataType: true (valore predefinito) o false |