Configurare Archiviazione BLOB di Azure in un'attività di copia
Questo articolo descrive come utilizzare l'attività di copia in una pipeline di dati per copiare dati da e verso Archiviazione BLOB di Azure.
Formato supportato
Archiviazione BLOB di Azure supporta i formati di file seguenti. Per impostazioni basate sui formati, fare riferimento ai singoli articoli.
- Formato Avro
- Formato binario
- Formato di testo delimitato
- Formato Excel
- Formato JSON
- Formato ORC
- Formato Parquet
- Formato XML
Configurazione supportata
Per la configurazione di ogni scheda nell'attività di copia, consultare rispettivamente le sezioni seguenti.
Generali
Consultare la guida sulle Impostazioni generali per configurare la scheda Impostazioni generali.
Origine
Le proprietà seguenti sono supportate per Archiviazione BLOB di Azure nella scheda Origine di un'attività di copia.
Sono richieste le seguenti proprietà:
- Tipo di archivio dati: selezionare Esterno.
- Connessione: selezionare una connessione Archiviazione BLOB di Azure dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione Archiviazione BLOB di Azure selezionando Nuovo.
- Percorso file: selezionare Sfoglia per scegliere il file che si vuole copiare o compilare manualmente il percorso.
- Impostazioni file: selezionare Impostazioni file per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere gli articoli in Formato supportato per informazioni dettagliate.
In Avanzato è possibile specificare i seguenti campi:
Tipo di percorso file: è possibile scegliere come tipo di percorso file Percorso file, Prefisso, Percorso file con caratteri jolly o Elenco di file. La configurazione di ogni impostazione è:
Percorso file: se si sceglie questo tipo, i dati possono essere copiati dal contenitore o dal percorso di cartella/file specificato in precedenza.
Prefisso: prefisso per il nome del blob nel contenitore specificato, configurato per filtrare i blob di origine. Vengono selezionati i BLOB i cui nomi iniziano con
container/this_prefix
. Usa il filtro lato servizio per l'archiviazione BLOB.Quando si usa il Prefisso e si sceglie di copiare in una destinazione basata su file mantenendo la gerarchia, il percorso secondario dopo l'ultimo "/" del prefisso viene mantenuto. Ad esempio, per l'origine
container/folder/subfolder/file.txt
si configura il prefissofolder/sub
e quindi il percorso del file conservato èsubfolder/file.txt
.Percorso file con caratteri jolly: specifica il percorso della cartella o del file con caratteri jolly nel contenitore BLOB specificato per filtrare le cartelle o i file di origine.
I caratteri jolly consentiti sono
*
(corrispondenza di zero o più caratteri) e?
(corrispondenza di zero caratteri o di un carattere singolo). Usare^
per evitare che il nome della cartella contenga un carattere jolly o tale carattere di escape. Per altri esempi, vedere Esempi di filtri per cartelle e file.Percorso cartella con caratteri jolly: specificare il percorso della cartella con caratteri jolly nel contenitore specificato per filtrare le cartelle di origine.
Nome file con caratteri jolly: specificare il nome file con caratteri jolly nel contenitore e nel percorso della cartella specificati (o nel percorso della cartella con caratteri jolly) per filtrare i file di origine.
Elenco di file: indica un determinato set di file in cui eseguire la copia. In Percorso dell'elenco file immettere o sfogliare un file di testo che includa un elenco di file da copiare, un file per riga, con il percorso relativo a ciascun file.
Quando si usa questa opzione, non specificare un nome del file. Per altri esempi, vedere Esempi di elenco di file.
In modo ricorsivo: se questa casella di controllo è selezionata, tutti i file nella cartella di input e le relative sottocartelle vengono elaborati in modo ricorsivo. Se si deseleziona la casella di controllo, vengono elaborate solo quelle nella cartella selezionata. Questa impostazione è disabilitata quando viene selezionato un singolo file.
Elimina file dopo il completamento: se questa casella di controllo è selezionata, i file binari vengono eliminati dall'archivio di origine dopo il corretto spostamento nell'archivio di destinazione. L'eliminazione dei file avviene per file, quindi quando l'attività di copia fallisce, si vedranno alcuni file già copiati nella destinazione ed eliminati dall'origine, mentre altri rimangono ancora nell'archivio di origine.
Nota
Questa proprietà è valida solo nello scenario di copia dei file binari.
Numero massimo di connessioni simultanee: questa proprietà indica il limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Destinazione
Le proprietà seguenti sono supportate per Archiviazione BLOB di Azure nella scheda Destinazione di un'attività di copia.
Sono richieste le seguenti proprietà:
- Tipo di archivio dati: selezionare Esterno.
- Connessione: selezionare una connessione Archiviazione BLOB di Azure dall'elenco delle connessioni. Se la connessione non esiste, creare una nuova connessione Archiviazione BLOB di Azure selezionando Nuovo.
- Percorso file: selezionare Sfoglia per scegliere il file che si vuole copiare o compilare manualmente il percorso.
- Impostazioni file: selezionare Impostazioni file per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere gli articoli in Formato supportato per informazioni dettagliate.
In Avanzato è possibile specificare i seguenti campi:
Comportamento di copia: definisce il comportamento di copia quando l'origine è costituita da file provenienti da un archivio dati basato su file. È possibile scegliere Aggiungi contenuto dinamico, Nessuno, FlattenHierarchy o Mantieni gerarchia dall'elenco a discesa.
Aggiungi contenuto dinamico: per specificare un'espressione per un valore della proprietà, selezionare Aggiungi contenuto dinamico. Questa selezione apre il Generatore di espressioni in cui è possibile generare espressioni dalle variabili di sistema supportate, dall'output delle attività, dalle funzioni e da variabili o parametri specificati dall'utente. Per informazioni sul linguaggio delle espressioni, vedere Espressioni e funzioni.
Nessuno: scegliere questa selezione per non usare alcun comportamento di copia.
Gerarchia piatta: tutti i file della cartella di origine si trovano nel primo livello della cartella di destinazione. I file di destinazione hanno nomi generati automaticamente.
Mantieni gerarchia: conserva la gerarchia dei file nella cartella di destinazione. Il percorso relativo del file di origine nella cartella di origine è identico al percorso relativo del file di destinazione nella cartella di destinazione.
Numero massimo di connessioni simultanee: limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Dimensioni blocco (MB): specificare le dimensioni del blocco in megabyte usate per scrivere i dati nei BLOB in blocchi. Per altre informazioni, vedere Informazioni sui BLOB in blocchi.
Metadati: impostare metadati personalizzati durante la copia in una destinazione. Ogni oggetto nella matrice
metadata
rappresenta una colonna aggiuntiva.name
definisce il nome della chiave di metadati mentrevalue
indica il valore dei dati di tale chiave. Se si utilizza la funzionalità di conservazione degli attributi, i metadati specificati verranno uniti/sovrascritti con i metadati del file di origine.I valori dei dati consentiti sono:
$$LASTMODIFIED
: una variabile riservata indica di archiviare data/ora dell'ultima modifica dei file di origine. Si applica all'origine basata su file solo con formato binario.Expression
Valore statico
Mapping
Per la configurazione della scheda Mapping, vedere Configurare i mapping nella scheda Mapping. Se si sceglie Binario come formato di file, il mapping non sarà supportato.
Impostazione
Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.
Riepilogo della tabella
Le tabelle seguenti contengono altre informazioni sull'attività di copia in Archiviazione BLOB di Azure.
Informazioni sull'origine
Nome | Descrizione | valore | Richiesto | Proprietà dello script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di origine. | <connessione personale> | Sì | connection |
Percorso file | Percorso del file dei dati di origine. | <percorso del file dell'origine> | Sì | contenitore fileName |
Tipo percorso file | Il tipo di percorso file da usare. | • Percorso file • Prefisso • Percorso cartella con caratteri jolly, nome file con caratteri jolly • Elenco di file |
No | • prefisso • wildcardFolderPath, wildcardFileName • fileListPath |
In modo ricorsivo | Elaborare tutti i file nella cartella di input e nelle relative sottocartelle in modo ricorsivo o solo quelli nella cartella selezionata. Questa impostazione è disabilitata quando viene selezionato un singolo file. | Selezionare o deselezionare | No | recursive |
Eliminare i file dopo il completamento | I file nell'archivio dati di origine verranno eliminati subito dopo essere stati spostati nell'archivio di destinazione. L'eliminazione dei file avviene per singolo file, quindi quando un'attività di copia fallisce, è possibile che alcuni file siano già stati copiati nella destinazione ed eliminati dall'origine, mentre altri si trovano ancora nell'archivio di origine. | Selezionare o deselezionare | No | deleteFilesAfterCompletion |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Informazioni sulla destinazione
Nome | Descrizione | valore | Richiesto | Proprietà dello script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di destinazione. | <connessione personale> | Sì | connection |
Percorso file | Percorso del file dei dati di destinazione. | Percorso del file dell'origine | Sì | contenitore fileName |
Comportamento di copia | Definisce il comportamento durante la copia di file da un file system, come Archiviazione, a un altro (ad esempio, da un archivio BLOB a un altro). | • Nessuno • Aggiungi contenuto dinamico • Gerarchia piatta • Mantieni gerarchia |
No | copyBehavior |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Dimensione blocco (in MB) | Specificare le dimensioni del blocco in MB durante la scrittura di dati in Archiviazione BLOB di Azure. Il valore consentito è compreso tra 4 e 100 MB. | <dimensione blocco> | No | blockSizeInMB |
Metadati UFX | Impostare i metadati personalizzati quando si esegue la copia nella destinazione. | • $$LASTMODIFIED • Espressione • Valore statico |
No | metadata |