Azure Blob Storage configureren in een kopieeractiviteit
In dit artikel wordt beschreven hoe u de kopieeractiviteit in een gegevenspijplijn gebruikt om gegevens van en naar Azure Blob Storage te kopiëren.
Ondersteunde indeling
Azure Blob Storage ondersteunt de volgende bestandsindelingen. Raadpleeg elk artikel voor op indeling gebaseerde instellingen.
- Avro-indeling
- Binaire indeling
- Tekstindeling met scheidingstekens
- Excel-indeling
- JSON-indeling
- ORC-indeling
- Parquet-indeling
- XML-indeling
Ondersteunde configuratie
Voor de configuratie van elk tabblad onder kopieeractiviteit gaat u respectievelijk naar de volgende secties.
Algemeen
Raadpleeg de richtlijnen voor algemene instellingen voor het configureren van het tabblad Algemene instellingen.
Bron
De volgende eigenschappen worden ondersteund voor Azure Blob Storage op het tabblad Bron van een kopieeractiviteit.
De volgende eigenschappen zijn vereist:
- Gegevensarchieftype: Selecteer Extern.
- Verbinding maken ion: Selecteer een Azure Blob Storage-verbinding in de lijst met verbindingen. Als er geen verbinding bestaat, maakt u een nieuwe Azure Blob Storage-verbinding door Nieuw te selecteren.
- Bestandspad: selecteer Bladeren om het bestand te kiezen dat u wilt kopiëren of vul het pad handmatig in.
- Bestandsinstellingen: Selecteer Bestandsinstellingen om de bestandsindeling te configureren. Raadpleeg voor instellingen van verschillende bestandsindelingen artikelen in ondersteunde indeling voor gedetailleerde informatie.
Onder Geavanceerd kunt u de volgende velden opgeven:
Bestandstype: U kunt het bestandspad, het voorvoegsel, het pad naar het jokerteken, de lijst met bestanden als bestandspadtype kiezen. De configuratie van elke instelling is:
Bestandspad: Als u dit type kiest, kunnen de gegevens worden gekopieerd uit de opgegeven container of map/bestandspad dat u eerder hebt opgegeven.
Voorvoegsel: voorvoegsel voor de blobnaam onder de opgegeven container die is geconfigureerd om bron-blobs te filteren. Blobs waarvan de namen beginnen met
container/this_prefix
zijn geselecteerd. Het maakt gebruik van het filter aan de servicezijde voor blobopslag.Wanneer u voorvoegsel gebruikt en ervoor kiest om te kopiëren naar een op bestanden gebaseerde bestemming met behoud van de hiërarchie, blijft het subpad na het laatste '/' in het voorvoegsel behouden. U hebt bijvoorbeeld een bron
container/folder/subfolder/file.txt
en configureert het voorvoegsel alsfolder/sub
, dan issubfolder/file.txt
het behouden bestandspad .Pad naar jokertekens: geef de map of het bestandspad op met jokertekens onder de opgegeven blobcontainer om uw bronmappen of bestanden te filteren.
Toegestane jokertekens zijn
*
(komt overeen met nul of meer tekens) en?
(komt overeen met nul of één teken). Gebruik^
deze optie om te escapen als uw mapnaam een jokerteken of dit escape-teken bevat. Ga voor meer voorbeelden naar voorbeelden van mappen en bestandsfilters.Pad naar map met jokertekens: geef het mappad op met jokertekens onder de opgegeven container om bronmappen te filteren.
Bestandsnaam met jokertekens: geef de bestandsnaam op met jokertekens onder het opgegeven container- en mappad (of pad naar een jokerteken) om bronbestanden te filteren.
Lijst met bestanden: Geeft een opgegeven bestand aan naar kopiëren. Voer in het pad naar de bestandslijst een tekstbestand in of blader naar een tekstbestand met een lijst met bestanden die u wilt kopiëren, één bestand per regel. Dit is het relatieve pad naar elk bestand.
Wanneer u deze optie gebruikt, geeft u geen bestandsnaam op. Ga naar Voorbeelden van bestandslijsten voor meer voorbeelden.
Recursief: Als dit selectievakje is ingeschakeld, worden alle bestanden in de invoermap en de bijbehorende submappen recursief verwerkt. Als u het selectievakje uitschakelt, worden alleen de selectievakjes in de geselecteerde map verwerkt. Deze instelling is uitgeschakeld wanneer één bestand is geselecteerd.
Bestanden verwijderen na voltooiing: als dit selectievakje is ingeschakeld, worden de binaire bestanden verwijderd uit het bronarchief nadat ze naar het doelarchief zijn verplaatst. Het verwijderen van bestanden is per bestand, dus wanneer de kopieeractiviteit mislukt, ziet u dat sommige bestanden al naar het doel zijn gekopieerd en uit de bron zijn verwijderd, terwijl andere nog steeds in het bronarchief aanwezig zijn.
Notitie
Deze eigenschap is alleen geldig in een scenario voor het kopiëren van binaire bestanden.
Maximum aantal gelijktijdige verbindingen: deze eigenschap geeft de bovengrens aan van gelijktijdige verbindingen die tijdens de uitvoering van de activiteit tot stand zijn gebracht met het gegevensarchief. Geef alleen een waarde op wanneer u gelijktijdige verbindingen wilt beperken.
Doel
De volgende eigenschappen worden ondersteund voor Azure Blob Storage op het tabblad Doel van een kopieeractiviteit.
De volgende eigenschappen zijn vereist:
- Gegevensarchieftype: Selecteer Extern.
- Verbinding maken ion: Selecteer een Azure Blob Storage-verbinding in de lijst met verbindingen. Als de verbinding niet bestaat, maakt u een nieuwe Azure Blob Storage-verbinding door Nieuw te selecteren.
- Bestandspad: Selecteer Bladeren om het bestand te kiezen dat u handmatig wilt kopiëren of invullen.
- Bestandsinstellingen: Selecteer Bestandsinstellingen om de bestandsindeling te configureren. Raadpleeg voor instellingen van verschillende bestandsindelingen artikelen in ondersteunde indeling voor gedetailleerde informatie.
Onder Geavanceerd kunt u de volgende velden opgeven:
Kopieergedrag: Definieert het kopieergedrag wanneer de bron bestanden uit een bestandsgegevensarchief is. U kunt dynamische inhoud toevoegen, Geen, FlattenHierarchy of Hiërarchie behouden in de vervolgkeuzelijst kiezen.
Dynamische inhoud toevoegen: Als u een expressie voor een eigenschapswaarde wilt opgeven, selecteert u Dynamische inhoud toevoegen. Met deze selectie wordt de opbouwfunctie voor expressies geopend, waarin u expressies kunt bouwen op basis van ondersteunde systeemvariabelen, activiteitsuitvoer, functies en door de gebruiker opgegeven variabelen of parameters. Ga naar Expressies en functies voor informatie over de expressietaal.
Geen: kies deze selectie om geen kopieergedrag te gebruiken.
Platgemaakte hiërarchie: alle bestanden uit de bronmap bevinden zich op het eerste niveau van de doelmap. De doelbestanden hebben automatisch gegenereerde namen.
Hiërarchie behouden: behoudt de bestandshiërarchie in de doelmap. Het relatieve pad van het bronbestand naar de bronmap is identiek aan het relatieve pad van het doelbestand naar de doelmap.
Maximum aantal gelijktijdige verbindingen: de bovengrens van gelijktijdige verbindingen die tijdens de uitvoering van de activiteit tot stand zijn gebracht met het gegevensarchief. Geef alleen een waarde op wanneer u gelijktijdige verbindingen wilt beperken.
Blokgrootte (MB): geef de blokgrootte op, in megabytes, die wordt gebruikt voor het schrijven van gegevens naar blok-blobs. Ga naar Over blok-blobs voor meer informatie.
Metagegevens: aangepaste metagegevens instellen bij het kopiëren naar een bestemming. Elk object onder de
metadata
matrix vertegenwoordigt een extra kolom. Dename
naam van de metagegevenssleutel wordt gedefinieerd en devalue
gegevenswaarde van die sleutel wordt aangegeven. Als defunctie kenmerken behouden wordt gebruikt, worden de opgegeven metagegevens samengevoegd/overschreven met de metagegevens van het bronbestand.Toegestane gegevenswaarden zijn:
$$LASTMODIFIED
: een gereserveerde variabele geeft aan dat de laatste wijzigingstijd van de bronbestanden moet worden opgeslagen. Alleen van toepassing op een bron op basis van bestanden met binaire indeling.Expression
Statische waarde
Toewijzing
Voor de configuratie van het tabblad Toewijzing gaat u naar De toewijzingen configureren onder het tabblad Toewijzing. Als u Binair als bestandsindeling kiest, wordt toewijzing niet ondersteund.
Instellingen
Zie Uw andere instellingen configureren op het tabblad Instellingen voor Instellingen.
Tabelsamenvatting
De volgende tabellen bevatten meer informatie over de kopieeractiviteit in Azure Blob Storage.
Brongegevens
Name | Beschrijving | Waarde | Vereist | JSON-scripteigenschap |
---|---|---|---|---|
Gegevensarchieftype | Het gegevensarchieftype. | Extern | Ja | / |
Verbinding | Uw verbinding met het brongegevensarchief. | <uw verbinding> | Ja | verbinding |
Bestandspad | Het bestandspad van uw brongegevens. | <bestandspad van uw bron> | Ja | Container fileName |
Bestandstype | Het bestandstype dat u wilt gebruiken. | • Bestandspad •Voorvoegsel • Pad naar jokerteken, bestandsnaam van jokerteken • Lijst met bestanden |
Nee | •Voorvoegsel • wildcardFolderPath, wildcardFileName • fileListPath |
Recursief | Alle bestanden in de invoermap en de bijbehorende submappen recursief verwerken of alleen de bestanden in de geselecteerde map. Deze instelling is uitgeschakeld wanneer één bestand is geselecteerd. | Geselecteerd of selectie opheffen | Nee | Recursieve |
Bestanden verwijderen na voltooiing | De bestanden in het brongegevensarchief worden direct verwijderd nadat ze naar het doelarchief zijn verplaatst. Het verwijderen van bestanden is per bestand, dus wanneer een kopieeractiviteit mislukt, kunt u zien dat sommige bestanden al naar het doel zijn gekopieerd en uit de bron zijn verwijderd, terwijl anderen zich nog in het bronarchief bevinden. | Geselecteerd of selectie opheffen | Nee | deleteFilesAfterCompletion |
Maximum aantal gelijktijdige verbindingen | De bovengrens van gelijktijdige verbindingen die tijdens de uitvoering van de activiteit tot stand zijn gebracht met het gegevensarchief. Geef alleen een waarde op wanneer u gelijktijdige verbindingen wilt beperken. | <maximum aantal gelijktijdige verbindingen> | Nee | maxConcurrent Verbinding maken ions |
Doelgegevens
Name | Beschrijving | Waarde | Vereist | JSON-scripteigenschap |
---|---|---|---|---|
Gegevensarchieftype | Het gegevensarchieftype. | Extern | Ja | / |
Verbinding | Uw verbinding met het doelgegevensarchief. | <uw verbinding> | Ja | verbinding |
Bestandspad | Het bestandspad van uw doelgegevens. | Bestandspad van de bron | Ja | Container fileName |
Gedrag van kopiëren | Definieert het gedrag bij het kopiëren van bestanden van het ene bestandssysteem, zoals opslag, naar het andere (bijvoorbeeld van de ene blobopslag naar een andere). | •Geen • Dynamische inhoud toevoegen • Platgemaakte hiërarchie • Hiërarchie behouden |
Nee | copyBehavior |
Maximum aantal gelijktijdige verbindingen | De bovengrens van gelijktijdige verbindingen die tijdens de uitvoering van de activiteit tot stand zijn gebracht met het gegevensarchief. Geef alleen een waarde op wanneer u gelijktijdige verbindingen wilt beperken. | <maximum aantal gelijktijdige verbindingen> | Nee | maxConcurrent Verbinding maken ions |
Blokgrootte (MB) | Geef de blokgrootte in MB op bij het schrijven van gegevens naar Azure Blob Storage. De toegestane waarde ligt tussen 4 MB en 100 MB. | <blokgrootte> | Nee | blockSizeInMB |
Metagegevens | Stel de aangepaste metagegevens in wanneer deze naar de bestemming worden gekopieerd. | • $$LASTMODIFIED •Expressie • Statische waarde |
Nee | metagegevens |