Konfigurer Azure Files i en kopiaktivitet
I denne artikel beskrives det, hvordan du bruger kopiaktiviteten i Datapipeline til at kopiere data fra og til Azure Files.
Understøttet format
Azure Files understøtter følgende filformater. Se hver artikel for at få formatbaserede indstillinger.
- Avro-format
- Binært format
- Afgrænset tekstformat
- Excel-format
- JSON-format
- ORC-format
- Parquetformat
- XML-format
Understøttet konfiguration
Hvis du vil konfigurere hver fane under kopiaktivitet, skal du gå til henholdsvis følgende afsnit.
Generelt
Se vejledningen til generelle indstillinger for at konfigurere fanen Generelle indstillinger.
Kilde
Følgende egenskaber understøttes for Azure Files under fanen Source for en kopiaktivitet.
Følgende egenskaber er påkrævet:
Datalagertype: Vælg ekstern.
Forbind ion: Vælg en Azure Files-forbindelse på forbindelseslisten. Hvis der ikke findes nogen forbindelse, skal du oprette en ny Azure Files-forbindelse ved at vælge Ny.
Filtype: Du kan vælge Filsti, Præfiks, Sti til jokertegnfil, Liste over filer som filtype. Konfigurationen af hver indstilling er:
Filsti: Hvis du vælger denne type, kan dataene kopieres fra den angivne mappe-/filsti.
Præfiks: Præfiks for filnavnet under det angivne filshare til filtrering af kildefiler. Filer med et navn, der starter med
fileshare_in_connection/this_prefix
, er markeret. Den bruger filteret på tjenestesiden til Azure Files, hvilket giver en bedre ydeevne end et jokertegnfilter.Sti til jokertegnfil: Angiv mappen eller filstien med jokertegn for at filtrere kildemapper eller -filer.
Tilladte jokertegn er
*
(svarer til nul eller flere tegn) og?
(svarer til nul eller enkelttegn). Bruges^
til at escape, hvis mappenavnet har et jokertegn eller dette escape-tegn. Du kan få flere eksempler ved at gå til Eksempler på mappe- og filfilter.Sti til jokertegnmappe: Angiv mappestien med jokertegn for at filtrere kildemapper.
Filnavn med jokertegn: Angiv filnavnet med jokertegn under stien til den konfigurerede mappe/jokertegnmappe for at filtrere kildefiler.
Liste over filer: Angiver en given fil, der skal kopieres til. På listen Sti til fil skal du angive eller gå til en tekstfil, der indeholder en liste over filer, du vil kopiere, én fil pr. linje, som er den relative sti til hver fil.
Når du bruger denne indstilling, skal du ikke angive et filnavn. Du kan få flere eksempler ved at gå til Eksempler på fillister.
Mappesti: Angiv stien til en mappe. Det er påkrævet.
Sti til filliste: Angiv stien til den tekstfil, der indeholder en liste over filer, du vil kopiere.
Rekursivt: Angiv, om dataene skal læses rekursivt fra undermapperne eller kun fra den angivne mappe. Bemærk, at når Rekursivt vælges, og destinationen er et filbaseret lager, kopieres eller oprettes der ikke en tom mappe eller undermappe på destinationen. Denne egenskab er valgt som standard og gælder ikke, når du konfigurerer sti til filliste.
Filformat: Vælg det filformat, der anvendes på rullelisten. Vælg Indstillinger for at konfigurere filformatet. Du kan finde detaljerede oplysninger i artikler i Understøttet format for at få flere oplysninger om indstillinger for forskellige filformater.
Under Avanceret kan du angive følgende felter:
Filtrer efter senest ændret: Filer filtreres på baggrund af de senest ændrede datoer. Denne egenskab gælder ikke, når du konfigurerer filtypen som Liste over filer.
Starttidspunkt (UTC):Filerne vælges, hvis deres seneste ændringstid er større end eller lig med det konfigurerede tidspunkt.
Sluttidspunkt (UTC):Filerne vælges, hvis deres seneste ændringstidspunkt er mindre end det konfigurerede tidspunkt.
Når Starttidspunkt (UTC) har datetime-værdi, men Sluttidspunkt (UTC) er NULL, betyder det, at de filer, hvis senest ændrede attribut er større end eller lig med datetime-værdien, vælges. Når Sluttidspunkt (UTC) har datetime-værdi, men Starttidspunkt (UTC) er NULL, betyder det, at de filer, hvis senest ændrede attribut er mindre end datetime-værdien, vælges. Egenskaberne kan være NULL, hvilket betyder, at der ikke anvendes et filattributfilter på dataene.
Aktivér registrering af partition: Angiv, om partitionerne skal fortolkes fra filstien, og tilføj dem som yderligere kildekolonner. Den er som standard ikke markeret og understøttes ikke, når du bruger binært filformat.
Partitionsrodsti: Når registrering af partition er aktiveret, skal du angive den absolutte rodsti for at læse partitionerede mapper som datakolonner.
Hvis den ikke er angivet som standard,
- Når du bruger filstien eller listen over filer på kilden, er partitionsrodstien den sti, du har konfigureret.
- Når du bruger jokertegnmappefilteret, er partitionsrodstien understien før det første jokertegn.
Hvis du f.eks. konfigurerer stien som
root/folder/year=2020/month=08/day=27
:- Hvis du angiver rodstien for partitionen som
root/folder/year=2020
, genererer kopiaktivitet to kolonner mere måned og dag med værdien "08" og "27" ud over kolonnerne i filerne. - Hvis der ikke er angivet en partitionsrodsti, oprettes der ingen ekstra kolonne.
Maks. antal samtidige forbindelser: Denne egenskab angiver den øvre grænse for samtidige forbindelser, der er oprettet til datalageret under aktivitetskørslen. Angiv kun en værdi, når du vil begrænse samtidige forbindelser.
Flere kolonner: Tilføj flere datakolonner for at gemme kildefilernes relative sti eller statiske værdi. Udtrykket understøttes for sidstnævnte.
Destination
Følgende egenskaber understøttes for Azure Files under fanen Destination for en kopiaktivitet.
Følgende egenskaber er påkrævet:
- Datalagertype: Vælg ekstern.
- Forbind ion: Vælg en Azure Files-forbindelse på forbindelseslisten. Hvis forbindelsen ikke findes, skal du oprette en ny Azure Files-forbindelse ved at vælge Ny.
- Filsti: Vælg Gennemse for at vælge den fil, du vil kopiere eller udfylde stien manuelt.
- Filformat: Vælg det filformat, der anvendes på rullelisten. Vælg Indstillinger for at konfigurere filformatet. Du kan finde detaljerede oplysninger i artikler i Understøttet format for at få flere oplysninger om indstillinger for forskellige filformater.
Under Avanceret kan du angive følgende felter:
Funktionsmåde for kopiering: Definerer kopifunktionsmåden, når kilden er filer fra et filbaseret datalager. Du kan vælge en funktionsmåde på rullelisten.
- Fladgør hierarki: Alle filer fra kildemappen er på det første niveau i destinationsmappen. Destinationsfilerne har automatisk genererede navne.
- Flet filer: Fletter alle filer fra kildemappen til én fil. Hvis filnavnet er angivet, er det flettede filnavn det angivne navn. Ellers er det et automatisk genereret filnavn.
- Bevar hierarki: Bevarer filhierarkiet i destinationsmappen. Den relative sti for kildefilen til kildemappen er identisk med den relative sti for destinationsfilen til destinationsmappen.
Maksimalt antal samtidige forbindelser: Den øvre grænse for samtidige forbindelser, der er oprettet til datalageret under aktivitetskørslen. Angiv kun en værdi, når du vil begrænse samtidige forbindelser.
Maksimalt antal rækker pr. fil: Når du skriver data til en mappe, kan du vælge at skrive til flere filer og angive det maksimale antal rækker pr. fil. Angiv det maksimale antal rækker, du vil skrive pr. fil.
Tilknytning
For Konfiguration af fanen Tilknytning skal du gå til Konfigurer dine tilknytninger under fanen Tilknytning. Hvis du vælger Binær som filformat, understøttes tilknytning ikke.
Indstillinger
Hvis du vil have Indstillinger fanekonfiguration, skal du se Konfigurer dine andre indstillinger under fanen Indstillinger.
Tabeloversigt
Følgende tabeller indeholder flere oplysninger om kopiaktiviteten i Azure Files.
Kildeoplysninger
Navn | Beskrivelse | Værdi | Obligatorisk | JSON-scriptegenskab |
---|---|---|---|---|
Datalagertype | Datalagertypen. | Eksternt | Ja | / |
Forbind ion | Din forbindelse til kildedatalageret. | <din Azure Files-forbindelse> | Ja | Forbindelse |
Filtype | Den filtype, der bruges til at hente kildedata. | • Filsti •Præfiks • Sti til jokertegnfil • Liste over filer |
Ja | / |
For filsti | ||||
Register | Stien til mappen. | <dit mappenavn> | Nr. | folderPath |
Filnavn | Filnavnet under den angivne mappesti. | <dit filnavn> | Nr. | Filnavn |
For præfiks | ||||
Præfiks | Præfikset for filnavnet under det angivne filshare til filtrering af kildefiler. | <dit præfiks> | Nr. | Præfiks |
For sti til jokertegnfil | ||||
Sti til jokertegnmappe | Mappestien med jokertegn til filtrering af kildemapper. | <mappestien med jokertegn> | Nr. | jokertegnFolderPath |
Filnavn med jokertegn | Filnavnet med jokertegn under den angivne mappe-/jokertegnmappesti til filtrering af kildefiler. | <filnavnet med jokertegn> | Ja | jokertegnFileName |
For Liste over filer | ||||
Mappesti | Stien til mappen. | <dit mappenavn> | Nr. | folderpath |
Sti til filliste | Angiver, at et givent filsæt skal kopieres. Peg på en tekstfil, der indeholder en liste over filer, du vil kopiere, én fil pr. linje. | < sti til filliste > | Nr. | fileListPath |
Rekursivt | Behandl alle filer i inputmappen og dens undermapper rekursivt eller kun dem i den valgte mappe. Denne indstilling er deaktiveret, når der vælges en enkelt fil. | Markeret eller fravælg | Nr. | Rekursive |
Filformat | Filformatet for kildedataene. Du kan finde flere oplysninger om forskellige filformater i artikler i Understøttet format for at få detaljerede oplysninger. | / | Ja | / |
Filtrer efter senest ændret | Filerne med tidspunkt for seneste ændring i intervallet [Starttidspunkt, Sluttidspunkt) filtreres til yderligere behandling. Klokkeslættet anvendes på UTC-tidszonen i formatet yyyy-mm-ddThh:mm:ss.fffZ . Disse egenskaber kan springes over, hvilket betyder, at der ikke anvendes et filattributfilter. Denne egenskab gælder ikke, når du konfigurerer filtypen som Liste over filer. |
dato/klokkeslæt | Nr. | modifiedDatetimeStart modifiedDatetimeEnd |
Aktivér registrering af partition | Angiver, om partitionerne fra filstien skal fortolkes og tilføjes som yderligere kildekolonner. | markeret eller ikke markeret (standard) | Nr. | enablePartitionDiscovery: true eller false (standard) |
Maks. antal samtidige forbindelser | Den øvre grænse for samtidige forbindelser, der er oprettet til datalageret under aktivitetskørslen. Angiv kun en værdi, når du vil begrænse samtidige forbindelser. | <maks. antal samtidige forbindelser> | Nr. | maxConcurrent Forbind ions |
Flere kolonner | Tilføj yderligere datakolonner for at gemme kildefilernes relative sti eller statiske værdi. Udtrykket understøttes for sidstnævnte. | • Navn •Værdi |
Nr. | additionalColumns: •Navn •Værdi |
Destinationsoplysninger
Navn | Beskrivelse | Værdi | Obligatorisk | JSON-scriptegenskab |
---|---|---|---|---|
Datalagertype | Datalagertypen. | Eksternt | Ja | / |
Forbind ion | Din forbindelse til destinationsdatalageret. | <din forbindelse> | Ja | Forbindelse |
Filsti | Mappe-/filstien til destinationsfilen. | < mappe-/filsti > | Ja | / |
Register | Stien til mappen under den angivne bucket. | <dit mappenavn> | Nr. | folderpath |
Filnavn | Filnavnet under den angivne bucket og mappesti. | <dit filnavn> | Nr. | Filnavn |
Funktionsmåde for kopiering | Definerer funktionsmåden for kopiering, når kilden er filer fra et filbaseret datalager. | • Fladgør hierarki • Flet filer • Bevar hierarki |
Nr. | copyBehavior: • Fladt hierarki • Fletfiler • PreserveHierarchy |
Maks. antal samtidige forbindelser | Den øvre grænse for samtidige forbindelser, der er oprettet til datalageret under aktivitetskørslen. Angiv kun en værdi, når du vil begrænse samtidige forbindelser. | <maks. antal samtidige forbindelser> | Nr. | maxConcurrent Forbind ions |
Maks. antal rækker pr. fil | Når du skriver data til en mappe, kan du vælge at skrive til flere filer og angive det maksimale antal rækker pr. fil. Angiv det maksimale antal rækker, du vil skrive pr. fil. | < dine maksimale rækker pr. fil > | Nr. | maxRowsPerFile |