Konfigurer MongoDB Atlas i en kopiaktivitet
I denne artikel beskrives det, hvordan du bruger kopiaktiviteten i datapipeline til at kopiere data fra og til MongoDB Atlas.
Understøttet konfiguration
Hvis du vil konfigurere hver fane under kopiaktivitet, skal du gå til henholdsvis følgende afsnit.
Generelt
Se vejledningen til generelle indstillinger for at konfigurere fanen Generelle indstillinger.
Kilde
Gå til fanen Kilde for at konfigurere din kopiaktivitetskilde. Se følgende indhold for at få den detaljerede konfiguration.
Følgende egenskaber er påkrævet:
- Datalagertype: Vælg ekstern.
- Forbind ion: Vælg en MongoDB Atlas-forbindelse på forbindelseslisten. Hvis der ikke findes nogen forbindelse, skal du oprette en ny MongoDB Atlas-forbindelse ved at vælge Ny.
- Database: Vælg databasen på rullelisten.
- Samlingsnavn: Angiv navnet på samlingen i MongoDB Atlas-databasen. Du kan vælge samlingen på rullelisten eller vælge Rediger for at angive den manuelt.
Under Avanceret kan du angive følgende felter:
Filter: Angiver markeringsfilteret ved hjælp af forespørgselsoperatorer. Hvis du vil returnere alle dokumenter i en samling, skal du udelade denne parameter eller overføre et tomt dokument ({}).
Markørmetoder: Vælg + Ny for at angive den måde, den underliggende forespørgsel udføres på. Måderne at udføre forespørgslen på er:
- project: Angiver de felter, der skal returneres i dokumenterne til projektion. Hvis du vil returnere alle felter i de tilsvarende dokumenter, skal du udelade denne parameter.
- sort: Angiver den rækkefølge, som forespørgslen returnerer matchende dokumenter i. Se cursor.sort().
- limit: Angiver det maksimale antal dokumenter, som serveren returnerer. Se cursor.limit().
- skip: Angiver antallet af dokumenter, der skal springes over, og hvorFra MongoDB Atlas begynder at returnere resultater. Se cursor.skip().
Batchstørrelse: Angiver antallet af dokumenter, der skal returneres i hvert batch af svaret fra MongoDB Atlas-forekomsten. I de fleste tilfælde påvirker ændring af batchstørrelsen ikke brugeren eller programmet.
Flere kolonner: Tilføj flere datakolonner for at gemme kildefilernes relative sti eller statiske værdi. Udtrykket understøttes for sidstnævnte.
Destination
Gå til fanen Destination for at konfigurere destinationen for kopiaktiviteten. Se følgende indhold for at få den detaljerede konfiguration.
Følgende egenskaber er påkrævet:
- Datalagertype: Vælg ekstern.
- Forbind ion: Vælg en MongoDB Atlas-forbindelse på forbindelseslisten. Hvis der ikke findes nogen forbindelse, skal du oprette en ny MongoDB Atlas-forbindelse ved at vælge Ny.
- Database: Vælg databasen på rullelisten.
- Samlingsnavn: Angiv navnet på samlingen i MongoDB Atlas-databasen. Du kan vælge samlingen på rullelisten eller vælge Rediger for at angive den manuelt.
Under Avanceret kan du angive følgende felter:
Skrivefunktion: Beskriver, hvordan du skriver data til MongoDB Atlas. Tilladte værdier: Indsæt og Upsert.
Upserts funktionsmåde er at erstatte dokumentet, hvis der allerede findes et dokument med det samme
_id
. Ellers skal du indsætte dokumentet.Bemærk
Tjenesten genererer automatisk et
_id
for et dokument, hvis_id
en ikke er angivet enten i det oprindelige dokument eller ved kolonnetilknytning. Det betyder, at du skal sikre, at dokumentet har et id, før Upsert fungerer som forventet.Timeout for skrivning af batch: Angiv ventetiden for batchindsætningshandlingen, før der opstår timeout. Den tilladte værdi er et tidsrum.
Skriv batchstørrelse: Denne egenskab styrer størrelsen af dokumenter, der skal skrives i hvert batch. Du kan prøve at øge værdien for at forbedre ydeevnen og reducere værdien, hvis dokumentets størrelse er stor.
Tilknytning
Hvis du vil have mere at vide om konfiguration af fanen Tilknytning , skal du se Konfigurer dine tilknytninger under fanen Tilknytning. Tilknytning understøttes ikke, når både kilde og destination er hierarkiske data.
Indstillinger
Hvis du vil have Indstillinger fanekonfiguration, skal du gå til Konfigurer dine andre indstillinger under fanen Indstillinger.
Tabeloversigt
Følgende tabel indeholder flere oplysninger om kopiaktiviteten i MongoDB Atlas.
Kildeoplysninger
Navn | Beskrivelse | Værdi | Obligatorisk | JSON-scriptegenskab |
---|---|---|---|---|
Datalagertype | Datalagertypen. | Eksternt | Ja | / |
Forbind ion | Din forbindelse til kildedatalageret. | < din MongoDB Atlas-forbindelse > | Ja | Forbindelse |
Database | Den database, du bruger som kilde. | < din database > | Ja | database |
Collection name | Navnet på samlingen i MongoDB Atlas-databasen. | < din samling > | Ja | Samling |
Filter | Markeringsfilteret ved hjælp af forespørgselsoperatorer. Hvis du vil returnere alle dokumenter i en samling, skal du udelade denne parameter eller overføre et tomt dokument ({}). | < dit valgfilter > | Nr. | filter |
Markørmetoder | Den måde, den underliggende forespørgsel udføres på. | • projekt • sortér • grænse • springe over |
Nr. | cursorMethods: •Projekt •Sortere •Grænse •Springe |
Batchstørrelse | Det antal dokumenter, der skal returneres i hvert batch af svaret fra MongoDB Atlas-forekomsten. | < din skrivebatchstørrelse > (standarden er 100) |
Nr. | batchSize |
Flere kolonner | Tilføj yderligere datakolonner for at gemme kildefilernes relative sti eller statiske værdi. Udtrykket understøttes for sidstnævnte. | • Navn •Værdi |
Nr. | additionalColumns: •Navn •Værdi |
Destinationsoplysninger
Navn | Beskrivelse | Værdi | Obligatorisk | JSON-scriptegenskab |
---|---|---|---|---|
Datalagertype | Datalagertypen. | Eksternt | Ja | / |
Forbind ion | Din forbindelse til destinationsdatalageret. | < din MongoDB Atlas-forbindelse > | Ja | Forbindelse |
Database | Den database, du bruger som destination. | < din database > | Ja | database |
Collection name | Navnet på samlingen i MongoDB Atlas-databasen. | < din samling > | Ja | Samling |
Skrivefunktionsmåde | Beskriver, hvordan du skriver data til MongoDB Atlas. Tilladte værdier: Indsæt og Upsert. Upserts funktionsmåde er at erstatte dokumentet, hvis der allerede findes et dokument med det samme _id . Ellers skal du indsætte dokumentet.Bemærk! Tjenesten genererer automatisk en _id for et dokument, hvis _id en ikke er angivet enten i det oprindelige dokument eller ved kolonnetilknytning. Det betyder, at du skal sikre, at dokumentet har et id, før Upsert fungerer som forventet. |
• Indsæt (standard) • Upsert |
Nr. | writeBehavior: •Indsætte • upsert |
Timeout for skrivning af batch | Ventetiden for, at batchindsætningshandlingen afsluttes, før der udløber timeout. | Timespan (standarden er 00:30:00-30 minutter) |
Nr. | writeBatchTimeout |
Skriv batchstørrelse | Styrer størrelsen af dokumenter, der skal skrives i hvert batch. Du kan prøve at øge denne værdi for at forbedre ydeevnen og mindske værdien, hvis dokumentets størrelse er stor. | < din skrivebatchstørrelse > | Nr. | writeBatchSize |