Konfigurera MongoDB Atlas i en kopieringsaktivitet
Den här artikeln beskriver hur du använder kopieringsaktiviteten i datapipelinen för att kopiera data från och till MongoDB Atlas.
Konfiguration som stöds
För konfigurationen av varje flik under kopieringsaktivitet går du till följande avsnitt.
Allmänt
Se vägledningen allmänna inställningar för att konfigurera fliken Allmänna inställningar.
Källa
Gå till fliken Källa för att konfigurera kopieringsaktivitetskällan. Se följande innehåll för den detaljerade konfigurationen.
Följande egenskaper krävs:
- Datalagertyp: Välj Extern.
- Anslut ion: Välj en MongoDB Atlas-anslutning i anslutningslistan. Om det inte finns någon anslutning skapar du en ny MongoDB Atlas-anslutning genom att välja Ny.
- Databas: Välj din databas i listrutan.
- Samlingsnamn: Ange namnet på samlingen i MongoDB Atlas-databasen. Du kan välja samlingen i listrutan eller välja Redigera för att ange den manuellt.
Under Avancerat kan du ange följande fält:
Filter: Anger markeringsfilter med hjälp av frågeoperatorer. Om du vill returnera alla dokument i en samling utelämnar du den här parametern eller skickar ett tomt dokument ({}).
Markörmetoder: Välj + Ny för att ange hur den underliggande frågan ska köras. Följande sätt att köra frågor är:
- project: Anger de fält som ska returneras i dokumenten för projektion. Om du vill returnera alla fält i matchande dokument utelämnar du den här parametern.
- sort: Anger i vilken ordning frågan returnerar matchande dokument. Se cursor.sort().
- gräns: Anger det maximala antalet dokument som servern returnerar. Se cursor.limit().
- skip: Anger antalet dokument som ska hoppa över och varifrån MongoDB Atlas börjar returnera resultat. Se cursor.skip().
Batchstorlek: Anger antalet dokument som ska returneras i varje batch av svaret från MongoDB Atlas-instansen. I de flesta fall påverkar det inte användaren eller programmet att ändra batchstorleken.
Ytterligare kolumner: Lägg till ytterligare datakolumner för att lagra källfilernas relativa sökväg eller statiska värde. Uttrycket stöds för det senare.
Mål
Gå till fliken Mål för att konfigurera kopieringsaktivitetens mål. Se följande innehåll för den detaljerade konfigurationen.
Följande egenskaper krävs:
- Datalagertyp: Välj Extern.
- Anslut ion: Välj en MongoDB Atlas-anslutning i anslutningslistan. Om det inte finns någon anslutning skapar du en ny MongoDB Atlas-anslutning genom att välja Ny.
- Databas: Välj din databas i listrutan.
- Samlingsnamn: Ange namnet på samlingen i MongoDB Atlas-databasen. Du kan välja samlingen i listrutan eller välja Redigera för att ange den manuellt.
Under Avancerat kan du ange följande fält:
Skrivbeteende: Beskriver hur du skriver data till MongoDB Atlas. Tillåtna värden: Infoga och Upsert.
Upserts beteende är att ersätta dokumentet om ett dokument med samma
_id
redan finns. Annars infogar du dokumentet.Kommentar
Tjänsten genererar automatiskt ett
_id
för ett dokument om ett_id
inte har angetts i det ursprungliga dokumentet eller efter kolumnmappning. Det innebär att du måste se till att ditt dokument har ett ID för att Upsert ska fungera som förväntat.Tidsgräns för skrivning av batch: Ange väntetiden för batchinfogningsåtgärden som ska slutföras innan tidsgränsen uppnås. Det tillåtna värdet är tidsintervall.
Skriv batchstorlek: Den här egenskapen styr storleken på dokument som ska skrivas i varje batch. Du kan försöka öka värdet för att förbättra prestanda och minska värdet om dokumentstorleken är stor.
Mappning
Information om konfiguration av fliken Mappning finns i Konfigurera dina mappningar under mappningsfliken. Mappning stöds inte när både källa och mål är hierarkiska data.
Inställningar
För Inställningar flikkonfiguration går du till Konfigurera dina andra inställningar under fliken Inställningar.
Tabellsammanfattning
Följande tabell innehåller mer information om kopieringsaktiviteten i MongoDB Atlas.
Källinformation
Name | Beskrivning | Värde | Obligatoriskt | JSON-skriptegenskap |
---|---|---|---|---|
Typ av datalager | Din datalagertyp. | Externt | Ja | / |
Anslutning | Din anslutning till källdatalagret. | < din MongoDB Atlas-anslutning > | Ja | anslutning |
Databas | Din databas som du använder som källa. | < din databas > | Ja | database |
Samlingsnamn | Namnet på samlingen i MongoDB Atlas-databasen. | < din samling > | Ja | Samling |
Filter | Markeringsfiltret med hjälp av frågeoperatorer. Om du vill returnera alla dokument i en samling utelämnar du den här parametern eller skickar ett tomt dokument ({}). | < ditt markeringsfilter > | Nej | filter |
Markörmetoder | Det sätt som den underliggande frågan körs på. | • projekt • sortera • gräns • hoppa över |
Nej | cursorMethods: •Projekt •Sortera •Gräns •Hoppa över |
Batchstorlek | Antalet dokument som ska returneras i varje batch av svaret från MongoDB Atlas-instansen. | < din skriv batchstorlek > (standardvärdet är 100) |
Nej | batchSize |
Ytterligare kolumner | Lägg till ytterligare datakolumner för att lagra källfilernas relativa sökväg eller statiska värde. Uttrycket stöds för det senare. | • Namn •Värde |
Nej | additionalColumns: •Namn •Värde |
Målinformation
Name | Beskrivning | Värde | Obligatoriskt | JSON-skriptegenskap |
---|---|---|---|---|
Typ av datalager | Din datalagertyp. | Externt | Ja | / |
Anslutning | Din anslutning till måldatalagret. | < din MongoDB Atlas-anslutning > | Ja | anslutning |
Databas | Din databas som du använder som mål. | < din databas > | Ja | database |
Samlingsnamn | Namnet på samlingen i MongoDB Atlas-databasen. | < din samling > | Ja | Samling |
Skrivbeteende | Beskriver hur du skriver data till MongoDB Atlas. Tillåtna värden: Infoga och Upsert. Upserts beteende är att ersätta dokumentet om ett dokument med samma _id redan finns. Annars infogar du dokumentet.Obs! Tjänsten genererar automatiskt ett _id för ett dokument om ett _id inte har angetts i det ursprungliga dokumentet eller efter kolumnmappning. Det innebär att du måste se till att ditt dokument har ett ID för att Upsert ska fungera som förväntat. |
• Infoga (standard) • Upsert |
Nej | writeBehavior: •Infoga • upsert |
Tidsgräns för skrivning av batch | Väntetiden för att batchinfogningsåtgärden ska slutföras innan tidsgränsen uppnås. | tidsintervall (standardvärdet är 00:30:00 –30 minuter) |
Nej | writeBatchTimeout |
Skriv batchstorlek | Styr storleken på dokument som ska skrivas i varje batch. Du kan prova att öka det här värdet för att förbättra prestanda och minska värdet om dokumentstorleken är stor. | < din skriv batchstorlek > | Nej | writeBatchSize |