Konfigurera Azure Cosmos DB för MongoDB i en kopieringsaktivitet
Den här artikeln beskriver hur du använder kopieringsaktiviteten i datapipelines för att kopiera data från och till Azure Cosmos DB för MongoDB.
Konfiguration som stöds
För konfigurationen av varje flik under kopieringsaktivitet går du till följande avsnitt.
Allmänt
Se vägledningen allmänna inställningar för att konfigurera fliken Allmänna inställningar.
Källa
Gå till fliken Källa för att konfigurera kopieringsaktivitetskällan. Se följande innehåll för den detaljerade konfigurationen.
Följande egenskaper krävs:
- Anslut ion: Välj en Azure Cosmos DB för MongoDB-anslutning i anslutningslistan. Om det inte finns någon anslutning skapar du en ny Azure Cosmos DB för MongoDB-anslutning genom att välja Mer längst ned i anslutningslistan.
- Databas: Välj din databas i listrutan.
- Samlingsnamn: Ange namnet på Azure Cosmos DB-samlingen. Du kan välja samlingen i listrutan.
Under Avancerat kan du ange följande fält:
- Filter: Anger markeringsfilter med hjälp av frågeoperatorer. Om du vill returnera alla dokument i en samling utelämnar du den här parametern eller skickar ett tomt dokument ({}).
- Markörmetoder: Välj + Ny för att ange hur den underliggande frågan ska köras. Följande sätt att köra frågor är:
- project: Anger de fält som ska returneras i dokumenten för projektion. Om du vill returnera alla fält i matchande dokument utelämnar du den här parametern.
- sort: Anger i vilken ordning frågan returnerar matchande dokument. Gå till cursor.sort() för mer information.
- gräns: Anger det maximala antalet dokument som servern returnerar. Gå till cursor.limit() för mer information.
- skip: Anger antalet dokument som ska hoppa över och varifrån MongoDB börjar returnera resultat. Gå till cursor.skip() för mer information.
- Batchstorlek: Anger antalet dokument som ska returneras i varje batch av svaret från MongoDB-instansen. I de flesta fall påverkar det inte användaren eller programmet att ändra batchstorleken. Azure Cosmos DB begränsar varje batch får inte överskrida 40 MB i storlek, vilket är summan av batchstorleken för dokumentstorleken, så minska det här värdet om dokumentstorleken är stor. Standardvärdet är 100.
- Ytterligare kolumner: Lägg till ytterligare datakolumner för att lagra källfilernas relativa sökväg eller statiska värde. Uttrycket stöds för det senare.
Mål
Gå till fliken Mål för att konfigurera kopieringsaktivitetens mål. Se följande innehåll för den detaljerade konfigurationen.
Följande egenskaper krävs:
- Anslut ion: Välj en Azure Cosmos DB för MongoDB-anslutning i anslutningslistan. Om det inte finns någon anslutning skapar du en ny Azure Cosmos DB för MongoDB-anslutning genom att välja Mer längst ned i anslutningslistan.
- Databas: Välj din databas i listrutan.
- Samlingsnamn: Ange namnet på Azure Cosmos DB-samlingen. Du kan välja samlingen i listrutan.
Under Avancerat kan du ange följande fält:
Skrivbeteende: Beskriver hur du skriver data till Azure Cosmos DB för MongoDB. Tillåtna värden: Infoga och Upsert.
Upserts beteende är att ersätta dokumentet om ett dokument med samma
_id
redan finns. Annars infogar du dokumentet.Kommentar
Tjänsten genererar automatiskt ett
_id
för ett dokument om ett_id
inte har angetts i det ursprungliga dokumentet eller efter kolumnmappning. Det innebär att du måste se till att ditt dokument har ett ID för att Upsert ska fungera som förväntat.Tidsgräns för skrivning av batch: Ange väntetiden för batchinfogningsåtgärden som ska slutföras innan tidsgränsen uppnås. Det tillåtna värdet är tidsintervall och standardvärdet är 00:30:00 (30 minuter).
Skriv batchstorlek: Den här egenskapen styr storleken på dokument som ska skrivas i varje batch. Du kan försöka öka värdet för att förbättra prestanda och minska värdet om dokumentstorleken är stor. Standardvärdet är 10 000.
Mappning
Information om konfiguration av fliken Mappning finns i Konfigurera dina mappningar under mappningsfliken. Mappning stöds inte när både källa och mål är hierarkiska data.
Inställningar
För Inställningar flikkonfiguration går du till Konfigurera dina andra inställningar under fliken Inställningar.
Tabellsammanfattning
Följande tabell innehåller mer information om kopieringsaktiviteten i Azure Cosmos DB för MongoDB.
Källinformation
Name | Beskrivning | Värde | Obligatoriskt | JSON-skriptegenskap |
---|---|---|---|---|
Anslutning | Din anslutning till källdatalagret. | < din Azure Cosmos DB for MongoDB-anslutning > | Ja | anslutning |
Databas | Din databas som du använder som källa. | < din databas > | Ja | database |
Samlingsnamn | Namnet på Azure Cosmos DB-samlingen. | < din samling > | Ja | Samling |
Filter | Markeringsfiltret med hjälp av frågeoperatorer. Om du vill returnera alla dokument i en samling utelämnar du den här parametern eller skickar ett tomt dokument ({}). | < ditt markeringsfilter > | Nej | filter |
Markörmetoder | Det sätt som den underliggande frågan körs på. | • projekt • sortera • gräns • hoppa över |
Nej | cursorMethods: •Projekt •Sortera •Gräns •Hoppa över |
Batchstorlek | Antalet dokument som ska returneras i varje batch av svaret från MongoDB-instansen. I de flesta fall påverkar det inte användaren eller programmet att ändra batchstorleken. Azure Cosmos DB begränsar varje batch får inte överskrida 40 MB i storlek, vilket är summan av batchstorleken för dokumentstorleken, så minska det här värdet om dokumentstorleken är stor. | < din skriv batchstorlek > (standardvärdet är 100) |
Nej | batchSize |
Ytterligare kolumner | Lägg till ytterligare datakolumner för att lagra källfilernas relativa sökväg eller statiska värde. Uttrycket stöds för det senare. | • Namn •Värde |
Nej | additionalColumns: •Namn •Värde |
Målinformation
Name | Beskrivning | Värde | Obligatoriskt | JSON-skriptegenskap |
---|---|---|---|---|
Anslutning | Din anslutning till måldatalagret. | < din Azure Cosmos DB for MongoDB-anslutning > | Ja | anslutning |
Databas | Din databas som du använder som mål. | < din databas > | Ja | database |
Samlingsnamn | Namnet på Azure Cosmos DB-samlingen. | < din samling > | Ja | Samling |
Skrivbeteende | Beskriver hur du skriver data till Azure Cosmos DB för MongoDB. Tillåtna värden: Infoga och Upsert. Upserts beteende är att ersätta dokumentet om ett dokument med samma _id redan finns. Annars infogar du dokumentet.Obs! Tjänsten genererar automatiskt ett _id för ett dokument om ett _id inte har angetts i det ursprungliga dokumentet eller efter kolumnmappning. Det innebär att du måste se till att ditt dokument har ett ID för att Upsert ska fungera som förväntat. |
• Infoga (standard) • Upsert |
Nej | writeBehavior: •Infoga • upsert |
Tidsgräns för skrivning av batch | Väntetiden för att batchinfogningsåtgärden ska slutföras innan tidsgränsen uppnås. | tidsintervall (standardvärdet är 00:30:00 –30 minuter) |
Nej | writeBatchTimeout |
Skriv batchstorlek | Styr storleken på dokument som ska skrivas i varje batch. Du kan prova att öka det här värdet för att förbättra prestanda och minska värdet om dokumentstorleken är stor. | < din skriv batchstorlek > (standardvärdet är 10 000) |
Nej | writeBatchSize |