Konfigurieren von Azure Cosmos DB for MongoDB in einer Kopieraktivität
In diesem Artikel wird beschrieben, wie Sie die Kopieraktivität in einer Datenpipeline verwenden, um Daten von und nach Azure Cosmos DB for MongoDB zu kopieren.
Unterstützte Konfiguration
Die Konfiguration der einzelnen Registerkarten unter der Kopieraktivität finden Sie in den folgenden Abschnitten.
Allgemein
Informationen zum Konfigurieren der Registerkarte Allgemein finden Sie unter Allgemeine Einstellungen.
`Source`
Wechseln Sie zur Registerkarte Quelle, um die Quelle der Kopieraktivität zu konfigurieren. Die ausführliche Konfiguration finden Sie im Folgenden.
Die folgenden Eigenschaften sind erforderlich:
- Verbindung: Wählen Sie eine Azure Cosmos DB for MongoDB-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung vorhanden ist, erstellen Sie eine neue Azure Cosmos DB for MongoDB-Verbindung, indem Sie unten in der Verbindungsliste Mehr auswählen.
- Datenbank: Wählen Sie in der Dropdownliste Ihre Datenbank aus.
- Sammlungsname: Geben Sie den Namen der Azure Cosmos DB-Sammlung an. Sie können die Sammlung aus dem Dropdownlistenfeld auswählen.
Unter Erweitert können Sie die folgenden Felder angeben:
- Filter: Gibt den Auswahlfilter mit Abfrageoperatoren an. Um alle Dokumente in einer Sammlung zurückzugeben, lassen Sie diesen Parameter aus oder übergeben Sie ein leeres Dokument ({}).
- Cursormethoden: Wählen Sie + Neu aus, um anzugeben, wie die zugrunde liegende Abfrage ausgeführt werden soll. Die Möglichkeiten zum Ausführen von Abfragen sind:
- project: Gibt die Felder an, die in den Dokumenten für die Projektion zurückgegeben werden sollen. Um alle Felder in den entsprechenden Dokumenten zurückzugeben, lassen Sie diesen Parameter aus.
- sort: Gibt die Reihenfolge an, in der übereinstimmende Dokumente von der Abfrage zurückgegeben werden. Weitere Informationen finden Sie unter cursor.sort().
- limit: Gibt die maximale Anzahl von Dokumenten an, die vom Server zurückgegeben werden. Weitere Informationen finden Sie unter cursor.limit().
- skip Gibt die Anzahl von Dokumenten an, die übersprungen werden sollen und ab denen MongoDB mit der Rückgabe von Ergebnissen beginnt. Weitere Informationen finden Sie unter cursor.skip().
- Batchgröße: Gibt die Anzahl von Dokumenten an, die in jedem Batch der Antwort von der MongoDB-Instanz zurückgegeben werden sollen. In den meisten Fällen wirkt sich eine Änderung der Batchgröße nicht auf den Benutzer oder die Anwendung aus. In Azure Cosmos DB ist die maximale Größe der einzelnen Batches auf 40 MB begrenzt. Dies entspricht der Summe des Werts Batch-Größe für die Dokumentengröße. Verringern Sie deshalb diesen Wert, falls Ihre Dokumente groß sind. Der Standardwert ist 100.
- Zusätzliche Spalten: Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt.
Destination
Wechseln Sie zur Registerkarte Ziel, um das Ziel der Kopieraktivität zu konfigurieren. Die ausführliche Konfiguration finden Sie im Folgenden.
Die folgenden Eigenschaften sind erforderlich:
- Verbindung: Wählen Sie eine Azure Cosmos DB for MongoDB-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung vorhanden ist, erstellen Sie eine neue Azure Cosmos DB for MongoDB-Verbindung, indem Sie unten in der Verbindungsliste Mehr auswählen.
- Datenbank: Wählen Sie in der Dropdownliste Ihre Datenbank aus.
- Sammlungsname: Geben Sie den Namen der Azure Cosmos DB-Sammlung an. Sie können die Sammlung aus dem Dropdownlistenfeld auswählen.
Unter Erweitert können Sie die folgenden Felder angeben:
Verhalten bei Schreibvorgang: Beschreibt, wie Daten in Azure Cosmos DB for MongoDB geschrieben werden. Zulässige Werte: Einfügen und Upsert ausführen.
Das Verhalten von Upsert ausführen besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit dem gleichen
_id
-Typ bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.Hinweis
Der Dienst generiert automatisch eine
_id
für ein Dokument, wenn eine_id
weder im Originaldokument noch durch eine Spaltenzuordnung angegeben wird. Dies bedeutet, dass Sie sicherstellen müssen, dass Ihr Dokument eine ID besitzt, damit Upsert ausführen wie erwartet funktioniert.Zeitlimit für Batchschreibvorgang: Geben Sie die Wartezeit an, bis der Batch-Einfügevorgang beendet ist, bevor er eine Zeitüberschreitung verursacht. Der zulässige Wert ist eine Zweitspanne und der Standardwert ist 00:30:00 (30 Minuten).
Batchgröße für Schreibvorgang: Diese Eigenschaft steuert die Größe der in jeden Batch zu schreibenden Dokumente. Sie können diesen Wert erhöhen, um die Leistung zu verbessern, oder den Wert verringern, falls Ihre Dokumente groß sind. Der Standardwert ist 10.000.
Zuordnung
Informationen zur Konfiguration der Registerkarte Zuordnung finden Sie unter Konfigurieren der Zuordnungen auf der Registerkarte „Zuordnung“. Die Zuordnung wird nicht unterstützt, wenn sowohl die Quell- als auch die Zieldaten hierarchische Daten sind.
Einstellungen
Wechseln Sie für die Konfiguration der Registerkarte Einstellungen zu Konfigurieren der anderen Einstellungen auf der Registerkarte „Einstellungen“.
Tabellenzusammenfassung
Die folgende Tabelle enthält weitere Informationen zur Kopieraktivität in Azure Cosmos DB for MongoDB.
Quellinformationen
Name | Beschreibung | Wert | Erforderlich | JSON-Skripteigenschaft |
---|---|---|---|---|
Verbindung | Ihre Verbindung mit dem Quelldatenspeicher | < Ihre Azure Cosmos DB for MongoDB-Verbindung > | Ja | Verbindung |
Datenbank | Ihre Datenbank, die Sie als Quelle verwenden. | < Ihre Datenbank > | Ja | database |
Sammlungsname | Der Name der Azure Cosmos DB-Sammlung. | < Ihre Sammlung > | Ja | collection |
Filter | Auswahlfilter mit Abfrageoperatoren. Um alle Dokumente in einer Sammlung zurückzugeben, lassen Sie diesen Parameter aus oder übergeben Sie ein leeres Dokument ({}). | < Ihr Auswahlfilter > | Nein | filter |
Cursormethoden | Die Art, wie die zugrunde liegende Abfrage ausgeführt werden soll. | • project • sort • limit • skip |
Nein | cursorMethods: • project • sort • limit • skip |
Batchgröße | Die Anzahl von Dokumenten, die in jedem Batch der Antwort von der MongoDB-Instanz zurückgegeben werden sollen. In den meisten Fällen wirkt sich eine Änderung der Batchgröße nicht auf den Benutzer oder die Anwendung aus. In Azure Cosmos DB ist die maximale Größe der einzelnen Batches auf 40 MB begrenzt. Dies entspricht der Summe des Werts Batch-Größe für die Dokumentengröße. Verringern Sie deshalb diesen Wert, falls Ihre Dokumente groß sind. | <Schreibbatchgröße> (der Standardwert ist 100) |
Nein | batchSize |
Zusätzliche Spalten | Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. | • Name • Wert |
Nein | additionalColumns: • Name • Wert |
Zielinformationen
Name | Beschreibung | Wert | Erforderlich | JSON-Skripteigenschaft |
---|---|---|---|---|
Verbindung | Ihre Verbindung mit dem Zieldatenspeicher. | < Ihre Azure Cosmos DB for MongoDB-Verbindung > | Ja | Verbindung |
Datenbank | Ihre Datenbank, die Sie als Ziel verwenden. | < Ihre Datenbank > | Ja | database |
Sammlungsname | Der Name der Azure Cosmos DB-Sammlung. | < Ihre Sammlung > | Ja | collection |
Verhalten bei Schreibvorgang | Beschreibt, wie Daten in Azure Cosmos DB for MongoDB geschrieben werden. Zulässige Werte: Einfügen und Upsert ausführen. Das Verhalten von Upsert ausführen besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit dem gleichen _id -Typ bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.Hinweis: Der Dienst generiert automatisch eine _id für ein Dokument, wenn eine _id weder im Originaldokument noch durch eine Spaltenzuordnung angegeben wird. Dies bedeutet, dass Sie sicherstellen müssen, dass Ihr Dokument eine ID besitzt, damit Upsert ausführen wie erwartet funktioniert. |
• Einfügen (Standard) • Upsert |
Nein | writeBehavior: • Einfügen • Upsert |
Zeitlimit für Batchschreibvorgang | Wartezeit für den Abschluss der Batcheinfügung, bis das Timeout wirksam wird. | Zeitraum (der Standardwert ist 00:30:00 – 30 Minuten) |
Nein | writeBatchTimeout |
Schreibbatchgröße | Steuert die Größe von Dokumenten, die in jedem Batch geschrieben werden sollen. Sie können diesen Wert erhöhen, um die Leistung zu verbessern, oder den Wert verringern, falls Ihre Dokumente groß sind. | <Schreibbatchgröße> (der Standardwert ist 10.000) |
No | writeBatchSize |