Konfigurieren von MongoDB in einer Kopieraktivität
In diesem Artikel wird beschrieben, wie Sie die Kopieraktivität in der Datenpipeline verwenden, um Daten von und nach MongoDB zu kopieren.
Unterstützte Konfiguration
Die Konfiguration der einzelnen Registerkarten unter der Kopieraktivität finden Sie in den folgenden Abschnitten.
Allgemein
Informationen zum Konfigurieren der Registerkarte Allgemein finden Sie unter Allgemeine Einstellungen.
`Source`
Wechseln Sie zur Registerkarte Quelle, um die Quelle der Kopieraktivität zu konfigurieren. Die ausführliche Konfiguration finden Sie im Folgenden.
Die folgenden Eigenschaften sind erforderlich:
- Datenspeichertyp: Wählen Sie Extern aus.
- Verbindung: Wählen Sie eine MongoDB-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung vorhanden ist, erstellen Sie eine neue MongoDB-Verbindung, indem Sie Neu auswählen.
- Datenbank: Wählen Sie in der Dropdownliste Ihre Datenbank aus.
- Sammlungsname: Geben Sie den Namen der Sammlung in der MongoDB-Datenbank an. Sie können die Sammlung in der Dropdownliste auswählen oder Bearbeiten auswählen, um sie manuell einzugeben.
Unter Erweitert können Sie die folgenden Felder angeben:
- Filter: Gibt den Auswahlfilter mit Abfrageoperatoren an. Um alle Dokumente in einer Sammlung zurückzugeben, lassen Sie diesen Parameter aus oder übergeben Sie ein leeres Dokument ({}).
- Cursormethoden: Wählen Sie + Neu aus, um anzugeben, wie die zugrunde liegende Abfrage ausgeführt werden soll. Die Möglichkeiten zum Ausführen von Abfragen sind:
- project: Gibt die Felder an, die in den Dokumenten für die Projektion zurückgegeben werden sollen. Um alle Felder in den entsprechenden Dokumenten zurückzugeben, lassen Sie diesen Parameter aus.
- sort: Gibt die Reihenfolge an, in der übereinstimmende Dokumente von der Abfrage zurückgegeben werden. Weitere Informationen finden Sie unter cursor.sort().
- limit: Gibt die maximale Anzahl von Dokumenten an, die vom Server zurückgegeben werden. Weitere Informationen finden Sie unter cursor.limit().
- skip Gibt die Anzahl von Dokumenten an, die übersprungen werden sollen und ab denen MongoDB mit der Rückgabe von Ergebnissen beginnt. Weitere Informationen finden Sie unter cursor.skip().
- Batchgröße: Gibt die Anzahl von Dokumenten an, die in jedem Batch der Antwort von der MongoDB-Instanz zurückgegeben werden sollen. In den meisten Fällen wirkt sich eine Änderung der Batchgröße nicht auf den Benutzer oder die Anwendung aus.
- Zusätzliche Spalten: Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt.
Destination
Wechseln Sie zur Registerkarte Ziel, um das Ziel der Kopieraktivität zu konfigurieren. Die ausführliche Konfiguration finden Sie im Folgenden.
Die folgenden Eigenschaften sind erforderlich:
- Datenspeichertyp: Wählen Sie Extern aus.
- Verbindung: Wählen Sie eine MongoDB-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung vorhanden ist, erstellen Sie eine neue MongoDB-Verbindung, indem Sie Neu auswählen.
- Datenbank: Wählen Sie in der Dropdownliste Ihre Datenbank aus.
- Sammlungsname: Geben Sie den Namen der Sammlung in der MongoDB-Datenbank an. Sie können die Sammlung in der Dropdownliste auswählen oder Bearbeiten auswählen, um sie manuell einzugeben.
Unter Erweitert können Sie die folgenden Felder angeben:
Verhalten bei Schreibvorgang: Beschreibt, wie Daten in MongoDB geschrieben werden. Zulässige Werte: Einfügen und Upsert ausführen.
Das Verhalten von Upsert ausführen besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit dem gleichen
_id
-Typ bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.Hinweis
Der Dienst generiert automatisch eine
_id
für ein Dokument, wenn eine_id
weder im Originaldokument noch durch eine Spaltenzuordnung angegeben wird. Dies bedeutet, dass Sie sicherstellen müssen, dass Ihr Dokument eine ID besitzt, damit Upsert ausführen wie erwartet funktioniert.Zeitlimit für Batchschreibvorgang: Geben Sie die Wartezeit an, bis der Batch-Einfügevorgang beendet ist, bevor er eine Zeitüberschreitung verursacht. Der zulässige Wert ist ein Timespan-Wert.
Batchgröße für Schreibvorgang: Diese Eigenschaft steuert die Größe der in jeden Batch zu schreibenden Dokumente. Sie können diesen Wert erhöhen, um die Leistung zu verbessern, oder den Wert verringern, falls Ihre Dokumente groß sind.
Zuordnung
Informationen zur Konfiguration der Registerkarte Zuordnung finden Sie unter Konfigurieren der Zuordnungen auf der Registerkarte „Zuordnung“. Die Zuordnung wird nicht unterstützt, wenn sowohl die Quell- als auch die Zieldaten hierarchische Daten sind.
Einstellungen
Wechseln Sie für die Konfiguration der Registerkarte Einstellungen zu Konfigurieren der anderen Einstellungen auf der Registerkarte „Einstellungen“.
Tabellenzusammenfassung
Die folgende Tabelle enthält weitere Informationen zur Kopieraktivität in MongoDB.
Quellinformationen
Name | Beschreibung | Wert | Erforderlich | JSON-Skripteigenschaft |
---|---|---|---|---|
Datenspeichertyp | Ihr Datenspeichertyp | Extern | Ja | / |
Verbindung | Ihre Verbindung mit dem Quelldatenspeicher | < Ihre MongoDB-Verbindung > | Ja | Verbindung |
Datenbank | Ihre Datenbank, die Sie als Quelle verwenden. | < Ihre Datenbank > | Ja | database |
Sammlungsname | Der Name der Sammlung in der MongoDB-Datenbank | < Ihre Sammlung > | Ja | collection |
Filter | Auswahlfilter mit Abfrageoperatoren. Um alle Dokumente in einer Sammlung zurückzugeben, lassen Sie diesen Parameter aus oder übergeben Sie ein leeres Dokument ({}). | < Ihr Auswahlfilter > | Nein | filter |
Cursormethoden | Die Art, wie die zugrunde liegende Abfrage ausgeführt werden soll. | • project • sort • limit • skip |
Nein | cursorMethods: • project • sort • limit • skip |
Batchgröße | Die Anzahl von Dokumenten, die in jedem Batch der Antwort von der MongoDB-Instanz zurückgegeben werden sollen. | <Schreibbatchgröße> (der Standardwert ist 100) |
Nein | batchSize |
Zusätzliche Spalten | Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. | • Name • Wert |
Nein | additionalColumns: • Name • Wert |
Zielinformationen
Name | Beschreibung | Wert | Erforderlich | JSON-Skripteigenschaft |
---|---|---|---|---|
Datenspeichertyp | Ihr Datenspeichertyp | Extern | Ja | / |
Verbindung | Ihre Verbindung mit dem Zieldatenspeicher. | < Ihre MongoDB-Verbindung > | Ja | Verbindung |
Datenbank | Ihre Datenbank, die Sie als Ziel verwenden. | < Ihre Datenbank > | Ja | database |
Sammlungsname | Der Name der Sammlung in der MongoDB-Datenbank | < Ihre Sammlung > | Ja | collection |
Verhalten bei Schreibvorgang | Beschreibt, wie Daten in MongoDB geschrieben werden. Zulässige Werte: Einfügen und Upsert ausführen. Das Verhalten von Upsert ausführen besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit dem gleichen _id -Typ bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.Hinweis: Der Dienst generiert automatisch eine _id für ein Dokument, wenn eine _id weder im Originaldokument noch durch eine Spaltenzuordnung angegeben wird. Dies bedeutet, dass Sie sicherstellen müssen, dass Ihr Dokument eine ID besitzt, damit Upsert ausführen wie erwartet funktioniert. |
• Einfügen (Standard) • Upsert |
Nein | writeBehavior: • Einfügen • Upsert |
Zeitlimit für Batchschreibvorgang | Wartezeit für den Abschluss der Batcheinfügung, bis das Timeout wirksam wird. | Zeitraum (der Standardwert ist 00:30:00 – 30 Minuten) |
Nein | writeBatchTimeout |
Schreibbatchgröße | Steuert die Größe von Dokumenten, die in jedem Batch geschrieben werden sollen. Sie können diesen Wert erhöhen, um die Leistung zu verbessern, oder den Wert verringern, falls Ihre Dokumente groß sind. | <Schreibbatchgröße> | Nein | writeBatchSize |