Freigeben über


Konfigurieren von Azure Cosmos DB for MongoDB in einer Kopieraktivität

In diesem Artikel wird beschrieben, wie Sie die Kopieraktivität in einer Datenpipeline verwenden, um Daten von und nach Azure Cosmos DB for MongoDB zu kopieren.

Unterstützte Konfiguration

Die Konfiguration der einzelnen Registerkarten unter der Kopieraktivität finden Sie in den folgenden Abschnitten.

Allgemein

Informationen zum Konfigurieren der Registerkarte Allgemein finden Sie unter Allgemeine Einstellungen.

`Source`

Wechseln Sie zur Registerkarte Quelle, um die Quelle der Kopieraktivität zu konfigurieren. Die ausführliche Konfiguration finden Sie im Folgenden.

Screenshot: Registerkarte „Quelle“ mit der Liste der Eigenschaften

Die folgenden Eigenschaften sind erforderlich:

  • Verbindung: Wählen Sie eine Azure Cosmos DB for MongoDB-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung vorhanden ist, erstellen Sie eine neue Azure Cosmos DB for MongoDB-Verbindung, indem Sie unten in der Verbindungsliste Mehr auswählen.
  • Datenbank: Wählen Sie in der Dropdownliste Ihre Datenbank aus.
  • Sammlungsname: Geben Sie den Namen der Azure Cosmos DB-Sammlung an. Sie können die Sammlung aus dem Dropdownlistenfeld auswählen.

Unter Erweitert können Sie die folgenden Felder angeben:

  • Filter: Gibt den Auswahlfilter mit Abfrageoperatoren an. Um alle Dokumente in einer Sammlung zurückzugeben, lassen Sie diesen Parameter aus oder übergeben Sie ein leeres Dokument ({}).
  • Cursormethoden: Wählen Sie + Neu aus, um anzugeben, wie die zugrunde liegende Abfrage ausgeführt werden soll. Die Möglichkeiten zum Ausführen von Abfragen sind:
    • project: Gibt die Felder an, die in den Dokumenten für die Projektion zurückgegeben werden sollen. Um alle Felder in den entsprechenden Dokumenten zurückzugeben, lassen Sie diesen Parameter aus.
    • sort: Gibt die Reihenfolge an, in der übereinstimmende Dokumente von der Abfrage zurückgegeben werden. Weitere Informationen finden Sie unter cursor.sort().
    • limit: Gibt die maximale Anzahl von Dokumenten an, die vom Server zurückgegeben werden. Weitere Informationen finden Sie unter cursor.limit().
    • skip Gibt die Anzahl von Dokumenten an, die übersprungen werden sollen und ab denen MongoDB mit der Rückgabe von Ergebnissen beginnt. Weitere Informationen finden Sie unter cursor.skip().
  • Batchgröße: Gibt die Anzahl von Dokumenten an, die in jedem Batch der Antwort von der MongoDB-Instanz zurückgegeben werden sollen. In den meisten Fällen wirkt sich eine Änderung der Batchgröße nicht auf den Benutzer oder die Anwendung aus. In Azure Cosmos DB ist die maximale Größe der einzelnen Batches auf 40 MB begrenzt. Dies entspricht der Summe des Werts Batch-Größe für die Dokumentengröße. Verringern Sie deshalb diesen Wert, falls Ihre Dokumente groß sind. Der Standardwert ist 100.
  • Zusätzliche Spalten: Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt.

Destination

Wechseln Sie zur Registerkarte Ziel, um das Ziel der Kopieraktivität zu konfigurieren. Die ausführliche Konfiguration finden Sie im Folgenden.

Screenshot der Registerkarte „Ziel“ mit der Liste der Eigenschaften

Die folgenden Eigenschaften sind erforderlich:

  • Verbindung: Wählen Sie eine Azure Cosmos DB for MongoDB-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung vorhanden ist, erstellen Sie eine neue Azure Cosmos DB for MongoDB-Verbindung, indem Sie unten in der Verbindungsliste Mehr auswählen.
  • Datenbank: Wählen Sie in der Dropdownliste Ihre Datenbank aus.
  • Sammlungsname: Geben Sie den Namen der Azure Cosmos DB-Sammlung an. Sie können die Sammlung aus dem Dropdownlistenfeld auswählen.

Unter Erweitert können Sie die folgenden Felder angeben:

  • Verhalten bei Schreibvorgang: Beschreibt, wie Daten in Azure Cosmos DB for MongoDB geschrieben werden. Zulässige Werte: Einfügen und Upsert ausführen.

    Das Verhalten von Upsert ausführen besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit dem gleichen _id-Typ bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.

    Hinweis

    Der Dienst generiert automatisch eine _id für ein Dokument, wenn eine _id weder im Originaldokument noch durch eine Spaltenzuordnung angegeben wird. Dies bedeutet, dass Sie sicherstellen müssen, dass Ihr Dokument eine ID besitzt, damit Upsert ausführen wie erwartet funktioniert.

  • Zeitlimit für Batchschreibvorgang: Geben Sie die Wartezeit an, bis der Batch-Einfügevorgang beendet ist, bevor er eine Zeitüberschreitung verursacht. Der zulässige Wert ist eine Zweitspanne und der Standardwert ist 00:30:00 (30 Minuten).

  • Batchgröße für Schreibvorgang: Diese Eigenschaft steuert die Größe der in jeden Batch zu schreibenden Dokumente. Sie können diesen Wert erhöhen, um die Leistung zu verbessern, oder den Wert verringern, falls Ihre Dokumente groß sind. Der Standardwert ist 10.000.

Zuordnung

Informationen zur Konfiguration der Registerkarte Zuordnung finden Sie unter Konfigurieren der Zuordnungen auf der Registerkarte „Zuordnung“. Die Zuordnung wird nicht unterstützt, wenn sowohl die Quell- als auch die Zieldaten hierarchische Daten sind.

Einstellungen

Wechseln Sie für die Konfiguration der Registerkarte Einstellungen zu Konfigurieren der anderen Einstellungen auf der Registerkarte „Einstellungen“.

Tabellenzusammenfassung

Die folgende Tabelle enthält weitere Informationen zur Kopieraktivität in Azure Cosmos DB for MongoDB.

Quellinformationen

Name Beschreibung Wert Erforderlich JSON-Skripteigenschaft
Verbindung Ihre Verbindung mit dem Quelldatenspeicher < Ihre Azure Cosmos DB for MongoDB-Verbindung > Ja Verbindung
Datenbank Ihre Datenbank, die Sie als Quelle verwenden. < Ihre Datenbank > Ja database
Sammlungsname Der Name der Azure Cosmos DB-Sammlung. < Ihre Sammlung > Ja collection
Filter Auswahlfilter mit Abfrageoperatoren. Um alle Dokumente in einer Sammlung zurückzugeben, lassen Sie diesen Parameter aus oder übergeben Sie ein leeres Dokument ({}). < Ihr Auswahlfilter > Nein filter
Cursormethoden Die Art, wie die zugrunde liegende Abfrage ausgeführt werden soll. project
sort
limit
skip
Nein cursorMethods:
• project
• sort
• limit
• skip
Batchgröße Die Anzahl von Dokumenten, die in jedem Batch der Antwort von der MongoDB-Instanz zurückgegeben werden sollen. In den meisten Fällen wirkt sich eine Änderung der Batchgröße nicht auf den Benutzer oder die Anwendung aus. In Azure Cosmos DB ist die maximale Größe der einzelnen Batches auf 40 MB begrenzt. Dies entspricht der Summe des Werts Batch-Größe für die Dokumentengröße. Verringern Sie deshalb diesen Wert, falls Ihre Dokumente groß sind. <Schreibbatchgröße>
(der Standardwert ist 100)
Nein batchSize
Zusätzliche Spalten Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. • Name
• Wert
Nein additionalColumns:
• Name
• Wert

Zielinformationen

Name Beschreibung Wert Erforderlich JSON-Skripteigenschaft
Verbindung Ihre Verbindung mit dem Zieldatenspeicher. < Ihre Azure Cosmos DB for MongoDB-Verbindung > Ja Verbindung
Datenbank Ihre Datenbank, die Sie als Ziel verwenden. < Ihre Datenbank > Ja database
Sammlungsname Der Name der Azure Cosmos DB-Sammlung. < Ihre Sammlung > Ja collection
Verhalten bei Schreibvorgang Beschreibt, wie Daten in Azure Cosmos DB for MongoDB geschrieben werden. Zulässige Werte: Einfügen und Upsert ausführen.

Das Verhalten von Upsert ausführen besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit dem gleichen _id-Typ bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.

Hinweis: Der Dienst generiert automatisch eine _id für ein Dokument, wenn eine _id weder im Originaldokument noch durch eine Spaltenzuordnung angegeben wird. Dies bedeutet, dass Sie sicherstellen müssen, dass Ihr Dokument eine ID besitzt, damit Upsert ausführen wie erwartet funktioniert.
Einfügen (Standard)
Upsert
Nein writeBehavior:
• Einfügen
• Upsert
Zeitlimit für Batchschreibvorgang Wartezeit für den Abschluss der Batcheinfügung, bis das Timeout wirksam wird. Zeitraum
(der Standardwert ist 00:30:00 – 30 Minuten)
Nein writeBatchTimeout
Schreibbatchgröße Steuert die Größe von Dokumenten, die in jedem Batch geschrieben werden sollen. Sie können diesen Wert erhöhen, um die Leistung zu verbessern, oder den Wert verringern, falls Ihre Dokumente groß sind. <Schreibbatchgröße>
(der Standardwert ist 10.000)
No writeBatchSize