Konfigurieren von Azure Cosmos DB für NoSQL in einer Kopieraktivität
In diesem Artikel wird beschrieben, wie Sie die Kopieraktivität in einer Datenpipeline verwenden, um Daten von und nach Azure Cosmos DB for NoSQL zu kopieren.
Unterstützte Konfiguration
Informationen zur Konfiguration der einzelnen Registerkarten unter der Kopieraktivität finden Sie in den folgenden Abschnitten.
Allgemein
Informationen zum Konfigurieren der Registerkarte Allgemein finden Sie unter Allgemeine Einstellungen.
`Source`
Die folgenden Eigenschaften werden für Azure Cosmos DB for NoSQL unter der Registerkarte Quelle einer Kopieraktivität unterstützt.
Die folgenden drei Eigenschaften sind erforderlich:
- Datenspeichertyp: Wählen Sie Extern aus.
- Verbindung: Wählen Sie eine Azure Cosmos DB for NoSQL-Verbindung aus der Verbindungsliste aus. Wenn keine Verbindung besteht, erstellen Sie eine neue Azure Cosmos DB for NoSQL-Verbindung, indem Sie Neu auswählen.
- Container: Wählen Sie den Container aus, den Sie verwenden möchten. Wählen Sie Bearbeiten aus, um den Containernamen manuell einzugeben.
Unter Erweitert können Sie die folgenden Felder angeben:
Verwendungsabfrage: Sie können entweder Tabelle oder Abfrage als verwendete Abfrage auswählen. In der folgenden Liste wird die Konfiguration der einzelnen Einstellungen beschrieben.
Tabelle: Liest Daten aus der Tabelle, die Sie in Tabelle angegeben haben.
Abfrage: Gibt die Azure Cosmos DB-Abfrage zum Lesen von Daten an.
Seitengröße: Die Anzahl der Dokumente pro Seite des Abfrageergebnisses. Der Standardwert ist „-1“. Dies bedeutet, dass im Ergebnis die dienstseitige dynamische Seitengröße bis zu 1000 verwendet wird.
Datetime erkennen: Legt fest, ob „datetime“ aus den Zeichenfolgenwerten in den Dokumenten erkannt werden soll. Zulässige Werte sind true (Standard) oder false
Bevorzugte Regionen: Die bevorzugte Liste der Regionen, mit denen beim Abrufen von Daten aus Azure Cosmos DB eine Verbindung hergestellt werden soll. Wählen Sie eine bevorzugte Region aus der Dropdownliste aus, nachdem Sie Neu gewählt haben.
Zusätzliche Spalten: Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. Weitere Informationen finden Sie unter Hinzufügen zusätzlicher Spalten während des Kopiervorgangs.
Destination
Die folgenden Eigenschaften werden für Azure Cosmos DB for NoSQL unter der Registerkarte Ziel einer Kopieraktivität unterstützt.
Die folgenden drei Eigenschaften sind erforderlich:
- Datenspeichertyp: Wählen Sie Extern aus.
- Verbindung: Wählen Sie eine Azure Cosmos DB for NoSQL-Verbindung aus der Verbindungsliste aus.
- Container: Wählen Sie Durchsuchen aus, um die Datei auszuwählen, die Sie kopieren möchten, oder geben Sie den Pfad manuell ein.
Unter Erweitert können Sie die folgenden Felder angeben:
Schreibverhalten: Legt das Schreibverhalten fest, wenn das Ziel Dateien aus einem dateibasierten Datenspeicher sind. Sie können Dynamischen Inhalt hinzufügen, Einfügen oder Upsert aus der Dropdownliste auswählen.
Dynamischen Inhalt hinzufügen: Öffnen Sie den Bereich Dynamischen Inhalt hinzufügen. Dadurch wird der Ausdrucks-Generator geöffnet, in dem Sie Ausdrücke anhand von unterstützten Systemvariablen, Aktivitätsausgaben, Funktionen und benutzerdefinierten Variablen oder Parametern erstellen können. Informationen zur Ausdruckssprache finden Sie unter Ausdrücke und Funktionen.
Einfügen: Wählen Sie diese Option aus, wenn Ihre Quelldaten Einfügungen enthalten.
Upsert: Das Verhalten von „Upsert“ besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit der gleichen ID bereits vorhanden ist. Andernfalls wird das Dokument eingefügt.
Zeitlimit für Batchschreibvorgang: Die Wartezeit für den Abschluss der Batcheinfügung, bevor ein Timeout auftritt. Zulässige Werte sind
Timespan
. Beispiel: 00:30:00 (30 Minuten).Schreibbatchgröße: Geben Sie die Anzahl der Zeilen an, die pro Batch in die SQL-Tabelle eingefügt werden sollen. Der zulässige Wert ist eine ganze Zahl (Anzahl der Zeilen). Standardmäßig bestimmt der Dienst die geeignete Batchgröße dynamisch auf der Grundlage der Zeilengröße.
Maximale Anzahl gleichzeitiger Verbindungen: Die Obergrenze der gleichzeitigen Verbindungen zum Datenspeicher, die während des Ausführens der Aktivität hergestellt werden. Geben Sie diesen Wert nur an, wenn Sie die Anzahl der gleichzeitigen Verbindungen begrenzen möchten.
Analyse von Leistungsmetriken deaktivieren: Diese Einstellung steuert die Sammlung von Metriken wie DTU, DWU, RU usw. für die Optimierung der Kopierleistung und Empfehlungen. Wenn dieses Verhalten problematisch sein könnte, deaktivieren Sie dieses Feature.
Zuordnung
Wechseln Sie für die Konfiguration der Registerkarte Zuordnung zu Konfigurieren der Zuordnungen auf der Registerkarte „Zuordnung“.
Einstellungen
Wechseln Sie für die Konfiguration der Registerkarte Einstellungen zu Konfigurieren der anderen Einstellungen auf der Registerkarte „Einstellungen“.
Tabellenzusammenfassung
Die folgenden Tabellen enthalten weitere Informationen über die Kopieraktivitäten in Azure Cosmos DB for NoSQL.
Quelltabelle
Name | Beschreibung | Wert | Erforderlich | JSON-Skripteigenschaft |
---|---|---|---|---|
Datenspeichertyp | Ihr Datenspeichertyp | Extern | Ja | / |
Verbindung | Ihre Verbindung mit dem Quelldatenspeicher | <Ihre Verbindung> | Ja | Verbindung |
Container | Der Container Ihrer Quelldaten. | <Container Ihrer Quelle> | Ja | Container fileName |
Verwendungsabfrage | Sie können Tabelle oder Abfrage als Verwendungsabfrage auswählen. | • Tabelle • Abfrage |
Nein | Typ |
Seitengröße | Die Anzahl der Dokumente pro Seite des Abfrageergebnisses. Der Standardwert ist „-1“. Dies bedeutet, dass im Ergebnis die dienstseitige dynamische Seitengröße bis zu 1000 verwendet wird. | <Ihre Seitengröße> | Nein | pageSize |
Datetime löschen | Die Dateien im Quelldatenspeicher werden unmittelbar nach dem Verschieben in den Zielspeicher gelöscht. Die Dateien werden einzeln gelöscht, sodass Sie bei einem Fehler der Kopieraktivität feststellen werden, dass einige Dateien bereits ins Ziel kopiert und aus der Quelle gelöscht wurden, wohingegen sich andere weiter im Quellspeicher befinden. | Aktiviert oder deaktiviert | Nein | detectDatetime |
Bevorzugte Regionen | Die bevorzugte Liste der Regionen, mit denen beim Abrufen von Daten aus Azure Cosmos DB eine Verbindung hergestellt werden soll. Wählen Sie eine bevorzugte Region aus der Dropdownliste aus, nachdem Sie Neu gewählt haben. | <Ihre bevorzugten Regionen> | Nein | preferredRegions |
Zusätzliche Spalten | Fügen Sie zusätzliche Datenspalten hinzu, um den relativen Pfad oder statischen Wert der Quelldateien zu speichern. Für Letzteres wird ein Ausdruck unterstützt. Weitere Informationen finden Sie unter Hinzufügen zusätzlicher Spalten während des Kopiervorgangs. | <Maximal zulässige Anzahl paralleler Verbindungen> | Nein | additionalColumns |
Zieltabelle
Name | Beschreibung | Wert | Erforderlich | JSON-Skripteigenschaft |
---|---|---|---|---|
Datenspeichertyp | Ihr Datenspeichertyp | Extern | Ja | / |
Verbindung | Ihre Verbindung mit dem Zieldatenspeicher. | <Ihre Verbindung> | Ja | Verbindung |
Container | Der Container Ihrer Zieldaten. | <Container der Quelle> | Ja | Container fileName |
Verhalten bei Schreibvorgang | Beschreibt, wie Daten in Azure Cosmos DB geschrieben werden. Zulässige Werte: insert und upsert. Das Verhalten von upsert besteht darin, das Dokument zu ersetzen, wenn ein Dokument mit der gleichen ID bereits vorhanden ist. Andernfalls wird das Dokument eingefügt. | • Dynamischen Inhalt hinzufügen • Einfügen • Upsert |
Nein | writeBehavior |
Zeitlimit für Batchschreibvorgang | Die Wartezeit für den Abschluss der Batcheinfügung, bevor ein Timeout auftritt. Zulässige Werte sind Timespan-Werte. Beispiel: 00:30:00 (30 Minuten). | Zeitraum | Nein | writeBatchTimeout |
Schreibbatchgröße | Die Anzahl der Zeilen, die pro Batch in die SQL-Tabelle eingefügt werden sollen. Zulässiger Wert: integer (Anzahl der Zeilen) Standardmäßig bestimmt der Dienst die geeignete Batchgröße dynamisch auf der Grundlage der Zeilengröße. | <Anzahl von Zeilen> (Integer) |
Nein | writeBatchSize |
Maximal zulässige Anzahl paralleler Verbindungen | Die Obergrenze gleichzeitiger Verbindungen mit dem Datenspeicher während der Aktivitätsausführung. Geben Sie diesen Wert nur an, wenn Sie die Anzahl der gleichzeitigen Verbindungen begrenzen möchten. | <Maximal zulässige Anzahl paralleler Verbindungen> | Nein | maxConcurrentConnections |
Analyse von Leistungsmetriken deaktivieren | Diese Einstellung steuert die Sammlung von Metriken wie DTU, DWU, RU usw. zur Optimierung der Kopierleistung und für Empfehlungen. Wenn dieses Verhalten problematisch sein könnte, deaktivieren Sie dieses Feature. | Aktiviert oder deaktiviert | Nein | disableMetricsCollection |