Configurer Azure Cosmos DB for MongoDB dans une activité de copie
Cet article explique comment utiliser l’activité de copie dans les pipelines de données pour copier des données depuis et vers Azure Cosmos DB for MongoDB.
Configuration prise en charge
Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.
Général
Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .
Source
Accédez à l’onglet Source pour configurer votre source d’activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.
Les propriétés suivantes sont requises :
- Connexion : sélectionnez une connexion Azure Cosmos DB for MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion Azure Cosmos DB for MongoDB en sélectionnant Plus au bas de la liste des connexions.
- Base de données : sélectionnez votre base de données dans la liste déroulante.
- Nom de la collection : spécifiez le nom de la collection Azure Cosmos DB. Vous pouvez sélectionner une collection dans la liste déroulante.
Sous Avancé, vous pouvez spécifier les champs suivants :
- Filtre : permet de spécifier le filtre de sélection en tirant parti d’opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}).
- Méthodes de curseur : sélectionnez + Nouveau pour spécifier la façon dont la requête sous-jacente est exécutée. Les méthodes d’exécution de la requête sont les suivantes :
- projet : spécifie les champs à retourner dans les documents pour la projection. Pour retourner tous les champs dans les documents correspondants, omettez ce paramètre.
- sort : spécifie l’ordre dans lequel la requête retourne les documents correspondants. Pour plus d’informations, accédez à cursor.sort().
- limit : spécifie le nombre maximal de documents retournés par le serveur. Pour plus d’informations, accédez à cursor.limit().
- skip : spécifie le nombre de documents à ignorer, et à partir de quel endroit MongoDB commence à retourner des résultats. Pour plus d’informations, accédez à cursor.skip().
- Taille de lot : spécifie le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. Dans la plupart des cas, la modification de la taille de lot n’affectera pas l’utilisateur ou l’application. Azure Cosmos DB limite la taille de chaque lot à 40 Mo, qui est la somme de la taille Batch Size du nombre de documents. Par conséquent, diminuez cette valeur si la taille de votre document est trop grande. La valeur par défaut est 100.
- Colonnes supplémentaires: Ajoutez des colonnes de données supplémentaires pour stocker le chemin relatif ou la valeur statique des fichiers sources. L'expression est prise en charge pour ce dernier.
Destination
Accédez à l’onglet Destination pour configurer la destination de votre activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.
Les propriétés suivantes sont requises :
- Connexion : sélectionnez une connexion Azure Cosmos DB for MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion Azure Cosmos DB for MongoDB en sélectionnant Plus au bas de la liste des connexions.
- Base de données : sélectionnez votre base de données dans la liste déroulante.
- Nom de la collection : spécifiez le nom de la collection Azure Cosmos DB. Vous pouvez sélectionner une collection dans la liste déroulante.
Sous Avancé, vous pouvez spécifier les champs suivants :
Comportement d’écriture : décrit comment écrire des données dans Azure Cosmos DB for MongoDB. Les valeurs autorisées sont : insert et Upsert.
Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même
_id
existe déjà ; sinon, le document est inséré.Remarque
Le service génère automatiquement un
_id
pour un document si aucun_id
n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu.Délai d'attente du lot d'écriture : Temps d’attente pour que l’opération d’insertion par lot soit terminée avant d’expirer. La valeur autorisée est timespan et la valeur par défaut est 00:30:00 (30 minutes).
Taille de lot d’écriture : cette propriété contrôle la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter la valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse. La valeur par défaut est 10 000.
Mappage
Pour la configuration de l’onglet Mappage, consultez Configurer vos mappages sous l’onglet Mappage. Le mappage n’est pas pris en charge lorsque la source et la destination sont des données hiérarchiques.
Paramètres
Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.
Résumé du tableau
Le tableau suivant contient plus d’informations sur l’activité de copie dans Azure Cosmos DB for MongoDB.
Informations sur la source
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Connection | Votre connexion au magasin de données source. | < votre connexion Azure Cosmos DB for MongoDB > | Oui | connection |
Sauvegarde de la base de données | Votre base de données que vous utilisez comme source. | < votre base de données > | Oui | database |
Nom de la collection | Nom de la collection Azure Cosmos DB. | < votre collection > | Oui | collection |
Filter | Filtre de sélection utilisant des opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}). | < votre filtre de sélection > | Non | filter |
Méthodes de curseur | La façon dont la requête sous-jacente est exécutée. | • project • sort • limit • skip |
Non | cursorMethods : • project • sort • limit • skip |
Taille du lot | Le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. Dans la plupart des cas, la modification de la taille de lot n’affectera pas l’utilisateur ou l’application. Azure Cosmos DB limite la taille de chaque lot à 40 Mo, qui est la somme de la taille Batch Size du nombre de documents. Par conséquent, diminuez cette valeur si la taille de votre document est trop grande. | < taille de votre lot d’écriture > (la valeur par défaut est 100) |
Non | batchSize |
Colonnes supplémentaires | Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. | • Nom • Valeur |
Non | additionalColumns : • nom • valeur |
Informations de destination
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Connection | Votre connexion au magasin de données de destination. | < votre connexion Azure Cosmos DB for MongoDB > | Oui | connection |
Sauvegarde de la base de données | Votre base de données que vous utilisez comme destination. | < votre base de données > | Oui | database |
Nom de la collection | Nom de la collection Azure Cosmos DB. | < votre collection > | Oui | collection |
Comportement d’écriture | Décrit comment écrire des données dans Azure Cosmos DB for MongoDB. Les valeurs autorisées sont : insert et Upsert. Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même _id existe déjà ; sinon, le document est inséré.Remarque : le service génère automatiquement un _id pour un document si aucun _id n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu. |
• Insert (par défaut) • Upsert |
Non | writeBehavior : • insert • upsert |
Délai d’expiration du lot d’écriture | Temps d’attente pour que l’opération d’insertion de lot soit terminée avant d’expirer. | intervalle de temps (la valeur par défaut est 00:30:00 – 30 minutes) |
Non | writeBatchTimeout |
Taille de lot d’écriture | Permet de contrôler la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter cette valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse. | < taille de votre lot d’écriture > (la valeur par défaut est 10 000) |
Non | writeBatchSize |