Partage via


Configurer MongoDB dans une activité de copie

Cet article explique comment utiliser l’activité de copie dans un pipeline de données pour copier des données depuis et vers MongoDB.

Configuration prise en charge

Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.

Général

Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .

Source

Accédez à l’onglet Source pour configurer votre source d’activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.

Screenshot showing source tab and the list of properties.

Les propriétés suivantes sont requises :

  • Type de magasin de données : sélectionnez Externe.
  • Connexion : sélectionnez une connexion MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion MongoDB en sélectionnant Nouveau.
  • Base de données : sélectionnez votre base de données dans la liste déroulante.
  • Nom de la collection : spécifiez le nom de la collection dans la base de données MongoDB. Vous pouvez sélectionner la collection dans la liste déroulante, ou sélectionner Modifier pour l’entrer manuellement.

Sous Avancé, vous pouvez spécifier les champs suivants :

  • Filtre : permet de spécifier le filtre de sélection en tirant parti d’opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}).
  • Méthodes de curseur : sélectionnez + Nouveau pour spécifier la façon dont la requête sous-jacente est exécutée. Les méthodes d’exécution de la requête sont les suivantes :
    • projet : spécifie les champs à retourner dans les documents pour la projection. Pour retourner tous les champs dans les documents correspondants, omettez ce paramètre.
    • sort : spécifie l’ordre dans lequel la requête retourne les documents correspondants. Pour plus d’informations, accédez à cursor.sort().
    • limit : spécifie le nombre maximal de documents retournés par le serveur. Pour plus d’informations, accédez à cursor.limit().
    • skip : spécifie le nombre de documents à ignorer, et à partir de quel endroit MongoDB commence à retourner des résultats. Pour plus d’informations, accédez à cursor.skip().
  • Taille de lot : spécifie le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. Dans la plupart des cas, la modification de la taille de lot n’affectera pas l’utilisateur ou l’application.
  • Colonnes supplémentaires : ajoutez des colonnes de données supplémentaires au chemin d’accès relatif ou à la valeur statique des fichiers sources du magasin. L'expression est prise en charge pour ce dernier.

Destination

Accédez à l’onglet Destination pour configurer la destination de votre activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.

Screenshot showing destination tab and the list of properties.

Les propriétés suivantes sont requises :

  • Type de magasin de données : sélectionnez Externe.
  • Connexion : sélectionnez une connexion MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion MongoDB en sélectionnant Nouveau.
  • Base de données : sélectionnez votre base de données dans la liste déroulante.
  • Nom de la collection : spécifiez le nom de la collection dans la base de données MongoDB. Vous pouvez sélectionner la collection dans la liste déroulante, ou sélectionner Modifier pour l’entrer manuellement.

Sous Avancé, vous pouvez spécifier les champs suivants :

  • Comportement d’écriture : décrit comment écrire des données dans MongoDB. Les valeurs autorisées sont insert et Upsert.

    Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même _id existe déjà ; sinon, le document est inséré.

    Remarque

    Le service génère automatiquement un _id pour un document si aucun _id n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu.

  • Délai d'attente du lot d'écriture  : Temps d’attente pour que l’opération d’insertion par lot soit terminée avant d’expirer. La valeur autorisée est timespan.

  • Taille de lot d’écriture : cette propriété contrôle la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter la valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse.

Mappage

Pour la configuration de l’onglet Mappage, consultez Configurer vos mappages sous l’onglet Mappage. Le mappage n’est pas pris en charge lorsque la source et la destination sont des données hiérarchiques.

Paramètres

Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.

Résumé du tableau

Le tableau suivant contient plus d’informations sur l’activité de copie dans MongoDB.

Informations sur la source

Nom Description Valeur Obligatoire Propriété de script JSON
Type de banque de données Votre type de magasin de données. Externe Oui /
Connection Votre connexion au magasin de données source. < votre connexion MongoDB > Oui connection
Sauvegarde de la base de données Votre base de données que vous utilisez comme source. < votre base de données > Oui database
Nom de la collection Nom de la collection dans la base de données MongoDB. < votre collection > Oui collection
Filter Filtre de sélection utilisant des opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}). < votre filtre de sélection > Non filter
Méthodes de curseur La façon dont la requête sous-jacente est exécutée. project
sort
limit
skip
Non cursorMethods :
• project
• sort
• limit
• skip
Taille du lot Le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. < taille de votre lot d’écriture >
(la valeur par défaut est 100)
Non batchSize
Colonnes supplémentaires Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. • Name
• Valeur
Non additionalColumns :
• nom
• valeur

Informations de destination

Nom Description Valeur Obligatoire Propriété de script JSON
Type de banque de données Votre type de magasin de données. Externe Oui /
Connection Votre connexion au magasin de données de destination. < votre connexion MongoDB > Oui connection
Sauvegarde de la base de données Votre base de données que vous utilisez comme destination. < votre base de données > Oui database
Nom de la collection Nom de la collection dans la base de données MongoDB. < votre collection > Oui collection
Comportement d’écriture Décrit comment écrire des données dans MongoDB. Les valeurs autorisées sont insert et Upsert.

Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même _id existe déjà ; sinon, le document est inséré.

Remarque : le service génère automatiquement un _id pour un document si aucun _id n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu.
Insert (par défaut)
Upsert
Non writeBehavior :
• insert
• upsert
Délai d’expiration du lot d’écriture Temps d’attente pour que l’opération d’insertion de lot soit terminée avant d’expirer. intervalle de temps
(la valeur par défaut est 00:30:00 – 30 minutes)
Non writeBatchTimeout
Taille de lot d’écriture Permet de contrôler la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter cette valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse. < taille de votre lot d’écriture > Non writeBatchSize