Partager via


Configurer Azure Cosmos DB for MongoDB dans une activité de copie

Cet article explique comment utiliser l’activité de copie dans les pipelines de données pour copier des données depuis et vers Azure Cosmos DB for MongoDB.

Configuration prise en charge

Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.

Général

Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .

Source

Accédez à l’onglet Source pour configurer votre source d’activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.

Capture d'écran montrant l'onglet source et la liste des propriétés.

Les propriétés suivantes sont requises :

  • Connexion : sélectionnez une connexion Azure Cosmos DB for MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion Azure Cosmos DB for MongoDB en sélectionnant Plus au bas de la liste des connexions.
  • Base de données : sélectionnez votre base de données dans la liste déroulante.
  • Nom de la collection : spécifiez le nom de la collection Azure Cosmos DB. Vous pouvez sélectionner une collection dans la liste déroulante.

Sous Avancé, vous pouvez spécifier les champs suivants :

  • Filtre : permet de spécifier le filtre de sélection en tirant parti d’opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}).
  • Méthodes de curseur : sélectionnez + Nouveau pour spécifier la façon dont la requête sous-jacente est exécutée. Les méthodes d’exécution de la requête sont les suivantes :
    • projet : spécifie les champs à retourner dans les documents pour la projection. Pour retourner tous les champs dans les documents correspondants, omettez ce paramètre.
    • sort : spécifie l’ordre dans lequel la requête retourne les documents correspondants. Pour plus d’informations, accédez à cursor.sort().
    • limit : spécifie le nombre maximal de documents retournés par le serveur. Pour plus d’informations, accédez à cursor.limit().
    • skip : spécifie le nombre de documents à ignorer, et à partir de quel endroit MongoDB commence à retourner des résultats. Pour plus d’informations, accédez à cursor.skip().
  • Taille de lot : spécifie le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. Dans la plupart des cas, la modification de la taille de lot n’affectera pas l’utilisateur ou l’application. Azure Cosmos DB limite la taille de chaque lot à 40 Mo, qui est la somme de la taille Batch Size du nombre de documents. Par conséquent, diminuez cette valeur si la taille de votre document est trop grande. La valeur par défaut est 100.
  • Colonnes supplémentaires: Ajoutez des colonnes de données supplémentaires pour stocker le chemin relatif ou la valeur statique des fichiers sources. L'expression est prise en charge pour ce dernier.

Destination

Accédez à l’onglet Destination pour configurer la destination de votre activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.

Capture d’écran montrant l’onglet Destination et la liste des propriétés.

Les propriétés suivantes sont requises :

  • Connexion : sélectionnez une connexion Azure Cosmos DB for MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion Azure Cosmos DB for MongoDB en sélectionnant Plus au bas de la liste des connexions.
  • Base de données : sélectionnez votre base de données dans la liste déroulante.
  • Nom de la collection : spécifiez le nom de la collection Azure Cosmos DB. Vous pouvez sélectionner une collection dans la liste déroulante.

Sous Avancé, vous pouvez spécifier les champs suivants :

  • Comportement d’écriture : décrit comment écrire des données dans Azure Cosmos DB for MongoDB. Les valeurs autorisées sont : insert et Upsert.

    Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même _id existe déjà ; sinon, le document est inséré.

    Remarque

    Le service génère automatiquement un _id pour un document si aucun _id n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu.

  • Délai d'attente du lot d'écriture  : Temps d’attente pour que l’opération d’insertion par lot soit terminée avant d’expirer. La valeur autorisée est timespan et la valeur par défaut est 00:30:00 (30 minutes).

  • Taille de lot d’écriture : cette propriété contrôle la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter la valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse. La valeur par défaut est 10 000.

Mappage

Pour la configuration de l’onglet Mappage, consultez Configurer vos mappages sous l’onglet Mappage. Le mappage n’est pas pris en charge lorsque la source et la destination sont des données hiérarchiques.

Paramètres

Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.

Résumé du tableau

Le tableau suivant contient plus d’informations sur l’activité de copie dans Azure Cosmos DB for MongoDB.

Informations sur la source

Nom Description Valeur Obligatoire Propriété de script JSON
Connection Votre connexion au magasin de données source. < votre connexion Azure Cosmos DB for MongoDB > Oui connection
Sauvegarde de la base de données Votre base de données que vous utilisez comme source. < votre base de données > Oui database
Nom de la collection Nom de la collection Azure Cosmos DB. < votre collection > Oui collection
Filter Filtre de sélection utilisant des opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}). < votre filtre de sélection > Non filter
Méthodes de curseur La façon dont la requête sous-jacente est exécutée. project
sort
limit
skip
Non cursorMethods :
• project
• sort
• limit
• skip
Taille du lot Le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. Dans la plupart des cas, la modification de la taille de lot n’affectera pas l’utilisateur ou l’application. Azure Cosmos DB limite la taille de chaque lot à 40 Mo, qui est la somme de la taille Batch Size du nombre de documents. Par conséquent, diminuez cette valeur si la taille de votre document est trop grande. < taille de votre lot d’écriture >
(la valeur par défaut est 100)
Non batchSize
Colonnes supplémentaires Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. • Nom
• Valeur
Non additionalColumns :
• nom
• valeur

Informations de destination

Nom Description Valeur Obligatoire Propriété de script JSON
Connection Votre connexion au magasin de données de destination. < votre connexion Azure Cosmos DB for MongoDB > Oui connection
Sauvegarde de la base de données Votre base de données que vous utilisez comme destination. < votre base de données > Oui database
Nom de la collection Nom de la collection Azure Cosmos DB. < votre collection > Oui collection
Comportement d’écriture Décrit comment écrire des données dans Azure Cosmos DB for MongoDB. Les valeurs autorisées sont : insert et Upsert.

Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même _id existe déjà ; sinon, le document est inséré.

Remarque : le service génère automatiquement un _id pour un document si aucun _id n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu.
Insert (par défaut)
Upsert
Non writeBehavior :
• insert
• upsert
Délai d’expiration du lot d’écriture Temps d’attente pour que l’opération d’insertion de lot soit terminée avant d’expirer. intervalle de temps
(la valeur par défaut est 00:30:00 – 30 minutes)
Non writeBatchTimeout
Taille de lot d’écriture Permet de contrôler la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter cette valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse. < taille de votre lot d’écriture >
(la valeur par défaut est 10 000)
Non writeBatchSize