Compartir vía


Configuración de Azure Cosmos DB for MongoDB en una actividad de copia

En este artículo se describe cómo usar la actividad de copia en una canalización de datos para copiar datos desde y hacia Azure Cosmos DB for MongoDB.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General

Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.

Origen

Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Captura de pantalla que muestra la pestaña de origen y la lista de propiedades.

Las siguientes propiedades son obligatorias:

  • Conexión: seleccione una conexión de Azure Cosmos DB for MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Azure Cosmos DB for MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
  • Base de datos: Seleccione su base de datos en la lista desplegable.
  • Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección de la lista desplegable.

En Avanzado, puede especificar los campos siguientes:

  • Filtro: Especifica el filtro de selección mediante operadores de consulta. Para que se devuelvan todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}).
  • Métodos de cursor: Seleccionar + Nuevo para especificar la forma en que se ejecuta la consulta subyacente. Las formas de ejecutar la consulta son:
    • proyecto: Especifica los campos a devolver en los documentos para su proyección. Para devolver todos los campos en los documentos coincidentes, omita este parámetro.
    • ordenar: Especifica el orden en que la consulta devuelve los documentos coincidentes. Vaya a cursor.sort() para obtener más información.
    • límite: Especifica el número máximo de documentos que devuelve el servidor. Vaya a cursor.limit() para obtener más información.
    • omitir: Especifica el número de documentos que se omitirán y desde donde empieza MongoDB a devolver resultados. Vaya a cursor.skip() para obtener más información.
  • Tamaño de lote: Especifica el número de documentos a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita el tamaño de cada lote a 40 MB como máximo, que es la suma de los números de Tamaño de lote del tamaño de los documentos, por lo que debe reducir este valor si el tamaño del documento es mayor. El valor predeterminado es 100.
  • Columnas adicionales: añada columnas de datos adicionales para almacenar la ruta relativa o el valor estático de los archivos de origen. La expresión se admite para este último.

Destination

Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Captura de pantalla que muestra la pestaña de destino y la lista de propiedades.

Se requieren las siguientes propiedades:

  • Conexión: seleccione una conexión de Azure Cosmos DB for MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Azure Cosmos DB for MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
  • Base de datos: Seleccione su base de datos en la lista desplegable.
  • Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección de la lista desplegable.

En Avanzado, puede especificar los campos siguientes:

  • Comportamiento de escritura: Describe cómo escribir datos en Azure Cosmos DB for MongoDB. Valores permitidos: Insert y Upsert.

    El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id; en caso contrario, inserta el documento.

    Nota:

    El servicio genera automáticamente un _id para un documento si no se especifica un _id en el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione como es debido, su documento tiene un Id.

  • Tiempo de espera de escritura por lotes: especifique el tiempo que se concede a la operación de inserción por lotes para que finalice antes de que se agote el tiempo de espera. El valor permitido es timespan y el valor predeterminado es 00:30:00 (30 minutos).

  • Tamaño del lote de escritura: Esta propiedad controla el tamaño de los documentos a escribir en cada lote. Puede intentar aumentar el valor para mejorar el rendimiento y disminuirlo si el tamaño de su documento es grande. El valor predeterminado es 10 000.

Asignación

Para configurar la pestaña Asignación, consulte Configurar las asignaciones en la pestaña Asignación. La asignación no se admite cuando tanto el origen como el destino son datos jerárquicos.

Configuración

Para la configuración de la pestañaConfiguración, vaya a Configurar los otros parámetros en la ficha Configuración .

Resumen de tabla

La siguiente tabla contiene más información sobre la actividad de copia en Azure Cosmos DB for MongoDB.

Información de origen

Nombre Descripción Value Obligatorio Propiedad de script JSON
Connection La conexión al almacén de datos de origen. < su conexión para Azure Cosmos DB for MongoDB > conexión
Base de datos La base de datos que usa como origen. < su base de datos > database
Nombre de colección Nombre de la colección de Azure Cosmos DB. < su colección > collection
Filter El filtro de selección mediante operadores de consulta. Para que se devuelvan todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). < su filtro de selección > No filtrar
Métodos de cursor La forma en que se ejecuta la consulta subyacente. project
ordenación
límite
omitir
No cursorMethods:
• project
• ordenación
• límite
• omitir
Tamaño de lote El número de documentos a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita el tamaño de cada lote a 40 MB como máximo, que es la suma de los números de Tamaño de lote del tamaño de los documentos, por lo que debe reducir este valor si el tamaño del documento es mayor. < su tamaño del lote de escritura >
(el valor predeterminado es 100)
No batchSize
Columnas adicionales Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. • Name
• Valor
No additionalColumns:
• nombre
• valor

Información de destino

Nombre Descripción Value Obligatorio Propiedad de script JSON
Connection La conexión al almacén de datos de destino. < su conexión para Azure Cosmos DB for MongoDB > conexión
Base de datos La base de datos que se usa como destino. < su base de datos > database
Nombre de colección Nombre de la colección de Azure Cosmos DB. < su colección > collection
Comportamiento de escritura Describe cómo escribir datos en Azure Cosmos DB for MongoDB. Valores permitidos: Insert y Upsert.

El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id; en caso contrario, inserta el documento.

Nota: El servicio genera automáticamente un _id para un documento si no se especifica un _id en el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione como es debido, su documento tiene un Id.
Insertar (predeterminado)
Upsert
No writeBehavior:
• insert
• upsert
Tiempo de espera de escritura por lotes Tiempo que se concede a la operación de inserción por lotes para que finalice antes de que se agote el tiempo de espera. timespan
(El valor predeterminado es 00:30:00 [30 minutos]).
No writeBatchTimeout
Tamaño del lote de escritura Controla el tamaño de los documentos a escribir en cada lote. Puede intentar aumentar este valor para mejorar el rendimiento y disminuirlo si el tamaño de su documento es grande. < su tamaño del lote de escritura >
(el valor predeterminado es 10 000)
No writeBatchSize