Configuración de Azure Cosmos DB for MongoDB en una actividad de copia
En este artículo se describe cómo usar la actividad de copia en una canalización de datos para copiar datos desde y hacia Azure Cosmos DB for MongoDB.
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.
Origen
Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.
Las siguientes propiedades son obligatorias:
- Conexión: seleccione una conexión de Azure Cosmos DB for MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Azure Cosmos DB for MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
- Base de datos: Seleccione su base de datos en la lista desplegable.
- Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección de la lista desplegable.
En Avanzado, puede especificar los campos siguientes:
- Filtro: Especifica el filtro de selección mediante operadores de consulta. Para que se devuelvan todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}).
- Métodos de cursor: Seleccionar + Nuevo para especificar la forma en que se ejecuta la consulta subyacente. Las formas de ejecutar la consulta son:
- proyecto: Especifica los campos a devolver en los documentos para su proyección. Para devolver todos los campos en los documentos coincidentes, omita este parámetro.
- ordenar: Especifica el orden en que la consulta devuelve los documentos coincidentes. Vaya a cursor.sort() para obtener más información.
- límite: Especifica el número máximo de documentos que devuelve el servidor. Vaya a cursor.limit() para obtener más información.
- omitir: Especifica el número de documentos que se omitirán y desde donde empieza MongoDB a devolver resultados. Vaya a cursor.skip() para obtener más información.
- Tamaño de lote: Especifica el número de documentos a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita el tamaño de cada lote a 40 MB como máximo, que es la suma de los números de Tamaño de lote del tamaño de los documentos, por lo que debe reducir este valor si el tamaño del documento es mayor. El valor predeterminado es 100.
- Columnas adicionales: añada columnas de datos adicionales para almacenar la ruta relativa o el valor estático de los archivos de origen. La expresión se admite para este último.
Destination
Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.
Se requieren las siguientes propiedades:
- Conexión: seleccione una conexión de Azure Cosmos DB for MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Azure Cosmos DB for MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
- Base de datos: Seleccione su base de datos en la lista desplegable.
- Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección de la lista desplegable.
En Avanzado, puede especificar los campos siguientes:
Comportamiento de escritura: Describe cómo escribir datos en Azure Cosmos DB for MongoDB. Valores permitidos: Insert y Upsert.
El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo
_id
; en caso contrario, inserta el documento.Nota:
El servicio genera automáticamente un
_id
para un documento si no se especifica un_id
en el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione como es debido, su documento tiene un Id.Tiempo de espera de escritura por lotes: especifique el tiempo que se concede a la operación de inserción por lotes para que finalice antes de que se agote el tiempo de espera. El valor permitido es timespan y el valor predeterminado es 00:30:00 (30 minutos).
Tamaño del lote de escritura: Esta propiedad controla el tamaño de los documentos a escribir en cada lote. Puede intentar aumentar el valor para mejorar el rendimiento y disminuirlo si el tamaño de su documento es grande. El valor predeterminado es 10 000.
Asignación
Para configurar la pestaña Asignación, consulte Configurar las asignaciones en la pestaña Asignación. La asignación no se admite cuando tanto el origen como el destino son datos jerárquicos.
Configuración
Para la configuración de la pestañaConfiguración, vaya a Configurar los otros parámetros en la ficha Configuración .
Resumen de tabla
La siguiente tabla contiene más información sobre la actividad de copia en Azure Cosmos DB for MongoDB.
Información de origen
Nombre | Descripción | Value | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Connection | La conexión al almacén de datos de origen. | < su conexión para Azure Cosmos DB for MongoDB > | Sí | conexión |
Base de datos | La base de datos que usa como origen. | < su base de datos > | Sí | database |
Nombre de colección | Nombre de la colección de Azure Cosmos DB. | < su colección > | Sí | collection |
Filter | El filtro de selección mediante operadores de consulta. Para que se devuelvan todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). | < su filtro de selección > | No | filtrar |
Métodos de cursor | La forma en que se ejecuta la consulta subyacente. | • project • ordenación • límite • omitir |
No | cursorMethods: • project • ordenación • límite • omitir |
Tamaño de lote | El número de documentos a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita el tamaño de cada lote a 40 MB como máximo, que es la suma de los números de Tamaño de lote del tamaño de los documentos, por lo que debe reducir este valor si el tamaño del documento es mayor. | < su tamaño del lote de escritura > (el valor predeterminado es 100) |
No | batchSize |
Columnas adicionales | Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. | • Name • Valor |
No | additionalColumns: • nombre • valor |
Información de destino
Nombre | Descripción | Value | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Connection | La conexión al almacén de datos de destino. | < su conexión para Azure Cosmos DB for MongoDB > | Sí | conexión |
Base de datos | La base de datos que se usa como destino. | < su base de datos > | Sí | database |
Nombre de colección | Nombre de la colección de Azure Cosmos DB. | < su colección > | Sí | collection |
Comportamiento de escritura | Describe cómo escribir datos en Azure Cosmos DB for MongoDB. Valores permitidos: Insert y Upsert. El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; en caso contrario, inserta el documento.Nota: El servicio genera automáticamente un _id para un documento si no se especifica un _id en el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione como es debido, su documento tiene un Id. |
• Insertar (predeterminado) • Upsert |
No | writeBehavior: • insert • upsert |
Tiempo de espera de escritura por lotes | Tiempo que se concede a la operación de inserción por lotes para que finalice antes de que se agote el tiempo de espera. | timespan (El valor predeterminado es 00:30:00 [30 minutos]). |
No | writeBatchTimeout |
Tamaño del lote de escritura | Controla el tamaño de los documentos a escribir en cada lote. Puede intentar aumentar este valor para mejorar el rendimiento y disminuirlo si el tamaño de su documento es grande. | < su tamaño del lote de escritura > (el valor predeterminado es 10 000) |
No | writeBatchSize |