Configuración de Azure Cosmos DB for NoSQL en una actividad de copia
En este artículo se describe cómo usar la actividad de copia en una canalización de datos para copiar datos desde y hacia Azure Cosmos DB for NoSQL.
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.
Origen
Las siguientes propiedades son compatibles con Azure Cosmos DB for NoSQL en la pestaña Origen de una actividad de copia.
Se requieren las siguientes tres propiedades:
- Tipo de banco de datos : seleccione Externo.
- Conexión: seleccione una conexión de Azure Cosmos DB for NoSQL en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Azure Cosmos DB for NoSQL seleccionando Nuevo.
- Contenedor: seleccione el contenedor que quiere usar. Seleccione Editar para escribir manualmente el nombre del contenedor.
En Avanzado, puede especificar los campos siguientes:
Usar consulta: puede elegir Tabla o Consulta como consulta de uso. La siguiente lista describe la configuración de cada opción.
Tabla: lee los datos de la tabla especificada en Tabla.
Consulta: especifica la consulta de Azure Cosmos DB para leer datos.
Tamaño de página: número de documentos por página del resultado de la consulta. El valor predeterminado es "-1", lo que significa usar el tamaño de página dinámica del servicio hasta 1000.
Detectar datetime: determina si se debe detectar datetime a partir de los valores de cadena de los documentos. Los valores permitidos son: True (valor predeterminado) y False.
Regiones preferidas: lista preferida de regiones a las que se conectará cuando recupere los datos de Azure Cosmos DB. Seleccione una región preferida en la lista desplegable después de seleccionar Nuevo.
Columnas adicionales: añada columnas de datos adicionales para almacenar la ruta relativa o el valor estático de los archivos de origen. La expresión se admite para este último. Para más información, vaya a Agregar columnas adicionales durante la copia.
Destination
Las siguientes propiedades son compatibles con Azure Cosmos DB for NoSQL en la pestaña Destino de una actividad de copia.
Se requieren las siguientes tres propiedades:
- Tipo de banco de datos : seleccione Externo.
- Conexión: seleccione una conexión de Azure Cosmos DB for NoSQL en la lista de conexiones.
- Contenedor: seleccione Examinar para elegir el archivo que desea copiar o rellene la ruta manualmente.
En Avanzado, puede especificar los campos siguientes:
Comportamiento de escritura: define el comportamiento de escritura cuando el destino son archivos de un almacén de datos basado en archivos. Puede elegir Agregar contenido dinámico, Insertar o Upsert en la lista desplegable.
Agregar contenido dinámico: abra el panel Agregar contenido dinámico. Así se abre el generador de expresiones, donde puede compilar expresiones a partir de variables del sistema admitidas, salidas de actividad, funciones y variables o parámetros especificados por el usuario. Para más información sobre el lenguaje de expresiones, vaya a Expresiones y funciones.
Insertar: elija esta opción si los datos de origen tienen inserciones.
Upsert: el comportamiento de upsert consiste en reemplazar el documento si ya existe un documento con el mismo identificador; en caso contrario, inserta el documento.
Tiempo de espera de escritura por lotes: tiempo de espera para que la operación de inserción por lotes se complete antes de que se agote el tiempo de espera. Los valores permitidos son
Timespan
. Un ejemplo es 00:30:00 (30 minutos).Tamaño del lote de escritura: especifique el número de filas a insertar en la tabla SQL por lote. El valor permitido es un entero (número de filas). De manera predeterminada, el servicio determina dinámicamente el tamaño adecuado del lote en función del tamaño de fila.
Máximo de conexiones simultáneas: límite superior de conexiones simultáneas establecidas con el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas.
Deshabilitar el análisis de métricas de rendimiento: la configuración controla la recopilación de métricas, como DTU, DWU, RU, etc., para la optimización del rendimiento de la copia y las recomendaciones. Si le preocupa este comportamiento, desactive esta característica.
Asignación
Para la configuración de la pestañaAsignación, vaya a Configurar las asignaciones en la ficha Asignación .
Configuración
Para la configuración de la pestaña Parámetros, vaya a Configurar los otros parámetros en parámetros de pestaña.
Resumen de tabla
Las tablas siguientes contienen más información sobre la actividad de copia en Azure Cosmos DB for NoSQL.
Tabla de origen
Nombre | Descripción | Value | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Tipo de almacén de datos | El tipo de almacén de datos. | Externo | Sí | / |
Connection | La conexión al almacén de datos de origen. | <su conexión> | Sí | conexión |
Contenedor | Contenedor de los datos de origen. | <contenedor del origen> | Sí | contenedor fileName |
Usar consulta | Puede elegir Tabla o Consulta como consulta de uso. | • Tabla • Consulta |
No | type |
Tamaño de página | Número de documentos por página del resultado de la consulta. El valor predeterminado es "-1", lo que significa usar el tamaño de página dinámica del servicio hasta 1000. | <el tamaño de página> | No | pageSize |
Eliminar datetime | Los archivos del almacén de datos de origen se eliminarán justo después de moverse al almacén de destino. La eliminación del archivo es por archivo, por lo que cuando falla una actividad de copia, observará que algunos archivos ya se han copiado al destino y eliminado del origen, mientras que otros siguen en el almacén de origen. | Selección o anulación de selección | No | detectDatetime |
Regiones preferidas | Lista preferida de regiones a las que se conectará cuando recupere los datos de Azure Cosmos DB. Seleccione una región preferida en la lista desplegable después de seleccionar Nuevo. | <sus regiones preferidas> | No | preferredRegions |
Columnas adicionales | Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. Para más información, vaya a Agregar columnas adicionales durante la copia. | < número máximo de conexiones simultáneas > | No | additionalColumns |
Tabla de destino
Nombre | Descripción | Value | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Tipo de almacén de datos | El tipo de almacén de datos. | Externo | Sí | / |
Connection | La conexión al almacén de datos de destino. | <su conexión> | Sí | conexión |
Contenedor | Contenedor de los datos de destino. | <contenedor de origen> | Sí | contenedor fileName |
Comportamiento de escritura | Describe cómo escribir datos en Azure Cosmos DB. Valores permitidos: insert y upsert. El comportamiento de upsert consiste en reemplazar el documento si ya existe un documento con el mismo identificador; en caso contrario, inserta el documento. | • Agregar contenido dinámico • Insertar • Upsert |
No | writeBehavior |
Tiempo de espera de escritura por lotes | Tiempo de espera para que la operación de inserción por lotes se complete antes de que se agote el tiempo de espera. Los valores permitidos son intervalos de tiempo. Un ejemplo es 00:30:00 (30 minutos). | timespan | No | writeBatchTimeout |
Tamaño del lote de escritura | Número de filas que se va a insertar en la tabla SQL por lote. El valor que se permite es un entero (número de filas). De manera predeterminada, el servicio determina dinámicamente el tamaño adecuado del lote en función del tamaño de fila. | <número de filas > (entero) |
No | writeBatchSize |
Número máximo de conexiones simultáneas | Número máximo de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas. | < número máximo de conexiones simultáneas > | No | maxConcurrentConnections |
Desactivar análisis de métricas de rendimiento | Esta configuración controla la recopilación de métricas como DTU, DWU, RU, etc. para la optimización del rendimiento de la copia y las recomendaciones. Si le preocupa este comportamiento, desactive esta característica. | Selección o anulación de selección | No | disableMetricsCollection |