Compartir vía


¿Qué opciones hay para migrar de MongoDB a Azure Cosmos DB for MongoDB basado en núcleo virtual?

En este documento se describen las distintas opciones para realizar migraciones mediante lift-and-shift de las cargas de trabajo de MongoDB a la oferta de Azure Cosmos DB for MongoDB basado en núcleo virtual.

Las migraciones pueden hacerse de dos formas:

  • Migración sin conexión: una copia masiva basada en instantáneas del origen al destino. Nuevos datos agregados, actualizados o eliminados en el origen después de que la instantánea no se copie en el destino. El tiempo de inactividad de la aplicación necesario depende del tiempo necesario para que se complete la actividad de copia masiva.

  • Migración en línea: aparte de la actividad de copia de datos masiva realizada en la migración sin conexión, un flujo de cambios supervisa todas las incorporaciones, actualizaciones y eliminaciones. Una vez completada la copia de datos masiva, los datos del flujo de cambios se copian en el destino para asegurarse de que todas las actualizaciones realizadas durante el proceso de migración también se transfieren al destino. El tiempo de inactividad de la aplicación necesario es mínimo.

Azure Data Studio (online)

La extensión de migración de MongoDB para Azure Data Studio es la herramienta preferida para migrar las cargas de trabajo de MongoDB a Azure Cosmos DB for MongoDB basado en núcleo virtual.

El proceso de migración consta de dos fases:

  • Evaluación previa a la migración: una evaluación del patrimonio de datos actual de MongoDB para determinar si hay incompatibilidades.
  • Migración: la operación de migración mediante servicios administrados por Azure.

Evaluación previa a la migración

La evaluación implica averiguar si usa las características y la sintaxis que se admiten. El propósito de esta fase es identificar las incompatibilidades o advertencias que existen en la solución actual de MongoDB. Debe resolver los problemas encontrados en los resultados de la evaluación antes de continuar con el proceso de migración.

Sugerencia

Se recomienda revisar en detalle las características y la sintaxis admitidas y realizar una prueba de concepto antes de la migración real.

Migración

Use la interfaz gráfica de usuario para administrar todo el proceso de migración de principio a fin. La migración se inicia en Azure Data Studio, pero se ejecuta en la nube en recursos administrados por Azure.

Herramientas nativas de MongoDB (sin conexión)

Puede usar las herramientas nativas de MongoDB, como mongodump/mongorestore o mongoexport/mongoimport para migrar conjuntos de datos sin conexión (sin replicar cambios activos) a la oferta de Azure Cosmos DB for MongoDB basado en núcleo virtual.

Escenario Herramienta nativa de MongoDB
Mover un subconjunto de datos de la base de datos (basados en JSON/CSV) mongoexport/mongoimport
Mover toda la base de datos (basada en BSON) mongodump/mongorestore
  • mongoexport/mongoimport es el mejor par de herramientas de migración para migrar un subconjunto de la base de datos de MongoDB.
    • mongoexport exporta los datos existentes a un archivo JSON o CSV legible por el usuario. mongoexport toma un argumento que especifica el subconjunto de los datos existentes que se van a exportar.
    • mongoimport abre un archivo JSON o CSV e inserta el contenido en la instancia de la base de datos de destino (en este caso Azure Cosmos DB for MongoDB basado en núcleo virtual).
    • JSON y CSV no son formatos compactos; podría incurrir en demasiados cargos de red, ya que mongoimport envía datos a Azure Cosmos DB for MongoDB basado en núcleo virtual.
  • mongodump/mongorestore es el mejor par de herramientas de migración para migrar toda la base de datos de MongoDB. El formato BSON compacto hace un uso más eficaz de los recursos de red cuando los datos se insertan en Azure Cosmos DB for MongoDB basado en núcleo virtual.
    • mongodump exporta los datos existentes como un archivo BSON.
    • mongorestore importa el volcado del archivo BSON en Azure Cosmos DB for MongoDB basado en núcleo virtual.

Nota:

Las herramientas nativas de MongoDB solo pueden mover datos tan rápido como permita el hardware del host.

Migración de datos mediante Azure Databricks (sin conexión o en línea)

La migración mediante Azure Databricks ofrece un control total de la velocidad de migración y la transformación de datos. Este método también puede admitir grandes conjuntos de datos con un tamaño de TB. La utilidad de migración de Spark funciona como un trabajo en Databricks.

Esta herramienta admite los siguientes orígenes de MongoDB:

  • Máquina virtual de MongoDB
  • MongoDB Atlas
  • AWS DocumentDB
  • RU de MongoDB de Azure Cosmos DB (solo sin conexión)

Regístrese para la migración de Spark de Azure Cosmos DB for MongoDB para obtener acceso al repositorio de GitHub de Spark Migration Tool. El repositorio ofrece instrucciones detalladas y paso a paso para migrar las cargas de trabajo de varios orígenes de Mongo a Azure Cosmos DB for MongoDB basado en núcleo virtual.