Cuándo usar Azure Data Factory
En esta unidad, se analiza cómo puede determinar si Azure Data Factory es una solución de integración de datos adecuada para la organización. Se evalúa Azure Data Factory con respecto a los criterios siguientes:
- Requisitos de integración de datos
- Recursos de programación
- Compatibilidad con varios orígenes de datos
- Infraestructura sin servidor
Criterios de decisión
Para determinar si debe usar Azure Data Factory, use los criterios descritos en la tabla siguiente.
Criterios | Análisis |
---|---|
¿Necesita la integración de los datos? | Si la organización trabaja con macrodatos o es una organización tradicional de almacenamiento de datos relacionales, es posible que le interese una solución de integración de datos. |
¿Tiene los recursos de programación necesarios? | No todos los usuarios que trabajan con datos tienen experiencia en programación. Es posible que algunos prefieran trabajar con herramientas gráficas que proporcionan visualizaciones para facilitar la creación de las tareas que funcionan con los datos de origen. |
¿Tiene que trabajar con varios orígenes de datos? | Es posible que algunas organizaciones almacenen sus datos sin procesar en diferentes sistemas, tanto locales como basados en la nube. Una solución de análisis de datos debe poder conectarse con facilidad a muchos orígenes de datos. |
¿Puede crear, administrar y mantener componentes de integración de datos independientes? | Sin un servicio administrado para el análisis de datos, las empresas deben crear componentes de movimiento de datos personalizados. Como alternativa, es posible que creen servicios personalizados para integrar sus orígenes de datos y su procesamiento. La integración y el mantenimiento de estos sistemas puede ser costoso y difícil. Además, no todos estos sistemas tienen la supervisión, las alertas y los controles que ofrece un servicio totalmente administrado. |
Aplicación de los criterios
Revise las preguntas siguientes cuando considere Azure Data Factory como solución de integración de datos.
¿Necesita la integración de los datos?
Si la organización es pequeña y trabaja con orígenes de datos limitados, es posible que no necesite ningún servicio de integración de datos. Pero si la organización trabaja con macrodatos o es una organización tradicional de almacenamiento de datos relacionales, es posible que se beneficie de una solución de integración de datos. Tenga en cuenta lo siguiente:
- Las organizaciones de macrodatos se basan en tecnologías para controlar grandes cantidades de datos diversos. Para ellos, Azure Data Factory proporciona una forma de crear y ejecutar canalizaciones en la nube. Estas canalizaciones pueden acceder a servicios de datos locales y en la nube. Estas canalizaciones normalmente funcionan con tecnologías como Azure Synapse Analytics, Azure Blobs y Azure Data Lake. También Azure HDInsight, Azure Databricks y Azure Machine Learning.
- Las organizaciones de almacenamiento de datos relacionales suelen basarse en tecnologías como SQL Server. SQL Server Integration Services (SSIS) se usa a menudo para crear paquetes SSIS. Para este tipo de organizaciones, Azure Data Factory les ofrece la capacidad de ejecutar paquetes SSIS en Azure, lo que les permite acceder a servicios de datos locales y en la nube.
¿Tiene los recursos de programación necesarios?
Si la organización carece de los recursos de programación necesarios para crear las actividades necesarias, considere la posibilidad de Azure Data Factory. Azure Data Factory proporciona un proceso de poco código o sin código para trabajar con orígenes de datos y las actividades relacionadas. Por ejemplo, la herramienta de creación y supervisión de Azure Data Factory le permite crear canalizaciones gráficamente arrastrando y colocando actividades sobre una superficie de diseño. En la captura de pantalla siguiente se muestra la interfaz, donde un ingeniero de datos crea una canalización con varias actividades:
¿Tiene que trabajar con varios orígenes de datos?
Si la organización tiene un requisito para acceder a los datos en varias ubicaciones y desde varios orígenes, debe considerar una solución de integración de datos que proporcione esta compatibilidad. Azure Data Factory usa conectores para integrarse con orígenes de datos dispares. Actualmente se admiten más de 90 orígenes de datos. Además, Azure Data Factory admite opciones extensibles para acceder a otros orígenes de datos.
¿Puede crear, administrar y mantener componentes de integración de datos independientes?
Puede ser complejo y lento crear y administrar una solución de integración de datos propia basada en servidor. Sin embargo, si la ejecución de este tipo de solución en el centro de datos de la organización le funciona, no es necesario tener en cuenta Azure Data Factory. Pero hay ventajas en el uso de una solución sin servidor totalmente administrada para la integración de datos. Entre las ventajas clave se incluyen las siguientes:
- La capacidad de escalar según sea necesario para admitir más cargas de trabajo.
- No es necesario implementar, configurar y mantener servidores para hospedar las cargas de trabajo de integración de datos.
Resumen
En resumen, considere la posibilidad de Azure Data Factory cuando cumpla uno o varios de los criterios siguientes:
- Los ingenieros de datos carecen del tiempo necesario para crear código para realizar tareas de análisis de datos.
- Tiene varios orígenes de datos en diferentes ubicaciones.
- Quiere aprovechar las ventajas de una solución totalmente administrada basada en la nube.