Editar

Compartir vía


Uso de almacenes de datos modernos para pequeñas y medianas empresas

Azure Data Lake
Azure SQL Database
Microsoft Fabric

En este artículo se describen varias maneras en que las pequeñas y medianas empresas pueden modernizar los almacenes de datos heredados y explorar herramientas y funcionalidades de macrodatos, sin necesidad de exceder los presupuestos y conjuntos de aptitudes actuales. Estas soluciones completas de almacenamiento de datos se integran fácilmente con Azure Machine Learning, Servicios de Azure AI, Microsoft Power Platform, Microsoft Dynamics 365 y otras tecnologías de Microsoft. Estas soluciones proporcionan un punto de entrada sencillo a la plataforma de datos de software como servicio (SaaS) totalmente administrada en Microsoft Fabric que puede expandirse a medida que crecen sus necesidades.

Las PYME que usan SQL Server local para soluciones de almacenamiento de datos menores de 500 GB pueden beneficiarse del uso de este patrón. Usan varias herramientas para la ingesta de datos en su solución de almacenamiento de datos, como SQL Server Integration Services (SSIS), SQL Server Analysis Services (SSAS), SQL Server Reporting Services (SSRS), procedimientos almacenados de SQL comunes, herramientas externas de extracción, transformación y carga (ETL) y extracción, carga y transformación (ELT), trabajos de Agente SQL Server y replicación de instantáneas SQL. Las operaciones de sincronización de datos suelen basarse en instantáneas, se realizan una vez al día y no tienen requisitos de informes en tiempo real.

Arquitectura simplificada

Diagrama que muestra una arquitectura de pyme simplificada.

Descargue un archivo Visio de esta arquitectura.

Una oportunidad de modernización conceptual implica la transición de la solución de almacenamiento de datos heredada a una combinación de Azure SQL Database, Azure SQL Managed Instance y Fabric. Esta estrategia garantiza una amplia compatibilidad con las herramientas tradicionales de SQL Server y SQL Client, como SQL Server Management Studio (SSMS). También proporciona opciones de migrar mediante lift-and-shift para los procesos existentes y requiere una mejora mínima para el equipo de soporte técnico. Esta solución sirve como un paso inicial hacia la modernización completa, lo que permite a la organización adoptar completamente un enfoque de lago de datos a medida que el almacén de datos se expande y crece el conjunto de aptitudes del equipo.

Arquitectura

Diagrama que muestra una arquitectura expandida diseñada para satisfacer las necesidades futuras.

Descargue un archivo Visio de esta arquitectura.

Los almacenes de datos de pyme heredados pueden contener varios tipos de datos:

  • Datos no estructurados, como documentos y gráficos.

  • Datos semiestructurados, como registros y archivos CSV, JSON y XML.

  • Datos relacionales estructurados, incluidas las bases de datos que utilizan procedimientos almacenados para actividades de ETL y ELT.

Flujo de datos

El siguiente flujo de datos corresponde al diagrama anterior. Muestra la ingesta del tipo de datos que elija:

  1. Las canalizaciones de datos de Fabric o de Azure Data Factory orquestan la ingesta de datos transaccionales en la solución de almacenamiento de datos.

    • Las canalizaciones orquestan el flujo de bases de datos heredadas migradas o parcialmente refactorizadas y paquetes SSIS en SQL Database y SQL Managed Instance. Puede implementar rápidamente este enfoque de migrar mediante lift-and-shift, lo que garantiza una transición sin problemas de una solución SQL local a un entorno SaaS de Fabric futuro. Puede modernizar las bases de datos de forma incremental después de la migración mediante lift-and-shift.

    • Las canalizaciones pueden pasar datos no estructurados, semiestructurados y estructurados a Azure Data Lake Storage para el almacenamiento y el análisis centralizados con otros orígenes. El uso de este enfoque al fusionar los datos proporciona una ventaja empresarial mayor que volver a colocar los datos en la plataforma.

  2. Use los orígenes de datos de Microsoft Dynamics 365 para crear paneles de inteligencia empresarial (BI) centralizados en conjuntos de datos aumentados mediante las herramientas de análisis sin servidor de Fabric. Puede devolver los datos fusionados y procesados a Dynamics y usarlos para su posterior análisis en Fabric.

  3. Los datos en tiempo real de los orígenes de streaming pueden entrar en el sistema a través de Azure Event Hubs u otras soluciones de streaming. Para los clientes con requisitos de panel en tiempo real, Fabric Real-Time Analytics puede analizar estos datos inmediatamente.

  4. Los datos se pueden ingerir en Fabric OneLake centralizado para un análisis, almacenamiento e informes adicionales mediante accesos directos de Data Lake Storage. Este proceso permite el análisis en contexto y facilita el consumo de bajada.

  5. Las herramientas de análisis sin servidor, como el punto de conexión de SQL Analytics y las funcionalidades de Fabric Spark, están disponibles a petición dentro de Fabric y no requieren ningún recurso aprovisionado. Las herramientas de análisis sin servidor son ideales para:

    • Actividades de ETL y ELT en datos de OneLake.

    • Atender la capa dorada de la arquitectura medallion a los informes de Power BI a través de la característica DirectLake.

    • Exploraciones improvisadas de ciencia de datos en formato T-SQL o Python.

    • Creación temprana de prototipos para entidades de almacenamiento de datos.

Fabric se integra estrechamente con los consumidores potenciales de los conjuntos de datos de varios orígenes, incluidos los informes front-end de Power BI, Machine Learning, Power Apps, Azure Logic Apps, Azure Functions y App Service Web Apps de Azure.

Componentes

  • Fabric es un servicio de análisis que combina la ingeniería de datos, el almacenamiento de datos, la ciencia de datos y las funcionalidades de inteligencia empresarial en tiempo real. En esta solución, las funcionalidades de ingeniería de datos de Fabric proporcionan una plataforma colaborativa para ingenieros de datos, científicos de datos, analistas de datos y profesionales de BI. Este componente clave se basa en motores de proceso sin servidor y ofrece valor empresarial mediante la generación de información distribuida a los clientes.

  • SQL Database y SQL Managed Instance son servicios de base de datos relacionales basados en la nube. SQL Database y SQL Managed Instance usan SSMS para desarrollar y mantener artefactos heredados como procedimientos almacenados. En esta solución, estos servicios hospedan el almacenamiento de datos empresariales y realizan actividades de ETL y ELT mediante procedimientos almacenados o paquetes externos. SQL Database y SQL Managed Instance son entornos de plataforma como servicio (PaaS) que puede usar para cumplir los requisitos de alta disponibilidad y recuperación ante desastres. Asegúrese de elegir la SKU que satisfaga sus requisitos. Para obtener más información, consulte Alta disponibilidad para SQL Database y Alta disponibilidad para SQL Managed Instance.

  • SSMS es un entorno integrado para administrar la infraestructura de SQL que puede usar para desarrollar y mantener artefactos heredados, como procedimientos almacenados.

  • Event Hubs es una plataforma de streaming de datos en tiempo real y un servicio de ingesta de eventos. Event Hubs se integra perfectamente con los servicios de datos de Azure y puede ingerir datos desde cualquier lugar.

Alternativas

  • Puede usar Azure IoT Hub para reemplazar o complementar Event Hubs. Elija su solución según el origen de los datos de streaming y de si necesita clonación y comunicación bidireccional con los dispositivos de informes.

  • Puede usar canalizaciones de datos de Fabric en lugar de canalizaciones de Data Factory para la integración de datos. La decisión dependerá de varios factores. Para obtener más información, consulte Pasar de Azure Data Factory a Data Factory en Fabric.

  • Puede usar Fabric Warehouse en lugar de SQL Database o SQL Managed Instance para almacenar datos empresariales. En este artículo se da prioridad al tiempo de comercialización para los clientes que desean modernizar sus almacenes de datos. Para obtener más información sobre las opciones del almacén de datos para Fabric, consulte Guía de decisión de Fabric.

Detalles del escenario

Cuando las pyme modernizan sus almacenes de datos locales para la nube, pueden adoptar herramientas de macrodatos para una escalabilidad futura o usar soluciones tradicionales basadas en SQL para la rentabilidad, facilidad de mantenimiento y una transición sin problemas. Un enfoque híbrido proporciona lo mejor de ambos sectores y permite una migración sencilla de los patrimonios de datos existentes mientras se usan herramientas modernas y funcionalidades de inteligencia artificial. Las pyme pueden mantener sus orígenes de datos basados en SQL ejecutándose en la nube y modernizarlos según sea necesario.

En este artículo se describen varias estrategias para que las pyme modernicen los almacenes de datos heredados y exploren las herramientas y funcionalidades de macrodatos sin ampliar los presupuestos actuales y los conjuntos de aptitudes. Estas soluciones completas de almacenamiento de datos de Azure se integran perfectamente con Azure y servicios de Microsoft, incluidos los servicios de inteligencia artificial, Microsoft Dynamics 365 y Microsoft Power Platform.

Posibles casos de uso

  • Migre un almacenamiento de datos relacional local tradicional que tenga menos de 1 TB y use paquetes SSIS para organizar los procedimientos almacenados.

  • Integre en malla de los datos existentes de Dataverse de Dynamics o Microsoft Power Platform con orígenes de Data Lake por lotes y en tiempo real.

  • Use técnicas innovadoras para interactuar con datos centralizados de Azure Data Lake Storage Gen2. Estas técnicas incluyen el análisis sin servidor, la minería de conocimiento, la fusión de datos entre dominios y la exploración de datos del usuario final, incluido Fabric Copilot.

  • Configure empresas de comercio electrónico para que adopten un almacenamiento de datos para optimizar sus operaciones.

Esta solución no se recomienda para:

  • Implementación greenfield de almacenes de datos.

  • Migración de almacenes de datos locales que tienen más de 1 TB o que se prevé que alcancen ese tamaño en un año.

Consideraciones

Estas consideraciones implementan los pilares del marco de buena arquitectura de Azure, que es un conjunto de principios guía que se pueden usar para mejorar la calidad de una carga de trabajo. Para más información, consulte Marco de buena arquitectura de Microsoft Azure.

Optimización de costes

La optimización de costos trata de buscar formas de reducir los gastos innecesarios y mejorar las eficiencias operativas. Para obtener más información, consulte Lista de comprobación de revisión de diseño para la optimización de costes.

  • La calculadora de precios de Azure permite modificar los valores para comprender cómo afectan los requisitos específicos a los costes. Puede ver un precio de ejemplo para un escenario de almacenamiento de datos de pyme en la calculadora de precios de Azure.

  • Los precios de SQL Database dependen de los niveles de proceso y servicio que elija y del número de núcleos virtuales y unidades de transacción de base de datos. En el ejemplo se describe una base de datos única con proceso aprovisionado y ocho núcleos virtuales, y se asume que necesita ejecutar procedimientos almacenados en SQL Database.

  • Los precios de Data Lake Storage Gen2 dependen de la cantidad de datos que almacene y de la frecuencia con la que los use. Los precios de ejemplo abarcan 1 TB de almacenamiento de datos y otras suposiciones transaccionales. 1 TB hace referencia al tamaño del lago de datos, no al tamaño original de la base de datos heredada.

  • Los precios de Fabric dependen del precio de la capacidad de Fabric F o del precio Premium por persona. Las funcionalidades sin servidor usan CPU y memoria de la capacidad dedicada comprada.

  • Los precios de Event Hubs dependen del nivel que elija, del número de unidades de procesamiento aprovisionadas y del tráfico de entrada recibido. En el ejemplo se supone que hay una unidad de procesamiento en el nivel estándar que gestiona más de un millón de eventos al mes.

Colaboradores

Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.

Autor principal:

Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.

Pasos siguientes