Integración del análisis a escala de la nube en la estrategia de adopción de la nube
Cree una única estrategia centralizada de adopción de la nube para la organización mediante la metodología de estrategia de Cloud Adoption Framework de Azure. Si aún no ha registrado la estrategia de adopción de la nube, use la plantilla de estrategia y plan (strategy and plan template) para hacerlo.
En este artículo se exponen cuestiones sobre escenarios de análisis a escala de la nube que afectan a una estrategia más amplia.
Antes de implementar el análisis a escala de la nube, tenga un plan preparado para la estrategia de datos. Puede empezar poco a poco con un único caso de uso o tener un conjunto mucho más amplio de casos de uso que necesiten priorizarse. Una estrategia preparada ayuda a establecer los procesos y a desencadenar conversaciones iniciales sobre los puntos clave en los que hay que centrarse.
Clasificación por orden de prioridad de los resultados empresariales de la estrategia de datos
Tener una estrategia de datos eficaz le proporciona una ventaja competitiva. La estrategia de datos debería estar siempre alineada con los resultados empresariales que se buscan. La mayoría de los resultados empresariales se pueden clasificar en una o varias de las cuatro categorías siguientes:
Capacitación de los empleados: ofrezca a los empleados conocimientos en tiempo real sobre los clientes, los dispositivos y las máquinas. Este conocimiento les ayuda a colaborar de forma eficaz para satisfacer las necesidades empresariales o de los clientes con agilidad.
Interacción con los clientes: ofrezca una experiencia personalizada, enriquecida y conectada, inspirada en la marca. Aproveche el poder de los datos y la información para fomentar la fidelidad de los clientes en cada momento del recorrido del cliente.
Optimización de operaciones: aumente el flujo de información en toda la organización. Sincronice los procesos empresariales y use un enfoque basado en los datos para que cada interacción resulte valiosa.
Transformación de los productos y el ciclo de vida de desarrollo: recopile datos de telemetría sobre sus servicios y ofertas. Use los datos de telemetría para dar prioridad a una versión o crear una nueva característica y para evaluar continuamente la eficacia y la adopción.
Una vez que haya clasificado por orden de prioridad los resultados empresariales, examine los proyectos actuales y las iniciativas estratégicas a largo plazo, y clasifíquelos en consecuencia. Considere la posibilidad de combinar las cuatro categorías de resultados empresariales en un formato de matriz, en función de la complejidad y el impacto. Además, contemple agregar los pilares arquitectónicos para profundizar en el escenario.
Desbloqueo del valor estratégico
La formación de una cultura basada en datos con la que hacer progresar a la empresa en una forma consistente, emprendedora, ágil e informada presenta algunas complejidades inherentes y realidades básicas. Antes de entrar en la fase de implementación, concentre sus esfuerzos en el desarrollo de una estrategia de datos coherente que puede ayudarle a alcanzar los resultados empresariales que desea.
Los análisis a escala de la nube están alineados con motivaciones basadas en la innovación. Los factores comunes siguientes motivan a los clientes a integrar este escenario en su estrategia de adopción de la nube:
- Un marco de análisis escalable con el que puede crear una plataforma de datos empresarial
- Autoservicio, que capacita a los usuarios en la exploración de datos, la creación de recursos de datos y el desarrollo de productos
- Una cultura controlada por datos con recursos de datos reutilizables, comunidades de datos, intercambio seguro de terceros y uso compartido local
- Uso compartido de datos con confianza mediante directivas, identidad común, confidencialidad y cifrado
- Experiencias de los clientes mejoradas e involucración
- Transformación de productos o servicios
- Perturbación del mercado con nuevos productos o servicios
En el diagrama siguiente puede observar temas clave para poder entender las motivaciones de su propia estrategia. Analice detenidamente estos temas y cómo contribuyen a una estrategia de datos coherente. Considere también como puede desbloquear el valor estratégico de datos, lo que permite un crecimiento empresarial coherente.
"Una estrategia de datos es la base para usar datos como recurso e impulsar el negocio. No es un trabajo de revisión para los problemas de datos. Se trata de un plan rector a largo plazo que define las personas, los procesos y la tecnología que hay que poner en marcha para resolver los desafíos de datos".
La creación de la estrategia constituye un paso. Pero ejecutar la estrategia a escala empresarial supone un gran desafío para la cultura, las personas, los procesos y las opciones tecnológicas de una organización. La ejecución requiere compromiso y una propiedad clara en todos los niveles de la organización.
Aumento de las eficiencias
La agilidad de la nube necesita que las organizaciones se adapten rápidamente y generen eficiencias en todas las áreas de la actividad empresarial. Según el informe de riegos emergentes de Gartner (report on emerging risks), a pesar de que las organizaciones siguen centrándose e invirtiendo en iniciativas digitales, dos tercios de estas organizaciones evidencian debilidades empresariales y no cumplen las expectativas.
Operacionalización de la administración de datos
Muchas organizaciones han descentralizando gradualmente el equipo de TI central para ganar en agilidad. Las empresas quieren innovar rápidamente y el acceso a datos unificados de toda la empresa en forma de autoservicio les ayuda a satisfacer requisitos empresariales complejos.
Hay muchas razones por las que las empresas no pueden aprovechar todo el potencial de sus datos. Puede deberse a que las funciones empresariales trabajan en silos, donde cada equipo usa diferentes herramientas y estándares para el análisis de datos. O bien, podría ser debido a un error de vincular los indicadores clave de rendimiento a los objetivos empresariales generales.
La democratización de los datos ayuda a que ese valor vuelva a la empresa y a que logre objetivos difíciles del crecimiento empresarial.
- Comprenda y dé prioridad a sus necesidades de LOB.
- Distribuya los datos entre los dominios para habilitar la propiedad y acercar los datos a los usuarios.
- Implemente productos de datos de autoservicio para fomentar la información y el valor empresarial.
Para la gobernanza de datos, debe alcanzar un buen equilibrio en el mundo descentralizado de la democratización de datos. Si aplica la gobernanza de una forma demasiado estricta, puede menoscabar la innovación. Sin embargo, si no tiene un mínimo de principios y procesos básicos implementados, es probable que acabe con silos de datos. Estos silos pueden perjudicar la reputación y los ingresos potenciales de una organización. Un enfoque holístico de la gobernanza de datos es fundamental para desbloquear el valor estratégico de los datos de manera coherente.
En ausencia de una estrategia de datos bien ideada, hay una necesidad clara de «ponerse en marcha» y empezar rápidamente a aportar valor a la organización. Solucione los problemas empresariales actuales al actuar en los temas claves mencionados anteriormente o al usarlos como principios estratégicos dentro de un marco. Con estos temas clave, también puede crear una estrategia de datos holística que sea iterativa con validación, mientras sigue obteniendo resultados oportunos. Los líderes empresariales y tecnológicos deben desarrollar la mentalidad y las estrategias necesarias para generar valor a partir de los datos, y escalar rápidamente de una manera estructurada y simplificada
Para obtener más información, consulte ¿Qué es la gobernanza de datos?.
Desarrollo de una referencia cultural controlada por datos
Para crear una estrategia de datos correcta, necesita una referencia cultural controlada por datos. Desarrolle una cultura que fomente la participación abierta y colaborativa sistemáticamente. Con este tipo de cultura, todo el personal puede aprender, comunicar y mejorar los resultados empresariales de la organización. El desarrollo de una cultura basada en datos también mejora la capacidad de cada empleado de generar impacto o influencia, con el respaldo de los datos.
El punto inicial del recorrido varía en función de la organización, el sector y la ubicación actual a lo largo de la curva de madurez. En el siguiente diagrama se representa un modelo de madurez de ejemplo que describe los niveles de madurez del uso de la inteligencia artificial de una organización:
Nivel 0
Los datos no se aprovechan mediante programación ni de forma sistemática. El foco de los datos de la organización es desde una perspectiva de desarrollo de aplicaciones.
En el nivel 0, una organización suele tener proyectos de análisis no planeados. Cada aplicación está muy especializada en los datos únicos y las necesidades de las partes interesadas. Cada aplicación también tiene bases de código y equipos de ingeniería significativos, y muchas se diseñan fuera de TI. La habilitación de casos de uso y el análisis están aislados.
Nivel 1
En el nivel 1, se están formando equipos y se está creando una estrategia, pero el análisis sigue siendo por departamentos. La organización presenta una tendencia de ser buena en la captura y el análisis de datos tradicionales. Puede darse cierto nivel de compromiso con un enfoque a escala de la nube. Por ejemplo, es posible que ya haya acceso a los datos desde la nube.
Nivel 2
La plataforma de innovación de la organización ya está casi lista. Los flujo de trabajo están implementados para abordar la calidad de los datos. La organización puede responder a algunas preguntas de tipo "por qué".
En el nivel 2, la organización busca de forma activa una estrategia de datos de un extremo a otro que use almacenes de lagos de datos regulados centralmente para controlar la expansión del almacén de datos y mejorar la detectabilidad de los datos. La organización está lista para aplicaciones inteligentes que llevan el proceso a los lagos de datos regulados de forma centralizada. Estas aplicaciones inteligentes reducen riesgos privados, costes de procesos y la necesidad de copias federadas de datos importantes.
En este nivel, la organización también está preparada para servicios de datos compartidos hospedados centralmente y multiinquilino para las tareas comunes de procesamiento de datos. Estos servicios de datos compartidos permitirán información rápida de los servicios de inteligencia basados en ciencia de datos.
Nivel 3
La organización usa un enfoque de datos holístico. Los proyectos relacionados con datos están integrados en los resultados empresariales. La organización usa plataformas de análisis para realizar predicciones.
En el nivel 3, la organización desbloquea la innovación digital desde el punto de vista del patrimonio de datos y del desarrollo de aplicaciones. Los servicios de datos fundamentales están en funcionamiento, entre los que se incluyen los lagos de datos y los servicios de datos compartidos.
Varios equipos en la organización logran entregar cargas de trabajo empresariales críticas, casos de uso empresariales clave y resultados medibles. Los nuevos servicios de datos compartidos se identifican por medio de telemetría. TI es un asesor de confianza para equipos de toda la empresa que usa una estrategia de datos de un extremo a otro conectada y de confianza para poder mejorar los procesos empresariales críticos.
Nivel 4
En el nivel 4, toda la organización usa marcos, estándares empresariales y una cultura controlada por datos. La automatización, los bucles de comentarios controlados por datos y los centros de excelencia en torno al análisis o automatización se pueden observar en acción.
Desarrollo de objetivos alineados con la empresa
Identificar las prioridades en consonancia con la visión empresarial y mantener la ideología "pensar en grande, empezar con poco y actuar rápidamente" son factores clave para el éxito. La selección del caso de uso correcto no siempre tiene que ser un proceso de revisión complejo y largo. Podría ser un problema continuo en cualquier unidad de negocio en la que haya datos suficientes para validar su rentabilidad de la inversión, más ganas y un proceso de compra fácil. Las cosas pueden cambiar rápidamente y es ahí donde gran parte de la organización puede tener dificultades para empezar.
Descripción de los atributos de datos
Para crear una estrategia de datos sólida, debe comprender cómo funcionan los datos. Al conocer las características principales de datos, se puede desarrollar una práctica fundamentada para tratar los datos.
Los datos se mueven rápidamente, pero esta velocidad no puede desafiar las leyes de la física. Los datos deben cumplir las leyes del país y del sector en el que se crearon.
Los datos no cambian por sí solos, pero son propensos a cambios y pérdidas accidentales a no ser que adopte medidas para mitigar estos problemas. Adopte medidas de protección frente a los daños para controles, bases de datos y almacenamiento para poder lidiar con cambios imprevistos. Asegúrese igualmente de tener procesos de bajada, alertas, auditorías y de supervisión.
Por sí solos, los datos no generan información ni producen ningún valor. Para obtener información o valor, debe distribuir la mayoría de los datos en cuatro pasos diferentes:
- Ingesta de datos
- Storage
- Processing
- Análisis
Cada uno de estos cuatro pasos tiene sus propios principios, procesos, herramientas y tecnologías.
La retención de recursos de datos y la información relacionada puede afectar a decisiones socioeconómicas, políticas, de investigación y de inversión. Es fundamental que la organización sea capaz de proporcionar información de forma responsable y segura. Todos los datos generados o adquiridos deben someterse a un ejercicio de clasificación de datos, a menos que se indique explícitamente lo contrario. El cifrado es el estándar gold para tratar datos confidenciales tanto en reposo como en tránsito.
Todos los datos, las aplicaciones y los servicios tienen sus propia fuerza gravitacional, pero los datos cuentan con la fuerza mayor. A diferencia de la mítica manzana de Isaac Newton, los datos no tienen una masa física que afecte a los objetos de su alrededor. En su lugar, tienen latencia y rendimiento, que actúan como aceleradores para el proceso de análisis. La latencia, el rendimiento y la facilidad de acceso suelen requerir datos duplicados, incluso cuando no es deseable. Configure personas, procesos, herramientas y tecnologías adecuadamente para poder equilibrar estos requisitos con las directivas de datos de la organización.
Las arquitecturas rigen la velocidad a la que se pueden procesar los datos. Las construcciones se facilitan mediante innovaciones en software, hardware y redes. Algunas consideraciones sobre la arquitectura son:
- Configuración de la distribución de datos
- Creación de particiones
- Tecnologías de caché
- Procesamiento por lotes frente a procesamiento de flujos
- Equilibrio entre el procesamiento de back-end y del lado cliente
Definición de una estrategia de datos propia
No es ninguna novedad usar datos como ventaja competitiva para la creación de productos y servicios de mejor calidad. Sin embargo, sí son novedosos el volumen, la velocidad y la variedad de datos que la informática en la nube ha hecho posible.
El diseño de una plataforma de análisis de datos moderna en la nube se compone de seguridad, gobernanza, supervisión, escalado a petición, operaciones de datos y autoservicio. Comprender cómo interactúan estas facetas es lo que marca la diferencia entre una gran estrategia de datos de una buena. Use herramientas como Cloud Adoption Framework para garantizar la cohesión, la integridad y los procedimientos recomendados de la arquitectura.
Para que sea eficaz, la estrategia de datos debe contener disposiciones para la gobernanza de datos. En el diagrama siguiente se muestran las principales fases del ciclo de vida de los datos, centrándose en la gobernanza de datos como enfoque:
En las secciones siguientes se describen consideraciones que debe usar al decidir las capas de la estrategia de principios de diseño. Céntrese en la consecución de resultados empresariales y el valor de los datos.
Ingesta de datos
Una consideración clave para la ingesta de datos es la capacidad de crear una canalización de datos rápidamente de forma segura y compatible, desde los requisitos hasta la producción. Entre los elementos importantes, se incluyen las tecnologías controladas por metadatos, de autoservicio y con poco código para hidratar el lago de datos.
Al compilar canalizaciones, considere tanto el diseño como la habilidad para adoptar datos, distribuir datos y escalar el proceso. También debe asegurarse de que dispone de la compatibilidad adecuada con DEvOps para la integración y entrega continuas de la canalización.
Herramientas como Azure Data Factory admiten una gran cantidad de orígenes de datos locales, orígenes de datos de software como servicio (SaaS) y otros orígenes de datos de otras nubes públicas.
Storage
Etiquete y organice los datos en capas físicas y lógicas. Los lagos de datos forman parte de todas las arquitecturas modernas de análisis de datos. La organización debe aplicar los requisitos adecuados de privacidad, seguridad y cumplimiento de datos que cumplan la clasificación de datos y los requisitos de cumplimiento del sector en el que operan. La catalogación y el autoservicio facilitan la democratización de los datos en el nivel de la organización, lo que impulsa la innovación mientras un control de acceso adecuado guía.
Elija el almacenamiento correcto para la carga de trabajo. Incluso si no se acierta con el almacenamiento a la primera, la nube permite conmutar por error rápidamente y reiniciar el recorrido. Use los requisitos de la aplicación para elegir la mejor base de datos. Asegúrese de tener en cuenta la capacidad de procesar datos por lotes y de streaming al elegir la plataforma de análisis.
Procesamiento de datos
Las necesidades de procesamiento de datos variarán en función de la carga de trabajo. La mayoría de los procesamientos de datos a escala contienen elementos en tiempo real y de procesamiento por lotes. La mayor parte de las empresas tienen también elementos de requisitos de procesamiento de series temporales y una necesidad de procesar texto de forma libre para las funcionalidades de búsqueda empresarial.
El procesamiento de transacciones en línea (OLTP) proporciona los requisitos de proceso organizativo más populares. Algunas cargas de trabajo necesitan un procesamiento especializado, como la informática de alto rendimiento (HPC), conocida también como «big compute». Estas cargas de trabajo resuelven tareas matemáticas complejas por medio de muchos equipos basados en GPU o CPU.
Para determinadas cargas de trabajo especializadas, los clientes pueden proteger entornos de ejecución como la computación confidencial de Azure, que ayuda a los usuarios a proteger los datos mientras están en uso en plataformas de nube pública. Este estado es necesario para un procesamiento eficaz. Los datos están protegidos dentro de un entorno de ejecución de confianza (TEE), también conocido como enclave. Un TEE protege el código y los datos frente a visualizaciones y modificaciones externas. Los TEE permiten entrenar modelos de inteligencia artificial sin menoscabar la confidencialidad de datos, incluso cuando se usan orígenes de datos de distintas organizaciones.
Procesamiento analítico
La construcción de extracción, transformación, carga (ETL) se relaciona con el procesamiento analítico en línea (OLAP) y las necesidades de almacenamiento de datos. Un modelo de datos alineado con la empresa y un modelo semántico que permita a las organizaciones implementar reglas de negocio e indicadores clave de rendimiento (KPI) que se suelen implementar como parte del proceso analítico. Una funcionalidad útil es la detección automática del desfase de esquema.
Resumen de la estrategia de datos
La adopción de un enfoque fundamentado en otras consideraciones, como la gobernanza de datos y una inteligencia artificial responsable producen beneficios más tarde.
En Microsoft, se siguen los cuatro principios fundamentales: equidad, confiabilidad y seguridad, privacidad y seguridad e inclusión. Los dos fundamentos esenciales de transparencia y responsabilidad constituyen la base de los cuatro principios.
Hemos puesto en práctica los principios y la inteligencia artificial responsable mediante el desarrollo de recursos y un sistema de gobernanza. Algunas de nuestras directrices abordan la interacción entre el usuario y la inteligencia artificial, la inteligencia artificial conversacional, el diseño inclusivo, una lista de comprobación de imparcialidad de la inteligencia artificial y una hoja de datos para los conjuntos de datos.
También hemos desarrollado un conjunto de herramientas para ayudar a otros usuarios a comprender, proteger y controlar la inteligencia artificial en cada fase de la innovación. Estas herramientas son el resultado de esfuerzos de colaboración multidisciplinar para reforzar y acelerar la inteligencia artificial responsable. La colaboración ha abarcado la ingeniería y el desarrollo de software, las ciencias sociales, la investigación de usuarios, la ley y la directiva.
Para una mejor colaboración, hemos publicado como código abierto muchas herramientas, como InterpretML y Fairlearn. Otros pueden contribuir a estas herramientas de código abierto y basarse en ellas. También hemos democratizado las herramientas mediante Azure Machine Learning.
El eje para convertirse en una organización controlada por datos es fundamental para ofrecer una ventaja competitiva en la nueva normalidad. Queremos ayudar a que nuestros clientes cambien de un enfoque de solo aplicación a una aplicación y un enfoque dirigido por datos. Un enfoque centrado en las aplicaciones y los datos ayuda a crear una estrategia de datos de un extremo a otro que garantice la repetibilidad y escalabilidad en los casos de uso actuales y futuros que afectan a los resultados empresariales.
Fomento del compromiso, la comunicación y la participación
Todos los roles clave implicados en que la estrategia de datos sea eficaz deben entender con claridad el enfoque adoptado y los objetivos de negocio comunes. Los roles clave podrían incluir el equipo directivo (nivel C), las unidades de negocio y los equipos de TI,operaciones y entrega.
La comunicación es una de las partes más importantes de este marco. La organización debe diseñar un proceso para una comunicación eficaz entre los roles. La comunicación ayuda a cumplir de forma eficaz en el contexto del proyecto actual. También crea un foro para que todo el mundo implicado se mantenga en línea, actualizado y centrado en el objetivo general de elaborar una estrategia de datos holística para el futuro.
La interacción es esencial entre estos dos grupos:
- Miembros del equipo que diseñan e implementan la estrategia de datos
- Miembros del equipo que contribuyen a datos, los consumen y los explotan (como las unidades de negocio, que tomarán decisiones y crearán resultados basados en los datos)
Por decirlo de otro modo, las estrategias de datos y las plataformas de datos asociadas creadas sin la interacción de los usuarios se enfrentan a desafíos de relevancia y adopción.
Dos procesos estratégicos ayudan a lograr la eficacia en este marco:
- Formación de un centro de excelencia
- Adopción de un método de entrega ágil
Para más información, consulte Elaboración de un plan para el análisis a escala de la nube (Develop a plan for cloud-scale analytics).
Entrega de valor
Si se entregan productos de datos con los criterios de eficacia de una manera estandarizada y estructurada, dicha entrega validará el marco iterativo. Además, el uso del aprendizaje para innovar continuamente ayuda a ganar la confianza empresarial y ampliar los objetivo de la estrategia de datos. Este proceso proporciona una adopción más clara y rápida en toda la organización.
Lo mismo se aplica a la plataforma de datos. Si tiene una configuración donde varios equipos trabajan con bastante autonomía, debería evolucionar hacia una malla. Consecución de un proceso iterativo. En muchos casos, son necesarios cambios significativos en la configuración, la preparación y la alineación empresarial de la organización
Pasos siguientes
En los siguientes artículos puede encontrar orientaciones para el recorrido de adopción de la nube y para un escenario de adopción de la nube eficaz:
- Preparación de un plan para el análisis a escala de la nube (Develop a plan for cloud-scale analytics)
- Revisión del entorno de las zonas de aterrizaje de Azure
- Gobernanza del análisis a escala de la nube (Govern cloud scale analytics)
- Seguridad del análisis a escala de la nube (Secure cloud-scale analytics)