Configuración de ejemplo para la gobernanza de datos
La gobernanza de datos de Microsoft Purview, con Catálogo unificado de Microsoft Purview y Mapa de datos de Microsoft Purview, ofrece visibilidad completa, confianza en los datos e innovación responsable para ayudar a las organizaciones a lograr un mayor valor empresarial en la era de la inteligencia artificial. Con un ejemplo de administración de datos de estado, siga los pasos de este artículo para ayudarle a comprender cómo configurar Catálogo unificado y usar su funcionalidad para crear una práctica de gobernanza de datos sólida para su organización.
Paso 1: Configurar los dominios de gobernanza en Catálogo unificado
Los dominios de gobernanza son la clave para establecer la responsabilidad de los datos y le ayudarán a federar la gobernanza de esos datos en toda la empresa. Al crear dominios de gobernanza, a partir del propietario adecuado se asegura de que pueda identificar y colaborar de forma eficaz con expertos para todos los datos del patrimonio de datos. Los dominios de gobernanza pueden ser muchos tipos diferentes para alinearse con el tipo de límite de datos del equipo que gobernará esos datos. Por ejemplo: dominios funcionales (finanzas, RR. HH., ventas) o dominios de datos (producto, cliente, estado).
Requisitos previos
Concesión de permisos y compilación del primer dominio de gobernanza
Abra el portal de Microsoft Purview.
Inicie sesión en el portal de Microsoft Purview mediante la credencial de una cuenta de administrador a la que se le asigna el rol de administración de roles (por ejemplo, un administrador de Purview). Vaya a Roles y ámbitos de configuración > para ver y administrar.
Seleccione Grupos de roles.
En la página Grupos de roles para soluciones de Microsoft Purview , seleccione el grupo de roles De gobernanza de datos .
En la página Editar miembro del grupo de roles , seleccione Elegir usuarios o Elegir grupos.
Active la casilla para todos los usuarios o grupos que quiera agregar al grupo de roles.
Seleccione Seleccionar.
En Catálogo unificado, seleccione Administración de catálogos y, a continuación, dominios de gobernanza.
En la página Dominios de gobernanza , puede configurar el resto del catálogo para que otros usuarios puedan federar la propiedad de los datos, capacitar a los equipos para que desarrollen sus conocimientos y establezcan el valor empresarial de los datos.
- Para empezar, seleccione Nuevo dominio de gobernanza.
- Puede actualizar el nombre de su dominio de gobernanza, pero para ello podemos denominarlo "(Tutorial) Personal Health" y darle una descripción de "Los datos de salud personal hacen referencia a cualquier información relacionada con la salud física o mental de una persona que se recopila y usa dentro del sector sanitario. Esto puede incluir una amplia gama de tipos de datos, como registros médicos, historiales de tratamiento, imágenes de diagnóstico y resultados de pruebas de laboratorio. A menudo está protegido bajo diversas leyes y regulaciones para garantizar la privacidad y la confidencialidad."
- Seleccione el tipo como "dominio de datos".
- Deje el elemento primario en blanco (si este es el primer dominio de gobernanza del catálogo, no tendrá nada que seleccionar aquí)
- Seleccione Crear
- Ahora cree dos dominios más por su cuenta. Estos serán puntos clave de federación para la colaboración y la gobernanza en su propia organización, por lo que piense en quién podría ser el propietario de los dominios al implementar Catálogo unificado de Microsoft Purview.
- Puede seguir estos ejemplos:
- Un dominio funcional corporativo representa los recursos y términos altamente controlados que usa toda una empresa.
- Sales es un dominio funcional que la mayoría de las organizaciones tendrán que es un dominio secundario de Corporate.
- Para empezar, seleccione Nuevo dominio de gobernanza.
Seleccione el dominio de gobernanza creado.
Seleccione la pestaña Roles del dominio de gobernanza.
De forma predeterminada, al crear el dominio de gobernanza se agrega a todos los roles del dominio de gobernanza. Como propietario del dominio de gobernanza, agrega los administradores de datos (expertos empresariales en su dominio) y los propietarios de productos de datos (que saben qué recursos de datos son los mejores para que otros usuarios los consuman).
Vuelva a la pestaña Detalles .
Seleccione el botón Administrar directivas para aplicar una directiva de nivel de dominio. Esta directiva se aplicará a todos los productos de datos del dominio, lo que permite la aplicación automática de una directiva que garantiza que los expertos en datos no tengan que ser también expertos en directivas.
En la pestaña Administrar directivas de acceso , active la casilla situada junto a Permitir copias de datos. Al seleccionar esta opción de directiva, se aplicará automáticamente una atestación que requiere que todos los usuarios que soliciten acceso a los productos de datos atestiguan que comprenden la directiva de copia de datos de los datos.
Seleccione Guardar cambios para confirmar que el dominio de gobernanza establece la directiva.
Seleccione Publicar en el dominio de gobernanza. El botón Publicar publica todos los demás conceptos dentro del dominio.
Creación de términos de glosario
Agregar términos de glosario al dominio de gobernanza permite a otros usuarios comprender mejor cómo la empresa usa y entiende los datos. Los términos del glosario también garantizan que la información use términos comunes y, por lo general, sus conocimientos en todo el dominio de gobernanza.
En la página del dominio de gobernanza, busque la tarjeta Términos del glosario y seleccione Ver todo.
En la página Términos del glosario , seleccione Nuevo término.
Escriba los detalles:
- Nombre: "Brote"
- Descripción: una enfermedad que ha afectado o tiene el potencial de afectar a una gran parte de la población.
- Puede dejar el resto en blanco por ahora, pero hay campos que recopilar: el propietario del término responsable de definir el término para su empresa, acrónimos para compartir común también conocidos como nombres del término, por último, puede proporcionar vínculos a los recursos que tendrían aún más información sobre el término.
Seleccione Crear
Seleccione el botón Administrar directivas . De forma similar a las directivas de nivel de dominio, puede crear directivas de nivel de término que se aplicarán siempre que el término esté en uso.
Active la casilla situada junto a Aprobación del administrador requerida. Esto aplica una aprobación secundaria del administrador de la lista de usuarios en Microsoft Entra ID cuando se solicita acceso a los productos de datos.
Seleccione Publicar para el término brote creado. Los términos publicados se pueden filtrar en Catálogo unificado y garantizar que otros usuarios que usen el término para describir su producto de datos podrán ver esa descripción en Catálogo unificado mientras examinan el producto de datos.
Ahora cree dos términos más. Esta vez, seleccione el término "Brote" como término primario para los términos que ha creado. Pruebe a crear relaciones entre estos términos secundarios en la pestaña relacionada de ambos términos para ayudar a crear la red de cómo funcionan conjuntamente estos términos para explicar la totalidad de un tema.
- Pandemia: un brote mundial de una enfermedad que afecta a un gran número de personas en varios países o continentes.
- Epidemia: un brote regional o en todo el país de una enfermedad que es altamente contagiosa y afecta a una gran parte de la población.
Pruebe a crear un par de otros términos en cualquier otro dominio que haya creado anteriormente. Si no está seguro de qué agregar, pruebe el botón Obtener términos sugeridos para que GenAI proponga algunos en función de la descripción y el nombre del dominio que ya proporcionó.
Agregar un OKR
Ahora agregue un OKR (resultado objetivo y clave) para el dominio de Salud personal para ayudar a otros usuarios a comprender el valor empresarial de los datos. Esto creará una conexión directa entre los datos y el valor empresarial que proporciona.
Seleccione el cuadro OKR en la página dominio de gobernanza.
Seleccione Nuevo OKR.
Escriba primero los detalles del objetivo:
- Objetivo: Reducir el riesgo de pandemia al permitir una captación eficaz de la vacuna contra el paciente.
- Propietario: escriba su nombre
- Fecha de destino: '2024-12-31'
Seleccione Crear
La adición de resultados clave a su objetivo garantiza que los objetivos sean medibles y que se supervise el progreso hacia el objetivo. Seleccione + Agregar resultado de clave.
Escriba los detalles del resultado de la clave:
- Resultado clave: Garantizar que el 80 % de los grupos> de edad (65 años) más propensos a verse afectados por la pandemia reciban la vacunación completa a finales del año natural de 2024.
- Estado del progreso: En curso
- Importe del progreso: 70
- Importe objetivo: 80
- Cantidad máxima: 100
Seleccione Crear.
Seleccione Publicar.
Creación de elementos de datos críticos
Por último, cree un elemento de datos crítico (CDE) en Personal Health para asegurarse de que las columnas de datos más importantes tengan una definición, comprensión y comprensión coherentes y que siempre cumplan las expectativas empresariales sobre cómo se forman y almacenan esos datos.
- En la página dominios de gobernanza con el dominio de Estado personal seleccionado, seleccione el cuadro Elementos de datos críticos .
- Seleccione Nuevo elemento de datos crítico.
- Escriba los metadatos básicos de CDE:
- Nombre: Grupos de edad
- Descripción: La agrupación común de edades de las personas que se usan para garantizar los informes analíticos necesarios sigue una referencia de la que otros pueden depender y la eliminación de edades individuales para mejorar el anonimato de los datos. El grupo de edad se divide en 8 grupos; <2 años, 2-4 años, 5-11 años, 12-17 años, 18-24 años, 25-49 años, 50-64 años, 65+ años.
- Propietario: escriba su nombre
- Tipo de datos esperado: texto
- Seleccione Crear
La eficacia real del CDE es que se asigna directamente a las columnas de datos físicos donde se almacenan estos datos. Esta conexión garantiza una comprensión común y permite la evaluación de directivas y reglas de calidad de datos a escala.
En el CDE que acaba de crear, seleccione + Agregar columna.
Búsqueda del recurso de datos Covid 19 Vaccine and Case Trends desde el contenedor de oro del lago de datos
Seleccione la casilla, no el nombre, del recurso Covid 19 Vaccine and Case Trends(Tendencias de vacuna y caso ).
Sugerencia
Si selecciona el nombre azul del recurso, se abrirá una nueva ventana en Microsoft Purview en la que se muestran los detalles del recurso.
Seleccione el botón de radio situado junto a la columna AgeGroupVacc.
Seleccione Agregar.
Seleccione la pestaña Calidad de datos en la parte superior del CDE que acaba de crear para aplicar reglas de calidad de datos al CDE. Es similar a cómo ha agregado directivas para términos de glosario y dominios de gobernanza.
Seleccione Nueva regla.
Seleccionar coincidencia de tipo de datos
Escriba el nombre de la regla: Confirmar formato de grupo de edad
Seleccione Crear
Seleccione Publicar en el CDE.
Este CDE ahora aplicará automáticamente una regla de calidad de datos a cada producto de datos que use el recurso Covid 19 Vaccine and Case Trends, que le guiaremos en la sección siguiente.
- Pruebe a crear un par de otros CDE en los demás dominios. Estas son algunas ideas:
- Ventas: Ingresos y nombre del vendedor
- Corporativo: Id. de producto
Paso 2: Configurar y registrar los datos en Data Map
Si no tiene orígenes de datos disponibles para el examen, puede seguir estos pasos para implementar completamente un ejemplo de Azure Data Lake Storage (ADLS Gen2).
Sugerencia
Si ya tiene un origen de datos en el mismo inquilino que su cuenta de Microsoft Purview, pase a la siguiente parte de esta sección para examinar los recursos.
En un patrimonio de datos real se encuentran muchos sistemas diferentes en uso para diferentes aplicaciones de datos. Hay entornos de informes como Fabric y Snowflake en los que los equipos usan copias de datos para crear soluciones analíticas y potenciar sus informes y paneles. Hay sistemas de datos operativos que impulsan a los equipos o clientes de las aplicaciones a completar procesos empresariales que recopilan o agregan datos en función de las decisiones tomadas durante el proceso.
Para crear un patrimonio de datos más realista, la recomendación es mostrar muchos orígenes de datos en el catálogo, que pueden cubrir la amplitud de los distintos datos que puede tener cualquier empresa. Los tipos de datos necesarios para impulsar un caso de uso pueden ser muy diferentes con los usuarios empresariales que necesitan informes y paneles, los analistas necesitan dimensiones y hechos conformes para crear informes, científicos de datos o ingenieros de datos necesitan datos de origen sin procesar que proceden directamente del sistema que recopila los datos todos ellos y más permiten a los distintos usuarios ver la importancia de la búsqueda, comprender y acceder a los datos en el mismo lugar.
Para que otros tutoriales agreguen datos a su patrimonio, puede seguir estas guías:
- Tutorial de Fabric Lakehouse : proporciona la base de un entorno de informes
- Azure SQL Database (ejemplo): proporciona un ejemplo bien estructurado de un almacén de datos operativo
Requisitos previos
- Suscripción en Azure: Creación de una cuenta gratuita de Azure hoy
- Microsoft Entra ID para el inquilino: Gobierno de Microsoft Entra ID
- Una cuenta de Microsoft Purview
- Administración acceso a la cuenta de Microsoft Purview (este es el valor predeterminado si creó la cuenta de Microsoft Purview. Permisos en la nueva versión preliminar del portal de Microsoft Purview | Microsoft Learn)
- Todos los recursos; Microsoft Purview, el origen de datos y Microsoft Entra ID deben estar en el mismo inquilino en la nube.
Configuración del patrimonio de datos
R. Creación y rellenado de una cuenta de almacenamiento
- Siga esta guía para crear una cuenta de almacenamiento: Crear una cuenta de almacenamiento para Azure Data Lake Storage Gen2
- Cree contenedores para el nuevo lago de datos:
- Vaya a la página Información general de nuestra cuenta de almacenamiento.
- Seleccione la pestaña Contenedores en la sección Almacenamiento de datos.
- Seleccione el botón + Contenedor.
- Asigne un nombre a "bronze" y seleccione el botón Crear .
- Repita estos pasos para crear un contenedor "gold"
- Descargue algunos datos CSV de ejemplo de data.gov: Covid-19Vacunación y tendencias de casos por grupo de edad, Estados Unidos
- Cargue el archivo CSV en el contenedor denominado "bronze" en la cuenta de almacenamiento que creó.
- Seleccione el contenedor denominado "bronze" y seleccione el botón Cargar .
- Examine la ubicación donde guardó el ARCHIVO CSV y seleccione el archivo Covid-19_Vaccination_Case _Trends .
- Seleccione Cargar.
B. Creación de un Azure Data Factory
En este paso se muestra cómo se mueven los datos entre capas de un lago de datos medallion y se garantiza que los datos están en un formato estandarizado que los consumidores esperarían usar, este es un paso previo para ejecutar Data Quality.
Siga esta guía para crear un Azure Data Factory: Crear un Azure Data Factory
Copie los datos del archivo CSV del contenedor "bronze" en el contenedor "gold" como una tabla de formato Delta mediante esta guía de Azure Data Factory: Transformación de datos mediante un flujo de datos de asignación
Abra la experiencia de Azure Data Factory (ADF) desde el Azure Portal seleccionando el botón Iniciar studio en la pestaña Información general del recurso de ADF creado.
Seleccione la pestaña Autor en ADF Studio.
Seleccione el + botón y elija Flujo de datos en el menú desplegable.
Asigne al flujo de datos el nombre "CSVtoDeltaC19VaxTrends".
Seleccione Agregar origen en el cuadro vacío.
Establezca La configuración de origen en:
- Nombre del flujo de salida: "C19csv"
- Descripción: deje en blanco
- Tipo de origen: insertado
- Tipo de conjunto de datos insertado: Texto delimitado
- Servicio vinculado: seleccione el lago de datos donde almacenó el archivo csv.
Establezca las opciones de origen en:
- Modo de archivo: Archivo
- Ruta de acceso del archivo: /bronze/ Covid-19_Vaccination_Case _Trends
- No se encontró ningún archivo: deje desactivada la opción
- Captura de datos modificados: deje desactivada
- Tipo de compresión: Ninguno
- Codificación: Default(UTF-8)
- Delimitador de columna: Coma (,)
- Delimitador de filas: Default(\r, \n o\r\n)
- Carácter de comillas: comilla doble (")
- Carácter de escape: barra diagonal inversa ()
- Primera fila como encabezado: CHECKED
- Deje el resto como valores predeterminados.
Seleccione el pequeño + Junto al origen creado y seleccione Receptor.
Cree el receptor donde el formato y la ubicación de los datos que se van a almacenar para mover los datos de un csv en "bronce" a una tabla delta en "gold".
- Establezca los valores de Sink (deje todos los valores como predeterminados a menos que se especifique)
- Tipo de receptor: insertado
- Tipo de conjunto de datos insertado: Delta
- Servicio vinculado: el mismo lago de datos que se usa en el origen, porque almacenaremos en un contenedor diferente.
Establezca los valores de Configuración (deje todos los valores como predeterminados a menos que se especifique)
- Ruta de acceso de la carpeta: gold/Covid19 Vaccine and Case Trends
Debe escribir el valor porque este nombre es la forma en que queremos almacenar los datos y no existe para seleccionarlos.
Seleccione Validar, esto comprueba el flujo de datos y proporciona instrucciones para corregir los errores.
Seleccione Publicar todo.
Seleccione el + botón y seleccione canalización en el menú desplegable.
Asigne a la canalización el nombre "CSV to Delta C19 Vax Trends"
Seleccione el flujo de datos creado en los pasos anteriores CSV a Delta (C19VaxTrends) y arrástrelo y colóquelo en la pestaña Abrir canalización.
Seleccione Validar.
Seleccione Publicar.
Seleccione Depurar (usar tiempo de ejecución de actividad) para ejecutar la canalización.
Sugerencia
Si detecta errores de espacios o caracteres inadecuados para el formato delta: abra el archivo CSV descargado y realice correcciones. A continuación, vuelva a cargar y sobrescribir el CSV en la zona de bronce. A continuación, vuelva a ejecutar la canalización.
Vaya al contenedor gold en el lago de datos y ahora debería ver la nueva tabla Delta creada durante la canalización.
Examen de los recursos
Si no ha examinado los recursos de datos en el Mapa de datos de Microsoft Purview, puede seguir estos pasos para rellenar el mapa de datos.
El análisis de orígenes en el patrimonio de datos recopilará automáticamente los metadatos de los recursos de datos (tablas, archivos, carpetas, informes, etc.) en esos orígenes. Al registrar un origen de datos y crear el examen, se establece la propiedad técnica sobre los orígenes y recursos que se muestran en el catálogo y se asegura de que tiene control sobre quién puede acceder a los metadatos de Microsoft Purview. Al registrar y almacenar orígenes y recursos en el nivel de dominio, se almacenará en el nivel más alto de jerarquía de acceso. Normalmente, es mejor crear algunas colecciones en las que examinará los metadatos del recurso y establecerá la jerarquía de acceso correcta para esos datos.
-
Proporcione acceso de lector para Microsoft Purview Managed Identity (MSI) al lago de datos u otro almacén de datos.
Sugerencia
Msi es el nombre de cuenta de la instancia de Microsoft Purview.
Si ha elegido usar Microsoft Fabric o SQL, puede usar estas guías para proporcionar acceso:
Registrar el lago de datos y examinar los recursos
En Mapa de datos de Microsoft Purview en la pestaña Dominios, seleccione las asignaciones de roles para el dominio (será el nombre de la cuenta de Microsoft Purview):
- Agréguese como administrador del origen de datos y conservador de datos al dominio.
- Seleccione el icono de persona junto al rol Administrador del origen de datos.
- Busque su nombre tal y como está en Microsoft Entra ID (podría requerir que escriba el nombre completo escrito exactamente tal como está en Microsoft Entra ID).
- Seleccione Aceptar.
- Repita estos pasos para el conservador de datos.
- Agréguese como administrador del origen de datos y conservador de datos al dominio.
Registre el lago de datos:
- Seleccione la pestaña Orígenes de datos .
- Seleccione Registrar.
- Seleccione el tipo de almacenamiento Azure Data Lake Storage Gen2.
Proporcione los detalles para conectarse:
- Suscripción (opcional)
- Nombre del origen de datos (este será el nombre del origen de ADLS Gen2)
- Colección donde se deben almacenar los metadatos del recurso (opcional)
- Seleccione Registrar.
Una vez completado el registro del origen de datos, puede configurar el examen. El registro indica que Microsoft Purview está conectado al origen de datos y lo ha colocado en la colección correcta para la propiedad. A continuación, el examen leerá los metadatos del origen y rellenará los recursos del mapa de datos.
Seleccione el origen que registró en la pestaña orígenes de datos.
Seleccione nuevo examen y proporcione los detalles:
- Uso del entorno de ejecución de integración predeterminado para este examen
- La credencial debe ser MSI de Microsoft Purview (sistema)
- El nivel de examen es Detección automática
- Seleccione una colección o use el dominio (la colección debe ser la misma colección o una colección secundaria de donde se registró el origen de datos)
- Seleccione Continuar.
Sugerencia
En este momento, Microsoft Purview probará la conexión para validar que se puede realizar un examen. Si no ha concedido acceso al lector MSI de Microsoft Purview en el origen de datos, se producirá un error. Si no es el propietario del origen de datos o tiene un colaborador de acceso de usuario, se producirá un error en el examen, ya que espera que tenga autorización para crear la conexión.
Ahora solo seleccione el contenedor "gold" donde colocamos la tabla delta en la sección de datos de compilación del tutorial. Esto impedirá el examen de cualquier otro recurso de datos que se encuentra en el almacén de datos.
- Si solo tiene una comprobación azul junto a oro, puede dejar las comprobaciones junto a todo, ya que examinará el origen completo y seguirá creando los recursos que usaremos y mucho más.
- Seleccione Continuar.
En la pantalla seleccionar un conjunto de reglas de examen, debe usar el conjunto de reglas de examen predeterminado.
Seleccione Continuar.
En Set a scan trigger (Establecer un desencadenador de examen), establecerá la frecuencia del examen para que, a medida que continúe agregando recursos de datos al contenedor gold del lago, seguirá rellenando el mapa de datos. Seleccione Una vez.
Seleccione Continuar.
Seleccione Guardar y ejecutar. Esto creará un examen que solo leerá los metadatos del contenedor gold del lago de datos y rellenará la tabla que usaremos en Catálogo unificado de Microsoft Purview en las secciones siguientes. Si solo selecciona guardar, no ejecutará el examen y no verá los recursos. Una vez que se ejecute el examen, verá el examen que creó con el estado De última ejecución en cola. Cuando se completen las lecturas del examen, los recursos están listos para la sección siguiente. Esto puede tardar unos minutos o horas en función del número de recursos que tenga en el origen.
Paso 3: Publicación de los productos de datos
La creación de productos de datos es esencial para garantizar que la organización pueda detectar los datos adecuados. Los productos de datos le ayudarán a evitar que se rigen por encima de los datos que son bajos o no tienen ningún valor en el patrimonio de datos porque no tienen ningún uso o valor limitado. Asegurarse de que los expertos en datos están a punto de publicar productos de datos activará los datos más valiosos y creará el nivel adecuado de gobernanza en función de ese valor. El mantenimiento de recursos que los equipos técnicos no conocen el propósito empresarial de o que intentan controlar todo lo que hay en el complejo y creciente patrimonio de datos provocará tiempo adicional y perderá productividad persiguiendo los detalles de los datos que podrían no usarse nunca o que podrían simplemente quitarse del patrimonio. En su lugar, céntrese en los fragmentos de datos que tienen valor y que las personas necesitan descubrir y crear aún más valor. A medida que los equipos usan más datos y obtienen una mejor comprensión de lo que se necesita o se pueden crear productos de datos más útiles para satisfacer esas demandas y la gobernanza se pueden adaptar para garantizar que siempre permanece el tamaño adecuado en función del valor y la confidencialidad de los datos.
Requisitos previos
- Debe ser propietario de un producto de datos para el dominio de gobernanza que usa.
- Debe tener recursos de datos en el mapa de datos. Si no lo hace, consulte la sección 2 de este tutorial para agregar algunas.
- Se debe publicar un dominio de gobernanza para publicar un producto de datos. Si no tiene una, consulte la sección 1 de este tutorial para crear una.
Creación y publicación de un producto de datos
Abra el portal de Microsoft Purview.
Seleccione Catálogo unificado.
Seleccione Administración de catálogos y, a continuación, Dominios de gobernanza.
En la página Dominios de gobernanza , seleccione el dominio de Personal Health.
Seleccione el vínculo Ir a productos de datos en Conceptos empresariales.
Aquí es donde los expertos en datos denominados propietarios de productos de datos identificarán los recursos de datos que están diseñados para ser consumidos por otros usuarios de su organización y proporcionarán la información necesaria para que se puedan usar.
Seleccionar nuevo producto de datos
Proporcionar detalles sobre el producto de datos
- Nombre: 'Covid-19 Vacunación y caso tendencias por edad'
- Descripción: "Estos datos proceden de los CDC como parte del Departamento de Salud de los Estados Unidos & Human Services. Los datos contienen tendencias en vacunaciones y casos por grupo de edad, a nivel nacional estadounidense. Los datos se estratifican por al menos una dosis y se vacunan completamente. Los datos también representan a todos los asociados de vacunas, incluidas las clínicas de asociados jurisdiccionales, las farmacias minoristas, los centros de atención a largo plazo, los centros de diálisis, la Agencia Federal de Administración de Emergencias y los sitios asociados de administración de recursos y servicios de salud y las instalaciones de entidades federales."
- Tipo: Conjunto de datos
- Seleccione Siguiente
- Casos de uso: "Estos datos se proporcionan para uso público y están destinados a ayudar a comprender las tendencias de la vacunación y los nuevos casos por diferentes grupos de edad. Las edades se agrupan en dos grupos que van desde <2 años hasta más de 65 años. Del mismo modo, las tendencias se proporcionan en números diarios que proporcionan un promedio de siete días de nuevos casos por grupo de edad".
- Marcar como Aprobado como comprobado.
- Haga clic en Guardar.
Ahora tiene los metadatos base del producto de datos compilados. A continuación, agregue algunas propiedades y asigne el recurso desde el mapa de datos.
Seleccione el botón + Agregar recursos de datos .
Verá los recursos que ha examinado en el mapa de datos, que incluirán todas las carpetas y capas del origen de datos.
Busque el recurso Covid19 Vaccine and Case Trends que agregó al contenedor dorado del lago de datos y seleccione este conjunto de recursos.
Seleccione Agregar. Puede seleccionar tantos recursos como sea necesario para un producto de datos, pero aquí solo se necesita uno.
Sugerencia
Pruebe el botón Obtener sugerencias para que GenAI le ayude a elegir entre los recursos del mapa de datos y seleccione Las tendencias de vacuna y caso de Covid19 en una lista reducida de resultados.
Ahora puede ver el recurso agregado al producto de datos.
Seleccione + Agregar término junto al título de términos del glosario.
Seleccione el término de brote creado anteriormente y seleccione Agregar.
Debería ver el elemento de datos crítico para el grupo de edad del recurso asignado al producto de datos ahora.
Seleccione + Agregar OKR junto al título de OKR.
Seleccione reducir el riesgo de pandemia al permitir una captación eficaz de la vacuna contra el paciente. Es el objetivo que hemos creado en la primera sección.
Administración de directivas de solicitud de acceso a productos de datos
En la parte superior de la página, el último paso antes de publicar el producto de datos es seleccionar el botón Administrar directivas . Aquí, las directivas de acceso y el flujo de trabajo de acceso de solicitud se configuran seleccionando y proporcionando los nombres para su aprobación. También puede usar la pestaña Directivas heredadas para ver la directiva de dominio de gobernanza aplicada a la atestación de copias de datos que aplicamos anteriormente. Es lo mismo para la aprobación del administrador requerida procedente del término glosario de Brote.
Seleccione la pestaña Administrar directivas .
En Límite de tiempo de acceso, proporcione detalles sobre cuánto tiempo es correcta la solicitud de acceso antes de tener que renovarse. Estableceremos esta opción para conceder acceso hasta un año.
En la caja, coloque 1.
Seleccione años en la lista desplegable.
En Requisitos de aprobación, proporcione su nombre en el cuadro aprobadores. (Necesitará el nombre registrado en Microsoft Entra ID)
Nota:
No es necesario comprobar la aprobación del administrador porque esa directiva se hereda del término del glosario de brotes.
Seleccione el botón Formulario de solicitud de vista previa para ver lo que verán los consumidores del catálogo al solicitar acceso. Verá la atestación de copia de datos y la aprobación del administrador necesarias porque se establecieron mediante el dominio de gobernanza y el término del glosario.
Seleccione Guardar cambios.
Una vez que tenga asignados los recursos de datos y las directivas de acceso, estará listo para publicar el producto de datos en el catálogo.
Seleccione Publicar en el producto de datos.
Pruebe a crear un informe de beneficios en otros dominios que creó anteriormente.
- Informe de beneficios, tipo: paneles o informes.
- Patrón de producto, tipo: datos de Maser y datos de referencia.
Nota:
Puede agregar muchos recursos a estos recursos y ver cómo se verá un producto de datos con muchos recursos y puede que los productos de datos se ajusten a los términos de cualquier dominio para ver cómo se usa el glosario para describir los datos mediante un conjunto coherente de términos.
Paso 4: Ejecución de la calidad de los datos
Ahora que tiene un producto de datos disponible en el catálogo, la ejecución de reglas de calidad de datos indicará a todos que los datos están en buen estado y listos para usarse. A medida que se obtenga más información sobre los datos, se pueden agregar nuevas reglas de calidad de datos para asegurarse de que son adecuadas para todos los casos de uso. Garantizar que los productos de datos son de la más alta calidad ayudará a generar confianza en los datos e indicar a otros usuarios que se supervisan de forma mejorada. A medida que aumenta el valor de los datos, la calidad de esos datos tendrá que supervisarse y controlarse más estrechamente, ya que los problemas de calidad de los datos pueden causar impactos masivos si se administran de forma deficiente.
Requisitos previos
- Las reglas de calidad de datos solo se pueden ejecutar en tablas de formato delta en ADLS Gen2 y Microsoft Fabric.
- La identidad administrada de Microsoft Purview debe estar habilitada para leer el origen de datos, ya que es la única credencial admitida para la calidad de los datos en la actualidad.
- Debe tener el rol de administrador de calidad de datos en el dominio de gobernanza en el que se ejecuta la calidad de los datos.
- Debe ser el propietario o tener acceso de administrador de acceso de usuario al origen de datos al que está conectando el examen de calidad de datos para garantizar una autorización de seguridad adecuada para examinar los datos.
- Debe tener el rol de administrador de perfiles de datos para ejecutar perfiles en los datos.
Creación y ejecución de reglas de calidad de datos
Abra el portal de Microsoft Purview.
Seleccione Catálogo unificado.
Seleccione la pestaña Calidad de los datos en Administración de datos.
Seleccione el dominio de personal health creado en la sección 1.
Seleccione el botón Administrar y elija Connections en el menú. La creación de esta conexión garantizará que pueda ejecutar exámenes de calidad de datos en el origen de datos de ese dominio de gobernanza, lo que impedirá que los equipos obtengan acceso al conocimiento de los datos sin la autorización adecuada.
Seleccione Nuevo en la pantalla de conexiones para crear una nueva conexión:
- Proporcione el nombre para mostrar "Personal Health ADLSg2 DQ".
- Seleccione el tipo de origen de Azure Data Lake Storage Gen2.
- Proporcione los detalles del origen de datos creado en la sección 2.
Nota:
La credencial debe ser MSI de Microsoft Purview (sistema) para una conexión de calidad de datos
- Seleccione Probar conexión
- Una vez probada la conexión, seleccione Enviar.
- Proporcione los detalles del origen de datos creado en la sección 2.
Una vez establecida la conexión, está listo para ejecutar perfiles y empezar a crear reglas de calidad de datos. Esto garantiza que los expertos que conocen las reglas de negocio y las reglas adecuadas se ejecutan en los productos de datos más importantes.
- Volver a la página Calidad de datos.
- Seleccione el dominio de gobernanza de Personal Health.
- Seleccione el producto de datos Covid-19 Vaccination and Case Trending by Age integrado en la sección 3.
- Seleccione el recurso que se agregó al producto de datos. (Debe estar en formato delta de la sección 2 o la calidad de los datos no se ejecutará).
- Aplique reglas de calidad de datos a las columnas de los datos para medir si cumplen las expectativas de calidad:
- Seleccione la pestaña Reglas en el recurso seleccionado.
- Seleccione Nueva regla.
- Seleccione Regla de campos vacíos o en blanco.
- Proporcione los detalles:
- Seleccione la columna AgeGroupVacc en la lista desplegable de columnas.
- Nombre de regla: Confirmar que existe el grupo de edad de vacunación
- Seleccione Crear.
- Seleccione Nueva regla.
- Seleccione Coincidencia de tipo de datos.
- Proporcione los detalles.
- Seleccione La columna DateAdministered.
- Seleccione Crear.
- Seleccione Ejecutar examen de calidad de datos.
Datos de perfil
Cree un perfil para los datos para ver las estáticas de alto nivel de cada columna y detectar las anomalías que podrían tener una nueva regla.
- En Catálogo unificado, seleccione Administración de estado y, después, Calidad de datos.
- Seleccionar datos de perfil
- Active la casilla superior situada junto a Nombre de columna para generar perfiles de todas las columnas. Microsoft Purview le recomendará qué columnas generar perfiles y puede seleccionar las columnas que sabe que merecen la pena generar perfiles para ayudar a evitar que los perfiles de datos altamente confidenciales o los datos que sabe se rellenen de forma dispersa.
- Seleccione Ejecutar perfil
Una vez completado el examen, podrá revisar la puntuación de calidad de los datos y el perfil del nuevo producto de datos y la puntuación de calidad de los datos estará disponible para todos los usuarios del catálogo, lo que garantiza que todos conozcan el estado de los datos.
Cree una programación para los exámenes de calidad de datos para asegurarse de que supervisa continuamente los problemas de calidad de los datos. Establezca alertas para asegurarse de que está solucionando problemas de calidad de datos antes de que los consumidores se vean afectados.
- En Administración de estado, seleccione Calidad de los datos.
- Seleccione el dominio de Personal Health donde hemos configurado las reglas de calidad de datos.
- En la lista desplegable Administrar , seleccione Exámenes programados.
- En la página Exámenes programados , seleccione Nuevo.
-
Agregar detalles de información general
- Nombre: Personal Health DQ Monthly Evaluation
- Descripción: examen mensual de las reglas de DQ para la mejora continua.
- Seleccione Continuar.
- Seleccione el ámbito del examen.
- Active la casilla situada junto a Covid-19 Vacunación y el producto de datos Tendencias de casos por edad
- Seleccione Continuar.
- Programar el examen para asegurarse de que se ejecuta el último día de cada mes
- Seleccione Periódicamente
- Periodicidad: cada mes
- Días del mes: último
- Programación de la hora del examen (UTC): 12:00:00
- Iniciar periodicidad a las (UTC): deje como valor predeterminado.
- Seleccione Continuar.
- Revise los detalles del examen para ver si hay algún cambio que quiera realizar antes de guardarlo.
- Haga clic en Guardar. Dado que se ha desencadenado un examen manual anterior, no es necesario desencadenar otro examen ahora, pero si se necesita un nuevo examen, seleccione Guardar y ejecutar.
Configurar alertas
Una vez que la calidad de los datos tiene exámenes programados, hay alertas que se pueden desencadenar para que los administradores sepan si hay problemas o atención necesarios debido a problemas de calidad de datos o errores de examen. Configure una alerta de calidad de datos para los exámenes con errores y cuando la puntuación disminuya más del 5 %.
- Volver al dominio De salud personal en la página Calidad de los datos.
- En la lista desplegable Administrar , seleccione Alertas.
- Seleccione Nuevo.
- Especificar los detalles de la alerta
- Nombre para mostrar: Examen mensual de Personal Health DQ
- Descripción: para asegurarse de que los umbrales mínimos de DQ cumplen las expectativas del consumidor.
- Objetivo: la puntuación disminuye en más de
- Umbral: 5
- Desactivar notificaciones: deje desactivada la opción
- Activar la notificación para los exámenes de calidad con errores: dejar activado
- Destinatario: escriba su nombre.
- Seleccione Continuar.
Sugerencia
Al implementar en el Catálogo unificado querrá enviar las alertas a los administradores que pueden notificar a los consumidores del problema y trabajar con el propietario técnico de los datos para realizar correcciones.
Al final de esta sección, ahora tendrá un Catálogo unificado funcional con calidad de datos operativos para administrar los datos que ofrece a los consumidores de datos de la organización. Todo ha sido para obtener los datos más valiosos para el consumidor y generar confianza en los datos que usarían. A medida que crece el valor de los datos y surgen nuevas estrategias de datos, la siguiente sección le ayudará a mostrar cómo puede administrar todo el catálogo o profundizar en la administración de datos específicos con datos maestros.
Paso 5: Administración de datos maestros
La administración de datos maestros es la práctica de ajustar las entidades de datos más importantes que deben ser precisas, únicas y aplicadas de forma coherente en todas las áreas de la empresa, ya que los errores y problemas de estos datos pueden afectar a toda la empresa. A través de uno de nuestros asociados de MDM, podrá integrar su elección de la solución Master Administración de datos (MDM) con Microsoft Purview para habilitar la unificación, estandarización y limpieza de datos que permitirá la creación de registros dorados y la publicación de datos maestros como productos de datos.
Siga los tutoriales que encontrará aquí para la solución que prefiera: Administración de datos maestros en Microsoft Purview
Paso 6: Administrar el estado de los datos
En Microsoft Purview Data Estate Health, Central Data Office y otros administradores de datos pueden evaluar el estado de los datos con respecto a sus estándares de empresa y administrar eficazmente el progreso hacia su estrategia. Para asegurarse de que todos los usuarios de la empresa saben lo que se puede hacer para aumentar el valor de sus datos, es esencial que los estándares se entiendan y sean escalables para toda la organización sin necesidad de convertir a todos en expertos en gobernanza de datos. A partir de un conjunto estándar del sector de controles que están disponibles de forma inmediata en Microsoft Purview, cada oficina de datos y personalizar los controles para satisfacer sus expectativas y asegurarse de que se alinea con sus objetivos de datos. Fundamental para la eficacia de estos controles no es solo la medición de estos estándares, sino también garantizar que los responsables de los datos puedan tomar medidas por su cuenta y ser responsables de realizar las mejoras que afectan al valor de los datos. En Data Estate Health, puede establecer y administrar todas estas funcionalidades críticas.
Requisitos previos
- Productos de datos, términos del glosario y otros conceptos empresariales publicados en Catálogo unificado de Microsoft Purview. Puede seguir las secciones anteriores para crear estas opciones:
- Al menos 24 horas desde el mantenimiento de los productos de datos.
- Debe tener el rol Propietario de Data Health en Catálogo unificado.
Evaluación de la gobernanza de los datos con el estado del patrimonio de datos
Abra el portal de Microsoft Purview.
Seleccione Catálogo unificado.
En Data Estate Health en el panel de navegación izquierdo, seleccione Controles de estado.
Seleccione la zanahoria > situada junto al grupo de control Creación de valores .
Mientras mantiene el puntero sobre un título de control, seleccione el icono de lápiz para editar el control. Al editar el control, cambia el umbral del control para establecer expectativas sobre cuál debe ser la puntuación y establecer la puntuación de color para mostrar las fases de progreso.
Los detalles le permiten proporcionar una descripción del control y lo que significa para su organización y establecer un propietario para un control específico.
Seleccione la pestaña Reglas del control para cambiar el umbral. Esto demuestra que tiene un objetivo alto y, si no es correcto, es fundamental realizar un seguimiento.
- Heredar del grupo: alternar para desactivar (debe activarse en gris).
- Puntuación de destino: 90
- Seleccione Nueva regla.
- Establezca el cuadro junto a la puntuación en GreaterThanOrEqual
- Establecer el porcentaje en 90
- Estado = Estado (verde)
- Else Box Status = Critical (Púrpura)
- Haga clic en Guardar.
En Estado del patrimonio de datos, seleccione Calidad de metadatos.
Aquí puede cambiar o agregar reglas que creen las puntuaciones del control. Aquí queremos cambiar la gravedad de las acciones para la creación de valores para garantizar que todos los usuarios conozcan la importancia de esta acción.
- Seleccione Configurar gravedad
- Seleccione el grupo de control Creación de valores.
- Seleccione el título del control de alineación Business OKR .
- Cambie la gravedad de Medio a Alto y seleccione Guardar.
- Seleccione la pestaña Acciones de mantenimiento.
- Filtro asignado a: a su nombre
- Seleccione una acción en la que pueda ver lo que el propietario de la acción debe hacer para garantizar que se cumplan las expectativas de gobernanza o puede asignar un nuevo propietario para obtener el mejor experto para proporcionar su entrada. También hay un estado que permite a otros usuarios saber qué trabajo está en marcha y dónde otras acciones podrían necesitar priorización.
Paso 7: Democratización de datos
Permitir que los usuarios busquen y accedan a los datos que necesitan de forma de queja es la esencia de la democratización de datos y garantiza que las personas puedan encontrar los datos que necesitan para crear valor empresarial. Proporcionar una experiencia limpia y sencilla para detectar datos es el propósito de Catálogo unificado de Microsoft Purview, a la vez que permite a los administradores actualizar y administrar los datos disponibles en el catálogo a escala. En esta sección, se explica cómo los usuarios pueden buscar y solicitar acceso a los datos y garantizar que los aprobadores adecuados puedan realizar un seguimiento y proporcionar entradas sobre esas solicitudes de acceso.
Requisitos previos
- Pasos completados del 1 al 4 como mínimo:
- Catálogo unificado permiso de lector en un dominio de gobernanza
Detección de productos de datos
- En Catálogo unificado, seleccione Detección y, después, Productos de datos.
- En la página Productos de datos , use la barra de búsqueda para buscar las tasas de vacunación por edad.
- Aquí verá los productos de datos que publicó en la sección 2. Esto muestra cómo los usuarios solo se exponen a los datos destinados a detectarlos e impide que los usuarios tengan que navegar por un patrimonio de datos altamente técnico.
- Seleccione el producto de datos Covid-19 Vaccination and Case Trending by Age
- Aquí, los consumidores pueden ver los metadatos que proporcionó y cualquiera de las demás propiedades que se configuraron durante la instalación. La puntuación de calidad de los datos también está aquí para que los consumidores conozcan la calidad antes de que incluso obtengan acceso a los datos.
- Seleccione el recurso y el consumidor puede ver que todas las columnas de están disponibles en el recurso de datos.
- Seleccione el término del glosario brote y el consumidor puede ver la descripción y otra información sobre el término para obtener una comprensión más profunda de los datos.
- Una vez que el consumidor esté seguro de que quiere usar esos datos, debe obtener acceso aprobado a los datos.
- Seleccione Solicitar acceso
- Rellene los detalles del formulario para enviar una solicitud.
- Usuario: deje su nombre
- Aprobación del administrador: se requiere automáticamente y se dirige al administrador de Microsoft Entra ID.
- Propósito: seleccionar un propósito
- Justificación empresarial: supervisión de OKR
- Active la casilla situada junto a la atestación para indicar que comprende las expectativas de usar estos datos.
- Seleccione Enviar.
La solicitud de acceso se enviará ahora a la lista administrada en Microsoft Entra ID. Desde aquí, el administrador puede acceder a las solicitudes abriendo el correo electrónico y seleccionando un vínculo o llegando a Microsoft Purview. La aprobación y administración del acceso se puede realizar directamente en Microsoft Purview.
- En Catálogo unificado, seleccione Administración de catálogos y, a continuación, seleccione Solicitudes.
- Seleccione el dominio De salud personal .
- Seleccione la solicitud que envió.
- Ahora, los aprobadores pueden aprobar o rechazar seleccionando Responder en la solicitud.