Compartir vía


Precios de la Mapa de datos de Microsoft Purview

En esta guía se tratan las directrices de precios para el mapa de datos en el portal de gobernanza de Microsoft Purview.

Para obtener detalles completos de la guía de precios de Microsoft Purview (anteriormente Azure Purview), consulte la introducción a la guía de precios.

Para obtener detalles específicos del precio, consulte la página de precios de Microsoft Purview (anteriormente Azure Purview). Este artículo le guiará a través de las características y factores que afectarán a los precios de la Mapa de datos de Microsoft Purview.

Los costos directos que afectan a los precios de los Mapa de datos de Microsoft Purview se basan en las tres dimensiones siguientes:

Mapa de datos elásticos

  • El mapa de datos es la base de la arquitectura del portal de gobernanza de Microsoft Purview, por lo que debe estar actualizado con la información de los recursos en el patrimonio de datos en un punto determinado.

  • El mapa de datos se cobra en términos de unidad de capacidad (CU). La asignación de datos se aprovisiona en una CU si el catálogo almacena hasta 10 GB de almacenamiento de metadatos y realiza hasta 25 operaciones de mapa de datos por segundo.

  • La asignación de datos siempre se aprovisiona en un CU cuando se crea una cuenta por primera vez.

  • Sin embargo, el mapa de datos se escala automáticamente entre los límites mínimo y máximo de esa ventana de elasticidad, para satisfacer los cambios en el mapa de datos con respecto a dos factores clave: el rendimiento de la operación y el almacenamiento de metadatos.

Rendimiento de la operación

  • Un factor controlado por eventos basado en las operaciones Create, Read, Update y Delete realizadas en el mapa de datos.
  • Algunos ejemplos de las operaciones de asignación de datos serían:
    • Creación de un recurso en Data Map
    • Adición de una relación a un recurso como propietario, administrador, primario y linaje
    • Edición de un recurso para agregar metadatos empresariales, como la descripción, el término del glosario
    • Búsqueda de palabras clave que devuelve resultados a la página de resultados de búsqueda
    • Importación o exportación de información mediante la API
  • Si hay varias consultas ejecutadas en el mapa de datos, el número de operaciones de E/S también aumenta, lo que da como resultado el escalado vertical del mapa de datos.
  • El número de usuarios simultáneos también forma un factor que rige la unidad de capacidad del mapa de datos.
  • Otros factores a tener en cuenta son el tipo de consulta de búsqueda, la interacción de api, los flujos de trabajo, las aprobaciones, etc.
  • Nivel de ráfaga de datos
    • Cuando se necesita más rendimiento de operaciones/segundo, el mapa de datos puede escalar automáticamente dentro de la ventana de elasticidad para satisfacer la carga cambiada.
    • Esto constituye la característica de ráfaga que debe calcularse y planearse para
    • La característica de ráfaga comprende el nivel de ráfaga y la duración de la ráfaga para la que existe la ráfaga.
      • El nivel de ráfaga es un índice multiplicativo de la elasticidad coherente esperada en estado estable
      • La duración de la ráfaga es el porcentaje del mes en el que se esperan esas ráfagas (en elasticidad) debido al aumento de metadatos o al mayor número de operaciones en el mapa de datos.

Almacenamiento de metadatos

  • Si el número de recursos se reduce en el patrimonio de datos y, a continuación, se quita en el mapa de datos a través de exámenes incrementales posteriores, el componente de almacenamiento se reduce automáticamente y, por tanto, el mapa de datos se reduce verticalmente.

Examen, clasificación e ingesta automatizados

Hay dos procesos automatizados principales que pueden desencadenar la ingesta de metadatos en el Mapa de datos de Microsoft Purview:

  • Exámenes automáticos mediante conectores nativos. Este proceso incluye tres pasos principales:

    • Examen de metadatos
    • Clasificación automática
    • Ingesta de metadatos en el Mapa de datos de Microsoft Purview
  • Ingesta automatizada mediante canalizaciones de Azure Data Factory o Azure Synapse. Por lo general, este proceso incluye:

    • Ingesta de metadatos y linaje en el Mapa de datos de Microsoft Purview si la cuenta está conectada a cualquier canalización de Azure Data Factory o Azure Synapse.

Exámenes automáticos mediante conectores nativos

  • Un examen completo procesa todos los recursos dentro de un ámbito seleccionado de un origen de datos, mientras que un examen incremental detecta y procesa los recursos, que se han creado, modificado o eliminado desde el examen correcto anterior.

  • Todos los exámenes (exámenes completos o incrementales) recogerán recursos actualizados, modificados o eliminados .

  • Es importante tener en cuenta y evitar los escenarios en los que varias personas o grupos que pertenecen a distintos departamentos configuran exámenes para el mismo origen de datos, lo que da lugar a más precios para el examen duplicado.

  • Programe exámenes incrementales frecuentes después del examen completo inicial alineado con los cambios en el patrimonio de datos. Esto garantizará que el mapa de datos se mantenga actualizado siempre y que los exámenes incrementales consuman menos horas de núcleo virtual en comparación con un examen completo.

  • El vínculo "Ver detalles" de un origen de datos permitirá a los usuarios ejecutar un examen completo. Sin embargo, considere la posibilidad de ejecutar exámenes incrementales después de un examen completo para el examen optimizado, excepto cuando haya un cambio en el conjunto de reglas de examen (clasificaciones o tipos de archivo)

  • Registre el origen de datos en una colección primaria y los exámenes de ámbito en la colección secundaria con distintos controles de acceso para asegurarse de que no se impliquen costos de examen duplicados.

  • Limitar los usuarios a los que se les permite registrar orígenes de datos para el examen a través de un control de acceso específico y un rol de administrador de origen de datos mediante la autorización de recopilación. Esto garantizará que solo se permita registrar orígenes de datos válidos y se controle el examen de las horas de núcleo virtual, lo que reduce los costos de examen.

  • Tenga en cuenta que el tipo de origen de datos y el número de recursos que se examinan afectan a la duración del examen.

  • Cree conjuntos de reglas de examen personalizados para incluir solo el subconjunto de tipos de archivo disponibles en el patrimonio de datos y las clasificaciones pertinentes para los requisitos empresariales para garantizar un uso óptimo de los escáneres.

  • Al crear un nuevo examen para un origen de datos, siga el orden de preparación recomendado antes de ejecutar realmente el examen. Esto incluye la recopilación de los requisitos de clasificaciones y tipos de archivo específicos de la empresa (para cuentas de almacenamiento) para permitir que se definan los conjuntos de reglas de examen adecuados para evitar varios exámenes y controlar los costos innecesarios de varios exámenes a través de requisitos que no se cumplen.

  • Alinee las programaciones de examen con el tamaño de las máquinas virtuales de Self-Hosted Integration Runtime (SHIR) (Virtual Machines) para evitar costos adicionales vinculados a máquinas virtuales.

Ingesta automatizada mediante canalizaciones de Azure Data Factory o Azure Synapse

  • Los metadatos y el linaje se ingieren de Azure Data Factory o Azure Synapse canalizaciones cada vez que las canalizaciones se ejecutan en el sistema de origen.

Conjuntos de recursos avanzados

  • El Mapa de datos de Microsoft Purview usa conjuntos de recursos para abordar el desafío de asignar un gran número de recursos de datos a un único recurso lógico proporcionando la capacidad de examinar todos los archivos del lago de datos y buscar patrones (GUID, patrones de localización, etc.) para agruparlos como un único recurso en el mapa de datos.

  • El conjunto de recursos avanzado es una característica opcional, que permite a los clientes obtener información enriquecida del conjunto de recursos calculada como Tamaño total, Recuento de particiones, etc., y permite la personalización de la agrupación de conjuntos de recursos mediante reglas de patrón. Si la característica Conjunto de recursos avanzados no está habilitada, el catálogo de datos seguirá conteniendo recursos del conjunto de recursos, pero sin las propiedades agregadas. En este caso, no se facturará al cliente ningún medidor de "conjunto de recursos".

  • Use la característica de conjunto de recursos básico, antes de activar los conjuntos de recursos avanzados de la Mapa de datos de Microsoft Purview para comprobar si se cumplen los requisitos.

  • Considere la posibilidad de activar conjuntos de recursos avanzados si:

    • El esquema de los lagos de datos cambia constantemente y busca más valor que la característica básica de conjunto de recursos para permitir que el Mapa de datos de Microsoft Purview calcule parámetros como #partitions, tamaño del patrimonio de datos, etc., como servicio.
    • Es necesario personalizar cómo se agrupan los recursos del conjunto de recursos.
  • Es importante tener en cuenta que la facturación de los conjuntos de recursos avanzados se basa en el proceso utilizado por el nivel sin conexión para agregar información del conjunto de recursos y depende del tamaño o número de conjuntos de recursos del catálogo.

Pasos siguientes