Administración del ciclo de vida de los datos
La administración del ciclo de vida de los datos es la práctica de usar directivas específicas para administrar de forma eficaz los datos durante todo el tiempo que existe en el sistema. Estas directivas deben constar de directivas generales de datos y almacenamiento que impulsen los procesos de administración de datos. Dado que los objetivos empresariales y los impulsores dictan las directivas de administración del ciclo de vida de los datos, generalmente se vinculan a un marco de acuerdos generales de gobernanza de TI, administración y nivel de servicio (SLA).
Después de saber qué tipo de datos tiene y cómo se usará, ya conoce su evolución y destino más probables. Debe comprender cómo evolucionan los datos, determinar cómo crece, supervisar los cambios en su uso con el tiempo, decidir cuánto tiempo debe existir y cumplir todas las reglas y regulaciones que se aplican a esos datos.
La administración del ciclo de vida de los datos aborda estas necesidades mediante una combinación de procesos, directivas y software para que los equipos puedan usar la tecnología adecuada para cada fase del ciclo de vida de los datos.
Ciclo de vida de los datos
Los productos de datos pueden tener ciclos de vida diferentes. En un patrón de ciclo de vida típico, los datos recién ingeridos se usan y se accede a ellos a menudo. A medida que aumenta su edad, su tasa de acceso disminuye y se ve una reducción drástica del uso de los datos más antiguos. Algunos productos de datos pueden expirar días o meses después de su creación, mientras que otros productos de datos se usan y modifican activamente durante toda su duración.
Sin embargo, los ciclos de vida de los datos pueden diferir de este patrón típico. Algunos datos permanecen sin usar después de su ingesta inicial o rara vez se accede a ellos después de almacenarlos. La mayoría de los lugares tienen regulaciones que determinan el tiempo necesario para almacenar datos, como datos personales y datos de contabilidad. Un país o región en particular puede requerir que conserve la documentación principal durante cinco años para los datos, como facturas entrantes y salientes, saldos de libros de efectivo, vales bancarios y recibos de salario. También puede requerir que la documentación secundaria se conserve durante tres a cinco años, lo que incluye cosas como cartas, acuerdos y notas.
Administración de los ciclos de vida de los datos
Hay dos maneras de abordar la administración del ciclo de vida de los datos en el análisis a escala de la nube:
- Puede usar las características del ciclo de vida de datos integrados de cada servicio de Azure que contenga datos persistentes, como Azure Data Lake. Este método es adecuado para mover datos a niveles de almacenamiento en frío y de archivo, pero no puede asegurarse de que los datos se eliminan después de una cantidad de tiempo especificada.
Importante
El nivel de archivo no se admite actualmente para las cuentas de almacenamiento con redundancia de zona. Para más información, consulte redundancia de datos.
- Puede integrar el ciclo de vida de los datos en un proceso de incorporación, lo que ofrece a los propietarios empresariales de aplicaciones la oportunidad de definir su directiva de ciclo de vida de los datos. Este proceso implica una aplicación personalizada para capturar métricas clave en estándares de metadatos para cada producto de datos. Parte de este método implica mover datos de caliente a frío a archivo y garantiza la eliminación de datos tras un periodo de tiempo especificado.