Zarządzanie cyklem życia danych
Zarządzanie cyklem życia danych to praktyka używania określonych zasad do efektywnego zarządzania danymi przez cały czas, w jaki istnieje w systemie. Te zasady powinny składać się z nadrzędnego magazynu i zasad danych, które napędzają procesy zarządzania danymi. Ponieważ cele biznesowe i czynniki dyktują zasady zarządzania cyklem życia danych, zazwyczaj są one wiązane ze strukturą ogólnych umów dotyczących ładu, zarządzania i poziomu usług (SLA).
Po zapoznaniu się z typem posiadanych danych i sposobem ich użycia, wiesz już, jaka jest ich najbardziej prawdopodobna ewolucja i przeznaczenie. Musisz zrozumieć, w jaki sposób dane ewoluują, określić, jak się rozwija, monitorować zmiany użycia w czasie, decydować o tym, jak długo powinny istnieć, i przestrzegać wszystkich zasad i przepisów, które mają zastosowanie do tych danych.
Zarządzanie cyklem życia danych odpowiada tym potrzebom przy użyciu kombinacji procesów, zasad i oprogramowania, dzięki czemu zespoły mogą używać odpowiedniej technologii dla każdej fazy cyklu życia danych.
Cykl życia danych
Produkty danych mogą mieć różne cykle życia. W typowym wzorcu cyklu życia nowo pozyskane dane są często używane i używane. Wraz ze wzrostem wieku szybkość dostępu często spada, a starsze dane znacząco spadają. Niektóre produkty danych mogą wygasnąć dni lub miesiące po ich utworzeniu, podczas gdy inne produkty danych są aktywnie używane i modyfikowane przez całe ich okresy istnienia.
Cykle życia danych mogą jednak różnić się od tego typowego wzorca. Niektóre dane pozostają nieużywane po początkowym pozyskiwaniu lub rzadko są dostępne po ich przechowywaniu. Większość miejsc ma przepisy, które określają, jak długo są wymagane do przechowywania danych, takich jak dane osobowe i dane księgowe. Określony kraj/region może wymagać przechowywania podstawowej dokumentacji przez pięć lat dla danych, takich jak faktury przychodzące i wychodzące, salda księgi kasowej, bony bankowe i paski płacowe. Może również wymagać przechowywania dodatkowej dokumentacji przez od trzech do pięciu lat, w tym listów, umów i notatek.
Zarządzanie cyklami życia danych
Istnieją dwa sposoby podejścia do zarządzania cyklem życia danych w analizie w skali chmury:
- Możesz użyć wbudowanych funkcji cyklu życia danych każdej usługi platformy Azure zawierającej utrwalone dane, takie jak Azure Data Lake. Ta metoda jest dobra do przenoszenia danych do warstw zimnych i archiwalnych, ale nie zapewnia usunięcia danych po upływie określonego czasu.
Ważne
Warstwa Archiwum nie jest obecnie obsługiwana dla kont magazynu strefowo nadmiarowego. Aby uzyskać więcej informacji, zobacz nadmiarowość danych.
- Cykl życia danych można zintegrować w procesie dołączania, co daje właścicielom aplikacji możliwość zdefiniowania zasad cyklu życia danych. Ten proces obejmuje aplikację niestandardową do przechwytywania kluczowych metryk do standardów metadanych dla każdego produktu danych. Część tej metody polega na przeniesieniu danych z gorącej do zimnej do archiwum i zapewnia usunięcie danych po upływie określonego czasu.