Wymagania dotyczące zarządzania danymi
Analiza w skali chmury zaleca uwzględnienie następujących wymagań dotyczących zarządzania danymi:
- Definicja jednostki danych w celu utworzenia wspólnego słownictwa biznesowego w słowniku biznesowym. Jednostki danych w tym kontekście oznaczają pojęcia, takie jak klient, dostawca, materiały, pracownik i inne.
- Identyfikacja i odnajdywanie jednostek danych.
- Klasyfikacja danych w celu zarządzania zabezpieczeniami dostępu do danych, prywatnością danych i przechowywaniem danych.
- Osoby, takie jak właściciele danych z odpowiedzialnością za nadzór nad danymi i stewardzi danych odpowiedzialni za ochronę danych i ich jakość.
- Procesy nadzoru nad danymi.
- Zarządzanie cyklem życia danych w celu zarządzania tym, jak długo powinny być przechowywane dane.
- Zasady i reguły definiujące sposób stosowania określonych danych w całym cyklu życia.
- Wymuszanie zasad w magazynach danych w rozproszonym środowisku danych.
- Zarządzanie danymi głównymi w celu zapewnienia spójności danych w systemach operacyjnych i analitycznych, takich jak klient, produkt i dostawca.
- Pochodzenie metadanych w celu zrozumienia transformacji i relacji jednostek danych.
- Technologia umożliwiająca zarządzanie danymi ustrukturyzowanymi, wielostrukturalnych i bez struktury. Ład może obejmować całe centrum danych, wiele chmur i brzeg.
Jednym z wyzwań jest to, że dane są zbierane i przechowywane w wielu miejscach w przedsiębiorstwie. Dane mogą obejmować dane zebrane i przechowywane w różnych lokalizacjach geograficznych i różnych jurysdykcjach prawnych. W związku z tym różne przepisy mogą mieć zastosowanie do zarządzania tymi samymi danymi w różnych jurysdykcjach. Odnajdywanie danych rozproszonych w wielu chmurach i lokalizacjach geograficznych w celu:
- Dowiedz się, jakie atrybuty danych, jednostki danych i relacje danych istnieją w rozproszonym krajobrazie danych.
- Klasyfikuj dane, aby wiedzieć, jak je zarządzać.
- Zdefiniuj zasady, aby określić sposób zarządzania danymi dla każdego typu klasyfikacji danych i zarządzania cyklem życia.
- Wymuszanie jakości danych, zabezpieczeń dostępu do danych, prywatności danych i zasad zarządzania cyklem życia w całym rozproszonym poziomie danych.
Klasyfikacja danych
Klasyfikacja danych to sposób kategoryzowania zasobów danych przez przypisanie unikatowych tagów logicznych lub klas do zasobów danych. Klasyfikacja jest oparta na kontekście biznesowym danych.
Musi istnieć sposób klasyfikowania danych, aby zrozumieć jej poziom poufności i jak długo je zachować. Klasyfikacja wymaga:
- Schemat klasyfikacji poufności danych.
- Schemat klasyfikacji przechowywania danych.
Schemat klasyfikacji poufności danych
Klasyfikacja | opis |
---|---|
Publiczne | Każda osoba może uzyskać dostęp do danych i może zostać wysłana do wszystkich osób. Na przykład otwórz dane dla instytucji rządowych. |
Tylko do użytku wewnętrznego | Tylko pracownicy mogą uzyskiwać dostęp do danych i nie mogą być wysyłane poza firmę. |
Poufne | Dane mogą być udostępniane tylko wtedy, gdy są potrzebne do określonego zadania. Nie można wysyłać danych poza firmę bez umowy o zachowaniu poufności. |
Poufne (dane osobowe) | Dane zawierają informacje prywatne, które muszą być maskowane i udostępniane tylko w oparciu o konieczność znajomości przez ograniczony czas. Nie można wysyłać danych do nieautoryzowanego personelu lub spoza firmy. |
Podlega ograniczeniom | Dane mogą być udostępniane tylko nazwanym osobom odpowiedzialnym za ich ochronę. Na przykład dokumenty prawne lub tajemnice handlowe. |
Schemat klasyfikacji przechowywania cyklu życia danych
Okres przetrzymywania | opis |
---|---|
None | Dane można usuwać w dowolnym momencie. |
Tymczasowy | Zachowaj dane przez krótki czas. Na przykład przechowuj dane usługi Twitter przez tydzień. |
Stały okres | Zachowaj dane przez zestaw lat, po którym można je usunąć. Na przykład przechowywanie rejestrów podatkowych przez siedem lat w celu zachowania zgodności z przepisami rządowymi. |
Stale | Nigdy nie usuwaj danych. Na przykład korespondencja prawna. |
Automatyzacja procesu klasyfikacji poufności danych i przechowywania cyklu życia danych przy użyciu klas zdefiniowanych w każdym schemacie jest wymagana do spójnego etykietowania danych w rozproszonym krajobrazie danych. Automatyzacja pozwala na spójne i prawidłowe rządy. Następnie zdefiniuj reguły i zasady dla każdej klasy w schemacie klasyfikacji, aby określić sposób zarządzania danymi zgodnie z klasyfikacją.
Role i obowiązki związane z ładem danych
Innym wymaganiem jest potrzeba odpowiedzialności. W przeciwnym razie zamieszanie pozostaje związane z tym, kto jest odpowiedzialny za zarządzanie danymi. Jeśli nie ma odpowiedzialności, jak odpowiedzieć na następujące pytania?
- Kto ustawia metryki sukcesu i monitoruje, jak dobrze działa program ładu danych?
- Kim są właściciele danych?
- Kto definiuje i utrzymuje słownik biznesowy?
- Kto tworzy i utrzymuje zasady dotyczące zabezpieczeń dostępu?
- Kto chroni prywatność danych osobowych pod kątem zgodności?
- Kto opiekuje się jakością danych produktów we wszystkich broszurach i witrynach partnerskich?
- Kto zapewnia spójność danych klientów we wszystkich systemach?
- Kto jest policją użycia danych subskrypcji zewnętrznej w porównaniu z licencją?
- Kto jest policją uprzywilejowanych użytkowników, takich jak administratorzy baz danych i analitycy danych?
- Czy jest to kadra kierownicza na poziomie C? Czy jest to szef działu?
- Czy jest to szef nadzoru, ryzyka i zgodności?
- Co z działem prawnym?
- Czy jest to odpowiedzialność it?
Role i obowiązki są potrzebne, aby uniknąć nieporozumień i ustawić podstawy, na których kultura danych może zmaterializować.
Procesy nadzoru nad danymi
Procesy są potrzebne, wraz z rolami i obowiązkami, aby:
- Zarządzanie definicją i utrzymaniem wspólnego słownictwa biznesowego.
- Odkryj i zidentyfikuj posiadane dane, co to znaczy i gdzie są przechowywane.
- Klasyfikuj dane, aby wiedzieć, jak je zarządzać.
- Zarządzanie definicją i konserwacją zasad zabezpieczeń dostępu do danych.
- Zarządzanie definicją i konserwacją zasad ochrony prywatności danych.
- Wykrywanie problemów z jakością danych i ich korygowanie.
- Zastosuj zasady, aby upewnić się, że akcja jest podejmowana pod kątem zgodności.
- Zarządzanie konserwacją danych głównych.
Zasady i reguły ładu danych
Zdefiniuj zasady i reguły do zarządzania:
- Reguły integralności danych
- Zasady i reguły pozyskiwania danych
- Zasady i reguły zabezpieczeń dostępu do danych
- Zasady i reguły dotyczące prywatności danych
- Zasady i reguły dotyczące jakości danych
- Zasady i reguły konserwacji danych
- Zasady i reguły przechowywania danych
Skojarz te zasady i reguły z każdą klasą w schematach klasyfikacji ładu danych.
Zarządzanie danymi głównymi
Innym wymaganiem w zarządzaniu danymi jest zarządzanie danymi głównymi. Dane główne to najczęściej udostępniane dane w dowolnej organizacji i zawierają podstawowe jednostki danych. Podstawowe jednostki danych obejmują klienta, dostawcę, materiały, pracownika i zasób. Zawiera również wykres finansowy danych dotyczących kont znalezionych w różnych aplikacjach finansowych. Ponieważ dane główne są tak szeroko udostępniane, są niezależne od aplikacji. Jest to wymagane zarówno przez operacyjne aplikacje przetwarzania transakcji, jak i systemy analityczne. Synchronizowanie tych danych może rozwiązać wiele błędów danych i błędów przetwarzania. Dlatego utrzymywanie tego w sposób scentralizowany za pośrednictwem wspólnego procesu i synchronizowanie każdego systemu, który go potrzebuje, to idealna sytuacja. Ponadto konieczne jest zapewnienie ładu w zakresie tego, kto może go utrzymywać i gdzie należy przeprowadzić konserwację.
Dotyczy to również danych referencyjnych, takich jak zestawy kodu i dane rynków finansowych. W takim przypadku standaryzacja i synchronizacja zestawów kodu są nazywane zarządzaniem danymi referencyjnymi, co jest również wymaganiem.
Pochodzenie metadanych
Na koniec istnieje wymaganie dotyczące pochodzenia metadanych. Możesz użyć dziennika inspekcji, aby dowiedzieć się, skąd pochodzą dane i jak są przekształcane w drodze do raportu lub magazynu danych. Możesz użyć metadanych, aby śledzić, kto lub co utrzymuje dane, w tym czas i miejsce ich wystąpienia.
Podsumowanie tego, co jest potrzebne do kompleksowego zarządzania danymi
Potrzebujesz kompleksowego rozwiązania, które może zarządzać danymi w całym cyklu życia magazynów danych w brzegu, wielu chmurach i centrum danych.
Rozwiązanie do zapewniania ładu danych powinno mieć kilka składników:
- Wizja i strategia zapewniania ładu danych
- Same dane, takie jak dane klienta, dane dostawcy, dane zamówienia i inne
- Cykl życia danych od utworzenia do zniszczenia, w ramach którego dane muszą być zarządzane
- Role i obowiązki dotyczące zarządzania danymi (ludzie)
- Procesy i działania ładu danych oraz sposób ich stosowania do cyklu życia danych
- Zasady i reguły do zarządzania danymi w różnych punktach cyklu życia
- Technologie zarządzania danymi, które pomagają w jego realizacji