Role w danych
Opowiadanie historii za pomocą danych to podróż, która zwykle nie zaczyna się od Ciebie. Dane muszą skądś pochodzić. Umieszczenie tych danych w miejscu, które jest dla Ciebie dostępne, wymaga działań prawdopodobnie wychodzących poza Twój zakres zadań, szczególnie w przypadku przedsiębiorstwa.
Współczesne aplikacje i projekty mogą być duże i zawiłe, często wykorzystując umiejętności i wiedzę wielu osób. Każda osoba kładzie na stół unikatowy talent i wiedzę fachową, współpracując i koordynując zadania i obowiązki w celu określenia projektu od koncepcji do produkcji.
Nie tak dawno takie role jak analitycy biznesowi i deweloperzy analizy biznesowej były normą w ramach przetwarzania i interpretacji danych. Jednak znaczący wzrost zarówno rozmiaru danych, jak i różnych typów danych spowodowały, że te role wyewoluowały w bardziej wyspecjalizowany zbiór umiejętności, który zmodernizował i usprawnił procesy inżynierii i analizy danych.
W poniższych sekcjach przedstawiono różne role w danych i określoną odpowiedzialność w ogólnym, spektrum odnajdowania i interpretacji danych:
Analityk biznesowy
Analityk danych
Inżynier danych
Mistrz danych
Administrator bazy danych
Analityk biznesowy
Chociaż istnieją pewne podobieństwa między analitykiem danych i analitykiem biznesowym, najważniejsza różnica między tymi dwoma rolami polega na tym, co one robią z danymi. Analityk biznesowy jest bliżej samej firmy i jest specjalistą ds. interpretacji danych, które pochodzą z wizualizacji. Często analityk danych i analityk biznesowy to może być odpowiedzialność jednej osoby.
Analityk danych
Analityk danych umożliwia firmom maksymalizowanie wartości ich zasobów danych za pomocą narzędzi do wizualizacji i raportowania, takich jak Microsoft Power BI. Analitycy danych są odpowiedzialni za profilowanie, czyszczenie i przekształcanie danych. Ich obowiązki obejmują również projektowanie i tworzenie skalowalnych i skutecznych modeli semantycznych oraz włączanie i implementowanie zaawansowanych możliwości analizy w raportach na potrzeby analizy. Współpracują oni z odpowiednimi osobami biorącymi udział w projekcie, aby identyfikować odpowiednie i niezbędne dane oraz wymagania dotyczące raportowania, a następnie wykonywać zadania związane z przekształcaniem nieprzetworzonych danych w odpowiednie i zrozumiałe szczegółowe informacje.
Analityk danych jest również odpowiedzialny za zarządzanie zasobami usługi Power BI, w tym raportami, pulpitami nawigacyjnymi, obszarami roboczymi i podstawowymi modelami semantycznymi używanymi w raportach. Wykonuje on zadania implementowania i konfigurowania właściwych procedur zabezpieczeń, w połączeniu z wymaganiami osób biorących udział w projekcie, w celu zapewnienia bezpieczeństwa przechowywania wszystkich zasobów usługi Power BI i ich danych.
Analitycy danych współpracują z inżynierami danych w celu określenia i zlokalizowania odpowiednich źródeł danych, które spełniają wymagania osób biorących udział w projekcie. Ponadto współpracują zarówno z inżynierem danych, jak i administratorem bazy danych, aby zapewnić, że analityk danych ma właściwy dostęp do wymaganych źródeł danych. Analityk danych współpracuje również z inżynierem danych w celu identyfikowania nowych procesów lub ulepszania istniejących procesów służących do gromadzenia danych do analizy.
Inżynier danych
Inżynierowie danych aprowizują i konfigurują technologie platformy danych znajdujące się w środowisku lokalnym i w chmurze. Zabezpieczają oni przepływ ustrukturyzowanych i nieustrukturyzowanych danych z wielu źródeł oraz zarządzają nim. Używane przez nich platformy mogą obejmować relacyjne bazy danych, nierelacyjne bazy danych, strumienie danych i magazyny plików. Inżynierowie danych zapewniają również bezpieczne i bezproblemowe integrowanie usług danych na różnych platformach danych.
Do podstawowych obowiązków inżynierów danych należy wykorzystanie usług i narzędzi danych lokalnych oraz w chmurze do pozyskiwania, przesyłania i przekształcania danych z wielu źródeł. Inżynierowie danych współpracują z osobami biorącymi udział w projekcie biznesowym w celu identyfikowania wymagań dotyczących danych oraz ich spełniania. Zajmują się oni również projektowaniem i implementowaniem rozwiązań.
Chociaż niektóre zadania i obowiązki inżyniera danych i administratora bazy danych mogą być podobne, zakres pracy inżyniera danych znacznie wykracza poza utrzymanie bazy danych i serwera, na którym jest hostowana, i prawdopodobnie nie obejmuje ogólnego zarządzania danymi operacyjnymi.
Inżynier danych odgrywa ogromną rolę w projektach analizy biznesowej i projektach dotyczących danych do celów naukowych. Gdy inżynier danych łączy dane ze sobą, co jest często opisywane jako uzdatnianie danych, realizacja projektów przebiega szybciej, ponieważ mistrzowie danych mogą skupić się na swoich własnych obszarach pracy.
Jako analityk danych ściśle współpracujesz z inżynierem danych, upewniając się, że masz dostęp do różnych źródeł danych ze strukturą i bez struktury, ponieważ będą one obsługiwać optymalizację modeli semantycznych, które są zwykle obsługiwane z nowoczesnego magazynu danych lub magazynu danych typu data lake.
Zarówno administratorzy baz danych, jak i profesjonalni analitycy biznesowi mogą łatwo przekwalifikować się na inżynierów danych, poznając narzędzia i technologie używane do przetwarzania dużych ilości danych.
Mistrz danych
Analitycy danych wykonują zaawansowane prace analityczne w celu uzyskania wartościowych danych. Wykonują oni różne prace — od analizy opisowej do analizy predykcyjnej. Analiza opisowa polega na ocenie danych w procesie zwanym eksploracyjną analizą danych. Analiza predykcyjna jest używana w procesie uczenia maszynowego w celu zastosowania technik modelowania, które umożliwiają wykrywanie anomalii lub wzorców. Te analizy są ważnymi elementami modeli prognoz.
Analiza opisowa i analiza predykcyjna to tylko część pracy analityków danych. Niektórzy z nich mogą nawet działać w obszarach uczenia głębokiego, iteracyjnie przeprowadzając eksperymenty w celu rozwiązania złożonych problemów dotyczących danych przy użyciu niestandardowych algorytmów.
Istnieje nawet przekonanie, że większość działań związanych z projektami nauki o danych polega na uzdatnianiu danych i opracowywaniu funkcji. Mistrzowie danych mogą przyspieszyć proces eksperymentowania, natomiast inżynierowie danych mogą użyć swoich umiejętności, aby pomyślnie uzdatniać dane.
Na pierwszy rzut oka może wydawać się, że mistrz danych i analityk danych wykonują bardzo różne prace, ale tak nie jest. Mistrz danych przegląda dane, aby określić pytania, które wymagają odpowiedzi, i często opracowuje hipotezę lub eksperyment i zwraca się do analityka danych w celu uzyskania pomocy dotyczącej wizualizacji i raportowania danych.
Administrator bazy danych
Administrator bazy danych implementuje i zarządza aspektami operacyjnymi rozwiązań natywnych dla chmury i hybrydowych platform danych opartych na usługach danych platformy Microsoft Azure i programie Microsoft SQL Server. Administrator bazy danych jest odpowiedzialny za ogólną dostępność oraz spójną wydajność i optymalizacje rozwiązań bazy danych. Współpracują oni z osobami biorącymi udział w projekcie, aby identyfikować i implementować zasady, narzędzia i procesy dotyczące tworzenia kopii zapasowych danych i planów odzyskiwania.
Rola administratora bazy danych różni się od roli inżyniera danych. Administrator bazy danych monitoruje i zarządza ogólną kondycją bazy danych oraz sprzętem, na którym się ona znajduje, natomiast inżynier danych bierze udział w procesie uzdatniania danych, czyli pozyskiwania, przekształcania, weryfikacji i czyszczenia danych w celu zaspokojenia potrzeb i spełnienia wymagań firmy.
Administrator bazy danych jest również odpowiedzialny za zarządzanie całościowym bezpieczeństwem danych, przyznawanie i ograniczanie dostępu użytkowników oraz ich uprawnień do danych zgodnie z potrzebami i wymaganiami biznesowymi.