Vereisten voor het beheren van gegevens
Bij analyses op cloudschaal wordt u aangeraden rekening te houden met de volgende vereisten voor het beheren van gegevens:
- Definitie van gegevensentiteit voor het maken van een algemene zakelijke woordenlijst in een zakelijke woordenlijst. Gegevensentiteiten in deze context betekenen concepten zoals klant, leverancier, materialen, werknemers en anderen.
- Identificatie en detectie van gegevensentiteiten.
- Gegevensclassificatie voor het beheren van beveiliging van gegevenstoegang, gegevensprivacy en gegevensretentie.
- Personen, zoals gegevenseigenaren met governanceverantwoordelijkheid en gegevensstewards die verantwoordelijk zijn voor gegevensbescherming en kwaliteit.
- Processen voor gegevensbeheer.
- Beheer van de levenscyclus van gegevens om te bepalen hoe lang gegevens moeten worden bewaard.
- Beleidsregels en regels om te definiëren hoe specifieke gegevens gedurende de gehele levenscyclus moeten worden beheerd.
- Beleids afdwinging in gegevensarchieven in het gedistribueerde gegevenslandschap.
- Hoofdgegevensbeheer om de gegevens consistent te maken in operationele en analytische systemen, zoals klant, product en leverancier.
- Metagegevensherkomst om inzicht te hebben in de transformatie en relatie van gegevensentiteiten.
- Technologie om gestructureerde, multi-gestructureerde en ongestructureerde gegevens te beheren. De governance kan betrekking hebben op het datacenter, meerdere clouds en de rand.
Een uitdaging is dat gegevens worden verzameld en opgeslagen op meerdere plaatsen in de hele onderneming. De gegevens kunnen gegevens bevatten die zijn verzameld en opgeslagen in verschillende geografische gebieden en verschillende juridische jurisdicties. Als gevolg hiervan kunnen verschillende wetgeving van toepassing zijn op het beheren van dezelfde gegevens in verschillende jurisdicties. Ontdek gegevens die zijn gedistribueerd over meerdere clouds en geografische locaties naar:
- Inzicht in welke gegevenskenmerken, gegevensentiteiten en gegevensrelaties er bestaan in het gedistribueerde gegevenslandschap.
- Classificeer de gegevens om te weten hoe deze moeten worden geregeld.
- Definieer beleidsregels om op te geven hoe gegevens moeten worden beheerd voor elk type gegevensclassificatie en levenscyclusbeheer.
- Dwing gegevenskwaliteit, beveiliging van gegevenstoegang, gegevensprivacy en levenscyclusbeheerbeleid af in het gedistribueerde gegevenslandschap.
Gegevensclassificatie
Gegevensclassificatie is een manier om gegevensassets te categoriseren door unieke logische tags of klassen toe te wijzen aan de gegevensassets. Classificatie is gebaseerd op de bedrijfscontext van de gegevens.
Er moet een manier zijn om gegevens te classificeren om inzicht te hebben in het vertrouwelijkheidsniveau en hoe lang ze moeten worden bewaard. Voor de classificatie is het volgende vereist:
- Een classificatieschema voor vertrouwelijkheid van gegevens.
- Een classificatieschema voor gegevensretentie.
Classificatieschema voor vertrouwelijkheid van gegevens
Classificatie | Beschrijving |
---|---|
Openbaar | Iedereen heeft toegang tot de gegevens en kan naar iedereen worden verzonden. Open bijvoorbeeld overheidsgegevens. |
Alleen intern gebruik | Alleen werknemers hebben toegang tot de gegevens en kunnen niet buiten het bedrijf worden verzonden. |
Vertrouwelijk | De gegevens kunnen alleen worden gedeeld als deze nodig zijn voor een specifieke taak. De gegevens kunnen niet buiten het bedrijf worden verzonden zonder een geheimhoudingsovereenkomst. |
Gevoelige (persoonlijke gegevens) | De gegevens bevatten persoonlijke gegevens, die gedurende een beperkte tijd alleen moeten worden gemaskeerd en gedeeld. De gegevens kunnen niet worden verzonden naar onbevoegd personeel of buiten het bedrijf. |
Beperkt | De gegevens kunnen alleen worden gedeeld met benoemde personen die verantwoordelijk zijn voor de beveiliging. Bijvoorbeeld juridische documenten of handelsgeheimen. |
Classificatieschema voor gegevenslevenscyclusretentie
Retentie | Beschrijving |
---|---|
Geen | Gegevens kunnen op elk gewenst moment worden verwijderd. |
Tijdelijk | Gegevens gedurende een korte periode bewaren. Houd bijvoorbeeld Twitter-gegevens een week bij. |
Vaste periode | Bewaar gegevens gedurende een bepaald aantal jaren, waarna ze kunnen worden verwijderd. Bewaar bijvoorbeeld belastingrecords gedurende zeven jaar om te voldoen aan overheidswetten. |
Permanent | Verwijder nooit gegevens. Bijvoorbeeld juridische correspondentie. |
Het automatiseren van het classificatieproces voor gegevensgeheimen en gegevenslevenscyclus met behulp van de klassen die in elk schema zijn gedefinieerd, is nodig om consistent gegevens in het gedistribueerde gegevenslandschap te labelen. Dankzij de automatisering kan deze consistent en correct worden beheerd. Definieer vervolgens regels en beleidsregels voor elke klasse in het classificatieschema om op te geven hoe gegevens volgens de classificatie moeten worden geregeld.
Rollen en verantwoordelijkheden voor gegevensbeheer
Een andere vereiste is de noodzaak van verantwoording. Anders blijft verwarring bestaan over wie verantwoordelijk is voor het beheren van gegevens. Als er geen verantwoordelijkheid is, hoe beantwoordt u de volgende vragen?
- Wie stelt metrische gegevens voor succes in en controleert hoe goed het programma voor gegevensbeheer werkt?
- Wie zijn de gegevenseigenaars?
- Wie definieert en onderhoudt een zakelijke woordenlijst?
- Wie maakt en onderhoudt beleidsregels voor toegangsbeveiliging?
- Wie beschermt de privacy van persoonlijke gegevens voor naleving?
- Wie is op zoek naar de kwaliteit van productgegevens op alle brochures en partnerwebsites?
- Wie zorgt ervoor dat klantgegevens consistent zijn in alle systemen?
- Wie houdt het gebruik van externe abonnementsgegevens ten opzichte van de licentie in de wacht?
- Wie houdt bevoegde gebruikers in de wacht, zoals databasebeheerders en gegevenswetenschappers?
- Is het een C-level executive? Is het een afdelingshoofd?
- Is het het hoofd van governance, risico en naleving?
- Hoe zit het met de juridische afdeling?
- Is het de verantwoordelijkheid van IT?
Rollen en verantwoordelijkheden zijn nodig om verwarring te voorkomen en de basis te bepalen waarop een gegevenscultuur kan worden gerealiseerd.
Processen voor gegevensbeheer
Processen zijn nodig, samen met rollen en verantwoordelijkheden, om:
- De definitie en het onderhoud van een gemeenschappelijk zakelijk vocabulaire bepalen.
- Ontdek en identificeer welke gegevens u hebt, wat dit betekent en waar deze zijn opgeslagen.
- Gegevens classificeren om te weten hoe ze deze moeten beheren.
- De definitie en het onderhoud van beveiligingsbeleid voor gegevenstoegang beheren.
- De definitie en het onderhoud van het privacybeleid voor gegevens beheren.
- Problemen met gegevenskwaliteit detecteren en herstellen.
- Pas beleidsregels toe om ervoor te zorgen dat er actie wordt ondernomen voor naleving.
- Beheer het onderhoud van hoofdgegevens.
Beleid en regels voor gegevensbeheer
Beleidsregels en regels definiëren om te bepalen:
- Regels voor gegevensintegriteit
- Beleid en regels voor gegevensopname
- Beveiligingsbeleid en -regels voor gegevenstoegang
- Beleid en regels voor gegevensprivacy
- Beleid en regels voor gegevenskwaliteit
- Beleid en regels voor gegevensonderhoud
- Beleid en regels voor gegevensretentie
Koppel deze beleidsregels en regels aan elke klasse in de classificatieschema's voor gegevensbeheer.
Mastergegevensbeheer
Een andere vereiste voor het beheren van gegevens is hoofdgegevensbeheer. Hoofdgegevens zijn de meest gedeelde gegevens in elke organisatie en bevatten kerngegevensentiteiten. Kerngegevensentiteiten zijn klant, leverancier, materiaal, werknemer en asset. Het omvat ook een financieel diagram van rekeninggegevens die in verschillende financiële toepassingen worden gevonden. Omdat hoofdgegevens zo veel worden gedeeld, zijn deze toepassingsneutraal. Het is nodig voor zowel operationele transactieverwerkingstoepassingen als analytische systemen. Door deze gegevens gesynchroniseerd te houden, kunnen veel gegevensfouten en procesfouten worden opgelost. Dus, het centraal onderhouden via een gemeenschappelijk proces en het synchroniseren van elk systeem dat nodig heeft, is de ideale situatie. Ook is governance nodig voor wie het mag onderhouden en waar dat onderhoud moet plaatsvinden.
Hetzelfde geldt voor referentiegegevens zoals codesets en financiële markten. In dit geval worden standaardisatie en synchronisatie van codesets ook wel referentiegegevensbeheer genoemd. Dit is ook een vereiste.
Herkomst van metagegevens
Ten slotte is er een vereiste voor de herkomst van metagegevens. U kunt een audittrail gebruiken om te weten waar gegevens vandaan komen en hoe deze worden getransformeerd en omgeleid naar een rapport of een gegevensarchief. U kunt metagegevens gebruiken om te traceren wie of wat gegevens onderhoudt, inclusief wanneer en waar deze zich voordoen.
Samenvatting van wat er nodig is voor end-to-end gegevensbeheer
U hebt een end-to-end-oplossing nodig die gegevens gedurende de gehele levenscyclus kan beheren in gegevensarchieven in de rand, meerdere clouds en het datacenter.
Uw oplossing voor gegevensbeheer moet verschillende onderdelen hebben:
- Een visie en strategie voor gegevensbeheer
- De gegevens zelf, zoals klantgegevens, leveranciersgegevens, ordergegevens en andere
- De levenscyclus van de gegevens van het maken tot de vernietiging waarin gegevens moeten worden beheerd
- Rollen en verantwoordelijkheden voor gegevensbeheer (personen)
- Processen en activiteiten voor gegevensbeheer en hoe deze van toepassing zijn op de levenscyclus van gegevens
- Beleidsregels en regels voor het beheren van gegevens op verschillende punten in de levenscyclus
- Technologieën voor gegevensbeheer om gegevensbeheer mogelijk te maken