Processer för datastyrning
Det finns fyra kategorier av datastyrningsprocesser.
Processkategori | Processer |
---|---|
Dataidentifieringsprocesser för att förstå datalandskapet | En data- och dataentitetsidentifiering, mappnings- och katalogiseringsprocess En process för dataprofilering för att fastställa datakvaliteten En process för identifiering av känsliga data och styrningsklassificering En upptäcktsprocess för dataunderhåll för CRUD-analys, såsom från loggfiler, för att förstå användning och underhåll av data, till exempel huvuddata i hela företaget |
Definitionsprocesser för datastyrning | Skapa och underhålla ett gemensamt affärsordförråd i en affärsordlista definiera dataentiteter, inklusive huvuddata, namn på dataattribut, dataintegritetsregler och giltiga format Definiera referensdata för att standardisera koduppsättningar i hela företaget Definiera klassificeringsscheman för datastyrning för att märka data för att avgöra hur de ska styras Definiera principer och regler för datastyrning för att styra dataentitets- och dokumentlivscykler Definiera mått och tröskelvärde för lyckade resultat |
Processer för datastyrning och regelframtvingande | En process för att automatisera tillämpningen och tillämpningen av principer och regler för datastyrning En process för att manuellt tillämpa och genomdriva principer och regler Händelsedrivna, begäranstyrda och batchtidsinställda datastyrningsprocesser publicerade som tjänster som kan anropas för styrning: Datainmatning – katalogisering, klassificering, ägartilldelning och lagring Datakvalitet Säkerhet för dataåtkomst Datasekretess Dataanvändning, till exempel delning och för att säkerställa att licensierade data endast används för godkända ändamål Dataunderhåll, till exempel huvuddata Datakvarhållning Huvuddata och referensdatasynkronisering |
Övervakningsprocesser | Övervaka och granska dataanvändningsaktivitet, datakvalitet, dataåtkomstsäkerhet, datasekretess, dataunderhåll och datakvarhållning Övervaka identifiering och lösning av principregelöverträdelser |
Den gemensamma affärsordlistan bör definieras i en företagsordlista i en datakatalog.
Arbetsgrupper för datastyrning planerar och utvecklar för att definiera data och förbättra specifika datadomäner, till exempel kund eller leverantör; uppdaterar styrelsen för datastyrning gällande framsteg och hanterar förvaltning i hela företaget för en specifik domän. Varje arbetsgrupp bör ta ansvar för att definiera en specifik dataentitet eller ett ämnesområde, till exempel flera relaterade entiteter. Flera dataentiteter i vokabulären, tillsammans med principer och regler, kan sedan bearbetas parallellt. Mer information finns i Datastyrningsroller och ansvarsområden
bild 1: Exempel på arbetsgrupp för datastyrning
Integrering av katalogens affärsordlista med andra tekniker behövs sedan för att få konsekventa gemensamma datanamn i alla tekniker. Exempel på andra tekniker att integrera med är:
- Verktyg för att extrahera, transformera, läsa in (ETL)
- Datamodelleringsverktyg
- BI-verktyg, databashanteringssystem
- Hantering av huvuddata
- Datavirtualiseringsverktyg
- Verktyg för programvaruutveckling
En bra metod för att skapa ett gemensamt affärsförråd är att utveckla en modell för datakoncept. Den här modellen använder en metod uppifrån och ned för att identifiera databegrepp som kan användas som dataentiteter i ett gemensamt affärsvokabulär. Olika arbetsgrupper för datastyrning kan sedan tilldelas till varje datakoncept (entitet) eller grupp med relaterade databegrepp (ämnesområde). Dessa arbetsgrupper ansvarar för att styra olika dataentiteter i landskapet.
När du skapar ett gemensamt affärsvokabulär kan du använda programvara för datakataloger för att automatiskt identifiera vilka data som finns i flera datalager. Den här programvaran hjälper till att identifiera alla attribut som är associerade med specifika dataentiteter, vilket är en nedifrån och upp-metod.
Flera arbetsgrupper kan stegvis skapa ett gemensamt affärsförråd snabbt genom att kombinera uppifrån och ned-metoden för en datakonceptmodell med den nedersta metoden för automatiserad dataidentifiering.
Med hjälp av en datakatalog för automatisk dataidentifiering kan du mappa olika data till ett gemensamt ordförråd. Datakatalogen kan hjälpa dig att förstå var data för varje viss dataentitet i affärsordlistan finns i hela företaget.
Principer och regler för att styra data vid olika tidpunkter i livscykeln
Principer för datastyrning beskriver en uppsättning regler för att kontrollera integritet, kvalitet, åtkomstsäkerhet, sekretess och kvarhållning av data. Det finns olika typer av principer som omfattar:
- Principer för dataintegritet, till exempel giltiga värden, referensintegritet.
- Principer för datakvalitet med datastandardisering, rensning och matchande regler.
- Dataskyddsprinciper med åtkomstsäkerhets- och datasekretessregler.
- Principer för datakvarhållning för att hantera livscykeln med kvarhållnings-, arkiv- och säkerhetskopieringsregler. Flera versioner av en princip kan behövas för att styra samma data i olika juridiska jurisdiktioner.
Klassificeringsschemat för datasekretess har fem klassificeringsnivåer:
- Offentlig
- Endast intern användning
- Konfidentiell
- Känsliga personuppgifter
- Begränsad
Styr data genom att kombinera det här klassificeringsschemat med principer och regler. Använd var och en av de fem nivåerna för att märka data, till exempel känsliga personuppgifter. Genom att skapa regler för känsliga personuppgifter och koppla dessa regler till en princip skapar du en princip för känsliga personuppgifter. Du kan koppla principen till etiketten för känsliga personuppgifter och sedan koppla etiketten för känsliga personuppgifter till data. På så sätt omfattas alla data som är märkta som känsliga personuppgifter av samma principer och regler. Den här processen kallas taggbaserad principhantering. Det är flexibelt eftersom en enskild regel eller en princip kan ändras oberoende av varandra. Alla data som är märkta med känsliga personuppgifter styrs av de nya reglerna. På samma sätt kan en etikett för känsliga personuppgifter tas bort från data och ersättas med en konfidentiell etikett. I det här fallet styrs data omedelbart av en ny uppsättning principer och regler som är associerade med den konfidentiella etiketten.
När du har definierat principer och regler i en datakatalog för varje klass i ett klassificeringsschema för datastyrning kan de skickas till andra tekniker från en datakatalog, via API:er, så att de kan tillämpas. I stället kan en gemensam datahanteringsplattform som kan ansluta till flera datalager eventuellt framtvinga dem.
Det bör sedan vara möjligt att övervaka datakvalitet, sekretess, åtkomstsäkerhet, användning, underhåll och kvarhållning av specifika dataentiteter under hela livscykeln.