Dela via


Processer för datastyrning

Det finns fyra kategorier av datastyrningsprocesser.

Processkategori Processer
Dataidentifieringsprocesser för att förstå datalandskapet En data- och dataentitetsidentifiering, mappnings- och katalogiseringsprocess
En process för dataprofilering för att fastställa datakvaliteten
En process för identifiering av känsliga data och styrningsklassificering
En upptäcktsprocess för dataunderhåll för CRUD-analys, såsom från loggfiler, för att förstå användning och underhåll av data, till exempel huvuddata i hela företaget
Definitionsprocesser för datastyrning Skapa och underhålla ett gemensamt affärsordförråd i en affärsordlista definiera dataentiteter, inklusive huvuddata, namn på dataattribut, dataintegritetsregler och giltiga format
Definiera referensdata för att standardisera koduppsättningar i hela företaget
Definiera klassificeringsscheman för datastyrning för att märka data för att avgöra hur de ska styras
Definiera principer och regler för datastyrning för att styra dataentitets- och dokumentlivscykler
Definiera mått och tröskelvärde för lyckade resultat
Processer för datastyrning och regelframtvingande En process för att automatisera tillämpningen och tillämpningen av principer och regler för datastyrning
En process för att manuellt tillämpa och genomdriva principer och regler
Händelsedrivna, begäranstyrda och batchtidsinställda datastyrningsprocesser publicerade som tjänster som kan anropas för styrning:
Datainmatning – katalogisering, klassificering, ägartilldelning och lagring
Datakvalitet
Säkerhet för dataåtkomst
Datasekretess
Dataanvändning, till exempel delning och för att säkerställa att licensierade data endast används för godkända ändamål
Dataunderhåll, till exempel huvuddata
Datakvarhållning
Huvuddata och referensdatasynkronisering
Övervakningsprocesser Övervaka och granska dataanvändningsaktivitet, datakvalitet, dataåtkomstsäkerhet, datasekretess, dataunderhåll och datakvarhållning
Övervaka identifiering och lösning av principregelöverträdelser

Den gemensamma affärsordlistan bör definieras i en företagsordlista i en datakatalog.

Arbetsgrupper för datastyrning planerar och utvecklar för att definiera data och förbättra specifika datadomäner, till exempel kund eller leverantör; uppdaterar styrelsen för datastyrning gällande framsteg och hanterar förvaltning i hela företaget för en specifik domän. Varje arbetsgrupp bör ta ansvar för att definiera en specifik dataentitet eller ett ämnesområde, till exempel flera relaterade entiteter. Flera dataentiteter i vokabulären, tillsammans med principer och regler, kan sedan bearbetas parallellt. Mer information finns i Datastyrningsroller och ansvarsområden

Diagram över hur du definierar entiteter i ett gemensamt affärsordförråd. bild 1: Exempel på arbetsgrupp för datastyrning

Integrering av katalogens affärsordlista med andra tekniker behövs sedan för att få konsekventa gemensamma datanamn i alla tekniker. Exempel på andra tekniker att integrera med är:

  • Verktyg för att extrahera, transformera, läsa in (ETL)
  • Datamodelleringsverktyg
  • BI-verktyg, databashanteringssystem
  • Hantering av huvuddata
  • Datavirtualiseringsverktyg
  • Verktyg för programvaruutveckling

En bra metod för att skapa ett gemensamt affärsförråd är att utveckla en modell för datakoncept. Den här modellen använder en metod uppifrån och ned för att identifiera databegrepp som kan användas som dataentiteter i ett gemensamt affärsvokabulär. Olika arbetsgrupper för datastyrning kan sedan tilldelas till varje datakoncept (entitet) eller grupp med relaterade databegrepp (ämnesområde). Dessa arbetsgrupper ansvarar för att styra olika dataentiteter i landskapet.

När du skapar ett gemensamt affärsvokabulär kan du använda programvara för datakataloger för att automatiskt identifiera vilka data som finns i flera datalager. Den här programvaran hjälper till att identifiera alla attribut som är associerade med specifika dataentiteter, vilket är en nedifrån och upp-metod.

Flera arbetsgrupper kan stegvis skapa ett gemensamt affärsförråd snabbt genom att kombinera uppifrån och ned-metoden för en datakonceptmodell med den nedersta metoden för automatiserad dataidentifiering.

Med hjälp av en datakatalog för automatisk dataidentifiering kan du mappa olika data till ett gemensamt ordförråd. Datakatalogen kan hjälpa dig att förstå var data för varje viss dataentitet i affärsordlistan finns i hela företaget.

Principer och regler för att styra data vid olika tidpunkter i livscykeln

Principer för datastyrning beskriver en uppsättning regler för att kontrollera integritet, kvalitet, åtkomstsäkerhet, sekretess och kvarhållning av data. Det finns olika typer av principer som omfattar:

  • Principer för dataintegritet, till exempel giltiga värden, referensintegritet.
  • Principer för datakvalitet med datastandardisering, rensning och matchande regler.
  • Dataskyddsprinciper med åtkomstsäkerhets- och datasekretessregler.
  • Principer för datakvarhållning för att hantera livscykeln med kvarhållnings-, arkiv- och säkerhetskopieringsregler. Flera versioner av en princip kan behövas för att styra samma data i olika juridiska jurisdiktioner.

Klassificeringsschemat för datasekretess har fem klassificeringsnivåer:

  • Offentlig
  • Endast intern användning
  • Konfidentiell
  • Känsliga personuppgifter
  • Begränsad

Styr data genom att kombinera det här klassificeringsschemat med principer och regler. Använd var och en av de fem nivåerna för att märka data, till exempel känsliga personuppgifter. Genom att skapa regler för känsliga personuppgifter och koppla dessa regler till en princip skapar du en princip för känsliga personuppgifter. Du kan koppla principen till etiketten för känsliga personuppgifter och sedan koppla etiketten för känsliga personuppgifter till data. På så sätt omfattas alla data som är märkta som känsliga personuppgifter av samma principer och regler. Den här processen kallas taggbaserad principhantering. Det är flexibelt eftersom en enskild regel eller en princip kan ändras oberoende av varandra. Alla data som är märkta med känsliga personuppgifter styrs av de nya reglerna. På samma sätt kan en etikett för känsliga personuppgifter tas bort från data och ersättas med en konfidentiell etikett. I det här fallet styrs data omedelbart av en ny uppsättning principer och regler som är associerade med den konfidentiella etiketten.

När du har definierat principer och regler i en datakatalog för varje klass i ett klassificeringsschema för datastyrning kan de skickas till andra tekniker från en datakatalog, via API:er, så att de kan tillämpas. I stället kan en gemensam datahanteringsplattform som kan ansluta till flera datalager eventuellt framtvinga dem.

Det bör sedan vara möjligt att övervaka datakvalitet, sekretess, åtkomstsäkerhet, användning, underhåll och kvarhållning av specifika dataentiteter under hela livscykeln.

Nästa steg