Krav för att styra data
Analys i molnskala rekommenderar att du överväger följande krav för att styra data:
- Dataentitetsdefinition för att skapa ett gemensamt affärsordförråd i en affärsordlista. Dataentiteter i det här sammanhanget innebär begrepp som kund, leverantör, material, medarbetare och andra.
- Identifiering och identifiering av dataentitet.
- Dataklassificering för att styra dataåtkomstsäkerhet, datasekretess och datakvarhållning.
- Personer, till exempel dataägare med styrningsansvar och dataförvaltare som ansvarar för dataskydd och kvalitet.
- Datastyrningsprocesser.
- Datalivscykelhantering för att styra hur länge data ska sparas.
- Principer och regler för att definiera hur specifika data ska styras under hela livscykeln.
- Principframtvingande för datalager i det distribuerade datalandskapet.
- Hantera data för att göra data konsekventa i drift- och analyssystem som kund, produkt och leverantör.
- Metadata härstamning för att förstå omvandlingen och relationen mellan dataentiteter.
- Teknik som gör det möjligt att styra strukturerade, flerstrukturerade och ostrukturerade data. Styrningen kan sträcka sig över datacentret, flera moln och gränsen.
En utmaning är att data samlas in och lagras på flera platser i företaget. Data kan omfatta data som samlas in och lagras i olika geografiska områden och olika juridiska jurisdiktioner. Därför kan olika lagstiftning gälla för att styra samma uppgifter i olika jurisdiktioner. Identifiera data som distribueras över flera moln och geografiska platser för att:
- Förstå vilka dataattribut, dataentiteter och datarelationer som finns i det distribuerade datalandskapet.
- Klassificera data för att veta hur de ska styra dem.
- Definiera principer för att ange hur data ska styras för varje typ av dataklassificering och livscykelhantering.
- Framtvinga principer för datakvalitet, dataåtkomstsäkerhet, datasekretess och livscykelhantering i det distribuerade datalandskapet.
Dartaklassificering
Dataklassificering är ett sätt att kategorisera datatillgångar genom att tilldela unika logiska taggar eller klasser till datatillgångarna. Klassificeringen baseras på affärskontexten för data.
Det måste finnas ett sätt att klassificera data för att förstå dess sekretessnivå och hur länge de ska behållas. Klassificeringen kräver:
- Ett klassificeringsschema för datasekretess.
- Ett klassificeringsschema för datakvarhållning.
Klassificeringsschema för datasekretess
Klassificering | beskrivning |
---|---|
Offentliga | Vem som helst kan komma åt data och de kan skickas till vem som helst. Öppna till exempel myndighetsdata. |
Endast intern användning | Endast anställda kan komma åt data och de kan inte skickas utanför företaget. |
Konfidentiellt | Data kan bara delas om de behövs för en viss uppgift. Data kan inte skickas utanför företaget utan ett sekretessavtal. |
Känslig (personliga data) | Data innehåller privat information, som endast måste maskeras och delas på grundval av behovsbe veta under en begränsad tid. Data kan inte skickas till obehörig personal eller utanför företaget. |
Begränsad | Data kan endast delas med namngivna personer som är ansvariga för dess skydd. Till exempel juridiska dokument eller affärshemligheter. |
Klassificeringsschema för datalivscykelkvarhållning
Kvarhållning | beskrivning |
---|---|
None | Data kan tas bort när som helst. |
Temporär | Behåll data under en kort tidsperiod. Behåll till exempel Twitter-data i en vecka. |
Fast period | Behåll data under ett visst antal år, varefter de kan tas bort. Till exempel föra skatteregister i sju år för att följa regeringens lagar. |
Permanent | Ta aldrig bort data. Till exempel juridisk korrespondens. |
Du måste automatisera klassificeringsprocessen för datasekretess och datalivscykelkvarhållning med hjälp av de klasser som definieras i varje schema för att konsekvent märka data i det distribuerade datalandskapet. Automatiseringen gör att den kan styras konsekvent och korrekt. Definiera sedan regler och principer för varje klass i klassificeringsschemat för att ange hur data ska styras enligt klassificeringen.
Roller och ansvarsområden för datastyrning
Ett annat krav är behovet av ansvarsskyldighet. Annars kvarstår förvirring om vem som är ansvarig för att styra data. Hur svarar du på följande frågor om det inte finns något ansvar?
- Vem anger framgångsmått och övervakar hur bra datastyrningsprogrammet fungerar?
- Vilka är dataägarna?
- Vem definierar och underhåller en företagsordlista?
- Vem skapar och underhåller principer för åtkomstsäkerhet?
- Vem skyddar personlig datasekretess för efterlevnad?
- Vem ser efter kvaliteten på produktdata på alla broschyrer och partnerwebbplatser?
- Vem ser till att kunddata är konsekventa i alla system?
- Vem övervakar dataanvändningen för externa prenumerationer jämfört med licensen?
- Vem övervakar privilegierade användare som databasadministratörer och dataforskare?
- Är det en chef på C-nivå? Är det en avdelningschef?
- Är det chefen för styrning, risk och efterlevnad?
- Hur är det med juridiska avdelningen?
- Är det IT:s ansvar?
Roller och ansvarsområden behövs för att undvika förvirring och för att skapa grunden för en datakultur som kan materialiseras.
Processer för datastyrning
Processer behövs, tillsammans med roller och ansvarsområden, för att:
- Styr definitionen och underhållet av ett gemensamt affärsförråd.
- Identifiera och identifiera vilka data du har, vad det innebär och var de lagras.
- Klassificera data för att veta hur de ska styra dem.
- Styr definitionen och underhållet av säkerhetsprinciper för dataåtkomst.
- Styr definitionen och underhållet av datasekretessprinciper.
- Identifiera datakvalitetsproblem och åtgärda dem.
- Tillämpa principer för att säkerställa att åtgärder vidtas för efterlevnad.
- Styr underhållet av huvuddata.
Principer och regler för datastyrning
Definiera principer och regler som ska styra:
- Regler för dataintegritet
- Principer och regler för datainmatning
- Säkerhetsprinciper och regler för dataåtkomst
- Principer och regler för datasekretess
- Principer och regler för datakvalitet
- Principer och regler för dataunderhåll
- Principer och regler för datakvarhållning
Associera dessa principer och regler med varje klass i klassificeringsscheman för datastyrning.
Hantering av huvuddata
Ett annat krav när det gäller att styra data är hantering av huvuddata. Huvuddata är de mest delade data i alla organisationer och innehåller kärndataentiteter. Viktiga dataentiteter är kund, leverantör, material, medarbetare och tillgång. Den innehåller även finansiella diagram över kontodata som finns i olika finansiella program. Eftersom huvuddata delas så brett är det programagnostisk. Det behövs av både operativa transaktionsbearbetningsprogram och analyssystem. Om du håller dessa data synkroniserade kan du lösa många datafel och processfel. Så att underhålla det centralt via en gemensam process och synkronisera varje system som behöver det är den idealiska situationen. Dessutom behövs styrning över vem som får underhålla den och var det underhållet måste ske.
Samma sak gäller för referensdata som koduppsättningar och finansiella marknader. I det här fallet kallas standardisering och synkronisering av koduppsättningar för referensdatahantering, vilket också är ett krav.
Härkomst av metadata
Slutligen finns det ett krav på metadata härkomst. Du kan använda en spårningslogg för att veta var data har sitt ursprung och hur de transformeras på väg till en rapport eller ett datalager. Du kan använda metadata för att spåra vem eller vad som underhåller data, inklusive när och var de inträffar.
Sammanfattning av vad som behövs för datastyrning från slutpunkt till slutpunkt
Du behöver en lösning från slutpunkt till slutpunkt som kan styra data under hela livscykeln över datalager i gränsen, flera moln och datacentret.
Din datastyrningslösning bör ha flera komponenter:
- En vision och strategi för datastyrning
- Själva data, till exempel kunddata, leverantörsdata, orderdata och andra
- Datalivscykeln från skapande till destruktion inom vilken data måste styras
- Roller och ansvarsområden för datastyrning (personer)
- Processer och aktiviteter för datastyrning och hur de tillämpas på datalivscykeln
- Principer och regler för att styra data vid olika tidpunkter i livscykeln
- Datastyrningstekniker som hjälper till att göra datastyrning möjlig