Gegevens democratiseren met digitale uitvindingen
Kolen, olie en menselijk potentieel waren de drie meest gevolgmatige activa tijdens de industriële revolutie. Deze activa bouwden bedrijven, verschoven markten en veranderden uiteindelijk landen. In de digitale economie zijn er drie even belangrijke activa voor innovatie: gegevens, apparaten en menselijk potentieel. Deze activa hebben een groot innovatiepotentieel. Voor elke innovatie-inspanning in het moderne tijdperk zijn gegevens de nieuwe olie.
In elk bedrijf zijn er gegevens die kunnen worden gebruikt om te zoeken naar en te voldoen aan de behoeften van klanten. Helaas kan het proces van het analyseren van gegevens om innovatie te stimuleren kostbaar en tijdrovend zijn, zodat er geen behoeften worden gedetecteerd en er geen oplossingen worden gemaakt. Gegevens democratisatie kan dit probleem oplossen.
Wat is democratisering van gegevens? Het is het proces van het ophalen van gegevens in de juiste handen om innovatie te stimuleren. Dit democratiseringsproces kan verschillende vormen aannemen, maar over het algemeen omvatten ze oplossingen voor opgenomen of geïntegreerde onbewerkte gegevens, centralisatie van gegevens, het delen van gegevens en het beveiligen van gegevens. Wanneer gegevens worden ge democratiseerd, kunnen experts in het bedrijf deze gebruiken om hypothesen te vormen en te testen. In veel gevallen kunnen cloudacceptatieteams bouwen met empathie van klanten met behulp van alleen gegevens, om snel te voldoen aan de behoeften van klanten.
Manieren om gegevens te democratiseren
Er zijn verschillende manieren om gegevens te democratiseren, maar de meeste methoden omvatten het verzamelen, centraliseren, beheren en delen van de gegevens. In de volgende secties worden enkele van deze methoden beschreven. Wanneer u een oplossing bouwt voor een klanthypothese, moet u beoordelen of u gegevens wilt democratiseren, in welke mate en hoe u dit moet doen.
Gegevens delen
Wanneer u bouwt met empathie van klanten, moet de klant de oplossing begeleiden. Als de behoefte gegevens is, stelt de oplossing de klant in staat om de gegevens rechtstreeks te onderzoeken, analyseren en rapporteren, zonder ondersteuning van IT-medewerkers.
Veel succesvolle innovaties beginnen als een minimum viable product (MVP) dat gegevens levert aan de klant. Een MVP is een versie van het product met precies genoeg functies die door de klant kunnen worden gebruikt. Het toont het mogelijke potentieel van het product om feedback van de klant te verzamelen. In dit Concierge-model is een werknemer de gegevensconsumer. Die werknemer gebruikt gegevens om de klant te helpen. Telkens wanneer de klant handmatige ondersteuning onderneemt, kan een hypothese worden getest en gevalideerd. Deze aanpak is vaak een rendabele manier om een klantgerichte hypothese te testen voordat u sterk investeert in geïntegreerde oplossingen.
De primaire hulpprogramma's voor het rechtstreeks delen van gegevens met gegevensgebruikers omvatten selfservicerapportage of gegevens die zijn ingesloten in andere ervaringen, met behulp van hulpprogramma's zoals Power BI.
Notitie
Voordat u gegevens deelt, moet u ervoor zorgen dat u de volgende secties hebt gelezen. Voor het delen van gegevens is mogelijk governance vereist om beveiliging voor de gegevens te bieden. Als de gegevens meerdere clouds omvatten, is centralisatie mogelijk vereist. Als gegevens zich in toepassingen bevinden, moet u deze verzamelen om deze te kunnen delen.
Gegevens beheren
Het delen van gegevens kan snel een minimaal levensvatbaar product opleveren voor gebruik in gesprekken van klanten. Als u deze gedeelde gegevens echter wilt omzetten in nuttige en bruikbare kennis, is meer algemeen vereist.
Nadat een hypothese is gevalideerd via het delen van gegevens, is de volgende fase van ontwikkeling doorgaans gegevensbeheer.
Gegevensbeheer is een breed onderwerp dat een eigen toegewezen framework kan vereisen, een kwestie die buiten het bereik van het Cloud Adoption Framework valt.
Er zijn verschillende aspecten van gegevensbeheer die u moet overwegen zodra u de hypothese van de klant valideert. Voorbeeld:
- Zijn de gedeelde gegevens gevoelig? Gegevens moeten worden geclassificeerd voordat ze openbaar worden gedeeld om de belangen van klanten en het bedrijf te beschermen.
- Als de gegevens gevoelig zijn, is deze beveiligd? Bescherming van gevoelige gegevens is een must voor ge democratiseerde gegevens. De voorbeeldworkload die wordt besproken in gegevensoplossingen beveiligen, bevat enkele verwijzingen voor het beveiligen van gegevens.
- Zijn de gegevens gecatalogusd? Het identificeren van de aard van de gedeelde gegevenshulpmiddelen in gegevensbeheer op lange termijn. Hulpprogramma's voor het documenteren van gegevens, zoals Azure Data Catalog, maken dit proces veel eenvoudiger in de cloud. Richtlijnen met betrekking tot de aantekening van gegevens en de documentatie van gegevensbronnen kunnen het proces versnellen.
Wanneer democratisering van gegevens belangrijk is voor een klantgerichte hypothese, moet u ervoor zorgen dat de governance van gedeelde gegevens zich in het releaseplan bevindt. Hiermee worden klanten, gegevensgebruikers en het bedrijf beschermd.
Gegevens centraliseren
Gegevens centralisatie leidt tot zinvollere rapportage, zorgt ervoor dat dezelfde gegevens beschikbaar zijn in de hele organisatie en uw ROI verhoogt. Wanneer gegevens worden verspreid over een IT-omgeving, kunnen de mogelijkheden om te innoveren extreem beperkt, duur en tijdrovend zijn. De cloud biedt nieuwe mogelijkheden om gegevens te centraliseren. Wanneer centralisatie van meerdere gegevensbronnen nodig is om te bouwen met empathie van klanten, kan de cloud het testen van hypothesen versnellen.
Let op
Centralisatie van gegevens vormt een risicopunt in elk innovatieproces. Wanneer gegevens centralisatie een technische piek is en geen bron van klantwaarde, raden we u aan om centralisatie uit te stellen totdat de hypothesen van de klant zijn gevalideerd.
Wanneer u centraliseert, hebt u een geschikt gegevensarchief nodig voor de gecentraliseerde gegevens. Het is een goede gewoonte om een datawarehouse in de cloud te maken. Deze schaalbare optie biedt een centrale locatie voor al uw gegevens. Dit type oplossing is beschikbaar in opties voor online analytische verwerking (OLAP) of big data.
De referentiearchitecturen voor OLAP - en big data-oplossingen kunnen u helpen bij het kiezen van de meest geschikte centralisatieoplossing in Azure. Als een hybride oplossing vereist is, kan de referentiearchitectuur voor het uitbreiden van on-premises gegevens ook helpen bij het versnellen van de ontwikkeling van oplossingen.
Belangrijk
Voor sommige behoeften en oplossingen van klanten is een eenvoudige benadering mogelijk voldoende. De cloudarchitect moet het team uitdagen om goedkope oplossingen te overwegen om de hypothese van de klant te valideren, met name tijdens vroege ontwikkeling. In deze sectie over het verzamelen van gegevens worden scenario's besproken die een andere oplossing voor uw situatie kunnen voorstellen.
Gegevens verzamelen
De twee primaire vormen van gegevensverzameling zijn integratie en opname.
Integratie: Gegevens die zich in een bestaand gegevensarchief bevinden, kunnen worden geïntegreerd in het gecentraliseerde gegevensarchief met behulp van traditionele technieken voor gegevensverplaatsing. Dit is met name gebruikelijk voor scenario's die betrekking hebben op gegevensopslag met meerdere clouds. Deze technieken omvatten het extraheren van de gegevens uit het bestaande gegevensarchief en het vervolgens laden ervan in het centrale gegevensarchief. Op een bepaald moment in dit proces worden de gegevens doorgaans getransformeerd om bruikbaarder en relevanter te zijn in het centrale archief.
Cloudhulpprogramma's hebben deze technieken omgezet in hulpprogramma's voor betalen per gebruik, waardoor de toegang tot gegevensverzameling en centralisatie wordt verminderd. Hulpprogramma's zoals Azure Database Migration Service en Azure Data Factory zijn twee voorbeelden. De referentiearchitectuur voor Data Factory met een OLAP-gegevensarchief is een voorbeeld van een dergelijke oplossing.
Opname: sommige gegevens bevinden zich niet in een bestaand gegevensarchief. Wanneer deze tijdelijke gegevens een primaire bron van innovatie zijn, moet u alternatieve benaderingen overwegen. Tijdelijke gegevens zijn te vinden in verschillende bestaande bronnen, zoals toepassingen, API's, gegevensstromen, IoT-apparaten, een blockchain, een toepassingscache, media-inhoud of zelfs in platte bestanden.
U kunt deze verschillende vormen van gegevens integreren in een centraal gegevensarchief op een OLAP- of big data-oplossing. Voor vroege iteraties van de build-measure-learn-cyclus kan een OLTP-oplossing (Online Transactional Processing) echter voldoende zijn om een klanthypothese te valideren. OLTP-oplossingen zijn niet de beste optie voor een rapportagescenario. Wanneer u echter bouwt met empathie van klanten, is het belangrijker om u te richten op de behoeften van klanten dan op beslissingen over technische hulpprogramma's. Nadat de hypothese van de klant op schaal is gevalideerd, is mogelijk een geschikter platform vereist. De referentiearchitectuur in OLTP-gegevensarchieven kan u helpen bepalen welke gegevensopslag het meest geschikt is voor uw oplossing.
Virtualiseren: integratie en opname van gegevens kan soms leiden tot trage innovatie. Wanneer er al een oplossing voor gegevensvirtualisatie beschikbaar is, kan dit een redelijkere benadering zijn. Opname en integratie kunnen zowel opslag- als ontwikkelingsvereisten dupliceren, gegevenslatentie toevoegen, het oppervlak van aanvallen vergroten, problemen met de kwaliteit van aanvallen activeren en governance-inspanningen verhogen. Gegevensvirtualisatie is een moderner alternatief dat de oorspronkelijke gegevens op één locatie verlaat en passthrough- of in de cache opgeslagen query's van de brongegevens maakt.
SQL Server 2017 en Azure SQL Data Warehouse ondersteunen beide PolyBase. Dit is de benadering van gegevensvirtualisatie die het meest wordt gebruikt in Azure.
Volgende stappen
Met een strategie voor het democratiseren van gegevens wilt u vervolgens benaderingen voor het ontwikkelen van toepassingen evalueren.