Oversikt over dataanalyse
Før data kan brukes til å fortelle en historie må de først kjøres gjennom en prosess som gjør dem brukbare i historien. Dataanalyse er derfor prosessen med å identifisere, rense, transformere og modellere data for å oppdage meningsfull og nyttig informasjon. Dataene er deretter utviklet til en historie via rapporter for analyse, for å støtte den kritiske beslutningsprosessen.
Ettersom verden blir mer datadrevet, blir historiefortelling gjennom dataanalyse en viktig komponent og aspekt i store og små bedrifter. Det er grunnen til at organisasjoner fortsetter å ansette dataanalytikere.
Datadrevne bedrifter tar avgjørelser basert på historien deres data forteller, og i dagens datadrevne verden blir ikke data brukt til sitt fulle potensial, en utfordring som de fleste bedrifter står overfor i dag. Dataanalyse er og bør være et kritisk aspekt i alle organisasjoner for å finne ut de påvirker virksomheten, inkludert kundenes meninger, markeds- og produktundersøkelser, identifisere trender eller andre datainnsikter.
Selv om prosessen med dataanalyse fokuserer på oppgaver som vasking, modellering og visualisering av data, må man ikke undervurdere hvor viktig dataanalyse er for virksomheten. For å analysere data er kjernekomponenter for analyse delt inn i følgende kategorier:
- Beskrivende
- Diagnostiserende
- Prediktive
- Foreskrevne
- Kognitive
Beskrivende analyse
Beskrivende analyse bidrar til å svare på spørsmål om hva som har skjedd, basert på historiske data. Beskrivende analyseteknikker oppsummerer store semantiske modeller for å beskrive resultater for interessenter.
Ved å utvikle KPI-er (sentrale ytelsesindikatorer), kan disse strategiene hjelpe deg med å spore om man oppnår eller ikke oppnår viktige mål. Målinger som avkastning på investering (ROI) brukes i mange bransjer, og spesialiserte måledata er utviklet for å spore ytelse i bestemte bransjer.
Eksempler på beskrivende analyse inkluderer generering av rapporter for å vise en organisasjons salg og økonomiske data.
Diagnoseanalyse
Diagnoseanalyse hjelper deg med å svare på spørsmål om hvorfor ting skjedde. Teknikker for diagnoseanalyse supplerer grunnleggende beskrivende analyse, og de bruker resultatene fra beskrivende analyse for å finne årsaken til disse hendelsene. Ytelsesindikatorene undersøkes videre for å finne ut hvorfor disse hendelsene er bedre eller verre. Dette skjer vanligvis i tre trinn:
Identifiser avvik i dataene. Disse kan være uventede endringer i måledata eller et bestemt marked.
Samle inn data som er relatert til disse avvikene.
Bruk statistikk-teknikker for å oppdage relasjoner og trender som forklarer disse avvikene.
Prediktiv analyse
Prediktiv analyse bidrar til å svare på spørsmål om hva som vil skje i fremtiden. Teknikker for prediktiv analyse bruker historiske data til å identifisere trender og avgjøre om de mest sannsynlig oppstår igjen. Prediktive analytiske verktøy gir verdifull innsikt i hva som kan skje i fremtiden. Teknikker omfatter en rekke statistikk- og maskinlæringsteknikker som nevrale nettverk, beslutningstrær og regresjon.
Foreskrevet analyse
Med foreskrevet analyse kan du svare på spørsmål om hvilke handlinger som skal utføres for å oppnå et mål. Ved å bruke innsikt fra forhåndsskriptiv analyse kan organisasjoner ta datadrevne beslutninger. Denne teknikken gjør det mulig for bedrifter å ta veloverveide beslutninger i uoversiktlige tider. Teknikker for beskrivende analyser er avhengige av maskinlæring som en av strategiene for å finne mønstre i store semantiske modeller. Ved å analysere tidligere beslutninger og hendelser kan du anslå sannsynligheten for forskjellige resultater.
Kognitiv analyse
Kognitiv analyse prøver å tegne følgeslutninger fra eksisterende data og mønstre, avlede konklusjoner basert på eksisterende kunnskapsbaser, og legger deretter til disse resultatene til i kunnskapsbasen for fremtidige følgeslutninger, en tilbakemeldingsløkke for selvlæring. Kognitiv analyse hjelper deg med å lære hva som kan skje hvis omstendigheter endres, og hvordan du kan håndtere disse situasjonene.
Følgeslutninger er ikke-strukturerte spørringer basert på en regeldatabase, og de er ikke-strukturerte hypoteser som samles inn fra flere kilder og uttrykkes med varierende tillitsgrad. Effektiv kognitiv analyse avhenger av maskinlæringsalgoritmer, og vil bruke flere konsepter for behandling av naturlige språk for å få mening ut av tidligere ubrukte data kilder, for eksempel samtalelogger og produktvurderinger.
Eksempel
Ved å aktivere rapporterings- og datavisualiseringer, bruker en detaljistbedrift en beskrivende analyse til å se på kjøpsmønstre fra tidligere år for å finne ut hvilke produkter som kan være populære neste år. De kan også se på støttende data for å forstå hvorfor et bestemt produkt var populært, og hvis denne trenden fortsetter kan du avgjøre om dette produktet fortsatt skal lagerføres.
En bedrift kan fastslå at et bestemt produkt var populært i forhold til en bestemt tidsramme. Deretter kan de bruke denne analysen til å finne ut om bestemte markedsføringsoppgaver eller elektroniske sosiale aktiviteter har bidratt til salgsøkningen.
En underliggende egenskap for dataanalyse er at en bedrift trenger å kunne stole på sine data. I praksis vil dataanalyseprosessen hente data fra klarerte kilder og forme dem til noe som kan forbrukes, er meningsfylt, lett å forstå og til hjelp i beslutningsprosessen. Ved hjelp av dataanalyse kan bedrifter oppnå en fullstendig forståelse av dataene sine gjennom datadrevne prosesser og beslutninger, noe som gir bedrifter mulighet til å være trygge på avgjørelsene sine.
Etter hvert som datamengden vokser er det nødvendig med dataanalytikere. En dataanalytiker vet hvordan de organiserer informasjon og trekker ut informasjon som er meningsfylt og forståelig. En dataanalytiker vet hvordan de kan samle inn de riktige dataene og hva de skal gjøre med dem. Dvs. de gir deg mening ut av data-overbelastningen.