Dela via


Introduktion till analys i molnskala

Analys i molnskala bygger på Azure-landningszoner för att förenkla distribution och styrning. Huvudsyftet med en Azure-landningszon är att se till att den nödvändiga infrastrukturen redan finns på plats när du distribuerar ett program eller en arbetsbelastning i Azure. Innan du distribuerar din molnbaserade analyslandningszon måste du gå igenom Cloud Adoption Framework för Azure för att distribuera en Azure-landningszonarkitektur som innehåller plattformslandningszoner.

För suveräna arbetsbelastningar tillhandahåller Microsoft Suverän landningszon (SLZ), som är en variant av en företagsmässig Azure-landningszon. SLZ är avsedd för organisationer som behöver avancerade nationella kontroller. Analys i molnskala kan distribueras mot den här varianten av Azure-landningszonen.

Analys i molnskala omfattar distribution till programlandningszoner. Dessa zoner finns vanligtvis under hanteringsgruppen för landningszoner. Principer filtrerar ned till de exempelmallar som Microsoft tillhandahåller.

Du kan använda dessa exempelmallar för dina data lakehouse- och -data mesh--distributioner.

Utvärdering av analys i molnskala

Ofta söker ett företag klarhet eller normativ vägledning innan det börjar definiera teknisk information för ett specifikt användningsfall eller projekt, eller för molnskalningsanalys från slutpunkt till slutpunkt. När ett företag formulerar sin övergripande datastrategi kan det vara svårt att se till att alla nödvändiga och strategiska principer inom ramen för den aktuella användningen beaktas.

För att påskynda leveransen av den här implementeringen av insikter från slutpunkt till slutpunkt, samtidigt som dessa utmaningar beaktas, har Microsoft utvecklat ett normativt scenario för analys i molnskala. Den överensstämmer med de viktiga teman som beskrivs i Utveckla en plan för analys i molnskala.

Analys i molnskala bygger på Cloud Adoption Framework och tillämpar principerna i Azure Well-Architected Framework. Cloud Adoption Framework innehåller normativ vägledning och metodtips för molndriftsmodeller, referensarkitekturer och plattformsmallar. Den här vägledningen baseras på verkliga upplevelser från några av våra mest utmanande, sofistikerade och komplexa miljöer.

Analys i molnskala hjälper dig att förbereda för att skapa och operationalisera landningszoner som värdar och kör analytiska arbetsbelastningar. Du skapar landningszonerna på grundval av förbättrad säkerhet, styrning och efterlevnad. Landningszoner är skalbara och modulära, men de stöder autonomi och innovation.

Dataarkitekturens historik

I slutet av 1980-talet introducerades informationslagrets generation 1. Den här modellen kombinerar olika datakällor från ett företag. I slutet av 2000-talet kom generation 2 fram, med införandet av stordataekosystem som Hadoop och datasjöar. I mitten av 2010-talet kom molndataplattformen: insamling av strömmande data, som Kappa- eller Lambda-arkitekturer, introducerades. I början av 2020-talet introducerades datasjöhus, datanät, datainfrastrukturer och datacentrerade driftsmönster.

Trots dessa framsteg använder många organisationer fortfarande den centraliserade monolitiska plattformen: generation 1. Det här systemet fungerar bra, upp till en viss punkt. Flaskhalsar kan dock uppstå på grund av beroende processer, nära kopplade komponenter och hyperspecialiserade team. Extrahera, transformera och läsa in jobb (ETL) kan bli framträdande och sakta ned leveranstidslinjen.

Informationslager och datasjöar är fortfarande värdefulla och spelar en viktig roll i din övergripande arkitektur. I följande dokumentation beskrivs några av de utmaningar som kan uppstå när du använder dessa traditionella metoder för skalning. Dessa utmaningar är särskilt relevanta i en komplex organisation, där datakällor, krav, team och utdata ändras.

Flytta till analys i molnskala

Din aktuella analysdataarkitektur och driftsmodell kan omfatta informationslager, datasjöar och data lakehouse-strukturer, datainfrastruktur eller datanät.

Varje datamodell har sina egna fördelar och utmaningar. Analys i molnskala hjälper dig att flytta din nuvarande metod till datahantering så att den kan utvecklas med din infrastruktur.

Du kan stödja alla dataplattformar och scenarion för att skapa ett molnskalningsanalysramverk från slutpunkt till slutpunkt som fungerar som grund och möjliggör skalning.

Modern dataplattform och önskade resultat

Ett av de första stegen är att aktivera din datastrategi för att möta dina utmaningar genom att iterativt skapa en skalbar och flexibel modern dataplattform.

I stället för att bli överväldigad av servicebiljetter och försöka uppfylla konkurrerande affärsbehov, kan du när du implementerar en modern dataplattform spela en mer rådgivande roll eftersom du kan frigöra din tid för att fokusera på mer värdefullt arbete. Du tillhandahåller verksamhetslinjer med plattform och system för självbetjäning av data- och analysbehov.

Följande är rekommenderade områden med inledande fokus:

  • Förbättra datakvaliteten, underlätta förtroendet och få insikter för att fatta datadrivna affärsbeslut.
  • Implementera holistiska data, hantering och analys i stor skala i hela organisationen.
  • Etablera robust datastyrning som möjliggör självbetjäning och flexibilitet för verksamhetsgrenar.
  • Upprätthålla säkerhet och juridisk efterlevnad i en helt integrerad miljö.
  • Skapa snabbt grunden för avancerade analysfunktioner med hjälp av en färdig lösning med välarkitekterade, repeterbara, modulära mönster.

Styra din analysegendom

Ett andra övervägande är att avgöra hur din organisation ska implementera datastyrning.

Datastyrning är en process för att säkerställa att de data som du använder i din verksamhet, rapporter och analys kan identifieras, vara korrekta, betrodda och att de kan skyddas.

För många företag är förväntningarna att data och AI kommer att ge konkurrensfördelar. Därför är chefer ivriga att sponsra AI-initiativ i sin beslutsamhet att bli datadrivna. För att AI ska vara effektivt måste den dock använda betrodda data. Annars kan beslutsprecision komprometteras, beslut kan fördröjas eller åtgärder missas, vilket kan påverka resultatet. Företag vill inte att kvaliteten på deras data ska vara dålig. Tills du har granskat den effekt som den digitala omvandlingen har haft på data kan det verka enkelt att åtgärda datakvaliteten.

Organisationer som har data spridda över ett hybridlandskap med flera moln och distribuerade data kämpar för att hitta var deras data finns och styra dem. Okontrollerade data kan ha en betydande inverkan på verksamheten. Dålig datakvalitet påverkar affärsverksamheten eftersom fel i data orsakar fel i processer och förseningar. Dålig datakvalitet påverkar också företagens beslutsfattande och möjligheten att fortsätta att vara kompatibla. Att säkerställa datakvalitet vid källan är ofta att föredra eftersom det kan vara mer komplext och kostsamt att åtgärda kvalitetsproblem i analyssystemet än att tillämpa datakvalitetsregler tidigt i inmatningsfasen. För att hjälpa dig att spåra och styra dataaktivitet måste datastyrning innehålla:

  • Dataupptäckt
  • Datakvalitet.
  • Skapa en policy.
  • Datadelning.
  • Metadata.

Skydda din analysegendom

En annan viktig faktor för datastyrning är dataskydd. Dataskydd kan hjälpa dig att säkerställa efterlevnad av lagstiftning och kan förhindra dataintrång. Datasekretess och det växande antalet dataintrång har gjort dataskydd till en topprioritering. Dataintrång belyser risken för känsliga data, till exempel personligt identifierbara kunddata. Konsekvenserna av datasekretessöverträdelse eller ett datasäkerhetsintrång kan vara:

  • Allvarliga skador på varumärkesbilden.
  • Förlust av kundförtroende och marknadsandel.
  • En sänkning av aktiekursen, vilket påverkar intressenternas avkastning på investeringar och chefslöner.
  • Betydande ekonomiska påföljder på grund av gransknings- eller efterlevnadsfel.
  • Rättsliga åtgärder.
  • Sekundära effekter av överträdelsen, till exempel, kunder kan falla offer för identitetsstöld.

I de flesta fall måste offentligt citerade företag deklarera överträdelser. Om överträdelser inträffar kommer kunderna sannolikt att skylla på företaget snarare än hackaren. Kunder kan bojkotta företaget i flera månader eller kanske aldrig återvända.

Om lagstiftningen om datasekretess inte efterlevs kan det leda till betydande ekonomiska påföljder. Genom att styra dina data kan du undvika dessa risker.

Driftsmodell och fördelar

Att införa en modern datastrategiplattform ändrar inte bara den teknik som din organisation använder. Det ändrar också hur organisationen fungerar.

Analys i molnskala ger vägledning som hjälper dig att organisera och utbilda dina anställda, inklusive:

  • Persona-, roll- och ansvarsdefinitioner.
  • Föreslagna strukturer för agila, vertikala och tvärdomänteam.
  • Utbildningsresurser, inklusive Azure-data- och AI-certifieringar via Microsoft Learn.

Det är också viktigt att engagera slutanvändarna under hela moderniseringsprocessen och när du fortsätter att utveckla din plattform och registrera nya användningsfall.

Arkitekturer

Azure-landningszoner representerar den strategiska designvägen och det tekniska måltillståndet för din miljö. De gör distribution och styrning enklare så att du kan förbättra flexibiliteten och efterlevnaden. De ser också till att rätt infrastruktur redan finns på plats när ett nytt program eller en ny arbetsbelastning läggs till i din miljö. Azures datahanterings- och datalandningszoner, integrerade med SaaS-styrnings- och analyslösningar (Programvara som en tjänst) från Microsoft, är utformade med dessa grundläggande principer i åtanke och kan, när de kombineras med andra delar av analys i molnskala, hjälpa till att aktivera:

  • Självbetjäning.
  • Skalbarhet.
  • En snabb start.
  • Säkerhet.
  • Privatliv.
  • Optimerade åtgärder.

Landningszon för datahantering

Landningszonen för datahantering utgör grunden för plattformens centraliserade datastyrning och hantering i hela organisationen. Det underlättar också kommunikation för att mata in data från hela din digitala egendom, inklusive infrastrukturer för flera moln och hybrider.

Landningszonen för datahantering stöder många andra funktioner för datahantering och styrning, till exempel:

  • Datakataloger.
  • Datakvalitetshantering.
  • Dataklassificering.
  • Datahärledning.
  • Datamodelleringsarkiv.
  • API-kataloger.
  • Datadelning och kontrakt.

Dricks

Om du använder partnerlösningar för datakatalog, datakvalitetshantering eller datahärkomst bör de finnas i landningszonen för datahanteringen. Du kan också distribuera Microsoft Purview som en SaaS-lösning och ansluta till både landningszonen för datahantering och datalandningszonerna.

Datalandningszoner

Datalandningszoner för data närmare användarna och möjliggör självbetjäning samtidigt som gemensam hantering och styrning upprätthålls via anslutning till landningszonen för datahantering.

De är värdar för standardtjänster som nätverk, övervakning och datainmatning och bearbetning, förutom anpassningar som dataprodukter och visualiseringar.

Datalandningszoner är nyckeln till att aktivera plattformens skalbarhet. Beroende på organisationens storlek och behov kan du börja med en eller flera landningszoner.

När du bestämmer dig för mellan enstaka och flera landningszoner bör du överväga regionala beroenden och krav på datahemvist. Finns det till exempel lokala lagar eller förordningar som kräver att data stannar på en viss plats?

Oavsett ditt första beslut kan du lägga till eller ta bort datalandningszoner efter behov. Om du börjar med en enda landningszon rekommenderar vi att du planerar att utöka till flera landningszoner för att undvika framtida behov av migrering.

Kommentar

Där Microsoft Fabric distribueras är datalandningszonen värd för icke-SaaS-lösningar som datasjöar och andra Azure-datatjänster.

Mer information om landningszoner finns i Azure-landningszoner för analys i molnskala.

Slutsats

När du har läst den här dokumentationsuppsättningen, särskilt avsnitten styrning, säkerhet, drift och metodtips, rekommenderar vi att du konfigurerar en proof-of-concept-miljö med hjälp av distributionsmallarna. Dessa mallar, tillsammans med arkitekturvägledning, ger dig praktisk erfarenhet av några av Azure- och Microsoft SaaS-teknikerna. Mer information finns i checklistan Komma igång.

Nästa steg