Styra data i Microsoft Fabric
Microsoft Fabric innehåller några grundläggande styrningsfunktioner som kan vara tillräckliga för vissa organisationers behov.
I din vårdgivare har du exakta datastyrningsbehov eftersom lagstiftningen i vissa av dina territorier är mycket strikt men du vill inte medföra onödiga kostnader. Du vill utvärdera datastyrningsfunktionerna i Microsoft Fabric för att ta reda på om de täcker dina krav på egen hand.
I den här lektionen ska vi utforska Fabrics styrningsfunktioner.
Vad är Microsoft Fabric?
Fabric är Microsofts analys- och dataplattform från slutpunkt till slutpunkt. SaaS-plattformen (Software-as-a-Service) kan lagra, flytta, bearbeta, mata in, transformera och analysera dina data oavsett storlek och aktuellt format. Eftersom Fabric sömlöst integrerar dina data behöver du inte längre gränssnittslösningar från olika leverantörer med hjälp av olika protokoll. När du har data på den plats och det format som du behöver kan avancerade business intelligence-funktioner analysera dem och generera insikter som stöd för ditt beslutsfattande. Alla infrastrukturresursers funktioner och verktyg stöds med AI-integrering, vilket påskyndar produktiviteten.
Kommentar
Microsoft Fabric innehåller funktioner som tidigare var tillgängliga separat i Power BI, Azure Synapse Analytics och Azure Data Factory tillsammans med nya funktioner.
Fabric-upplevelser
Infrastrukturresurser innehåller olika funktioner för att hantera alla dina datamanipulerings- och analysbehov:
- Data Factory: Använd den här upplevelsen för att mata in, förbereda och transformera data från många olika källor via olika dataanslutningar.
- Synapse Dataingenjör ing: Den här upplevelsen är en Spark-plattform som du kan använda för att samla in, lagra, bearbeta och analysera stora mängder data via schemalagda jobb och notebook-filer.
- Synapse Data Warehouse: Använd den här upplevelsen för att separera beräkning från lagring och skala var och en separat. Data lagras i Data Lake-format och visar branschledande SQL-prestanda.
- Synapse Datavetenskap: Använd den här upplevelsen för att träna, distribuera och använda maskininlärningsmodeller.
- Realtidsinformation: Den här upplevelsen är en komplett lösning för händelsedrivna data, till exempel enhetstelemetri, dataloggar och strömmande data.
- Power BI: Använd den här upplevelsen för att visualisera, undersöka och identifiera trender som är dolda i dina data. Du kan dela Power BI-rapporter för att stödja det bästa beslutsfattandet.
- Dataaktivator: Använd den här upplevelsen för att ange åtgärder, till exempel e-postmeddelanden och arbetsflöden, som startas när specifika villkor uppfylls i dina data. Du kan skapa dessa åtgärder utan att skriva kod.
OneLake
I Infrastruktur lagras all information i en datasjö, som kan innehålla både strukturerade och ostrukturerade data. Microsofts implementering av datasjön kallas OneLake och bygger på Azure Data Lake Storage (ADLS) generation 2. Den här enda underliggande lagringsmekanismen hjälper till att eliminera silor och minska kostnaderna samtidigt som principer och säkerhet tillämpas universellt.
Vad är datastyrning?
De data som din organisation har och processer är ofta affärskritiska och mycket känsliga. Det är viktigt för de flesta företag att data lagras på ett säkert sätt, är lättillgängliga och bearbetas i enlighet med lagstiftningen i alla områden som du är verksam i.
Datastyrning är en term som beskriver de principer och metoder som du använder för att säkerställa kvalitet, konsekvens, säkerhet och användbarhet för dina data. Området omfattar en rad aktiviteter och ansvarsområden som hanterar data effektivt under hela livscykeln.
Ett datastyrningsprogram innehåller vanligtvis:
- Granskning: Registrera var data kommer från och vem som ändrar dem
- Utvärdering: Utvärdera användbarheten och noggrannheten hos dina data
- Dokumentation: Beskriva typen av data för personer som kan använda dem
- Hantering: Ta bort felaktiga data, svara på åtkomstbegäranden, säkerställa efterlevnad av datalagstiftningen
- Skydd: Skydda data mot obehörig åtkomst, utpressningstrojaner och andra attacker
Välstyrda data är tillförlitliga och lättillgängliga för rätt personer.
Dricks
Stora organisationer har också ofta data som är indelade i silor. Historiska system och databaser, som innehas av separata enheter inom din verksamhet, medför hinder i säkerhetssyfte som hindrar åtkomsten. I dessa fall är integrering av data och borttagning av datasilor, på ett sådant sätt att säkerheten upprätthålls, en viktig del av datastyrningen.
En stabil datastyrningsregim kan dra nytta av fördelar för ditt företag, till exempel:
- En enda sanningskälla som minskar förvirringen och stöder bra beslutsfattande.
- Data av högre kvalitet som återspeglar den värld som den mäter mer exakt.
- Snabbare efterlevnad av åtkomstbegäranden.
- Minskade kostnader för datalagring och hantering.
Datastyrningsfunktioner i Microsoft Fabric
Du kan utföra många datastyrningsuppgifter i Fabric, direkt från hyllan och utan ytterligare en prenumeration på Microsoft Purview. Nu ska vi undersöka några av de funktioner som är tillgängliga:
Hantera dataegendomen
Din organisations dataegendom är hela dess insamling av datatillgångar. Stora dataegendomar tar administrativ tid att underhålla och hantera. Infrastrukturresurser kan hjälpa den här uppgiften med följande verktyg:
- Infrastrukturadministratörsportalen: styr klientinställningar, kapaciteter, domäner och andra objekt, vanligtvis reserverade för administratörer.
- Klienter, domäner och arbetsytor: logiska containrar som du kan använda för att styra åtkomsten till data och funktioner. Infrastrukturadministratörer bör till exempel ha åtkomst till alla inställningar i klientorganisationen, medan datakontrollanter på teamnivå kanske bara har kontroll över inställningarna på sin domän eller arbetsyta.
- Domäner grupperar data som är relevanta för ett enda affärsområde eller ämnesfält.
- Arbetsytor grupperar infrastrukturobjekt som används av ett enda team eller en avdelning.
- Kapaciteter: Dessa objekt begränsar användningen av beräkningsresurser för alla infrastrukturarbetsbelastningar.
- Metadatagenomsökning: Genomsökning extraherar värden som namn, identiteter, känsligheter, godkännanden och så vidare från datasjöar. Du kan använda dessa metadata för att analysera och ange styrningsprinciper.
Skydda och skydda data
Säkra data skyddas mot obehörig åtkomst och destruktiva attacker. Det är också kompatibelt med de regler för datalagring som gäller i din region. Infrastrukturresurser innehåller följande användbara verktyg:
- Datataggar: Använd taggar för att identifiera känsligheten för data och tillämpa datakvarhållning och skyddsprinciper.
- Arbetsyteroller: Använd roller för att definiera de användare som har behörighet att komma åt data på en arbetsyta.
- Kontroller på datanivå: Använd kontroller på nivån infrastrukturresurser, till exempel tabeller, rader och kolumner för att införa detaljerade begränsningar.
- Certifieringar: Infrastrukturresurser följer många certifieringar för datahantering, inklusive HIPAA BAA, ISO/IEC 27017, ISO/IEC 27018, ISO/IEC 27001 och ISO/IEC 27701.
Uppmuntra identifiering och användning av data
Data är bara användbara om användarna kan hitta och analysera dem. Dessa funktioner i Fabric kan uppmuntra dataanvändning:
- OneLake-datahubben: Det här verktyget gör det enkelt för användare att hitta och utforska data i din egendom.
- Godkännande: Användare godkänner ett infrastrukturresursobjekt för att identifiera det med hög kvalitet. Godkännanden hjälper andra användare att lita på de data som objektet innehåller.
- Data härkomst: Den här funktionen hjälper användarna att förstå dataflödet mellan objekt på en arbetsyta och vilken inverkan en ändring skulle ha.
Övervaka dataanvändning
Infrastruktur gör det möjligt för användare att övervaka hur information används:
- Övervakningshubben: Den här hubben visar vad som hände med fabric-objekt. Du ser bara aktiviteter för de infrastrukturobjekt som du har behörighet att visa.
- Kapacitetsmått: Använd appen Kapacitetsmått för att övervaka användning och förbrukning.