Microsoft Fabric-terminologie
Meer informatie over de definities van termen die worden gebruikt in Microsoft Fabric, inclusief termen die specifiek zijn voor Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory en Power BI.
Algemene voorwaarden
Capaciteit: Capaciteit is een toegewijde set bronnen die op een bepaald tijdstip beschikbaar zijn om te worden gebruikt. Capaciteit definieert de mogelijkheid van een resource om een activiteit uit te voeren of uitvoer te produceren. Verschillende items verbruiken op een bepaald moment verschillende capaciteit. Fabric biedt capaciteit via de Fabric-SKU en proefversies. Zie Wat is capaciteit?
Ervaring: Een verzameling mogelijkheden die zijn gericht op een specifieke functionaliteit. De Fabric-ervaringen omvatten Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory en Power BI.
item: een item een set mogelijkheden binnen een ervaring. Gebruikers kunnen ze maken, bewerken en verwijderen. Elk itemtype biedt verschillende mogelijkheden. De data engineering-ervaring bevat bijvoorbeeld de taakdefinitie-items lakehouse, notebook en Spark.
tenant: Een tenant is één exemplaar van Fabric voor een organisatie en is afgestemd op een Microsoft Entra-id.
Werkruimte: Een werkruimte is een verzameling items die verschillende functionaliteit samenbrengt in één omgeving die is ontworpen voor samenwerking. Het fungeert als een container die gebruikmaakt van capaciteit voor het uitgevoerde werk en biedt besturingselementen voor wie toegang heeft tot de items erin. In een werkruimte maken gebruikers bijvoorbeeld rapporten, notebooks, semantische modellen, enzovoort. Zie het artikel Werkruimten voor meer informatie.
Fabric Data Engineering
Lakehouse: A lakehouse is een verzameling bestanden, mappen en tabellen die een database vertegenwoordigen boven een data lake die wordt gebruikt door de Apache Spark-engine en SQL-engine voor verwerking van big data. Een lakehouse bevat geavanceerde mogelijkheden voor ACID-transacties wanneer u Delta-tabellen in open-sourceformaat gebruikt. Het lakehouse-item wordt gehost in een unieke werkruimtemap in Microsoft OneLake. Het bevat bestanden in verschillende indelingen (gestructureerd en ongestructureerd) ingedeeld in mappen en submappen. Voor meer informatie, zie Wat is een lakehouse?
Notebook: een Fabric-notebook is een interactief programmeerprogramma voor meerdere talen met uitgebreide functies. Dit omvat het ontwerpen van code en markdown, het uitvoeren en bewaken van een Spark-taak, het weergeven en visualiseren van het resultaat en het samenwerken met het team. Hiermee kunnen data engineers en data scientist gegevens verkennen en verwerken en machine learning-experimenten bouwen met zowel code als weinig code. Het kan eenvoudig worden getransformeerd naar een pijplijnactiviteit voor orkestratie.
Spark-toepassing: Een Apache Spark-toepassing is een programma dat is geschreven door een gebruiker met behulp van een van de API-talen van Spark (Scala, Python, Spark SQL of Java) of door Microsoft toegevoegde talen (.NET met C# of F#). Wanneer een toepassing wordt uitgevoerd, is deze onderverdeeld in een of meer Spark-taken die parallel worden uitgevoerd om de gegevens sneller te verwerken. Zie Spark-toepassingsbewakingvoor meer informatie.
Apache Spark-taak: een Spark-taak maakt deel uit van een Spark-toepassing die parallel wordt uitgevoerd met andere taken in de toepassing. Een taak bestaat uit meerdere taken. Zie Spark-taakbewakingvoor meer informatie.
Apache Spark-taakdefinitie: Een Spark-taakdefinitie is een set parameters, ingesteld door de gebruiker, die aangeeft hoe een Spark-toepassing moet worden uitgevoerd. Hiermee kunt u batch- of streamingtaken verzenden naar het Spark-cluster. Voor meer informatie, zie Wat is een Apache Spark-taakdefinitie?
V-order: Een schrijfoptimalisatie naar de Parquet-bestandsindeling die snelle leesbewerkingen mogelijk maakt en kostenefficiëntie en betere prestaties biedt. Alle Fabric-engines schrijven standaard v-geordende Parquet-bestanden.
Datafabriek
Connector: Data Factory biedt een uitgebreide set connectors waarmee u verbinding kunt maken met verschillende typen gegevensarchieven. Nadat u verbinding hebt gemaakt, kunt u de gegevens transformeren. Voor meer informatie, zie connectoren.
Gegevenspijplijn: In Data Factory wordt een gegevenspijplijn gebruikt voor het organiseren van gegevensverplaatsing en -transformatie. Deze pijplijnen verschillen van de implementatiepijplijnen in Fabric. Zie Pipelines in het overzicht van Data Factory voor meer informatie.
Gegevensstroom Gen2: gegevensstromen bieden een interface met weinig code voor het opnemen van gegevens uit honderden gegevensbronnen en het transformeren van uw gegevens. Gegevensstromen in Fabric worden dataflow Gen2 genoemd. Gegevensstroom Gen1 bestaat in Power BI. Dataflow Gen2 biedt extra mogelijkheden in vergelijking met gegevensstromen in Azure Data Factory of Power BI. U kunt geen upgrade uitvoeren van Gen1 naar Gen2. Zie Gegevensstromen in het overzicht van Data Factory voor meer informatie.
Trigger: Een automatiseringsmogelijkheid in Data Factory die pijplijnen initieert op basis van specifieke voorwaarden, zoals planningen of beschikbaarheid van gegevens.
Fabric Data Science
Data Wrangler: Data Wrangler is een hulpprogramma op basis van een notebook waarmee gebruikers een meeslepende ervaring hebben om verkennende gegevensanalyse uit te voeren. De functie combineert een rasterachtige gegevensweergave met dynamische samenvattingsstatistieken en een set algemene bewerkingen voor het opschonen van gegevens, die allemaal beschikbaar zijn met een paar geselecteerde pictogrammen. Elke bewerking genereert code die als een herbruikbaar script kan worden opgeslagen in het notebook.
Experiment: Een machine learning-experiment is de primaire eenheid van de organisatie en controle voor alle gerelateerde machine learning-uitvoeringen. Zie Machine learning-experimenten in Microsoft Fabricvoor meer informatie.
Model: Een machine learning-model is een bestand dat is getraind om bepaalde typen patronen te herkennen. U traint een model over een set gegevens en u geeft het een algoritme dat wordt gebruikt om redeneren en leren van die gegevensset. Zie Machine Learning-modelvoor meer informatie.
Uitvoeren: Een uitvoering komt overeen met één uitvoering van modelcode. In MLflow-is het bijhouden gebaseerd op experimenten en uitvoeringen.
Fabric Data Warehouse
SQL-analyse-eindpunt: Each Lakehouse een SQL-analyse-eindpunt heeft waarmee een gebruiker query's kan uitvoeren op deltatabelgegevens met TSQL via TDS. Zie SQL Analytics-eindpuntvoor meer informatie.
Fabric Data Warehouse: The Fabric Data Warehouse fungeert als een traditioneel datawarehouse en ondersteunt de volledige transactionele T-SQL-mogelijkheden die u zou verwachten van een datawarehouse voor ondernemingen. Zie Fabric Data Warehousevoor meer informatie.
Real-Time Intelligentie
Activator: Activator is een hulpprogramma zonder code, weinig code waarmee u waarschuwingen, triggers en acties voor uw gegevens kunt maken. Activator wordt gebruikt om waarschuwingen te maken voor uw gegevensstromen. Zie Activatorvoor meer informatie.
Eventhouse: Eventhouses bieden een oplossing voor het verwerken en analyseren van grote hoeveelheden gegevens, met name in scenario's die realtime analyse en verkenning vereisen. Ze zijn ontworpen om realtime gegevensstromen efficiënt te verwerken, waardoor organisaties gegevens in bijna realtime kunnen opnemen, verwerken en analyseren. Eén werkruimte kan meerdere Eventhouses bevatten, een eventhouse kan meerdere KQL-databases bevatten en elke database kan meerdere tabellen bevatten. Zie Eventhouse-overzichtvoor meer informatie.
Eventstream: De functie Microsoft Fabric-gebeurtenisstromen biedt een centrale locatie in het Fabric-platform voor het vastleggen, transformeren en routeren van realtime gebeurtenissen naar bestemmingen zonder code. Een eventstream bestaat uit verschillende streaminggegevensbronnen, opnamebestemmingen en een gebeurtenisprocessor wanneer de transformatie nodig is. Zie Microsoft Fabric eventstreamsvoor meer informatie.
KQL-database: de KQL-database gegevens bevat in een indeling waarop u KQL-query's kunt uitvoeren. KQL-databases zijn items binnen een Eventhouse. Zie KQL-databasevoor meer informatie.
KQL-queryset: De KQL-queryset is het item dat wordt gebruikt voor het uitvoeren van query's, het weergeven van resultaten en het bewerken van queryresultaten op gegevens uit uw Data Explorer-database. De queryset bevat de databases en tabellen, de query's en de resultaten. Met de KQL-queryset kunt u query's opslaan voor toekomstig gebruik, of query's exporteren en delen met anderen. Zie voor meer informatie Querygegevens in de KQL Queryset.
Real-Time hub
- Real-Time hub: Real-Time hub is de enige plaats voor alle gegevens in beweging binnen uw hele organisatie. Elke Microsoft Fabric-gebruiker wordt automatisch voorzien van de hub. Zie Real-Time huboverzichtvoor meer informatie.
OneLake
- nl-NL: Snelkoppeling: Snelkoppelingen zijn ingebedde verwijzingen in OneLake die verwijzen naar andere bestandopslaglocaties. Ze bieden een manier om verbinding te maken met bestaande gegevens zonder deze rechtstreeks te hoeven kopiëren. Zie OneLake-snelkoppelingenvoor meer informatie.