Wat is een semantische koppeling?
Semantische koppeling is een functie waarmee u een verbinding tot stand kunt brengen tussen semantische modellen en Synapse-Datawetenschap in Microsoft Fabric. Het gebruik van een semantische koppeling wordt alleen ondersteund in Microsoft Fabric.
Voor Spark 3.4 en hoger is semantische koppeling beschikbaar in de standaardruntime wanneer u Fabric gebruikt en hoeft u deze niet te installeren.
Voor Spark 3.3 of lager, of als u wilt bijwerken naar de nieuwste versie van de semantische koppeling, voert u de volgende opdracht uit:
%pip install -U semantic-link
De belangrijkste doelen van semantische koppeling zijn voor:
- Vereenvoudig de gegevensconnectiviteit.
- Schakel de doorgifte van semantische informatie in.
- Naadloos integreren met bestaande hulpprogramma's die gegevenswetenschappers gebruiken, zoals notebooks.
Met semantische koppeling kunt u domeinkennis over gegevenssemantiek op een gestandaardiseerde manier behouden waarmee gegevensanalyse kan worden versneld en fouten kunnen worden verminderd.
Semantische koppelingsgegevensstroom
De semantische koppelingsgegevensstroom begint met semantische modellen die gegevens en semantische informatie bevatten. Semantische koppeling overbrugt de kloof tussen Power BI en de Synapse Datawetenschap ervaring.
Met semantische koppeling kunt u semantische modellen uit Power BI gebruiken in de Synapse-Datawetenschap ervaring om taken uit te voeren, zoals diepgaande statistische analyse en voorspellende modellering met machine learning-technieken. U kunt de uitvoer van uw data science-werk opslaan in OneLake met behulp van Apache Spark en de opgeslagen uitvoer opnemen in Power BI met behulp van Direct Lake.
Power BI-connectiviteit
Een semantisch model fungeert als één tabellair objectmodel dat betrouwbare bronnen biedt voor semantische definities zoals Power BI-metingen. Semantische koppeling maakt verbinding met semantische modellen in de volgende ecosystemen, waardoor gegevenswetenschappers eenvoudig kunnen werken in het systeem waarmee ze het meest bekend zijn.
- Python Pandas-ecosysteem , via de SemPy Python-bibliotheek.
- Apache Spark-ecosysteem via de systeemeigen Spark-connector. Deze implementatie ondersteunt verschillende talen, waaronder PySpark, Spark SQL, R en Scala.
Toepassingen van semantische informatie
Semantische informatie in gegevens bevat Power BI-gegevenscategorieën, zoals adres en postcode, relaties tussen tabellen en hiërarchische informatie.
Deze gegevenscategorieën omvatten metagegevens die semantische koppeling doorgeven aan de Synapse-Datawetenschap-omgeving om nieuwe ervaringen mogelijk te maken en gegevensherkomst te onderhouden.
Enkele voorbeelden van semantische koppelingen zijn:
- Intelligente suggesties van ingebouwde semantische functies.
- Innovatieve integratie voor het uitbreiden van gegevens met Power BI-metingen met behulp van invoegtoepassingen.
- Hulpprogramma's voor validatie van gegevenskwaliteit op basis van de relaties tussen tabellen en functionele afhankelijkheden binnen tabellen.
Semantische koppeling is een krachtig hulpprogramma waarmee bedrijfsanalisten gegevens effectief kunnen gebruiken in een uitgebreide data science-omgeving.
Semantische koppeling vereenvoudigt een naadloze samenwerking tussen gegevenswetenschappers en bedrijfsanalisten door de noodzaak om bedrijfslogica die is ingesloten in Power BI-metingen te elimineren. Deze aanpak zorgt ervoor dat beide partijen efficiënt en productief kunnen werken, waardoor het potentieel van hun gegevensgestuurde inzichten wordt gemaximaliseerd.
FabricDataFrame-gegevensstructuur
FabricDataFrame is de primaire gegevensstructuur die door semantische koppeling wordt gebruikt om semantische informatie van semantische modellen door te geven in de Synapse Datawetenschap-omgeving.
De klasse FabricDataFrame
:
- Ondersteunt alle pandas-bewerkingen.
- Subklassen van pandas DataFrame en metagegevens toevoegen, zoals semantische informatie en herkomst.
- Maakt semantische functies en de methode voor meting van invoegtoepassingen beschikbaar waarmee u Power BI-metingen kunt gebruiken in het werk van de gegevenswetenschap.
Gerelateerde inhoud
- De referentiedocumentatie voor het Python-semantische koppelingspakket (SemPy) verkennen
- Zelfstudie: Gegevens opschonen met functionele afhankelijkheden
- Power BI-connectiviteit met semantische koppeling en Microsoft Fabric
- Gegevens verkennen en valideren met behulp van een semantische koppeling
- Relaties in semantische modellen verkennen en valideren