Co to jest link semantyczny?
Link semantyczny to funkcja umożliwiająca nawiązanie połączenia między modelami semantycznymi i usługą Synapse Nauka o danych w usłudze Microsoft Fabric. Korzystanie z linku semantycznego jest obsługiwane tylko w usłudze Microsoft Fabric.
W przypadku platformy Spark w wersji 3.4 lub nowszej link semantyczny jest dostępny w domyślnym środowisku uruchomieniowym podczas korzystania z sieci szkieletowej i nie ma potrzeby jej instalowania.
W przypadku platformy Spark 3.3 lub nowszej albo zaktualizowania do najnowszej wersji linku semantycznego uruchom następujące polecenie:
%pip install -U semantic-link
Podstawowe cele semantycznego połączenia to:
- Ułatwianie łączności danych.
- Włącz propagację informacji semantycznych.
- Bezproblemowa integracja z ustalonymi narzędziami używanymi przez analityków danych, takimi jak notesy.
Link semantyczny pomaga zachować wiedzę o domenie na temat semantyki danych w ustandaryzowany sposób, który może przyspieszyć analizę danych i zmniejszyć błędy.
Semantyczny przepływ danych łącza
Semantyczny przepływ danych linku rozpoczyna się od semantycznych modeli zawierających dane i informacje semantyczne. Połączenie semantyczne łączy między usługą Power BI a środowiskiem usługi Synapse Nauka o danych.
Link semantyczny umożliwia korzystanie z semantycznych modeli z usługi Power BI w środowisku usługi Synapse Nauka o danych do wykonywania zadań, takich jak szczegółowa analiza statystyczna i modelowanie predykcyjne przy użyciu technik uczenia maszynowego. Dane wyjściowe pracy nauki o danych można przechowywać w usłudze OneLake przy użyciu platformy Apache Spark i pozyskiwać przechowywane dane wyjściowe do usługi Power BI przy użyciu usługi Direct Lake.
Łączność z usługą Power BI
Semantyczny model służy jako pojedynczy tabelaryczny model obiektów, który zapewnia niezawodne źródła dla definicji semantycznych, takich jak miary usługi Power BI. Link semantyczny łączy się z semantycznymi modelami w następujących ekosystemach, co ułatwia analitykom danych pracę w systemie, z którego najbardziej się znają.
- Ekosystem biblioteki python pandas za pośrednictwem biblioteki języka Python SemPy.
- Ekosystem platformy Apache Spark za pośrednictwem łącznika natywnego platformy Spark. Ta implementacja obsługuje różne języki, w tym PySpark, Spark SQL, R i Scala.
Zastosowania informacji semantycznych
Informacje semantyczne w danych obejmują kategorie danych usługi Power BI, takie jak adres i kod pocztowy, relacje między tabelami i informacje hierarchiczne.
Te kategorie danych składają się z metadanych, które link semantyczny jest propagowany do środowiska usługi Synapse Nauka o danych, aby umożliwić nowe środowiska i zachować pochodzenie danych.
Oto przykładowe aplikacje linku semantycznego:
- Inteligentne sugestie wbudowanych funkcji semantycznych.
- Innowacyjna integracja na potrzeby rozszerzania danych za pomocą miar usługi Power BI przy użyciu miar dodawania.
- Narzędzia do sprawdzania jakości danych oparte na relacjach między tabelami i zależnościami funkcjonalnymi w tabelach.
Link semantyczny to zaawansowane narzędzie, które umożliwia analitykom biznesowym efektywne korzystanie z danych w kompleksowym środowisku nauki o danych.
Link semantyczny ułatwia bezproblemową współpracę między analitykami danych i analitykami biznesowymi, eliminując konieczność ponownego implementowania logiki biznesowej osadzonej w miarach usługi Power BI. Takie podejście zapewnia, że obie strony mogą działać wydajnie i wydajnie, maksymalizując potencjał analizy opartej na danych.
Struktura danych FabricDataFrame
FabricDataFrame to podstawowa struktura danych używana przez łącze semantyczne do propagowania informacji semantycznych z modeli semantycznych do środowiska usługi Synapse Nauka o danych.
Klasa FabricDataFrame
:
- Obsługuje wszystkie operacje biblioteki pandas.
- Podklasy ramki danych pandas i dodaje metadane, takie jak informacje semantyczne i pochodzenie.
- Uwidacznia funkcje semantyczne i metodę add-measure , która umożliwia korzystanie z miar usługi Power BI w pracy z nauką o danych.
Powiązana zawartość
- Zapoznaj się z dokumentacją referencyjną pakietu linku semantycznego języka Python (SemPy)
- Samouczek: czyszczenie danych przy użyciu zależności funkcjonalnych
- Łączność usługi Power BI z łączem semantycznym i usługą Microsoft Fabric
- Eksplorowanie i weryfikowanie danych przy użyciu linku semantycznego
- Eksplorowanie i weryfikowanie relacji w modelach semantycznych