Udostępnij za pośrednictwem


Co to jest link semantyczny?

Link semantyczny to funkcja umożliwiająca nawiązanie połączenia między modelami semantycznymi i usługą Synapse Nauka o danych w usłudze Microsoft Fabric. Korzystanie z linku semantycznego jest obsługiwane tylko w usłudze Microsoft Fabric.

  • W przypadku platformy Spark w wersji 3.4 lub nowszej link semantyczny jest dostępny w domyślnym środowisku uruchomieniowym podczas korzystania z sieci szkieletowej i nie ma potrzeby jej instalowania.

  • W przypadku platformy Spark 3.3 lub nowszej albo zaktualizowania do najnowszej wersji linku semantycznego uruchom następujące polecenie:

    %pip install -U semantic-link
    

Podstawowe cele semantycznego połączenia to:

  • Ułatwianie łączności danych.
  • Włącz propagację informacji semantycznych.
  • Bezproblemowa integracja z ustalonymi narzędziami używanymi przez analityków danych, takimi jak notesy.

Link semantyczny pomaga zachować wiedzę o domenie na temat semantyki danych w ustandaryzowany sposób, który może przyspieszyć analizę danych i zmniejszyć błędy.

Semantyczny przepływ danych linku rozpoczyna się od semantycznych modeli zawierających dane i informacje semantyczne. Połączenie semantyczne łączy między usługą Power BI a środowiskiem usługi Synapse Nauka o danych.

Diagram przedstawiający przepływ danych z usługi Power BI do notesów w usłudze Synapse Nauka o danych i z powrotem do usługi Power BI.

Link semantyczny umożliwia korzystanie z semantycznych modeli z usługi Power BI w środowisku usługi Synapse Nauka o danych do wykonywania zadań, takich jak szczegółowa analiza statystyczna i modelowanie predykcyjne przy użyciu technik uczenia maszynowego. Dane wyjściowe pracy nauki o danych można przechowywać w usłudze OneLake przy użyciu platformy Apache Spark i pozyskiwać przechowywane dane wyjściowe do usługi Power BI przy użyciu usługi Direct Lake.

Łączność z usługą Power BI

Semantyczny model służy jako pojedynczy tabelaryczny model obiektów, który zapewnia niezawodne źródła dla definicji semantycznych, takich jak miary usługi Power BI. Link semantyczny łączy się z semantycznymi modelami w następujących ekosystemach, co ułatwia analitykom danych pracę w systemie, z którego najbardziej się znają.

  • Ekosystem biblioteki python pandas za pośrednictwem biblioteki języka Python SemPy.
  • Ekosystem platformy Apache Spark za pośrednictwem łącznika natywnego platformy Spark. Ta implementacja obsługuje różne języki, w tym PySpark, Spark SQL, R i Scala.

Zastosowania informacji semantycznych

Informacje semantyczne w danych obejmują kategorie danych usługi Power BI, takie jak adres i kod pocztowy, relacje między tabelami i informacje hierarchiczne.

Te kategorie danych składają się z metadanych, które link semantyczny jest propagowany do środowiska usługi Synapse Nauka o danych, aby umożliwić nowe środowiska i zachować pochodzenie danych.

Oto przykładowe aplikacje linku semantycznego:

  • Inteligentne sugestie wbudowanych funkcji semantycznych.
  • Innowacyjna integracja na potrzeby rozszerzania danych za pomocą miar usługi Power BI przy użyciu miar dodawania.
  • Narzędzia do sprawdzania jakości danych oparte na relacjach między tabelami i zależnościami funkcjonalnymi w tabelach.

Link semantyczny to zaawansowane narzędzie, które umożliwia analitykom biznesowym efektywne korzystanie z danych w kompleksowym środowisku nauki o danych.

Link semantyczny ułatwia bezproblemową współpracę między analitykami danych i analitykami biznesowymi, eliminując konieczność ponownego implementowania logiki biznesowej osadzonej w miarach usługi Power BI. Takie podejście zapewnia, że obie strony mogą działać wydajnie i wydajnie, maksymalizując potencjał analizy opartej na danych.

Struktura danych FabricDataFrame

FabricDataFrame to podstawowa struktura danych używana przez łącze semantyczne do propagowania informacji semantycznych z modeli semantycznych do środowiska usługi Synapse Nauka o danych.

Diagram przedstawiający przepływ danych z łączników do modeli semantycznych do elementu FabricDataFrame do funkcji semantycznych.

Klasa FabricDataFrame:

  • Obsługuje wszystkie operacje biblioteki pandas.
  • Podklasy ramki danych pandas i dodaje metadane, takie jak informacje semantyczne i pochodzenie.
  • Uwidacznia funkcje semantyczne i metodę add-measure , która umożliwia korzystanie z miar usługi Power BI w pracy z nauką o danych.