Udostępnij za pośrednictwem


Propagacja danych semantycznych z modeli semantycznych

Podczas odczytywania modelu semantycznego do elementu FabricDataFrame semantyczne informacje, takie jak metadane i adnotacje z modelu semantycznego, są automatycznie dołączane do elementu FabricDataFrame. Z tego artykułu dowiesz się, jak biblioteka SemPy języka Python zachowuje adnotacje dołączone do tabel i kolumn modelu semantycznego.

Propagacja semantyczna dla użytkowników biblioteki pandas

Biblioteka SemPy języka Python jest częścią funkcji linku semantycznego i obsługuje użytkowników biblioteki pandas. Biblioteka SemPy obsługuje operacje, które biblioteka pandas umożliwia wykonywanie na danych.

SemPy umożliwia również propagację danych semantycznych z modeli semantycznych, na których działasz. Propagując dane semantyczne, można zachować adnotacje dołączone do tabel i kolumn w modelu semantycznym podczas wykonywania operacji, takich jak fragmentowanie, scalanie i łączenie.

Strukturę danych FabricDataFrame można utworzyć na jeden z dwóch sposobów:

  • Możesz odczytać tabelę lub dane wyjściowe miary z modelu semantycznego do elementu FabricDataFrame.

    Podczas odczytywania z modelu semantycznego do elementu FabricDataFrame metadane z usługi Power BI automatycznie nawilżają lub wypełniają element FabricDataFrame. Innymi słowy element FabricDataFrame zachowuje semantyczne informacje z tabel lub miar modelu.

  • Możesz użyć danych w pamięci, aby utworzyć element FabricDataFrame, podobnie jak w przypadku ramek danych biblioteki pandas.

    Podczas tworzenia elementu FabricDataFrame na podstawie danych w pamięci należy podać nazwę modelu semantycznego, z którego element FabricDataFrame może ściągać informacje o metadanych.

Sposób zachowywania danych semantycznych przez bibliotekę SemPy różni się w zależności od czynników, takich jak wykonywane operacje i kolejność wykonywanych elementów FabricDataFrame.

Propagacja semantyczna z scaleniem

Podczas scalania dwóch elementów FabricDataFrame kolejność ramek danych określa sposób propagacji informacji semantycznych przez bibliotekę SemPy.

  • Jeśli obie elementy FabricDataFrame są oznaczone adnotacjami, pierwszeństwo ma metadane na poziomie tabeli lewej ramki FabricDataFrame. Ta sama reguła dotyczy poszczególnych kolumn; adnotacje kolumn w lewym elemencie FabricDataFrame mają pierwszeństwo przed adnotacjami kolumn w prawej ramce danych.

  • Jeśli tylko jedna ramka FabricDataFrame jest oznaczona adnotacją, funkcja SemPy używa swoich metadanych. Ta sama reguła dotyczy poszczególnych kolumn; Funkcja SemPy używa adnotacji kolumn znajdujących się w obiekcie FabricDataFrame z adnotacjami.

Propagacja semantyczna z łączeniem

Po połączeniu wielu elementów FabricDataFrame dla każdej kolumny SemPy kopiuje metadane z pierwszej ramki FabricDataFrame zgodnej z nazwą kolumny. Jeśli istnieje wiele dopasowań, a metadane nie są takie same, program SemPy wyświetla ostrzeżenie.

Można również propagować łączenie szkieletowych ramek danych za pomocą zwykłych ramek danych biblioteki pandas, umieszczając najpierw element FabricDataFrame.

Propagacja semantyczna dla użytkowników platformy Spark

Link semantyczny łącznik natywny platformy Spark nawilża (lub wypełnia) słownik metadanych kolumny Platformy Spark. Obecnie obsługa propagacji semantycznej jest ograniczona i podlega wewnętrznej implementacji platformy Spark dotyczącej propagacji informacji o schemacie. Na przykład agregacja kolumn usuwa metadane.