Läsa från semantiska modeller och skriva data som kan användas av Power BI med python

Artikel
11/24/2024

I den här artikeln lär du dig att läsa data och metadata och utvärdera mått i semantiska modeller med hjälp av SemPy Python-biblioteket i Microsoft Fabric. Du får också lära dig hur du skriver data som semantiska modeller kan använda.

Förutsättningar

Skaffa en Microsoft Fabric-prenumeration. Eller registrera dig för en kostnadsfri utvärderingsversion av Microsoft Fabric.
Logga in på Microsoft Fabric.
Använd upplevelseväxlaren längst ned till vänster på startsidan för att byta till Fabric.

Besök den Datavetenskap upplevelsen i Microsoft Fabric.
Skapa en ny anteckningsbok för att kopiera/klistra in kod i celler
För Spark 3.4 och senare är Semantic-länken tillgänglig i standardkörningen när du använder Infrastrukturresurser, och du behöver inte installera den. Om du använder Spark 3.3 eller senare, eller om du vill uppdatera till den senaste versionen av Semantic Link, kan du köra kommandot: python %pip install -U semantic-link
Lägga till en Lakehouse i anteckningsboken
Ladda ned semantikmodellen Sample.pbix för kundlönsamhet från mappen datauppsättningar på lagringsplatsen fabric-samples och spara den semantiska modellen lokalt

Ladda upp den semantiska modellen till din arbetsyta

Den här artikeln använder semantikmodellen Customer Profitability Sample.pbix . Den här semantiska modellen refererar till ett företag som tillverkar marknadsföringsmaterial. Den innehåller produkt-, kund- och motsvarande intäktsdata för olika affärsenheter.

Öppna din arbetsyta i Fabric Datavetenskap
Välj Ladda upp > bläddra och välj semantikmodellen Customer Profitability Sample.pbix .

När uppladdningen är klar har arbetsytan tre nya artefakter: en Power BI-rapport, en instrumentpanel och en semantisk modell med namnet Exempel på kundlönsamhet. Stegen i den här artikeln förlitar sig på den semantiska modellen.

Använda Python för att läsa data från semantiska modeller

SemPy Python-API:et kan hämta data och metadata från semantiska modeller som finns på en Microsoft Fabric-arbetsyta. API:et kan också köra frågor på dem.

Notebook-filen, Power BI-datauppsättningens semantiska modell och lakehouse kan finnas på samma arbetsyta eller på olika arbetsytor. Som standard försöker SemPy komma åt din semantiska modell från:

Arbetsytan i ditt sjöhus, om du bifogat ett sjöhus till din anteckningsbok.
Arbetsytan i anteckningsboken, om det inte finns någon bifogad lakehouse.

Om din semantiska modell inte finns på någon av dessa arbetsytor måste du ange arbetsytan för din semantiska modell när du anropar en SemPy-metod.

Så här läser du data från semantiska modeller:

Visa en lista över tillgängliga semantiska modeller på din arbetsyta.

import sempy.fabric as fabric

df_datasets = fabric.list_datasets()
df_datasets

Lista tabellerna som är tillgängliga i semantikmodellen Exempel på kundlönsamhet .

df_tables = fabric.list_tables("Customer Profitability Sample", include_columns=True)
df_tables

Visa en lista över måtten som definierats i semantikmodellen Exempel på kundlönsamhet .

Dricks

I följande kodexempel angav vi arbetsytan för SemPy som ska användas för att komma åt semantikmodellen. Du kan ersätta Your Workspace med namnet på arbetsytan där du laddade upp semantikmodellen (från avsnittet Ladda upp semantikmodellen till arbetsytan ).
```
df_measures = fabric.list_measures("Customer Profitability Sample", workspace="Your Workspace")
df_measures
```
Här har vi fastställt att tabellen Kund är den intressanta tabellen.
Läs tabellen Kund från semantikmodellen Exempel på kundlönsamhet .
```
df_table = fabric.read_table("Customer Profitability Sample", "Customer")
df_table
```
Kommentar
- Data hämtas med XMLA. Detta kräver att minst XMLA är skrivskyddat för att aktiveras.
- Mängden hämtningsbara data begränsas av – maximalt minne per fråga för den kapacitets-SKU som är värd för den semantiska modellen – Spark-drivrutinsnoden (besök nodstorlekar för mer information) som kör notebook-filen
- Alla begäranden har låg prioritet för att minimera påverkan på Microsoft Azure Analysis Services-prestanda och faktureras som interaktiva begäranden.
Utvärdera måttet Totala intäkter för varje kunds tillstånd och datum.
```
df_measure = fabric.evaluate_measure(
    "Customer Profitability Sample",
    "Total Revenue",
    ["'Customer'[State]", "Calendar[Date]"])
df_measure
```
Kommentar
- Som standard hämtas inte data med XMLA och kräver därför inte att XMLA är skrivskyddat för att aktiveras.
- Data omfattas inte av begränsningar för Power BI-serverdelen.
- Mängden hämtningsbara data begränsas av – maximalt minne per fråga för den kapacitets-SKU som är värd för den semantiska modellen – Spark-drivrutinsnoden (besök nodstorlekar för mer information) som kör notebook-filen
- Alla begäranden faktureras som interaktiva begäranden

Om du vill lägga till filter i måttberäkningen anger du en lista över tillåtna värden för en viss kolumn.

filters = {
    "State[Region]": ["East", "Central"],
    "State[State]": ["FLORIDA", "NEW YORK"]
}
df_measure = fabric.evaluate_measure(
    "Customer Profitability Sample",
    "Total Revenue",
    ["Customer[State]", "Calendar[Date]"],
    filters=filters)
df_measure

Du kan också utvärdera måttet Total intäkt per kundens tillstånd och datum med en DAX-fråga.
```
df_dax = fabric.evaluate_dax(
    "Customer Profitability Sample",
    """
    EVALUATE SUMMARIZECOLUMNS(
        'State'[Region],
        'Calendar'[Date].[Year],
        'Calendar'[Date].[Month],
        "Total Revenue",
        CALCULATE([Total Revenue]))
    """)
```
Kommentar
- Data hämtas med XMLA och kräver därför att minst XMLA är skrivskyddat för att aktiveras
- Mängden hämtningsbara data begränsas av tillgängligt minne i Microsoft Azure Analysis Services och Spark-drivrutinsnoden (besök nodstorlekar för mer information)
- Alla begäranden använder låg prioritet för att minimera påverkan på Analysis Services-prestanda och faktureras som interaktiva begäranden
Använd cellmagi %%dax för att utvärdera samma DAX-fråga, utan att behöva importera biblioteket. Kör den här cellen för att läsa in %%dax cellmagi:
```
%load_ext sempy
```
Parametern för arbetsytan är valfri. Den följer samma regler som arbetsyteparametern för evaluate_dax funktionen.

Cellmagi stöder också åtkomst till Python-variabler med syntaxen {variable_name} . Om du vill använda en klammerparentes i DAX-frågan kan du undvika den med en annan klammerparentes (exempel: EVALUATE {{1}}).
```
%%dax "Customer Profitability Sample" -w "Your Workspace"
EVALUATE SUMMARIZECOLUMNS(
    'State'[Region],
    'Calendar'[Date].[Year],
    'Calendar'[Date].[Month],
    "Total Revenue",
    CALCULATE([Total Revenue]))
```
Den resulterande FabricDataFrame är tillgänglig via variabeln _ . Den variabeln samlar in utdata från den senast utförda cellen.
```
df_dax = _

df_dax.head()
```
Du kan lägga till mått i data som hämtats från externa källor. Den här metoden kombinerar tre uppgifter:
- Den löser kolumnnamn till Power BI-dimensioner
- Den definierar gruppera efter kolumner
- Det filtrerar måttet Alla kolumnnamn som inte kan matchas inom den angivna semantiska modellen ignoreras (mer information finns i DAX-syntaxresursen som stöds).
```
from sempy.fabric import FabricDataFrame

df = FabricDataFrame({
        "Sales Agent": ["Agent 1", "Agent 1", "Agent 2"],
        "Customer[Country/Region]": ["US", "GB", "US"],
        "Industry[Industry]": ["Services", "CPG", "Manufacturing"],
    }
)

joined_df = df.add_measure("Total Revenue", dataset="Customer Profitability Sample")
joined_df
```

Särskilda parametrar

SemPy read_table och evaluate_measure metoderna har fler parametrar som är användbara för att manipulera utdata. Dessa parametrar omfattar:

fully_qualified_columns: För värdet "True" returnerar metoderna kolumnnamn i formuläret TableName[ColumnName]
num_rows: Antalet rader som ska matas ut i resultatet
pandas_convert_dtypes: För värdet "True" omvandlar Pandas resulterande DataFrame-kolumner till bästa möjliga dtype-convert_dtypes. Om den här parametern är inaktiverad kan du skriva inkompatibilitetsproblem mellan kolumner i relaterade tabeller. Power BI-modellen kanske inte identifierar dessa problem på grund av konvertering av implicit DAX-typ

SemPy read_table använder också den modellinformation som Power BI tillhandahåller.

multiindex_hierarchies: Om "Sant" konverteras Power BI-hierarkier till en Pandas MultiIndex-struktur

Skriva data som kan användas med semantiska modeller

Spark-tabeller som läggs till i ett Lakehouse läggs automatiskt till i motsvarande standardsemantiska modell. Det här exemplet visar hur du skriver data till det bifogade Lakehouse. FabricDataFrame accepterar samma indata som Pandas-dataramar.

from sempy.fabric import FabricDataFrame

df_forecast = FabricDataFrame({'ForecastedRevenue': [1, 2, 3]})

df_forecast.to_lakehouse_table("ForecastTable")

Med Power BI kan tabellen ForecastTable läggas till i en sammansatt semantisk modell med Lakehouse-semantikmodellen.

Dela via

Läsa från semantiska modeller och skriva data som kan användas av Power BI med python

Förutsättningar

Ladda upp den semantiska modellen till din arbetsyta

Använda Python för att läsa data från semantiska modeller

Särskilda parametrar

Skriva data som kan användas med semantiska modeller

Feedback

Ytterligare resurser

Dela via

Läsa från semantiska modeller och skriva data som kan användas av Power BI med python

Förutsättningar

Ladda upp den semantiska modellen till din arbetsyta

Använda Python för att läsa data från semantiska modeller

Särskilda parametrar

Skriva data som kan användas med semantiska modeller

Relaterat innehåll

Feedback

Ytterligare resurser