Compartilhar via


O que é o link semântico?

O Link Semântico é um recurso que permite estabelecer uma conexão entre os modelos semânticos e a Ciência de Dados do Synapse no Microsoft Fabric. O uso do link semântico só é compatível com o Microsoft Fabric.

  • Para o Spark 3.4 e superior, o link semântico está disponível no runtime padrão quando o Fabric é usado e não há necessidade de instalá-lo.

  • Para o Spark 3.3 ou inferior, ou para atualizar para a última versão do link semântico, execute o seguinte comando:

    %pip install -U semantic-link
    

Os principais objetivos do link semântico são:

  • Facilitar a conectividade de dados.
  • Permitir a propagação de informações semânticas.
  • Integre-se perfeitamente com ferramentas estabelecidas que os cientistas de dados usam, como notebooks.

O link semântico ajuda você a preservar o conhecimento do domínio sobre a semântica dos dados de forma padronizada, o que pode acelerar a análise de dados e reduzir erros.

O fluxo de dados do link semântico começa com modelos semânticos que contêm dados e informações semânticas. O link semântico faz a ponte entre o Power BI e a experiência do Synapse Data Science.

Um diagrama que mostra o fluxo de dados do Power BI para blocos de anotações no Synapse Data Science e de volta para o Power BI.

Com o Link Semântico, você pode usar modelos semânticos do Power BI na experiência do Synapse Data Science para executar tarefas como análise estatística detalhada e modelagem preditiva com técnicas de machine learning. A saída do trabalho de ciência de dados pode ser armazenada no OneLake usando o Apache Spark e ingerida no Power BI usando o Direct Lake.

Conectividade do Power BI

Um modelo semântico serve como um único modelo de objeto tabular, oferecendo fontes confiáveis para definições semânticas, como medidas do Power BI. O link semântico se conecta a modelos semânticos nos seguintes ecossistemas, facilitando o trabalho dos cientistas de dados no sistema com o qual estão mais familiarizados.

  • Ecossistema pandas do Python, por meio da biblioteca SemPy do Python.
  • Ecossistema Apache Spark, através do conector nativo do Spark. Essa implementação é compatível com várias linguagens de programação, incluindo PySpark, Spark SQL, R e Scala.

Aplicativos de informações semânticas

As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas.

Essas categorias de dados incluem metadados propagados pelo link semântico no ambiente de Ciência de Dados para permitir novas experiências e manter a linhagem de dados.

Alguns exemplos de aplicativos de link semântico são:

O Link Semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente amplo de ciência de dados.

O Link Semântico facilita a colaboração entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial dos insights orientados por dados.

Estrutura de dados FabricDataFrame

FabricDataFrame é a estrutura de dados primária que o link semântico usa para propagar informações semânticas de modelos semânticos para o ambiente do Synapse Data Science.

Um diagrama que mostra o fluxo de dados de conectores para modelos semânticos para FabricDataFrame para funções semânticas.

A classe FabricDataFrame:

  • Suporta todas as operações de pandas.
  • Subclassifica o pandas DataFrame e adiciona metadados, como informações semânticas e de linhagem.
  • Expõe funções semânticas e o método add-measure, que permite que você use medidas do Power BI no trabalho de ciência de dados.