O que é o link semântico?
O Link Semântico é um recurso que permite estabelecer uma conexão entre os modelos semânticos e a Ciência de Dados do Synapse no Microsoft Fabric. O uso do link semântico só é compatível com o Microsoft Fabric.
Para o Spark 3.4 e superior, o link semântico está disponível no runtime padrão quando o Fabric é usado e não há necessidade de instalá-lo.
Para o Spark 3.3 ou inferior, ou para atualizar para a última versão do link semântico, execute o seguinte comando:
%pip install -U semantic-link
Os principais objetivos do link semântico são:
- Facilitar a conectividade de dados.
- Permitir a propagação de informações semânticas.
- Integre-se perfeitamente com ferramentas estabelecidas que os cientistas de dados usam, como notebooks.
O link semântico ajuda você a preservar o conhecimento do domínio sobre a semântica dos dados de forma padronizada, o que pode acelerar a análise de dados e reduzir erros.
Fluxo de dados de link semântico
O fluxo de dados do link semântico começa com modelos semânticos que contêm dados e informações semânticas. O link semântico faz a ponte entre o Power BI e a experiência do Synapse Data Science.
Com o Link Semântico, você pode usar modelos semânticos do Power BI na experiência do Synapse Data Science para executar tarefas como análise estatística detalhada e modelagem preditiva com técnicas de machine learning. A saída do trabalho de ciência de dados pode ser armazenada no OneLake usando o Apache Spark e ingerida no Power BI usando o Direct Lake.
Conectividade do Power BI
Um modelo semântico serve como um único modelo de objeto tabular, oferecendo fontes confiáveis para definições semânticas, como medidas do Power BI. O link semântico se conecta a modelos semânticos nos seguintes ecossistemas, facilitando o trabalho dos cientistas de dados no sistema com o qual estão mais familiarizados.
- Ecossistema pandas do Python, por meio da biblioteca SemPy do Python.
- Ecossistema Apache Spark, através do conector nativo do Spark. Essa implementação é compatível com várias linguagens de programação, incluindo PySpark, Spark SQL, R e Scala.
Aplicativos de informações semânticas
As informações semânticas nos dados incluem categorias de dados do Power BI, como endereço e código postal, relações entre tabelas e informações hierárquicas.
Essas categorias de dados incluem metadados propagados pelo link semântico no ambiente de Ciência de Dados para permitir novas experiências e manter a linhagem de dados.
Alguns exemplos de aplicativos de link semântico são:
- Sugestões inteligentes de funções semânticas internas.
- Integração inovadora para aumentar dados com medidas do Power BI por meio do uso de add-measures.
- Ferramentas para validação da qualidade dos dados com base nas relações entre tabelas e dependências funcionais dentro das tabelas.
O Link Semântico é uma ferramenta poderosa que permite que os analistas de negócios usem dados de forma eficaz em um ambiente amplo de ciência de dados.
O Link Semântico facilita a colaboração entre cientistas de dados e analistas de negócios, eliminando a necessidade de reimplementar a lógica de negócios incorporada nas medidas do Power BI. Essa abordagem garante que ambas as partes possam trabalhar de forma eficiente e produtiva, maximizando o potencial dos insights orientados por dados.
Estrutura de dados FabricDataFrame
FabricDataFrame é a estrutura de dados primária que o link semântico usa para propagar informações semânticas de modelos semânticos para o ambiente do Synapse Data Science.
A classe FabricDataFrame
:
- Suporta todas as operações de pandas.
- Subclassifica o pandas DataFrame e adiciona metadados, como informações semânticas e de linhagem.
- Expõe funções semânticas e o método add-measure, que permite que você use medidas do Power BI no trabalho de ciência de dados.
Conteúdo relacionado
- Explore a documentação de referência para o pacote de link semântico do Python (SemPy)
- Tutorial: limpeza de dados com dependências funcionais
- Conectividade do Power BI com o Link Semântico e o Microsoft Fabric
- Explorar e validar dados usando o link semântico
- Explorar e validar relacionamentos em modelos semânticos