Compartilhar via


Como usar GraphFrames no Azure Databricks

Este artigo inclui notebooks de exemplo para ajudá-lo a começar a usar GraphFrames no Azure Databricks. GraphFrames é um pacote para Apache Spark que fornece gráficos baseados em DataFrame. Ele fornece APIs de alto nível em Java, Python e Scala. O objetivo é oferecer a funcionalidade do GraphX e a funcionalidade estendida usando os DataFrames do Spark. Essa funcionalidade estendida inclui a localização de motivos, a serialização baseada em DataFrame e consultas de grafo altamente expressivas.

Este artigo inclui três blocos de anotações de exemplo: um bloco de anotações introdutório disponível em Python e em Scala e um guia do usuário do Python. Para obter exemplos adicionais usando GraphFrames com Scala, consulte Guia do usuário do GraphFrames – Scala.

Recomendação do Databricks Runtime para GraphFrames

O Databricks recomenda usar um cluster que executa o Databricks Runtime para Machine Learning, pois ele inclui uma instalação otimizada do GraphFrames.

Se você não estiver usando um cluster executando o Databricks Runtime ML, baixe o arquivo JAR da biblioteca GraphFrames, carregue-o em um volume e instale-o no cluster.

Introdução ao GraphFrames

O notebook a seguir mostra como usar o GraphFrames para executar a análise de grafo.

Análise de grafo com GraphFrames (Python)

Obter notebook

Análise de grafo com GraphFrames (Scala)

Obter notebook

Guia do usuário do GraphFrames (Python)

O notebook a seguir inclui exemplos de código Python de como usar GraphFrames.

Notebook GraphFrames Python

Obter notebook