Partilhar via


Como usar GraphFrames no Azure Databricks

Este artigo inclui blocos de anotações de exemplo para ajudá-lo a get começou a usar GraphFrames no Azure Databricks. GraphFrames é um pacote para o Apache Spark que fornece gráficos baseados em DataFrame. Fornece APIs de alto nível em Java, Python e Scala. Ele visa fornecer tanto a funcionalidade do GraphX quanto a funcionalidade estendida aproveitando o Spark DataFrames. Esta funcionalidade alargada inclui localização de temas, serialização baseada no DataFrame e consultas de gráfico altamente expressivas.

Este artigo inclui três blocos de anotações de exemplo: um bloco de anotações introdutório disponível em Python e no Scala e um guia do usuário do Python. Para obter exemplos adicionais usando GraphFrames com Scala, consulte Guia do usuário do GraphFrames - Scala.

Recomendação de tempo de execução do Databricks para GraphFrames

A Databricks recomenda o uso de um cluster executando o Databricks Runtime for Machine Learning, pois inclui uma instalação otimizada do GraphFrames.

Se você não estiver usando um cluster executando o Databricks Runtime ML, baixe o arquivo JAR da biblioteca GraphFrames, carregue-o em um volume e instale-o em seu cluster.

Get começou com GraphFrames

Os blocos de anotações a seguir mostram como usar GraphFrames para executar a análise de gráficos.

Análise de gráficos com GraphFrames (Python)

Get caderno

Análise de gráficos com GraphFrames (Scala)

Get portátil

Guia do usuário do GraphFrames (Python)

O bloco de anotações a seguir inclui exemplos de código Python de como usar GraphFrames.

Caderno Python GraphFrames

Get notebook