GraphFrames gebruiken in Azure Databricks
Dit artikel bevat voorbeeldnotebooks om u te helpen aan de slag te gaan met GraphFrames in Azure Databricks. GraphFrames is een pakket voor Apache Spark dat op DataFrame gebaseerde grafieken biedt. Het biedt API's op hoog niveau in Java, Python en Scala. Het is erop gericht om zowel de functionaliteit van GraphX als uitgebreide functionaliteit te bieden die gebruikmaakt van Spark DataFrames. Deze uitgebreide functionaliteit omvat het vinden van motifs, serialisatie op basis van DataFrame en zeer expressieve grafiekquery's.
Dit artikel bevat drie voorbeeldnotebooks: een inleidende notebook die beschikbaar is in Python en scala en een Python-gebruikershandleiding. Zie de Gebruikershandleiding voor GraphFrames - Scala voor meer voorbeelden van het gebruik van GraphFrames met Scala.
Aanbeveling voor Databricks Runtime voor GraphFrames
Databricks raadt aan om een cluster met Databricks Runtime voor Machine Learning te gebruiken, omdat het een geoptimaliseerde installatie van GraphFrames bevat.
Als u geen cluster met Databricks Runtime ML gebruikt, downloadt u het JAR-bestand uit de GraphFrames-bibliotheek, laadt u het naar een volume en installeert u het op uw cluster.
Aan de slag met GraphFrames
In de volgende notebooks ziet u hoe u GraphFrames gebruikt om grafiekanalyses uit te voeren.
Grafiekanalyse met GraphFrames (Python)
Grafiekanalyse met GraphFrames (Scala)
GraphFrames-gebruikershandleiding (Python)
Het volgende notebook bevat Python-codevoorbeelden voor het gebruik van GraphFrames.