Dela via


Använda GraphFrames i Azure Databricks

Den här artikeln innehåller exempel på notebook-filer som hjälper dig att komma igång med GraphFrames i Azure Databricks. GraphFrames är ett paket för Apache Spark som tillhandahåller DataFrame-baserade grafer. Det innehåller API:er med hög nivå i Java, Python och Scala. Syftet är att tillhandahålla både funktionerna i GraphX och utökade funktioner som utnyttjar Spark DataFrames. Den här utökade funktionen inkluderar motivsökning, DataFrame-baserad serialisering och uttrycksfulla diagramfrågor.

Den här artikeln innehåller tre exempel på notebook-filer: en introduktionsanteckningsbok som är tillgänglig i Python och i Scala och en Python-användarhandbok. Ytterligare exempel med GraphFrames med Scala finns i Användarhandbok för GraphFrames – Scala.

Databricks Runtime-rekommendation för GraphFrames

Databricks rekommenderar att du använder ett kluster som kör Databricks Runtime for Machine Learning, eftersom det innehåller en optimerad installation av GraphFrames.

Om du inte använder ett kluster som kör Databricks Runtime ML laddar du ned JAR-filen från GraphFrames-biblioteket, läser in den till en volym och installerar den i klustret.

Kom igång med GraphFrames

Följande notebook-filer visar hur du använder GraphFrames för att utföra grafanalys.

Diagramanalys med GraphFrames (Python)

Hämta notebook-fil

Diagramanalys med GraphFrames (Scala)

Hämta notebook-fil

Användarhandbok för GraphFrames (Python)

Följande notebook-fil innehåller Python-kodexempel på hur du använder GraphFrames.

Python-notebook-fil för GraphFrames

Hämta notebook-fil