Dela via


Använda GraphFrames i Azure Databricks

Den här artikeln innehåller exempel på notebook-filer som hjälper dig att get börjat använda GraphFrames i Azure Databricks. GraphFrames är ett paket för Apache Spark som tillhandahåller DataFrame-baserade grafer. Det innehåller API:er med hög nivå i Java, Python och Scala. Syftet är att tillhandahålla både funktionerna i GraphX och utökade funktioner som utnyttjar Spark DataFrames. Den här utökade funktionen inkluderar motivsökning, DataFrame-baserad serialisering och uttrycksfulla diagramfrågor.

Den här artikeln innehåller tre exempel på notebook-filer: en introduktionsanteckningsbok som är tillgänglig i Python och i Scala och en Python-användarhandbok. Ytterligare exempel med GraphFrames med Scala finns i Användarhandbok för GraphFrames – Scala.

Databricks Runtime-rekommendation för GraphFrames

Databricks rekommenderar att du använder ett kluster som kör Databricks Runtime for Machine Learning, eftersom det innehåller en optimerad installation av GraphFrames.

Om du inte använder ett kluster som kör Databricks Runtime ML laddar du ned JAR-filen från GraphFrames-biblioteket, läser in den till en volym och installerar den i klustret.

Get började med GraphFrames

Följande notebook-filer visar hur du använder GraphFrames för att utföra grafanalys.

Diagramanalys med GraphFrames (Python)

Get anteckningsbok

Diagramanalys med GraphFrames (Scala)

Get anteckningsbok

Användarhandbok för GraphFrames (Python)

Följande notebook-fil innehåller Python-kodexempel på hur du använder GraphFrames.

Python-notebook-fil för GraphFrames

Get anteckningsbok