Använda GraphFrames i Azure Databricks
Den här artikeln innehåller exempel på notebook-filer som hjälper dig att komma igång med GraphFrames i Azure Databricks. GraphFrames är ett paket för Apache Spark som tillhandahåller DataFrame-baserade grafer. Det innehåller API:er med hög nivå i Java, Python och Scala. Syftet är att tillhandahålla både funktionerna i GraphX och utökade funktioner som utnyttjar Spark DataFrames. Den här utökade funktionen inkluderar motivsökning, DataFrame-baserad serialisering och uttrycksfulla diagramfrågor.
Den här artikeln innehåller tre exempel på notebook-filer: en introduktionsanteckningsbok som är tillgänglig i Python och i Scala och en Python-användarhandbok. Ytterligare exempel med GraphFrames med Scala finns i Användarhandbok för GraphFrames – Scala.
Databricks Runtime-rekommendation för GraphFrames
Databricks rekommenderar att du använder ett kluster som kör Databricks Runtime for Machine Learning, eftersom det innehåller en optimerad installation av GraphFrames.
Om du inte använder ett kluster som kör Databricks Runtime ML laddar du ned JAR-filen från GraphFrames-biblioteket, läser in den till en volym och installerar den i klustret.
Kom igång med GraphFrames
Följande notebook-filer visar hur du använder GraphFrames för att utföra grafanalys.
Diagramanalys med GraphFrames (Python)
Diagramanalys med GraphFrames (Scala)
Användarhandbok för GraphFrames (Python)
Följande notebook-fil innehåller Python-kodexempel på hur du använder GraphFrames.