Udostępnij za pośrednictwem


Jak używać elementów GraphFrame w usłudze Azure Databricks

Ten artykuł zawiera przykładowe notesy ułatwiające rozpoczęcie korzystania z elementów GraphFrame w usłudze Azure Databricks. GraphFrames to pakiet dla platformy Apache Spark, który udostępnia grafy oparte na ramce danych. Udostępnia on interfejsy API wysokiego poziomu w językach Java, Python i Scala. Ma ona na celu zapewnienie zarówno funkcjonalności programu GraphX, jak i rozszerzonej funkcjonalności korzystającej z ramek danych platformy Spark. Ta rozszerzona funkcjonalność obejmuje znajdowanie motywu, serializację opartą na ramkach danych i wysoce ekspresywne zapytania dotyczące grafów.

Ten artykuł zawiera trzy przykładowe notesy: notes wprowadzający dostępny w języku Python i w języku Scala oraz podręcznik użytkownika języka Python. Aby uzyskać dodatkowe przykłady użycia elementów GraphFrames z językiem Scala, zobacz Podręcznik użytkownika programu GraphFrames — Scala.

Zalecenie środowiska Databricks Runtime dla elementów GraphFrames

Usługa Databricks zaleca używanie klastra z uruchomionym środowiskiem Databricks Runtime na potrzeby uczenia maszynowego, ponieważ obejmuje zoptymalizowaną instalację elementów GraphFrames.

Jeśli nie używasz klastra z uruchomionym środowiskiem Databricks Runtime ML, pobierz plik JAR z biblioteki GraphFrames, załaduj go do woluminu i zainstaluj go w klastrze.

Rozpoczynanie pracy z elementami GraphFrame

W poniższych notesach pokazano, jak używać elementów GraphFrame do przeprowadzania analizy grafu.

Analiza grafu za pomocą elementów GraphFrame (Python)

Pobierz notes

Analiza grafu za pomocą elementów GraphFrame (Scala)

Pobierz notes

Podręcznik użytkownika programu GraphFrames (Python)

Poniższy notes zawiera przykłady kodu w języku Python dotyczące używania elementów GraphFrame.

Notes języka Python GraphFrames

Pobierz notes