Поделиться через


Использование GraphFrames в Azure Databricks

В этой статье приведены примеры записных книжек, которые помогут вам get начать работу с GraphFrames в Azure Databricks. GraphFrames — это пакет для Apache Spark, предоставляющий графы на основе данных. Он предоставляет высокоуровневые API для Java, Python и Scala, Она предназначена для предоставления функциональных возможностей GraphX и расширенных функциональных возможностей, используя преимущества кадров данных Spark. Эти расширенные возможности включают поиск в Motif, сериализацию на основе DataFrame и выразительные запросы графов.

В этой статье содержится три примера записных книжек: вводная записная книжка, доступная в Python и в Scala, а также руководство пользователя Python. Дополнительные примеры использования GraphFrames с Scala см . в руководстве пользователя GraphFrames — Scala.

Рекомендация по среде выполнения Databricks для GraphFrames

Databricks рекомендует использовать кластер со средой Databricks Runtime для Машинного обучения, так как он включает оптимизированную установку GraphFrames.

Если вы не используете кластер под управлением Databricks Runtime ML, скачайте JAR-файл из библиотеки GraphFrames, загрузите его в том и установите его в кластер.

Get начало работы с GraphFrames

В следующих записных книжках показано, как использовать ГрафФреймы для выполнения анализа графов.

Анализ графов с помощью GraphFrames (Python)

Get записная книжка

Анализ графов с помощью GraphFrames (Scala)

Get записная книжка

Руководство пользователя GraphFrames (Python)

В следующей записной книжке приведены примеры кода Python по использованию GraphFrames.

Записная книжка GraphFrames на Python

Get записная книжка