Преобразование данных Azure Synapse Link for Dataverse с помощью Apache Spark

Вы можете использовать Azure Synapse Link, чтобы подключить свои данные Microsoft Dataverse к Azure Synapse Analytics для изучения ваших данных и сокращения времени получения аналитической информации. В этой статье рассматривается, как преобразовать данные Dataverse с помощью ядра Apache Spark, доступного в вашем рабочем пространстве Synapse.

Примечание

Azure Synapse Link for Microsoft Dataverse ранее называлось "Экспорт в Data Lake". Служба была переименована в мае 2021 года и будет продолжать экспортировать данные в Azure Data Lake, а также в Azure Synapse Analytics.

Предварительные условия

В этом разделе описаны предварительные условия, необходимые для преобразования данных Dataverse с помощью Apache Spark после использования службы Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. В этом руководстве предполагается, что вы уже экспортировали данные из Dataverse с помощью Azure Synapse Link for Dataverse.

  • Доступ к учетной записи хранилища. Вам должна быть предоставлена одна из следующих ролей для учетной записи хранения: средство чтения данных BLOB-объектов хранилища, участник данных BLOB-объектов хранилища или владелец данных BLOB-объектов хранилища.

  • Администратор Synapse. Вам должен быть предоставлен доступ с ролью Администратор Synapse в Synapse Studio.

Преобразование данных с помощью записной книжки Apache Spark

  1. В Power Apps выберите желаемый Azure Synapse Link из списка, а затем выберите Перейти к Azure Synapse workspace.

    Перейти в рабочую область.

  2. Разверните Базы данных, выберите свой контейнер Dataverse. Ваши экспортированные таблицы отображаются в каталоге Таблицы на левой боковой панели.

    Найти таблицы в Synapse.

  3. Щелкните правой кнопкой мыши нужную таблицу и выберите Создать записную книжку > Загрузить в DataFrame.

    Загрузите в DataFrame.

  4. Присоедините записную книжку к пулу Apache Spark, выбрав пул в раскрывающемся меню. Если у вас нет пула Apache Spark, выберите Управление пулами, чтобы создать его.

    Прикрепите пул Spark.

  5. Добавьте ячейки кода для преобразования ваших данных. Запустите отдельные ячейки, нажав кнопку воспроизведения слева от каждой ячейки, или последовательно запустите все ячейки, выбрав Запустить все на верхней панели.

    Записная книжка Spark.

См. также

Блог: Объявление Azure Synapse Link for Dataverse

Что такое Apache Spark в Azure HDInsight

Примечание

Каковы ваши предпочтения в отношении языка документации? Пройдите краткий опрос (обратите внимание, что этот опрос представлен на английском языке).

Опрос займет около семи минут. Личные данные не собираются (заявление о конфиденциальности).