Поделиться через


Обнаружение, подключение и изучение данных в Synapse с помощью Microsoft Purview

В этом документе вы узнаете о типе взаимодействия, которое можно выполнить при регистрации учетной записи Microsoft Purview в Synapse.

Предпосылки

Использование Microsoft Purview в Synapse

Для использования Microsoft Purview в Synapse требуется доступ к этой учетной записи Microsoft Purview. Synapse проходит через разрешение Microsoft Purview. Например, если у вас есть роль с разрешениями куратора, вы сможете изменять метаданные, отсканированные Microsoft Purview.

Обнаружение данных: поиск наборов данных

Чтобы обнаружить зарегистрированные и сканированные microsoft Purview данные, можно использовать панель поиска в верхнем центре рабочей области Synapse. Выберите Microsoft Purview, чтобы искать во всех данных организации.

Поиск активов Microsoft Purview

Действия Microsoft Purview

Ниже приведен список функций Microsoft Purview, доступных в Synapse:

  • Обзор метаданных
  • Просмотр и изменение схемы метаданных с классификациями, терминами глоссария, типами данных и описаниями
  • Просмотрите структуру, чтобы понять зависимости и провести анализ влияния. Дополнительные сведения о линии см. в
  • Просматривайте и редактируйте контакты, чтобы узнать, кто является владельцем или экспертом по набору данных.
  • Связанные для понимания иерархических зависимостей определенного набора данных. Этот интерфейс полезен для просмотра иерархии данных.
  • Щелкните на запрос доступа, чтобы запросить доступ к данным, запустив рабочий процесс самослужебного доступа к данным, который был настроен администратором рабочего процесса в Microsoft Purview. Для получения дополнительной информации см. запрос доступа и рабочий процесс доступа к даннымSelf-Service.

Действия, которые можно выполнять над наборами данных с помощью ресурсов Synapse

Подключение данных к Synapse

  • Вы можете создать новую связанную службу в Synapse. Это действие потребуется для копирования данных в Synapse или для их размещения в вашем концентраторе данных (для поддерживаемых источников данных, таких как ADLSg2)
  • Для таких объектов, как файлы, папки или таблицы, можно напрямую создать новый набор данных интеграции и использовать существующую связанную службу, если она уже создана.

Мы еще не можем определить, существует ли связанная служба или набор данных интеграции.

 Разработка в Synapse

Можно выполнить три действия: создать скрипт SQL, создать записную книжкуи новый поток данных.

С помощью нового скрипта SQL , в зависимости от типа поддержки, можно:

  • Просмотрите первые 100 строк, чтобы понять форму данных.
  • Создание внешней таблицы из базы данных Synapse SQL
  • Загрузка данных в базу данных Synapse SQL

С помощью новой записной книжкиможно:

  • Загрузка данных в DataFrame Spark
  • Создайте таблицу Spark (если это делается в формате Parquet, то она также создаёт таблицу пула SQL без серверов).

С помощью нового потока данныхможно создать интеграционный набор данных, который можно использовать как источник в конвейере потока данных. Поток данных — это возможность разработчика без кода для преобразования данных. Дополнительные сведения об использовании потока данных в Synapse.

 Дальнейшие действия