Обнаружение, подключение и изучение данных в Synapse с помощью Microsoft Purview
В этом документе вы узнаете о типе взаимодействия, которое можно выполнить при регистрации учетной записи Microsoft Purview в Synapse.
Предпосылки
- Учетная запись Microsoft Purview
- Рабочая область Synapse
- Подключить учетную запись Microsoft Purview к Synapse
Использование Microsoft Purview в Synapse
Для использования Microsoft Purview в Synapse требуется доступ к этой учетной записи Microsoft Purview. Synapse проходит через разрешение Microsoft Purview. Например, если у вас есть роль с разрешениями куратора, вы сможете изменять метаданные, отсканированные Microsoft Purview.
Обнаружение данных: поиск наборов данных
Чтобы обнаружить зарегистрированные и сканированные microsoft Purview данные, можно использовать панель поиска в верхнем центре рабочей области Synapse. Выберите Microsoft Purview, чтобы искать во всех данных организации.
Действия Microsoft Purview
Ниже приведен список функций Microsoft Purview, доступных в Synapse:
- Обзор метаданных
- Просмотр и изменение схемы метаданных с классификациями, терминами глоссария, типами данных и описаниями
- Просмотрите структуру, чтобы понять зависимости и провести анализ влияния. Дополнительные сведения о линии см. в
- Просматривайте и редактируйте контакты, чтобы узнать, кто является владельцем или экспертом по набору данных.
- Связанные для понимания иерархических зависимостей определенного набора данных. Этот интерфейс полезен для просмотра иерархии данных.
- Щелкните на запрос доступа, чтобы запросить доступ к данным, запустив рабочий процесс самослужебного доступа к данным, который был настроен администратором рабочего процесса в Microsoft Purview. Для получения дополнительной информации см. запрос доступа и рабочий процесс доступа к даннымSelf-Service.
Действия, которые можно выполнять над наборами данных с помощью ресурсов Synapse
Подключение данных к Synapse
- Вы можете создать новую связанную службу в Synapse. Это действие потребуется для копирования данных в Synapse или для их размещения в вашем концентраторе данных (для поддерживаемых источников данных, таких как ADLSg2)
- Для таких объектов, как файлы, папки или таблицы, можно напрямую создать новый набор данных интеграции и использовать существующую связанную службу, если она уже создана.
Мы еще не можем определить, существует ли связанная служба или набор данных интеграции.
Разработка в Synapse
Можно выполнить три действия: создать скрипт SQL, создать записную книжкуи новый поток данных.
С помощью нового скрипта SQL , в зависимости от типа поддержки, можно:
- Просмотрите первые 100 строк, чтобы понять форму данных.
- Создание внешней таблицы из базы данных Synapse SQL
- Загрузка данных в базу данных Synapse SQL
С помощью новой записной книжкиможно:
- Загрузка данных в DataFrame Spark
- Создайте таблицу Spark (если это делается в формате Parquet, то она также создаёт таблицу пула SQL без серверов).
С помощью нового потока данныхможно создать интеграционный набор данных, который можно использовать как источник в конвейере потока данных. Поток данных — это возможность разработчика без кода для преобразования данных. Дополнительные сведения об использовании потока данных в Synapse.