Подключение к Amazon Redshift в Microsoft Purview
Важно!
Сейчас эта функция доступна в предварительной версии. Дополнительные условия использования предварительных версий Microsoft Azure включают дополнительные юридические условия, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или еще не выпущены в общедоступной версии.
В этом документе представлена предварительная версия для сканирования Amazon Redshift в Microsoft Purview.
Поддерживаемые возможности
Извлечение метаданных | Полная проверка | Добавочное сканирование | Сканирование с заданной областью | Классификация | Присвоение подписей | Политика доступа | Lineage | Общий доступ к данным | Интерактивное представление |
---|---|---|---|---|---|---|---|---|---|
Да | Да | Нет | Да | Нет | Нет | Нет | Нет | Нет | Нет |
При сканировании Amazon Redshift Microsoft Purview поддерживает извлечение технических метаданных, в том числе:
- Сервер
- Databases
- Схемы
- Таблицы, включая столбцы, внешние ключи и ограничения уникальности
- Представления, включая столбцы
- Хранимые процедуры, включая набор данных параметров
- Функции, включая набор данных параметров
При настройке сканирования можно выбрать сканирование всей базы данных Amazon Redshift или область проверку на подмножество схем, соответствующих заданным именам или шаблонам имен.
Известные ограничения
- При удалении объекта из источника данных в настоящее время при последующей проверке соответствующий ресурс в Microsoft Purview автоматически не удаляется.
Предварительные условия
Учетная запись Azure с активной подпиской. Создайте учетную запись бесплатно.
Активная учетная запись Microsoft Purview.
Чтобы зарегистрировать источник и управлять им на портале управления Microsoft Purview, необходимо быть администратором источника данных и читателем данных. Дополнительные сведения см. на странице разрешений Microsoft Purview .
Настройте правильную среду выполнения интеграции для вашего сценария. Если источник данных не является общедоступным, настройте последнюю поддерживаемую kubernetes локальную среду выполнения интеграции.
Регистрация
В этом разделе вы сможете зарегистрировать источник данных Amazon Redshift для сканирования и общей папки данных в Purview.
Необходимые условия для регистрации
- Вы должны быть Администратор источника данных и одной из других ролей Purview (например, читатель данных или участник Data Share), чтобы зарегистрировать источник и управлять им на портале управления Microsoft Purview. Дополнительные сведения см. на странице разрешений Microsoft Purview .
Действия по регистрации
Перед настройкой проверки источника данных важно зарегистрировать источник данных в Microsoft Purview.
Перейдите на портал управления Microsoft Purview:
- Перейдите непосредственно к https://web.purview.azure.com учетной записи Microsoft Purview и выберите ее.
- Открытие портал Azure, поиск и выбор учетной записи Microsoft Purview. Нажмите кнопку Портал управления Microsoft Purview .
Перейдите к схеме данных —> источники
Перейдите к соответствующей коллекции в меню Источники и щелкните значок Зарегистрировать , чтобы зарегистрировать новый источник данных Amazon Redshift.
Выберите источник данных Amazon Redshift и нажмите кнопку Продолжить.
Укажите подходящее имя для источника данных и укажите следующие сведения:
- Конечная точка — конечная точка кластера Amazon Redshift. Пример:
examplecluster.abc123xyz789.us-west-2.redshift.amazonaws.com
- Port — номер порта, указанный при запуске кластера. Значение по умолчанию — 5439.
- Конечная точка — конечная точка кластера Amazon Redshift. Пример:
Кластер Amazon Redshift отображается в выбранной коллекции.
Проверка
Совет
Чтобы устранить неполадки со сканированием, выполните указанные ниже действия.
- Убедитесь, что вы правильно настроили проверку подлинности для сканирования.
- Ознакомьтесь с нашей документацией по устранению неполадок сканирования.
Проверка подлинности для сканирования
Microsoft Purview поддерживает обычную проверку подлинности (имя пользователя и пароль) для сканирования Amazon Redshift.
Пользователю должно быть предоставлено разрешение SELECT для каждой отдельной системной таблицы Для Microsoft Purview для запроса метаданных из:
- svv_external_tables
- svv_external_columns
- svv_table_info
- information_schema.routines
- information_schema.parameters
- pg_views
- pg_database
- pg_description
Кроме того, пользователю должно быть предоставлено разрешение EXECUTE для системной функции Microsoft Purview для запроса метаданных из:
- pg_get_late_binding_view_cols
Создание учетных данных
Microsoft Purview использует Key Vault Azure для безопасного хранения учетных данных, которые используются для проверки подлинности в источниках.
- Если вы не настроили Key Vault Azure для хранения учетных данных, сначала создайте Key Vault Azure, а затем выполните следующие действия, чтобы подключить учетную запись Microsoft Purview к Key Vault Azure.
- Получив Key Vault Azure, сохраните пароль Amazon Redshift в качестве секрета в Key Vault, а затем выполните следующие действия, чтобы создать учетные данные со следующими сведениями:
- Учетные данные обычной проверки подлинности
- Добавление имени пользователя в поле ввода
- Добавьте подключение Key Vault и имя секрета, в котором хранится пароль.
Создание сканирования
Откройте учетную запись Microsoft Purview и выберите Открыть портал управления Microsoft Purview.
Перейдите к схеме данных -->Sources , чтобы просмотреть иерархию коллекций.
Щелкните значок Создать сканирование под ранее зарегистрированным источником данных Amazon Redshift .
Выберите среду выполнения интеграции.
Предоставьте следующие данные:
- Name — имя для сканирования.
- Учетные данные— выберите ранее созданные учетные данные.
- База данных — имя проверяемого экземпляра базы данных.
- Schema — подмножество импортируемых схем, выраженных в виде списка схем, разделенных точкой с запятой. Например: "schema1; schema2". Все пользовательские схемы импортируются, если этот список пуст. Все системные схемы и объекты по умолчанию игнорируются. Допустимые шаблоны имен схем могут быть статическими именами или содержать подстановочные знаки . Например: "A%;%B;%C%; D":
- Начните с A или
- Заканчивается на B или
- Содержать C или
- Равный D
Выберите Проверить подключение , чтобы проверить параметры.
Нажмите Продолжить.
В разделе Триггер сканирования выберите, следует ли настроить расписание или запустить проверку один раз.
Просмотрите проверку и выберите Сохранить и запустить.
Просмотр проверок и запусков сканирования
Чтобы просмотреть существующие проверки, выполните приведенные далее действия.
- Перейдите на портал Microsoft Purview. В левой области выберите Карта данных.
- Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .
- Выберите сканирование с результатами, которые вы хотите просмотреть. На панели отображаются все предыдущие запуски сканирования, а также состояние и метрики для каждого запуска сканирования.
- Выберите идентификатор запуска, чтобы проверка сведения о выполнении проверки.
Управление проверками
Чтобы изменить, отменить или удалить сканирование:
Перейдите на портал Microsoft Purview. В левой области выберите Карта данных.
Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .
Выберите проверку, которой вы хотите управлять. Далее вы можете:
- Измените сканирование, выбрав Изменить проверку.
- Отмените выполняемую проверку, выбрав Отмена выполнения проверки.
- Удалите сканирование, выбрав Удалить сканирование.
Примечание.
- При удалении сканирования ресурсы каталога, созданные на основе предыдущих проверок, не удаляются.
Обзор, поиск и просмотр ресурсов
После успешного сканирования кластеров Amazon Redshift можно просмотреть Единый каталог или выполнить поиск Единый каталог, чтобы просмотреть сведения об активе.
Дальнейшие действия
Следуйте приведенным ниже руководствам, чтобы узнать больше о Microsoft Purview и ваших данных.
- Обзор или поиск Единый каталог Microsoft Purview.
- Аналитика ресурсов данных в Microsoft Purview