Поделиться через


Качество данных для сочетания баз данных Microsoft Fabric

Примечание.

Каталог данных Microsoft Purview меняется на Единый каталог Microsoft Purview. Все функции останутся неизменными. Вы увидите изменение имени, когда новый интерфейс управления данными Microsoft Purview станет общедоступным в вашем регионе. Проверьте имя в регионе.

Ярлыки — это объекты в OneLake, указывающие на другие расположения хранилища. Расположение может быть внутренним или внешним для OneLake. Расположение, на которое указывает ярлык, называется целевым путем ярлыка. Расположение, в котором отображается ярлык, называется путь к ярлыку. Ярлыки отображаются в виде папок в OneLake, и все рабочие нагрузки или службы, имеющие доступ к OneLake, могут использовать их.

Сочетания клавиш в Microsoft OneLake позволяют объединить данные между доменами, облаками и учетными записями, создав единое виртуальное озеро данных для всего предприятия. Все возможности и аналитические механизмы Microsoft Fabric могут напрямую подключаться к существующим источникам данных, таким как Azure, Amazon Web Services (AWS) и OneLake, через единое пространство имен. OneLake управляет всеми разрешениями и учетными данными, поэтому вам не нужно отдельно настраивать каждую рабочую нагрузку Fabric для подключения к каждому источнику данных.

Дополнительные сведения о сочетаниях клавиш Microsoft Fabric см. в документации по Fabric.

Настройка качества данных для сочетания баз данных Fabric

Войдите в рабочую область Microsoft Fabric. Нажмите кнопку с многоточием в разделе Таблицы и выберите Создать ярлык. Здесь можно создать:

Снимок экрана: рабочая область Fabric с выделенной кнопкой создания ярлыка.

Ярлык Azure Data Lake 2-го поколения

  1. Выберите ярлык Azure Data Lake Storage 2-го поколения на странице Создание ярлыка рабочей области Fabric.

    Снимок экрана: страница создания ярлыка Fabric с выделенным элементом ADLS 2-го поколения.

  2. Выберите ADLS 2-го поколения проверка подлинности SAS.

    Снимок экрана: новое окно ярлыка с выбранной проверкой подлинности на основе маркера SAS.

  3. Создайте SAS и строка подключения для ресурса ADLS 2-го поколения в портал Azure.

  4. Скопируйте конечную точку озера данных.

    Снимок экрана: копирование конечной точки озера данных в портал Azure.

  5. Добавьте сведения о хранилище для сочетания клавиш.

    Снимок экрана: добавление сведений о хранилище в ярлык Fabric в новом окне ярлыка.

  6. Перейдите к и выберите правильную разностную папку.

    Снимок экрана: выбор правильной разностной папки в новом окне ярлыка.

  7. Предварительный просмотр разностной таблицы сочетаний в рабочей области Fabric.

    Снимок экрана: предварительный просмотр разностной таблицы OneLake.

  8. Запустите проверку ресурса Azure Data Lake 2-го поколения в Схема данных Microsoft Purview с помощью проверки подлинности субъекта-службы.

    Снимок экрана: проверка карты данных для ADLS 2-го поколения.

  9. После завершения сканирования ресурс данных должен отображаться в каталоге данных в виде таблицы lakehouse.

  10. Свяжите ресурс с продуктом данных для проверки и оценки качества данных.

    Снимок экрана: ресурс быстрого доступа к данным в каталоге.

  11. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Ярлык Amazon S3

  1. Выберите Создать ярлык в рабочей области Microsoft Fabric.

  2. Выберите AWS S3 и добавьте URL-адрес, идентификатор ключа доступа и ярлык ключа доступа.

    Снимок экрана: страница нового ярлыка Amazon S3 с добавленными сведениями.

  3. Добавьте URL-адрес подключения и сведения о хранилище.

    Снимок экрана: страница нового ярлыка Amazon S3 с добавленным URL-адресом подключения и сведениями о хранилище.

  4. Просмотрите ярлык в рабочей области Fabric.

  5. Запустите проверку ресурса Amazon S3 в Схема данных Microsoft Purview с помощью проверки подлинности субъекта-службы.

  6. После завершения сканирования ресурс данных должен появиться в каталоге данных.

  7. Свяжите ресурс с продуктом данных для проверки и оценки качества данных.

  8. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Ярлык Google Cloud Storage (GCS)

  1. Выберите Создать ярлык в рабочей области Microsoft Fabric.

  2. Выберите Google Cloud Storage и добавьте URL-адрес, идентификатор ключа доступа и ярлык ключа доступа.

    Снимок экрана: клавиша HMAC для сочетания клавиш GCS.

  3. Добавьте URL-адрес подключения и сведения о хранилище.

    Снимок экрана: URL-адрес подключения GCS.

  4. Просмотрите ярлык в рабочей области Fabric.

  5. Запустите проверку ресурса Amazon S3 в Схема данных Microsoft Purview с помощью проверки подлинности субъекта-службы.

  6. После завершения сканирования ресурс данных должен появиться в каталоге данных.

  7. Свяжите ресурс с продуктом данных для проверки и оценки качества данных.

  8. Откройте решение Качество данных Microsoft Purview и выполните проверку качества данных или профилируйте данные как обычно.

Важно!

  • Используйте субъект-службу для сканирования карт данных и управляемое удостоверение для проверки качества данных.
  • Все данные, поданные с помощью ярлыка, будут обрабатываться в том же регионе.
  • Сбор метаданных в Purview для субартифактов Fabric Lakehouse является улучшением, основанным на сборе метаданных для Fabric, который был выпущен в декабре 2023 г. Эта функция находится на этапе закрытой предварительной версии .
  • Команда Fabric зависит от того, чтобы отличать ярлыки от собственных элементов в пакете SDK OneLake для Подартифактов Lakehouse. В настоящее время все ярлыки (таблицы и файлы) будут рассматриваться в качестве собственных элементов при проверке. Чтобы включить оценку DQ данных fabric lakehouse, необходимо разрешить список клиентов.