Поделиться через


Раздел 3. Публикация продуктов данных

Создание продуктов данных очень важно, чтобы ваша организация сделала нужные данные доступными для обнаружения. Продукты данных помогут предотвратить чрезмерное управление данными, которые являются низкими или не имеют ценности в вашем хранилище данных, так как они не используются или имеют ограниченное значение. Обеспечение того, что специалисты по данным собираются опубликовать продукты данных, активирует наиболее ценные данные и создаст правильный уровень управления на основе этой ценности. Обработка ресурсов, которые технические команды не знают о бизнес-цели или пытаются управлять всем в вашем сложном и растущем пространстве данных, приведет к дополнительному времени и потере производительности, преследуя детали данных, которые никогда не будут использоваться или могут быть просто удалены из имущества. Вместо этого сосредоточьтесь на фрагментах данных, которые имеют ценность, и что людям нужно обнаружить и создать еще больше ценности. По мере того как команды используют больше данных и получают лучшее представление о том, что необходимо, или можно создать более полезные продукты данных для удовлетворения этих требований, и система управления может адаптироваться, чтобы обеспечить всегда правильный размер в зависимости от ценности и конфиденциальности данных.

Предварительные условия

Создание и публикация продукта данных

  1. Откройте портал Microsoft Purview.

  2. Выберите Единый каталог.

  3. Выберите Управление каталогом , а затем Домены управления.

  4. На странице Домены управления выберите личный домен работоспособности.

  5. Выберите ссылку Перейти к продуктам данных в разделе Бизнес-понятия.

  6. Здесь эксперты по данным, называемые владельцами продуктов данных, определяют ресурсы данных, которые предназначены для использования другими пользователями в вашей организации, и предоставляют необходимую информацию, чтобы сделать их пригодными для использования.

  7. Выберите Новый продукт данных

  8. Предоставление сведений о продукте данных

    1. Название: "Covid-19 Вакцинация и случаи тенденции по возрасту"
    2. Описание: "Эти данные поступают из CDC в составе Министерства здравоохранения США & социальных служб. Данные содержат тенденции вакцинации и случаев по возрастным группам на национальном уровне США. Данные стратифицируются по крайней мере одной дозой и полностью вакцинированы. Данные также представляют всех партнеров по вакцинам, включая юрисдикционные партнерские клиники, розничные аптеки, учреждения по долгосрочному уходу, диализные центры, Федеральное агентство по управлению чрезвычайными ситуациями и партнерские сайты администрирования ресурсов и услуг здравоохранения, а также объекты федеральных организаций.
    3. Тип: Набор данных
    4. Нажмите Далее.
    5. Варианты использования: "Эти данные предоставляются для общественного использования и предназначены для того, чтобы помочь понять тенденции вакцинации и новые случаи в различных возрастных группах. Возрасты разделены на две группы от <2 лет до 65+ лет. Аналогичным образом тенденции представлены в ежедневных цифрах, которые обеспечивают среднее число новых случаев заболевания в семь дней по возрастным группам".
    6. Пометка как одобренная как установленная.
    7. Выберите Сохранить.
  9. Теперь у вас есть базовые метаданные продукта данных. Затем добавьте некоторые свойства и сопоставите ресурс с карты данных.

    Снимок экрана: выбор ресурсов для добавления в продукт данных.

  10. Нажмите кнопку + Добавить ресурсы данных .

  11. Вы увидите ресурсы, которые вы сканировали на карте данных. Это будет включать все папки и слои источника данных.

  12. Найдите ресурс Вакцины и тенденции случаев covid19 , добавленный в золотой контейнер озера данных, и выберите этот набор ресурсов.

  13. Нажмите Добавить. Вы можете выбрать столько ресурсов, сколько требуется для продукта данных, но здесь требуется только один.

    Совет

    Нажмите кнопку Получить предложения , чтобы genAI помоги выбрать ресурсы на карте данных, а затем выберите Вакцина и тенденции случаев covid19 в сокращенном списке результатов.

  14. Теперь вы можете увидеть ресурс, добавленный в продукт данных.

  15. Выберите + Добавить термин рядом с заголовком терминов глоссария.

    Снимок экрана: добавление термина глоссария в продукт данных.

  16. Выберите термин вспышки, созданный ранее, и нажмите кнопку Добавить.

    Снимок экрана: выбор термина глоссария.

  17. Вы должны увидеть критически важный элемент данных для возрастной группы из ресурса, сопоставленного с продуктом данных.

  18. Выберите + Добавить OKR рядом с заголовком OKR.

  19. Выберите пункт Снижение риска пандемии путем эффективного использования вакцины для пациентов. Это цель, которую мы создали в первом разделе.

Управление политиками запросов на доступ к продуктам данных

В верхней части страницы последним шагом перед публикацией продукта данных является нажатие кнопки Управление политиками . Здесь политики доступа и рабочий процесс запроса доступа настраиваются путем выбора и предоставления имен для утверждения. Вы также можете использовать вкладку Унаследованные политики , чтобы просмотреть политику домена управления, примененную для аттестации копий данных, примененную ранее. То же самое касается утверждения руководителя , необходимого из термина глоссария вспышки.

  1. Перейдите на вкладку Управление политиками .

    Снимок экрана: управление политиками продуктов данных.

  2. В разделе Ограничение времени доступа укажите сведения о том, как долго выполняется запрос на доступ, прежде чем его нужно продлить. Мы настроим этот параметр, чтобы предоставить доступ на срок до одного года.

  3. В коробку положите 1.

  4. Выберите годы в раскрывающемся списке.

  5. В разделе Требования к утверждению укажите свое имя в поле утверждающих. (Для этого потребуется зарегистрировать имя в Microsoft Entra ID)

    Примечание.

    Нам не нужно проверка утверждение руководителя, так как мы наследуем политику от термина глоссария вспышки.

  6. Нажмите кнопку Форма предварительного просмотра запроса , чтобы увидеть, что потребители каталога будут просматривать при запросе доступа. Вы увидите, что требуется аттестация копирования данных и утверждение руководителя, так как они были заданы доменом управления и термином глоссария.

    Снимок экрана: предварительный просмотр формы запроса на доступ.

  7. Нажмите Сохранить изменения.

После сопоставления ресурсов данных и настройки политик доступа вы сможете опубликовать продукт данных в каталоге.

  1. Выберите Опубликовать в продукте данных.

  2. Попробуйте создать отчет о прибыли в других доменах, созданных ранее

    1. Отчет о прибыли, тип: панели мониторинга и отчеты.
    2. Источник продукта, тип: данные Maser и эталонные данные.

Примечание.

Вы можете добавить к ним много ресурсов и посмотреть, как будет выглядеть продукт данных с большим количеством ресурсов, а также может ли продукты данных использовать термины из любого домена, чтобы увидеть, как глоссарий используется для описания данных с помощью согласованного набора терминов.

Дальнейшие действия

Раздел 4. Качество данных запуска