Требования к управлению данными
Аналитика в масштабе облака рекомендует учитывать следующие требования для управления данными:
- Определение сущности данных для создания общего бизнес-словаря в бизнес-глоссарии. Сущности данных в этом контексте означают такие понятия, как клиент, поставщик, материалы, сотрудники и другие.
- Идентификация и обнаружение сущностей данных.
- Классификация данных для управления безопасностью доступа к данным, конфиденциальностью данных и хранением данных.
- Люди, такие как владельцы данных с подотчетностью управления и сотрудниками по управлению данными, ответственными за защиту и качество данных.
- Процессы управления данными.
- Управление жизненным циклом данных для управления сроком хранения данных.
- Определение политик и правил управления конкретными данными в течение всего жизненного цикла.
- Применение политик к разным хранилищам данных в альбомной ориентации данных.
- Управление главными данными для обеспечения согласованности данных в операционных и аналитических системах, таких как клиент, продукт и поставщик.
- Происхождение метаданных для понимания преобразования и связи сущностей данных.
- Технология позволяет управлять структурированными, многоструктурированными и неструктурированными данными. Управление может охватывать центр обработки данных, несколько облаков и пограничные устройства.
Одна из проблем заключается в том, что данные собираются и хранятся в нескольких местах в разных местах предприятия. Кроме того, это могут быть данные, собираемые и хранящиеся в разных географических регионах и юрисдикциях. В результате для управления одними и теми же данными в разных юрисдикциях применяются разные законы. Обнаруживайте данные, распределенные по нескольким облакам и географическим расположениях, чтобы:
- Понять, какие существуют атрибуты данных, сущности данных и связи данных в альбомной ориентации данных.
- Классифицируйте данные, чтобы узнать, как управлять им.
- Определите политики, чтобы указать способ управления данными для каждого типа классификации данных и управления жизненным циклом.
- Обеспечить качество данных, безопасность доступа к данным, конфиденциальность данных и политик управления жизненным циклом в альбомной ориентации данных.
Классификация данных
Классификация данных — это способ классификации ресурсов данных путем назначения уникальных логических тегов или классов ресурсам данных. В основе классификации лежит бизнес-контекст данных.
Для понимания уровня конфиденциальности и срока хранения данных необходимо определить способ их классификации. При классификации данных требуется разработать:
- Схема классификации конфиденциальности данных.
- Схема классификации хранения данных.
Схема классификации конфиденциальности данных
Классификация | Description |
---|---|
Общедоступный | Любой пользователь может получить доступ к данным, и его можно отправить любому пользователю. Например, откройте данные для государственных организаций. |
Только для внутреннего применения | Доступ к данным может получить только сотрудники, и его нельзя отправлять за пределы компании. |
Конфиденциальная | Данные можно совместно использовать только в том случае, если это необходимо для конкретной задачи. Данные не могут быть отправлены за пределы компании без соглашения о неразглашении. |
Конфиденциальные (персональные) данные | Данные содержат частную информацию, которая должна быть маскирована и предоставлена только на основе ограниченного времени. Данные не могут быть отправлены несанкционированным сотрудникам или за пределами компании. |
С ограниченным доступом | Эти данные могут предоставляться только именованным лицам, которые отвечают за защиту. Например, юридические документы или торговые секреты. |
Схема классификации жизненного цикла данных
Хранение | Description |
---|---|
Нет | Данные можно удалять в любое время. |
Временные процедуры | Храните данные в течение короткого периода времени. Например, сохраняйте данные Twitter в течение недели. |
Фиксированный период | Храните данные в течение заданного количества лет, после чего его можно удалить. Например, сохраняйте налоговые записи в течение семи лет, чтобы соответствовать законам правительства. |
Постоянный | Никогда не удалять данные. Например, юридическая корреспонденция. |
Автоматизация процесса классификации конфиденциальности данных и хранения жизненного цикла данных с помощью классов, определенных в каждой схеме, необходима для последовательной маркировки данных в распределенном ландшафте данных. Автоматизация обеспечивает согласованное и правильное управление. Для управления данными в соответствии с классификацией определите правила и политики для каждого класса, указанного в схеме классификации.
Роли и обязанности по системе управления данными
Еще одним требованием является обеспечение подотчетности. В противном случае путаница заключается в том, кто отвечает за управление данными. Как ответить на следующие вопросы в отсутствие подотчетности?
- Кто задает метрики успешности и следит, насколько хорошо работает программа управления данными?
- Кто является владельцем данных?
- Кто составляет и обеспечивает ведение бизнес-глоссария?
- Кто формирует и утверждает политику безопасности доступа к данным?
- Кто несет ответственность за соблюдение требований при защите конфиденциальности персональных данных?
- Кто отслеживает качество данных продукта, просматривая брошюры и партнерские веб-сайты?
- Кто обеспечивает согласованность данных клиента во всех системах?
- Кто контролирует соответствие данных внешней подписки лицензии?
- Кто контролирует привилегированных пользователей, таких как администраторы баз данных и специалисты по обработке данных?
- Это руководитель уровня C? Это руководитель отдела?
- Это руководитель отдела управления, рисков и соответствия требованиям?
- Что насчет юридического отдела?
- Несет ли ИТ-ответственность?
Определение ролей и обязанностей позволит избежать путаницы и задаст основу для материализации языка и региональных параметров данных.
Процессы управления данными
Необходимы процессы, роли и обязанности, чтобы:
- Управление определением и обслуживанием общего бизнес-словаря.
- Узнайте и определите, какие данные у вас есть, что это означает, и где он хранится.
- Классифицируйте данные, чтобы узнать, как управлять им.
- Управление определением и обслуживанием политик безопасности доступа к данным.
- Управление определением и обслуживанием политик конфиденциальности данных.
- Определите проблемы с качеством данных и исправьте их.
- Примените политики для обеспечения соответствия требованиям.
- Управление обслуживанием основных данных.
Политики и правила управления данными
Определите следующие политики и правила управления данными:
- Правила целостности данных
- Политики и правила приема данных
- Политики и правила управления безопасностью доступа к данным
- Политики и правила управления конфиденциальностью данных
- Политики и правила качества данных
- Политики и правила обслуживания данных
- Политики и правила хранения данных
Полученные политики и правила необходимо сопоставить с каждым классом в схемах классификации управления данными.
Управление основными данными
Другим требованием для управления данными является управление главными данными. Основные данные — это наиболее распространенные общие данные, хранящиеся в организации и включающие основные сущности данных. К основным сущностям данных относятся клиент, поставщик, материалы, сотрудник и ресурс, а также данные плана финансовых счетов, которые находятся в разных финансовых приложениях. Так как основные данные настолько широко распространены, это не зависит от приложения. Они необходимы для работы приложений по обработке транзакций и аналитических систем. Сохранение синхронизации этих данных может устранить множество ошибок данных и ошибок обработки. Таким образом, поддержание его централизованно с помощью общего процесса и синхронизации каждой системы, которая нуждается в ней, является идеальной ситуацией. Кроме того, управление требуется для определения лиц, допускаемых к обслуживанию основных данных, и мест для выполнения обслуживания.
То же самое относится и к эталонным данным, таким как наборы кода и данные финансовых рынков. В этом случае стандартизация и синхронизация наборов кода называются эталонным управлением данными, что также является обязательным требованием.
преобразования метаданных;
Наконец, существует требование к преобразованию метаданных. Вы можете использовать следы аудита, чтобы узнать, откуда исходит данные и как они преобразуются по пути к отчету или хранилищу данных. Метаданные используются для того, чтобы отследить, кто или что обслуживает данные, включая время и местоположение.
Краткие сведения о комплексном управлении данными
Для управления данными на протяжении всего жизненного цикла в хранилищах данных на пограничных устройствах, нескольких облаках и центре обработки данных необходимо комплексное решение.
Решение по управлению данными должно содержать несколько компонентов:
- Концепция и стратегия управления данными.
- Сами данные, такие как данные клиента, данные поставщика, данные заказа и другие
- Жизненный цикл данных от создания до уничтожения, в рамках которого необходимо управлять данными
- Роли и обязанности управления данными (люди)
- Процессы и действия по управлению данными и их применение к жизненному циклу данных
- Политики и правила для управления данными в различных точках жизненного цикла
- Технологии управления данными, помогающие обеспечить управление данными