Поделиться через


Управление жизненным циклом

Управление жизненным циклом данных — это практика использования конкретных политик для эффективного управления данными в течение всего времени существования в системе. Эти политики должны состоять из переопределения хранилищ и политик данных, которые управляют процессами управления данными. Так как бизнес-цели и драйверы диктуют политики управления жизненным циклом данных, они обычно связываются с платформой общих соглашений об управлении ИТ,управлении и уровне обслуживания (соглашения об уровне обслуживания).

После того как вы знаете, какой тип данных у вас есть и как он будет использоваться, вы уже знаете его наиболее вероятное развитие и судьбу. Необходимо понять, как развиваются данные, определить, как он растет, отслеживать изменения в его использовании с течением времени, решать, сколько времени он должен существовать, и соответствовать всем правилам и правилам, применяемым к этим данным.

Управление жизненным циклом данных отвечает этим потребностям с помощью сочетания процессов, политик и программного обеспечения, чтобы команды могли использовать соответствующую технологию для каждого этапа жизненного цикла данных.

Жизненный цикл данных

Продукты данных могут иметь разные жизненные циклы. В типичном шаблоне жизненного цикла новые приемы данных часто используются и обращаются к ним. По мере увеличения возраста его скорость доступа часто уменьшается, и старые данные видят резкое снижение использования. Некоторые продукты данных могут истекает через несколько дней или месяцев после их создания, а другие продукты данных активно используются и изменяются в течение всего времени существования.

Жизненные циклы данных могут отличаться от этого типичного шаблона, однако. Некоторые данные остаются неиспользованными после их первичного ввода или к ним редко обращаются после их хранения. Большинство мест имеют правила, которые определяют, сколько времени требуется для хранения данных, таких как персональные данные и данные учета. В определённой стране или в определённом регионе может потребоваться сохранить первичную документацию в течение пяти лет для таких данных, как входящие и исходящие счета, балансы кассовой книги, банковские ваучеры и расчётные листки. Кроме того, может потребоваться сохранить вторичную документацию в течение трех–пяти лет, которая включает в себя такие вещи, как письма, соглашения и заметки.

Управление жизненным циклом данных

Существует два способа подхода к управлению жизненным циклом данных в облачной аналитике:

  • Вы можете использовать встроенные функции жизненного цикла данных каждой службы Azure, содержащей сохраненные данные, например Azure Data Lake. Этот метод подходит для перемещения данных на холодные и архивные уровни, но не гарантирует, что данные удаляются после указанного периода времени.

Внимание

Архивный уровень в настоящее время не поддерживается для учетных записей хранения, избыточных между зонами. Дополнительные сведения см. в статье о избыточности данных.

  • Жизненный цикл данных можно интегрировать в процесс подключения, что дает владельцам приложений возможность определить политику жизненного цикла данных. Этот процесс включает в себя пользовательское приложение для записи ключевых метрик в стандарты метаданных для каждого продукта данных. Часть этого метода включает в себя перемещение данных из горячего, в холодный и затем в архив, а также гарантирует удаление данных после указанного периода времени.

Следующие шаги