Изучение данных

Завершено

Если организация хочет использовать для защиты эффективный подход Zero Trust, она должна знать свои данные. В этом разделе мы дадим определение данных, рассмотрим их различные состояния и узнаем, какие данные считаются конфиденциальными. Вы также узнаете, что может сделать организация для обнаружения и выявления своих данных.

Что такое данные?

В контексте работы с компьютерами данные — это любая информация, которая передается, обрабатывается, хранится и используется с какой бы то ни было целью. Данные могут принимать различные формы, в том числе:

  • Числа
  • Текст
  • изображения;
  • "Audio" (Аудио);

Иными словами, данные могут представлять собой что угодно: от критически важных бизнес-сведений до личной информации, такой как номера кредитных карт, фотографии семьи и видео.

Данные — основа всех ресурсов и служб, в том числе файлов, приложений, устройств хранения и даже сетей. Все потому, что цель этих устройств — обработка, использование или хранение данных тем или иным образом. Говоря по-простому, именно ради данных мы используем эти службы и ресурсы.

Три состояния данных

Передаваемые данные

При перемещении данных они считаются передаваемыми. Например, когда вы переписываетесь по электронной почте или в чате, или отправляете свои данные для оформления заказа на веб-сайте. Данные в этом состоянии, как правило, защищены хуже, чем те, что находятся в покое. Это объясняется тем, что данные в таком состоянии уязвимы и подвержены различным угрозам, связанным с Интернетом, частными сетями, устройствами или другими средствами передачи.

Используемые данные

Данные считаются используемыми, когда к ним осуществляется доступ и когда их используют. В это понятие может входить чтение данных, обработка данных или внесение в них изменений. Обычно именно в этот момент данные наиболее уязвимы, поскольку открыты для отдельных пользователей или программ. На этом этапе любые уязвимости, вызванные недостатками программы или ошибками пользователя (ведь человеку свойственно ошибаться) могут поставить данные под угрозу.

Неактивные данные

Если с данными ничего не происходит, они считаются неактивными. Как правило, это означает, что данные не используются и не перемещаются между устройствами, приложениями или сетями. Данные в этом состоянии менее уязвимы, чем при передаче и использовании, так как доступ к ним, как правило, происходит нечасто. Они хранятся в архиве. Например, данные, хранящиеся на жестком диске или в службах удаленного хранилища, неактивны.

Что такое конфиденциальная информация?

Не все данные одинаковы. Некоторые данные представляют конфиденциальную информацию, которая в случае потери, кражи или раскрытия через несанкционированный доступ может нанести вред человеку или организации. Например:

  • Критически важная бизнес-информация, такая как интеллектуальная собственность, финансовая информация, сведения о контракте или поставщике.
  • Персональные данные, например фотографии, имена, адреса, банковские данные, номера социального страхования и биометрические данные, такие как отпечатки пальцев или даже DNA.

Несанкционированный доступ к любой конфиденциальной информации может нанести вред как пользователям, так и организации. Конфиденциальная информация часто служит мишенью для злоумышленников. Например, она может подвергнуться атаке программы-шантажиста (это один из типов вредоносных программ, используемых киберпреступниками: они берут в "заложники" конфиденциальную информацию и требуют выкуп, угрожая удалить ее или повредить иными методами).

Обнаружение и классификация данных

Чтобы изучить свои данные, организация может использовать методы обнаружения и классификации данных. Многие организации работают с большим и постоянно растущим объемом данных, поэтому практически невозможно обнаруживать и классифицировать данные исключительно вручную. Чтобы определить и классифицировать все данные, наряду с действиями вручную организация должна использовать средства автоматического обнаружения и классификации данных. В этом случае для обнаружения и классификации данных можно использовать шаблоны и ключевые слова, например:

  • Персональные данные, такие как номер социального страхования, реквизиты кредитных карт и номер паспорта.
  • Медицинские сведения, такие как номера медицинских карт пациентов, выписанные им лекарства и т. д.
  • Финансовая информация, в том числе индивидуальные номера налогоплательщиков и т.п.

Организация может также использовать классификаторы на основе машинного обучения, которые учатся идентифицировать содержимое, просматривая сотни примеров. Когда эти классификаторы завершат обучение, организация может указать им массив данных, которые нужно классифицировать. Это помогает организации эффективнее работать с данными, которые нелегко обнаружить с помощью ручного или автоматического сопоставления шаблонов.

Средства обнаружения и классификации также позволяют организации получить подробное представление и сделать выводы о том, какие метки применены к конфиденциальным элементам и что пользователи делают с этими элементами. Эти аналитические сведения предоставляются в форме подробных диаграмм, таблиц и других сведений, которые при необходимости можно экспортировать и проанализировать. При наличии всех этих сведений организации гораздо легче реализовать принцип Zero Trust "проверяй явным образом". Ведь вы можете использовать всю полученную информацию для принятия решений по обеспечению безопасности.