Сценарий Lamna Healthcare для облачной аналитики в Azure
Эта эталонная архитектура написана для клиентов, которые хотят использовать облачную аналитику не только для масштабируемости, но и для защиты своих данных. В нем показано, как управлять доступом к конфиденциальным данным и как обезличенные данные можно правильно предоставлять аналитикам.
Профиль клиента
Lamna Healthcare (Lamna) предлагает услуги по управлению пациентами поставщикам здравоохранения. Они обрабатывают данные пациентов с высокой степенью конфиденциальности на протяжении всего своего бизнеса. Доступ к подробным данным должен быть тщательно ограничен. Однако Ламна также хотела бы безопасно использовать некоторые версии этих данных для информирования о своих бизнес-практиках. Им нужен механизм для обмена данными с аналитиками, которые не нарушают законы о доверии пациентов или защите данных.
Текущая ситуация
Сегодня Lamna хранит все свои данные в локальной среде. Данные пациента хранятся в традиционной системе баз данных. Однако по мере роста бизнеса и увеличения объема данных компания должна перенести свои приложения пациентов в облако. В рамках этого перехода они хотели бы скопировать данные из приложения в облачную платформу аналитики, которая позволит их аналитикам лучше использовать данные без дополнительной нагрузки на базу данных приложения.
Критически важной проблемой для Ламны является безопасность данных пациента. В качестве медицинской компании они подвергаются нескольким различным законам по защите данных.
Архитектурное решение
Lamna реализует облачную аналитику в качестве решения для облачной платформы аналитики. Они полагаются на несколько посадочных зон как для повышения масштабируемости, так и для четкого разделения конфиденциальных данных продуктов.
Площадка управления данными
Критически важной концепцией для каждой реализации облачной аналитики является одна целевая зона управления данными. Эта подписка содержит ресурсы, которые будут совместно использоваться во всех зонах размещения. К ним относятся общие сетевые компоненты, такие как брандмауэр и частные зоны DNS. Она также включает ресурсы для управления данными и облаком. Каталог Microsoft Purview и Databricks Unity были развернуты как службы на уровне клиента.
Зона приема данных пациентов
На организационной диаграмме Ламны группа управления пациентами входит в группу операций. Тем не менее, учитывая крайнюю конфиденциальность используемых данных, у них есть собственная зона приземления данных в архитектуре облачной аналитики.
Эта посадочная зона содержит копию подробных данных пациентов и записей о состоянии здоровья из приложения компании по управлению пациентами и связанных продуктов данных. Эти продукты данных загружаются в целевую зону приложениями данных, которые регулярно получают данные в облако и помещают их в Azure Data Lake Storage.
Посадочная зона данных операций
Группа операций в Lamna отвечает за основную деятельность компании, а именно предоставление консультационных услуг поставщикам медицинских услуг. В целевой зоне операций они хранят данные, связанные с этими поставщиками здравоохранения и службами, с которыми они участвуют.
Как и все бизнес-данные, эти продукты данных также связаны с элементом конфиденциальности, и Lamna of хочет защитить свой список клиентов. Тем не менее, поскольку эти данные не включают сведения о работоспособности отдельных лиц, это не распространяется на самые строгие законы о защите данных.
Приложения данных
Целевая зона для операций включает в себя приложение данных , которое загружает данные поставщиков медицинских услуг из локальной операционной системы Lamna. Как и во всех приложениях данных, эти данные приземляются в облаке as-is и к продуктам данных не применяются никакие преобразования.
Продукты данных
Аналитики в Lamna нуждаются в доступе к данным для создания отчетов для бизнеса. Однако большая часть данных слишком чувствительна для широкой аудитории. Чтобы безопасно предоставить доступ к данным пациентов с высокой степенью конфиденциальности, группа операций создала набор данных маркеризованных пациентов продукта в своей целевой зоне. Используя Azure Data Factory, они копируют данные пациентов из зоны загрузки пациентов. Однако команда тщательно удалила или маркеризировала все столбцы, содержащие персональные данные. Этот шаг позволяет аналитикам использовать данные для бизнес-целей без предоставления каких-либо персональных сведений о пациентах.
Целевая зона маркетинговых данных
Маркетинговая группа ориентирована на получение новых клиентов и управление позицией Lamna в Marketplace. Их маркетинговая посадочная зона в основном используется для хранения и анализа внешних продуктов данных о рынках, которые они обслуживают, и отрасли здравоохранения.
Однако для поддержки нового маркетингового толка, группа хочет провести исследование результатов здоровья для пациентов, обслуживаемых клиентами Ламны. Они надеются создать отчет на основе фактов, поддерживаемый сильным статистическим доказательством, показывающим, что их подход к здравоохранению приводит к лучшим результатам.
Для поддержки этих новых усилий исследователи в маркетинговой группе должны получить доступ к данным пациентов с высоким уровнем конфиденциальности безопасным и соответствующим требованиям способом, чтобы при этом иметь возможность получать необходимую информацию.
Для удовлетворения этой потребности маркетинговая команда создает агрегированные продукты данных из токенизированного набора данных о пациентах, созданного группой операций. Эти продукты данных не содержат индивидуальные медицинские записи. Вместо этого они группируют записи по разным осям. Это помогает исследователям проводить исследования населения в целом без риска доступа к информации о здравоохранении любого человека.
Рис. 1. Схема архитектуры Lamna. На схеме представлены не все службы Azure. Это упрощено, чтобы выделить основные понятия о том, как ресурсы организованы в архитектуре.
Логическое обоснование
Должен ли всегда быть предоставлена собственная целевая зона данных для всех конфиденциальных данных?
Нет. Только самые ограниченные данные, требующие конкретных защит, например, доступ в реальном времени или ключи, управляемые клиентом, требуют собственной области размещения. В других сценариях другие функции защиты данных в Azure предоставляют высокозащищенную среду для данных. Это включает безопасность на уровне строк, безопасность на уровне столбцов и зашифрованные столбцы.
Дальнейшие действия
- Перейдите к шаблонам развертывания для облачной аналитики.
- Узнайте больше в о конфиденциальности данных для облачной аналитики в Azure.