Поделиться через


Обзор преобразования данных DICOM в решениях для данных здравоохранения

Возможность преобразования данных DICOM в решениях для данных здравоохранения позволяет перенести данные цифровой визуализации и коммуникаций в медицине (DICOM) в Fabric OneLake. Вы можете принимать, хранить и анализировать метаданные визуализации из различных модальностей, таких как рентген, компьютерная томография (КТ) и магнитно-резонансная томография (МРТ). Эта функция обеспечивает совместную работу, исследования и разработки (НИОКР), а также инновации в области ИИ для различных сценариев использования в здравоохранении и медико-биологических науках. Интеграция данных визуализации и клинических данных, хранящихся в формате FHIR (Fast Health Interoperability Resources), позволяет врачам и исследователям интерпретировать результаты визуализации в правильном клиническом контексте. Такая интерпретация приводит к более высокой точности диагностики, информативным клиническим решениям и улучшению результатов лечения пациентов.

Конвейеры решений для обработки данных здравоохранения обеспечивают бесшовное преобразование данных DICOM (визуализация) в табличные форматы, которые могут сохраняться в хранилище озера данных в форматах FHIR (серебряный) и OMOP (Сообщества по наблюдению за медицинскими результатами) (золотой). Они облегчают проведение исследовательского анализа и крупномасштабной аналитики визуализации и радиомики. Процесс преобразование данных через конвейер приема визуализации состоит из следующих этапов:

  1. Конвейер принимает и сохраняет необработанные файлы визуализации DICOM, представленные в собственном формате DCM, в бронзовом хранилище озера данных.
  2. Затем он извлекает метаданные DICOM (теги) из файлов визуализации и вставляет их в бронзовое хранилище озера данных DICOM для упрощения запросов.
  3. Данные в хранилище метаданных DICOM преобразуются в файлы NDJSON разностные таблицы FHIR ImagingStudy, сохраняются в OneLake и преобразуются в реляционный формат FHIR (серебряном хранилище озера данных).
  4. Наконец, данные преобразуются в таблицу дельты Image_Occurrence в OMOP формате (золотом хранилище озера данных).

Это преобразование упрощает такие сценарии, как:

  • Совместное использование наборов исследовательских данных с управлением доступом на основе ролей.
  • Обезличивание текстовых и графических данных для исследований и совместной работы.
  • Использование данных DICOM для обучения и проверки моделей машинного обучения.
  • Использование данных DICOM для проведения клинических исследований, эпидемиологических анализов и образовательной деятельности.

Преобразование данных DICOM является дополнительной возможностью в решениях для данных здравоохранения в Microsoft Fabric. Вы можете решить, использовать его или нет, в зависимости от ваших конкретных потребностей или сценариев.

Чтобы изучить эту возможность, а также узнать о развертывании, настройке и использовании, см. раздел:

Концептуальная архитектура

Как объясняется в статье Архитектура данных и управление в решениях для данных здравоохранения, в основе этой возможности лежит архитектура озера данных медальона. Вот как эта инфраструктура организует и обрабатывает данные DICOM на трех уровнях озера данных:

  • Бронзовый: на этом первом уровне исходные данные визуализации хранятся в исходном формате DICOM (файлы DCM) и хранилище метаданных, содержащее полный набор метаданных (тегов DICOM), извлеченных из файлов DCM.

  • Серебряный: серебряный слой (в соответствии со спецификацией FHIR) хранит метаданные визуализации, полученные из бронзового хранилища озера данных. Он также хранит ссылки на расположения файлов DCM в бронзовом слое. Метаданные изображений и ссылки на файлы хранятся в разностной таблице ImagingStudy, схема которой основана на сведенном формате ресурса ImagingStudy FHIR (R4.3).

  • Золото: Золотое слой (на основе OMOP спецификации) хранит и преобразует данные изображений, полученные из серебряной таблицы дельта хранилище и озеро данных ImagingStudy . Метаданные изображений и ссылки на файлы хранятся в золотой таблице дельты Image_Occurrence, схема которой основана на последних разработках стандартизации данных для наблюдательных исследований на основе визуализации. Более подробную информацию об этой стандартизации см. в разделе OMOP Расширение общей модели данных для данных медицинских изображений.

Чтобы понять, как метаданные DICOM преобразуются в разных Lakehouses, и рассмотреть преобразование сопоставление, см. Преобразование метаданных DICOM сопоставление в решениях для обработки медицинских данных.