Partilhar via


Descrição geral da transformação de dados DICOM em soluções de dados de cuidados de saúde

A capacidade de transformação de dados DICOM em soluções de dados de cuidados de saúde permite-lhe trazer os seus dados do Digital Imaging and Communications in Medicine (DICOM) para o Fabric OneLake. Pode ingerir, armazenar e analisar metadados de imagem de várias modalidades, como raios-X, Tomografia computadorizada (TAC) e Imagiologia de ressonância magnética (IRM). A funcionalidade permite a colaboração, investigação e desenvolvimento (I&D) e inovação da IA para diversos casos de utilização de cuidados de saúde e ciências da vida. A integração entre dados de imagem e dados clínicos armazenados no formato FHIR (Fast Health Interoperability Resources) capacita clínicos e pesquisadores a interpretar os achados de imagem dentro do contexto clínico correto. Esta interpretação leva a uma maior precisão diagnóstica, decisões clínicas informativas e melhores resultados para os pacientes.

Os pipelines de soluções de dados de cuidados de saúde permitem a transformação perfeita de dados DICOM (imagiologia) em formatos tabulares que podem persistir no lake nos formatos FHIR (prata) e OMOP (Observational Medical Outcomes Partnership) (ouro). Facilitam a realização de análises exploratórias e a execução de análises de imagem em larga escala e radiómica. O processo de transformação de dados através do pipeline de ingestão de imagens consiste nas seguintes etapas:

  1. O pipeline ingere e mantém os ficheiros de imagem DICOM não processados, presentes no formato DCM nativo, no lakehouse de bronze.
  2. Em seguida, extrai os metadados DICOM (etiquetas) dos ficheiros de imagem e insere-os na metastore DICOM do lakehouse de bronze para uma consulta simples.
  3. Os dados da metastore DICOM são convertidos em ficheiros NDJSON da tabela delta FHIR ImagingStudy, armazenados no OneLake e transformados no formato FHIR relacional (lakehouse de prata).
  4. Finalmente, os dados são transformados na tabela delta Image_Occurrence no formato OMOP (lakehouse de ouro).

Esta transformação facilita cenários como:

  • Partilhar conjuntos de dados de investigação com controlo de acesso baseado em funções.
  • Desidentificação de dados de texto e imagem para investigação e colaboração.
  • Utilização de dados DICOM para preparar e validar modelos de machine learning.
  • Utilização de dados DICOM para a realização de estudos clínicos, análises epidemiológicas e atividades educativas.

A transformação de dados DICOM é uma capacidade opcional das soluções de dados de cuidados de saúde no Microsoft Fabric. Tem a flexibilidade de decidir se deseja ou não usá-la, dependendo das suas necessidades ou cenários específicos.

Para explorar esta capacidade e saber mais sobre a implementação, configuração e utilização, consulte:

Arquitetura conceitual

Conforme explicado em Arquitetura e gestão de dados em soluções de dados de cuidados de saúde, a base da capacidade reside na arquitetura de lakehouse de medalhas. Veja como esta estrutura organiza e processa os dados DICOM nas três camadas do lakehouse:

  • Bronze: Esta primeira camada armazena os dados de imagem de origem no seu formato DICOM original (ficheiros DCM) e uma metastore que contém o conjunto completo de metadados (etiquetas DICOM) extraídos dos ficheiros DCM.

  • Prata: A camada de prata (baseada na especificação FHIR) armazena os metadados de imagem provenientes do lakehouse de bronze. Também armazena ligações de ficheiros referenciais para as localizações de ficheiros DCM na camada de bronze. Os metadados de imagem e as referências de ficheiros são armazenados na tabela delta ImagingStudy, cujo esquema é baseado num formato simplificado do recurso FHIR ImagingStudy (R4.3).

  • Ouro: O camada ouro (com base na especificação) armazena OMOP e transforma dados de imagem provenientes da tabela delta lakehouse ImagingStudy prateada. Os metadados de imagem e as referências de ficheiros são armazenados na tabela delta de ouro Image_Occurrence, cujo esquema é baseado no mais recente desenvolvimento de padronização de dados para investigação observacional baseada em imagens. Para obter mais informações sobre essa padronização, consulte OMOP Common Data Model Extension for medical imaging data.

Para entender como os metadados DICOM se transformam em diferentes lakehouses e revisar o mapeamento de transformação, consulte mapeamento de transformação de metadados DICOM em soluções de dados de saúde.