Compartir a través de


Descripción general de la estrategia del patrimonio de datos

La integración de datos sanitarios y de ciencias biológicas procedentes de diversos sistemas y aplicaciones ha sido una tarea costosa y que requiere mucho tiempo. Para abordar esto, implementar una estrategia de patrimonio de datos se vuelve crucial, ya que establece estándares uniformes para que las organizaciones administren eficientemente todos sus datos, independientemente de su ubicación o formato de almacenamiento.

La estrategia de patrimonio de datos se refiere a un enfoque integral y estructurado adoptado por las organizaciones para gestionar todo su ecosistema de datos de forma eficaz. Implica desarrollar un plan bien definido y un conjunto de pautas para adquirir, almacenar, procesar, proteger y utilizar datos en diversas fuentes, sistemas y aplicaciones dentro y en toda la organización. Como las instituciones de asistencia sanitaria y ciencias biológicas manejan una amplia gama de datos, incluidos datos clínicos, datos de imágenes, datos operativos y de investigación; La gestión eficaz de los datos se vuelve crucial para mantener la confidencialidad, el cumplimiento normativo y obtener una ventaja competitiva, además de brindar una atención eficaz a los pacientes.

Nota

Microsoft Fabric es una solución de análisis todo en uno para empresas que cubre todo, desde el movimiento de datos hasta la ciencia de datos, análisis en tiempo real o la inteligencia empresarial. Ofrece un conjunto completo de servicios, que incluyen el lago de datos, la ingeniería de datos y la integración de datos, todo en un solo lugar. Las soluciones de datos de atención médica en Microsoft Fabric permiten a las organizaciones de atención médica romper los silos de datos y armonizar sus datos de atención médica dispares en un único almacén unificado donde las cargas de trabajo de análisis e inteligencia artificial pueden operar a escala. Aprovechando las capacidades nativas de la plataforma, las organizaciones de salud pueden crear experiencias conectadas en cada punto de atención, empoderar a su fuerza laboral y desbloquear valor de los datos clínicos y operativos. Soluciones de datos sanitarios en Microsoft Fabric se encuentran actualmente en versión preliminar y esta documentación de "buena arquitectura" se actualizará en una versión futura para incluir soluciones de datos de atención médica en Microsoft Fabric.

Gestión de datos en salud y ciencias de la vida

A medida que la industria de la salud hace la transición a un modelo de atención basado en valores con énfasis en la atención centrada en el paciente, el volumen de datos de pacientes generados a través de experiencias inmersivas ha crecido significativamente. El crecimiento exponencial de los datos de atención médica en varios puntos de contacto requiere una estrategia sólida de administración de datos para administrar y utilizar de manera efectiva estos datos para generar información procesable que pueda mejorar la salud general de los miembros y pacientes.

Retos de administración de datos

Las industrias de la salud y las ciencias biológicas son entornos complejos y dinámicos que requieren un alto grado de integración e interoperabilidad para funcionar de manera efectiva. Uno de los principales desafíos de esta industria es que tradicionalmente está aislada, con diferentes proveedores y organizaciones que utilizan diferentes sistemas y tecnologías. La ausencia de integración e interoperabilidad entre estos sistemas y tecnologías ha provocado ineficiencias, errores y falta de continuidad en la atención a los pacientes. A continuación se detallan algunos desafíos comunes de la gestión de datos:

  • Silos de datos: La falta de intercambio de datos entre diferentes sistemas genera silos de datos. Los proveedores de atención médica tienen dificultades para acceder y compartir los datos de los pacientes, lo que puede provocar una falta de continuidad de la atención.
  • Falta de estandarización: Las organizaciones sanitarias y las empresas de ciencias biológicas utilizan diferentes sistemas y tecnologías, lo que dificulta la comunicación y el intercambio de datos sin problemas.
  • Complejidad de los sistemas: Los sistemas de atención médica y ciencias de la vida son cada vez más complejos y representan un desafío para integrar e interoperar datos de manera efectiva, lo que genera mayores costos y retrasos en la prestación de atención.
  • Datos faltantes o con formato incorrecto: Los datos faltantes o con formato incorrecto comprometen la precisión y confiabilidad de los conocimientos derivados de estos datos.
  • Preocupaciones de seguridad y privacidad: La seguridad y privacidad de los datos de los pacientes son fundamentales para los proveedores de atención médica y las empresas de ciencias biológicas. Compartir datos entre diferentes sistemas puede aumentar el riesgo de violaciones de datos y comprometer la privacidad del paciente.
  • Regulaciones de la industria: Las industrias de atención médica y ciencias biológicas tienen las regulaciones industriales más estrictas sobre el manejo de datos, lo que dificulta el intercambio y el acceso a los datos.
  • Desidentificación de datos no uniformes: La ley a menudo exige la desidentificación de datos, lo cual es difícil y requiere mucho tiempo.
  • Conjuntos de datos geográficamente únicos: Es difícil transformar conjuntos de datos geográficamente únicos para la investigación (es decir, datos de salud de la población).

Etapas de administración de datos

Hay varias etapas involucradas en la gestión eficaz de grandes datos y cada etapa es igualmente importante para generar información procesable de alta calidad utilizando los datos subyacentes.

Las principales etapas son:

Detección

El descubrimiento de datos en el contexto de la atención médica y las ciencias biológicas se refiere al proceso de identificar las fuentes de datos, el formato de los datos, como datos estructurados y no estructurados, y acceder a ellos. Los datos del mundo real y la evidencia del mundo real son algunas formas de descubrir datos. Los datos del mundo real se refieren a datos que se recopilan habitualmente de diversas fuentes fuera de los ensayos clínicos tradicionales, como registros médicos electrónicos, actividades de reclamaciones y facturación, datos de prescripciones, datos de dispositivos portátiles y datos recopilados a través de encuestas a pacientes u otros datos generados por los pacientes. métodos. La siguiente imagen ilustra los datos de atención médica más comunes según su taxonomía y estándares de datos.

Un diagrama que muestra el descubrimiento del patrimonio de datos para la salud.

Ingesta

La ingestión es el proceso de conectar, recopilar y controlar el flujo de información de diversas fuentes identificadas en la etapa de descubrimiento. Las siguientes imágenes ilustran las diferentes opciones, como Azure Functions, Logic Apps, Azure Data Factory, etc. Proporcionado por Microsoft para ingerir diversos tipos de información.

  1. La siguiente imagen muestra un canal de ingesta para ingerir datos de IoT desde dispositivos médicos como dispositivos portátiles inteligentes.

Diagrama que muestra un canal de ingesta para ingerir datos de IoT desde dispositivos médicos como dispositivos portátiles inteligentes.

  1. La siguiente imagen ilustra la idea de que los datos generados por dispositivos médicos pueden no estar en formato estándar; por lo tanto, primero se normalizan y luego se almacenan en un servidor FHIR como un recurso de observación FHIR. Los pasos que se muestran en el diagrama los realiza automáticamente el servicio MedTech en Azure Health Data Services.

Un diagrama que muestra la normalización de datos de tecnologías médicas.

  1. La siguiente imagen ilustra el proceso de ingesta para trabajar con datos clínicos, datos DICOM, datos no estructurados y SDoH.

Un diagrama ilustra el proceso de ingesta para trabajar con datos clínicos, datos DICOM, datos no estructurados y SDoH

Persistencia

Es muy importante almacenar los datos ingeridos en un almacenamiento permanente. Esto permite que otras aplicaciones, como la canalización aprendizaje automático, utilicen y generen información sobre los datos, así como Power BI visualizar la distribución de los datos. Microsoft proporciona varias plataformas de persistencia, como Azure Data Lake Storage, Azure Health Data Services y Microsoft Dataverse, para almacenar sus datos de atención médica. Microsoft también proporciona API como la API del servicio FHIR, el servicio DICOM, el servicio MedTech y Dataverse API de atención médica para extraer los datos a la plataforma proporcionada.

Un diagrama que muestra las acciones del CRUD.

Un diagrama que muestra la persistencia del patrimonio de datos para la salud.

Integración

La integración se refiere al proceso de reunir diferentes sistemas, tecnologías, fuentes de datos y procesos para crear una experiencia cohesiva para pacientes, proveedores de atención médica y otras partes interesadas. Microsoft Cloud for Healthcare ofrece herramientas listas para usar para integrar el repositorio de datos de Dataverse con varias fuentes de datos de atención médica, como Azure Health Data Services, servidores FHIR que no son de Microsoft, etc. La siguiente imagen ilustra la integración de datos FHIR a Azure. Databricks Delta Lake en Azure Health Data Services. Para obtener más información, consulte Conexión de datos FHIR a Azure Databricks Delta Lake en Azure Health Data Services

Un diagrama en el que se muestra la integración de lakehouse

Inteligencia

La inteligencia se refiere al proceso de agregar inteligencia a nuestros datos para obtener conocimientos más profundos. Microsoft proporciona herramientas como Azure aprendizaje automático, servicios cognitivos, Azure Databricks, Azure Synapse Analytics, etc. para agregar inteligencia a los datos de atención médica.

Análisis

El análisis implica analizar datos de atención médica para descubrir tendencias y patrones. Se pueden utilizar herramientas como Power BI para visualizar tendencias y patrones en los datos de atención médica para mejorar el apoyo a las decisiones clínicas y también mejorar la eficacia operativa.

La siguiente imagen muestra el ciclo de vida completo de los datos de salud:

Un diagrama que muestra el ciclo de vida completo de los datos de salud

La siguiente imagen ilustra el ciclo de vida completo de los datos de tecnologías médicas:

Un diagrama que muestra el ciclo de vida completo de MedTech del patrimonio de datos

Soluciones de gestión de datos ofrecidas por Microsoft

Microsoft ofrece un amplio conjunto de herramientas para manejar y administrar datos de atención médica. La siguiente tabla proporciona una lista completa de herramientas que se pueden utilizar para administrar datos de atención médica. Puede seguir el enlace de referencia correspondiente a cada herramienta para obtener más información.

Etapa de datos Herramientas Descripción Prestaciones Vínculo de referencia
Ingesta FHIR-Bulk Loader & Export Una solución de aplicación de funciones de Azure que proporciona servicios de ingesta y exportación de datos FHIR. FHIR-Bulk Loader puede importar cientos de miles de archivos por hora. microsoft/fhir-loader: Cargador de datos FHIR masivo
Ingesta FHIR Converter Permite la conversión de datos médicos de formatos heredados al estándar FHIR Es compatible con la siguiente conversión: 1. HL7v2 a FHIR 2. C-CDA a FHIR 3. JSON a FHIR 4. FHIR STU3 a FHIR R4 microsoft/FHIR-Converter: utilidad de conversión para traducir formatos de datos heredados a FHIR
Ingesta Kit de salud en FHIR HealthKitOnFhir es una biblioteca Swift que automatiza la exportación de datos de Apple HealthKit a un servidor FHIR®. Los datos de HealthKit se pueden enrutar a través del Conector IoT FHIR para Azure para agrupar datos de alta frecuencia para reducir la cantidad de Recursos de Observación generados. Los datos de HealthKit también se pueden exportar directamente a un servidor FHIR (apropiado para datos de baja frecuencia). microsoft/healthkit-on-fhir: HealthKitOnFhir es una biblioteca Swift que automatiza la exportación de datos de Apple HealthKit a un servidor FHIR
Persistencia Modelo de datos de Microsoft Cloud for Healthcare Los modelos de datos en Microsoft Cloud for Healthcare se basan en el marco de estándares Recursos Rápidos de Interoperabilidad en Salud (FHIR) que se pueden implementar fácilmente en un entorno de Dataverse. Facilita la implementación de nuevos casos de uso y flujos de trabajo sin redefinir la arquitectura de datos sanitarios. Los modelos basados en FHIR hacen que las implementaciones de Dynamics 365 para los clientes de atención médica sean más fáciles, rápidas y seguras. Información general del modelo de datos
Persistencia Dataverse Healthcare API Admite la escritura de datos FHIR en entidades de Dataverse y leer datos de entidades de Dataverse en formato FHIR. La transformación de los datos FHIR al modelo de datos común y viceversa es manejada automáticamente por el Descripción general de Dataverse Healthcare APIs
Persistencia Azure Health Data Services Es una plataforma administrada como servicio (PaaS) que proporciona una plataforma unificada para almacenar datos FHIR, DICOM y MedTech. Permite rutas más seguras y compatibles para ingerir, conservar y conectar datos de salud en la nube. Comenzar con Azure Health Data Services
Integración Kit de herramientas de integración de datos Proporciona una amplia colección de mapas de entidades predeterminados y mapas de atributos creados para cumplir con la especificación HL7 FHIR que se implementan como registros de Dataverse. Es altamente configurable para adaptarse a diversos requisitos de solución. Descripción general del kit de herramientas de integración de datos - Microsoft Cloud for Healthcare
Integración Tablas de datos de atención sanitaria virtual Admite traer datos directamente desde el servidor FHIR a la solución Microsoft Cloud for Healthcare sin almacenar permanentemente los datos en entidades de Dataverse. Evita la duplicación de datos y ahorra costes de almacenamiento. Descripción general de las tablas de datos de atención sanitaria virtual
Inteligencia Text Analytics for Health Esta es una característica prediseñadas ofrecida por el Lenguaje de IA de Azure. Es un servicio API basado en la nube que aplica inteligencia de aprendizaje automático para extraer y etiquetar información médica relevante de una variedad de textos no estructurados, como notas médicas, resúmenes de alta, documentos clínicos y registros médicos electrónicos. Text Analytics for Health realiza cuatro funciones clave denominadas reconocimiento de entidades, extracción de relaciones, vinculación de entidades y detección de afirmaciones, todo con una única llamada API. ¿Qué es Text Analytics for Health en Azure AI Language? - Servicios de Azure AI
Persistencia y análisis Plantillas de base de datos de atención sanitaria Las plantillas de base de datos de Azure Synapse son definiciones de esquema específicas de la industria que proporcionan un método rápido de creación de una base de datos conocida como base de datos de lago, que permite acelerar la creación de aplicaciones de la industria con análisis. Puede usar estos planos de información para planificar, crear y diseñar soluciones de datos para la gobernanza de datos, informes, inteligencia empresarial y análisis avanzado. Usar plantillas de base de datos de atención sanitaria con Microsoft Cloud for Healthcare
Análisis Análisis de servicios FHIR con Azure Databricks Delta Lake Analytics Data Lakehouse es una arquitectura de datos abierta que combina características existentes de lagos y almacenes de datos tradicionales. Delta Lake se ha convertido en el marco de almacenamiento líder que permite construir una arquitectura Lakehouse sobre las tecnologías de lagos de datos existentes. Azure Health Data Services habilita las arquitecturas Lakehouse exportando archivos parquet de datos FHIR que se alinean con el SQL abierto en FHIR .  Construir un Lakehouse para datos FHIR tiene estas ventajas: 1. Combinando sus datos FHIR con otros conjuntos de datos. 2. Tener una ubicación consistente de datos listos para la empresa que permite un mayor autoservicio en toda su organización. 3. Gestión de metadatos y versionado de datos simplificando datos que se actualizan con frecuencia. Healthcare-apis-samples/src/azuredatabricks-deltalake en principal · Microsoft/healthcare-apis-samples
Pruebas Synthea Synthea es un generador de pacientes sintéticos que modela el historial médico de pacientes sintéticos. Genera datos de pacientes sintéticos, realistas pero no reales, de alta calidad y registros médicos asociados que cubren todos los aspectos de la atención médica. Los datos resultantes están libres de restricciones de costos, privacidad y seguridad. Puede utilizarse sin restricciones para una variedad de usos secundarios en el mundo académico, la investigación, la industria y el gobierno. synthetichealth/synthea Wiki

Consulte también

Existen algunas arquitecturas comúnmente utilizadas para trabajar con datos de atención médica en la plataforma Microsoft Cloud for Healthcare. Estos se pueden utilizar como referencia para adaptar las soluciones exactas necesarias para manejar y administrar datos de atención médica. Para obtener más información, consulte Arquitecturas de referencia de Microsoft Cloud for Healthcare..

Obtenga más información sobre Microsoft Fabric con un escenario de un extremo a otro:

Pasos siguientes