Compartilhar via


Visão geral da Estratégia de Patrimônio de Dados

A integração de saúde e ciências biológicas de vários sistemas e aplicativos tem sido uma tarefa cara e demorada. Para resolver isso, a implementação de uma estratégia de património de dados torna-se crucial, uma vez que estabelece padrões uniformes para que as organizações possam gerenciar com eficiência todos os seus dados, independentemente do local ou do formato de armazenamento.

A Estratégia de Patrimônio de Dados refere-se a uma abordagem abrangente e estruturada adotada pelas organizações para gerenciar com eficiência todo o seu ecossistema de dados. Ela envolve o desenvolvimento de um plano bem definido e um conjunto de diretrizes para adquirir, armazenar, processar, proteger e utilizar dados em diversas fontes, sistemas e aplicativos dentro e em toda a organização. Como as instituições de saúde e de ciências biológicas lidam com uma gama diversificada de dados, incluindo dados clínicos, dados de imagem, dados operacionais e de pesquisa, o gerenciamento eficaz de dados torna-se crucial para manter a confidencialidade, a conformidade regulatória e obter uma vantagem competitiva, bem como para fornecer atendimento eficaz aos pacientes.

Observação

O Microsoft Fabric é uma solução de análise completa para empresas que cobre tudo, desde a movimentação de dados até a ciência de dados, a análise em tempo real e o business intelligence. Ele oferece um conjunto abrangente de serviços, incluindo data lake, engenharia de dados e integração de dados, tudo em um só lugar. As soluções de dados de serviços de saúde no Microsoft Fabric permitem que as organizações de saúde dividam silos de dados e harmonizem seus dados de saúde díspares em um único armazenamento unificado, em que análises e cargas de trabalho de IA podem operar em escala. Aproveitando os recursos nativos da plataforma, as organizações de saúde podem criar experiências conectadas em cada ponto de atendimento, capacitar sua força de trabalho e liberar valor de dados clínicos e operacionais. As soluções de dados de saúde no Microsoft Fabric estão atualmente em versão preliminar e essa documentação "Bem arquitetada" será atualizada em uma versão futura para incluir as soluções de dados de saúde no Microsoft Fabric.

Gerenciamento de dados em saúde e ciências biológicas

À medida que o setor da saúde transita para um modelo de cuidados baseado em valor, com ênfase nos cuidados centrados no paciente, o volume de dados dos pacientes gerados por meio de experiências imersivas cresceu significativamente. O crescimento exponencial dos dados de saúde em vários pontos de contato exige uma estratégia robusta de gerenciamento de dados para gerenciar e utilizar esses dados com eficiência para gerenciar insights práticos que possam melhorar a saúde geral dos membros e pacientes.

Desafios do gerenciamento de dados

Os setores de saúde e de ciências biológicas são ambientes complexos e dinâmicos que requerem um elevado grau de integração e interoperabilidade para funcionarem com eficiência. Um dos principais desafios dessa setor é que ele é tradicionalmente isolado, com diferentes fornecedores e organizações que utilizam diferentes sistemas e tecnologias. A ausência de integração e interoperabilidade entre esses sistemas e tecnologias levou a ineficiências, erros e falta de continuidade no atendimento aos pacientes. Veja abaixo alguns desafios comuns do gerenciamento de dados:

  • Silos de dados: a falta de compartilhamento de dados entre diferentes sistemas leva a silos de dados. Os prestadores de serviços de saúde têm dificuldade em acessar e compartilhar dados dos pacientes, o que pode levar à falta de continuidade dos cuidados.
  • Falta de padronização: as organizações de saúde e as empresas de ciências biológicas utilizam sistemas e tecnologias diferentes, dificultando a comunicação e a troca de dados de forma contínua.
  • Complexidade dos sistemas: os sistemas de saúde e de ciências biológicas estão cada vez mais complexos e representam um desafio para integrar e interoperar dados de forma eficaz, o que leva ao aumento dos custos e a atrasos na prestação de cuidados.
  • Dados malformados ou ausentes: dados malformados ou ausentes comprometem a precisão e a confiabilidade dos insights derivados desses dados.
  • Preocupações com segurança e privacidade: a segurança e a privacidade dos dados dos pacientes são essenciais para os prestadores de serviços de saúde e empresas de ciências biológicas. O compartilhamento de dados entre diferentes sistemas pode aumentar o risco de violações de dados e comprometer a privacidade do paciente.
  • Regulamentações do setor: os setores de saúde e ciências biológicas têm as regulamentações mais rigorosas do setor sobre o tratamento de dados, o que dificulta o compartilhamento e o acesso aos dados.
  • Desidentificação de dados não uniformes: a desidentificação de dados é frequentemente exigida por lei, o que é difícil e demorado.
  • Conjuntos de dados geograficamente únicos: é difícil transformar conjuntos de dados geograficamente únicos para pesquisa (ou seja, dados de saúde da população).

Estágios do gerenciamento de dados

Existem vários estágios envolvidos no gerenciamento eficaz de grandes volumes de dados e cada estágio é igualmente importante para gerar insights práticos de alta qualidade usando os dados subjacentes.

Os estágios principais são os seguintes:

Descoberta

A descoberta de dados no contexto da saúde e das ciências biológicas refere-se ao processo de identificação das fontes de dados, do formato dos dados, como dados estruturados e não estruturados, e o acesso a eles. Dados do mundo real e evidências do mundo real são algumas maneiras de descobrir dados. Dados do mundo real referem-se a dados que são coletados rotineiramente de diversas fontes fora dos ensaios clínicos tradicionais, como registros eletrônicos de saúde, atividades de solicitações e faturamento, dados de prescrição, dados de acessórios e dados coletados por meio de pesquisas com pacientes ou outros métodos gerados pelos pacientes. A imagem a seguir ilustra os dados de saúde mais comuns com base em sua taxonomia e padrões de dados.

Um diagrama mostrando a descoberta do patrimônio de dados para saúde.

Ingestão

A ingestão é o processo de conectar, coletar e controlar o fluxo de informações de várias fontes identificadas no estágio de descoberta. As imagens a seguir ilustram as diferentes opções, como Azure Functions, Aplicativos Lógicos, Azure Data Factory etc. fornecidas pela Microsoft para ingerir vários tipos de informações.

  1. A imagem a seguir mostra um pipeline de ingestão para ingerir dados de IoT de dispositivos médicos, como acessórios inteligentes.

Um diagrama mostrando um pipeline de ingestão para ingerir dados de IoT de dispositivos médicos, como acessórios inteligentes.

  1. A imagem a seguir ilustra a ideia de que os dados gerados por dispositivos médicos podem não estar no formato padrão, portanto, eles são primeiro normalizados e depois armazenados em um servidor FHIR como um recurso de observação FHIR. As etapas mostradas no diagrama são executadas automaticamente pelo serviço MedTech no Serviços de Dados de Saúde do Azure.

Um diagrama mostrando a normalização do dados do MedTech

  1. A imagem a seguir ilustra o pipeline de ingestão para trabalhar com dados clínicos, dados DICOM, dados não estruturados e SDoH.

Um diagrama ilustra o pipeline de ingestão para trabalhar com dados clínicos, dados DICOM, dados não estruturados e SDoH

Persistência

É muito importante armazenar os dados ingeridos no armazenamento permanente. Isso permite que outros aplicativos, como o pipeline de machine learning, usem e gerem insights sobre os dados, bem como o Power BI visualize a distribuição dos dados. A Microsoft fornece várias plataformas de persistência, como o Azure Data Lake Storage, os Serviços de Dados de Saúde do Azure e o Microsoft Dataverse, para armazenar seus dados de saúde. A Microsoft também fornece APIs, como a API de serviço FHIR, serviço DICOM, serviço MedTech e Dataverse Healthcare APIs para extrair os dados para a plataforma fornecida.

Um diagrama mostrando as ações CRUD.

Um diagrama mostrando a persistência do patrimônio de dados para saúde.

Integração

Integração refere-se ao processo de reunir diferentes sistemas, tecnologias, fontes de dados e processos para criar uma experiência coesa para pacientes, prestadores de serviços de saúde e outros stakeholders. O Microsoft Cloud for Healthcare oferece ferramentas prontas para uso para integrar o repositório de dados do Dataverse com diversas fontes de dados de saúde, como os Serviços de Dados de Saúde do Azure, os servidores FHIR que não são da Microsoft etc. A imagem a seguir ilustra a integração de dados FHIR ao Delta Lake Azure Databricks nos Serviços de Dados de Saúde do Azure. Para obter mais informações, consulte Conectando dados FHIR ao Azure Databricks Delta Lake nos Serviços de Dados de Saúde do Azure

Um diagrama mostrando a integração do lakehouse

Inteligência

Inteligência refere-se ao processo de adicionar inteligência aos nossos dados para obter insights mais profundos. A Microsoft fornece ferramentas, como Azure Machine Learning, serviços cognitivos, Azure Databricks, Azure Synapse Analytics etc., para adicionar inteligência aos dados de saúde.

Análise

A análise envolve a análise de dados de saúde para descobrir tendências e padrões. Ferramentas como Power BI podem ser usadas para visualizar tendências e padrões em dados de saúde para melhorar o suporte à decisão clínica e também para aumentar a eficiência operacional.

A imagem abaixo mostra o ciclo de vida completo dos dados de saúde:

Um diagrama mostrando o ciclo de vida completo dos dados de saúde

A imagem abaixo ilustra o ciclo de vida completo dos dados do MedTech:

Um diagrama mostrando o ciclo de vida completo do patrimônio de dados do MedTech

Soluções de gerenciamento de dados oferecidas pela Microsoft

A Microsoft oferece um amplo conjunto de ferramentas para manipular e gerenciar dados de saúde. A tabela a seguir fornece uma lista abrangente das ferramentas que podem ser usadas para gerenciar os dados de saúde. Você pode seguir o link de referência correspondente a cada ferramenta para obter mais informações.

Estágio dos dados Ferramentas Descrição Benefícios Link de referência
Ingestão FHIR-Bulk Loader e Export Uma solução do aplicativo Azure Function que fornece serviços de ingestão e exportação de dados FHIR. O FHIR-Bulk Loader pode importar centenas de milhares de arquivos por hora. microsoft/fhir-loader: Carregador de Dados FHIR em Massa
Ingestão Conversor de FHIR Permitir a conversão de dados de saúde de formatos herdados para o padrão FHIR Oferece suporte à seguinte conversão: 1. HL7v2 em FHIR 2. C-CDA em FHIR 3. JSON em FHIR 4. FHIR STU3 em FHIR R4 microsoft/FHIR-Converter: Utilitário de conversão para traduzir formatos de dados legados em FHIR
Ingestão Healthkit-on-FHIR HealthKitOnFhir é uma biblioteca Swift que automatiza a exportação de dados Apple HealthKit para um servidor FHIR®. Os dados do HealthKit podem ser roteados através do Conector IoMT FHIR para Azure para agrupar dados de alta frequência para reduzir o número de Recursos de Observação gerados. Os dados do HealthKit também podem ser exportados diretamente para um servidor FHIR (apropriado para dados de baixa frequência). microsoft/healthkit-on-fhir: HealthKitOnFhir é uma biblioteca Swift que automatiza a exportação de dados Apple HealthKit para um servidor FHIR
Persistência Modelo de dados do Microsoft Cloud for Healthcare Os modelos de dados no Microsoft Cloud for Healthcare são baseados na estrutura de padrões Fast Healthcare Interoperability Resources (FHIR) que são facilmente implantáveis em um ambiente do Dataverse. Ele facilita a implementação de novos casos de uso e fluxos de trabalho sem redefinir a arquitetura de dados de saúde. O modelo baseado em FHIR torna as implementações do Dynamics 365 para clientes da área de saúde mais fáceis, rápidas e seguras. Visão geral do modelo de dados
Persistência Dataverse Healthcare APIs Oferece suporte à gravação de dados FHIR para entidades do Dataverse e à leitura de dados de entidades do Dataverse no formato FHIR. A transformação de dados FHIR em Common Data Model e vice-versa é tratada automaticamente pelo Visão geral das Dataverse Healthcare APIs
Persistência Serviços de Dados de Saúde do Azure É uma plataforma gerenciada como serviço (PaaS) que fornece uma plataforma unificada para armazenar dados FHIR, DICOM e do MedTech. Ele permite caminhos mais seguros e em conformidade para ingerir, persistir e conectar dados de saúde na nuvem. Introdução aos Serviços de Dados de Saúde do Azure
Integração Kit de Ferramentas de Integração de Dados Ele fornece uma extensa coleção de mapas de entidades padrão e mapas de atributos criados para estar em conformidade com a especificação HL7 FHIR que são implantados como registros do Dataverse. Ele é altamente configurável para acomodar vários requisitos de solução. Visão geral do Kit de Ferramentas de Integração de Dados – Microsoft Cloud for Healthcare
Integração Tabelas de Dados de Serviço de Saúde Virtual Oferece suporte para trazer dados diretamente do servidor FHIR para a solução Microsoft Cloud for Healthcare sem armazenar permanentemente os dados em entidades do Dataverse. Evita a duplicação de dados e economiza custos de armazenamento. Visão geral das tabelas de dados virtuais de saúde
Inteligência Text Analytics for Health Este é um recurso predefinido oferecido pela Linguagem de IA do Azure. Ele é um serviço de API baseado em nuvem que aplica inteligência de aprendizado de máquina para extrair e rotular informações médicas relevantes de uma variedade de textos não estruturados, como anotações médicas, resumos de alta, documentos clínicos e registros eletrônicos de saúde. O Text Analytics for Health executa quatro funções principais: reconhecimento de entidade nomeada, extração de relação, vinculação de entidade e detecção de asserção, todas com uma única chamada à API. O que é o Text Analytics for Health na Linguagem de IA do Azure? - Serviços de IA do Azure
Persistência e Análise Modelos de Banco de Dados dos Serviços de Saúde Os modelos de banco de dados no Azure Synapse são definições de esquema específicas da indústria que fornecem um método rápido de criar um banco de dados conhecido como um banco de dados data lake, que pode acelerar a criação de aplicativos da indústria com infusão de análise. Você pode usar esses projetos de informações para planejar, arquitetar e projetar soluções de dados para governança de dados, relatórios, inteligência de negócios e análises avançadas. Usar Modelos de banco de dados dos serviços de saúde com o Microsoft Cloud for Healthcare
Análise Análise do serviço FHIR com o Azure Databricks Delta Lake Analytics Data Lakehouse é uma arquitetura de dados aberta que combina recursos existentes de data lakes e data warehouses tradicionais. Delta Lake emergiu como a estrutura de armazenamento líder que permite criar uma arquitetura de Lakehouse com base nas tecnologias de data lake existentes. Os Serviços de Dados de Saúde do Azure permitem arquiteturas de Lakehouse exportando arquivos parquet de dados FHIR que se alinham ao padrão aberto SQL no FHIR.  Criar um Lakehouse para dados FHIR tem estas vantagens: 1. Combinar seus dados FHIR com outros conjuntos de dados. 2. Ter uma localização consistente de dados prontos para a empresa, permitindo mais autoatendimento em toda a sua organização. 3. Gerenciamento de metadados e controle de versão de dados simplificando dados que são atualizados com frequência. healthcare-apis-samples/src/azuredatabricks-deltalake at main · microsoft/healthcare-apis-samples
Testes Synthea Synthea é um gerador de pacientes sintéticos que modela o histórico médico de pacientes sintéticos. Ele produz dados de pacientes sintéticos, realistas, mas não reais, de alta qualidade e registros de saúde associados, cobrindo todos os aspectos dos serviços de saúde. Os dados resultantes estão livres de restrições de custo, privacidade e segurança. Eles podem ser usados sem restrições para uma variedade de usos secundários na academia, na pesquisa, no setor e no governo. synthetichealth/Wiki do Synthea

Confira também

Existem algumas arquiteturas comumente usadas para trabalhar com dados de saúde na plataforma Microsoft Cloud for Healthcare. Eles podem ser usados como referência para personalizar as soluções exatas necessárias para lidar e gerenciar dados de saúde. Para obter mais informações, consulte Arquiteturas de referência do Microsoft Cloud for Healthcare.

Saiba mais sobre o Microsoft Fabric um cenário de ponta a ponta:

Próximas etapas