Compartilhar via


Usar o recurso Enriquecimento de anotações clínicas não estruturadas (versão preliminar) nas soluções de dados de serviços de saúde

[Este artigo faz parte da documentação de pré-lançamento e está sujeito a alterações.]

Observação

Esse conteúdo está sendo atualizado no momento.

O Enriquecimento de anotações clínicas não estruturadas (versão preliminar) usa o serviço Text Analytics for Health da Linguagem de IA do Azure para extrair as principais entidades FHIR (Fast Healthcare Interoperability Resources) de anotações clínicas não estruturadas. Ele cria dados estruturados a partir dessas anotações clínicas. Em seguida, você pode analisar esses dados estruturados para obter insights, previsões e medidas de qualidade destinadas a melhorar os resultados de saúde do paciente.

Para saber mais sobre o recurso e entender como implantá-lo e configurá-lo, consulte:

O Enriquecimento de anotações clínicas não estruturadas (versão preliminar) tem uma dependência direta do recurso Bases de dados de serviços de saúde. Certifique-se de configurar e executar com êxito os pipelines de Bases de dados de serviços de saúde primeiro.

Pré-requisitos

Serviço de ingestão de NLP

O notebook healthcare#_msft_ta4h_silver_ingestion executa o módulo NLPIngestionService na biblioteca de soluções de dados de serviços de saúde para invocar o serviço Text Analytics for Health. Esse serviço extrai anotações clínicas não estruturadas do recurso FHIR DocumentReference.Content para criar uma saída nivelada. Para saber mais, consulte Revisar a configuração do notebook.

Armazenamento de dados na camada prata

Após a análise da API de NLP (processamento de linguagem natural), a saída estruturada e nivelada é armazenada nas seguintes tabelas nativas no lakehouse healthcare#_msft_silver:

  • nlpentity: contém as entidades niveladas extraídas das anotações clínicas não estruturadas. Cada linha é um único termo extraído do texto não estruturado após a realização da análise de texto.
  • nlprelationship: fornece o relacionamento entre as entidades extraídas.
  • nlpfhir: contém o pacote de saída FHIR como uma cadeia de caracteres JSON.

Para rastrear o carimbo de data/hora da última atualização, o NLPIngestionService usa o campo parent_meta_lastUpdated em todas as três tabelas do lakehouse prata. Esse acompanhamento garante que o documento de origem DocumentReference, que é o recurso pai, seja armazenado primeiro para manter a integridade referencial. Esse processo ajuda a evitar inconsistências nos dados e recursos órfãos.

Importante

No momento, Text Analytics for Health retorna vocabulários listados na Documentação de Vocabulário do Metathesaurus UMLS. Para obter orientações sobre esses vocabulários, consulte Importar dados do UMLS.

Para a versão preliminar, usamos as terminologias SNOMED-CT (Systematized Nomenclature of Medicine - Clinical Terms), LOINC (Logical Observation Identifiers, Names, and Codes) e RxNorm que estão incluídas no conjunto de dados de exemplo OMOP com base nas orientações da Observational Health Data Sciences and Informatics (OHDSI).

Transformação OMOP

As soluções de dados de serviços de saúde no Microsoft Fabric também fornecem outro recurso para transformações OMOP (Observational Medical Outcomes Partnership). Quando você executa esse recurso, a transformação subjacente do lakehouse prata para o lakehouse ouro OMOP também transforma a saída estruturada e nivelada da análise de anotações clínicas não estruturadas. A transformação lê a tabela nlpentity no lakehouse prata e mapeia a saída para a tabela NOTE_NLP no lakehouse ouro OMOP.

Para obter mais informações, consulte Visão geral de transformações OMOP.

Veja o esquema para as saídas de NLP estruturadas, com o mapeamento de colunas de NOTE_NLP correspondente para o OMOP Common Data Model:

Referência do documento nivelada Descrição Mapeamento d e Note_NLP Dados de exemplo
id Identificador exclusivo para a entidade. Chave composta de parent_id, offset e length. note_nlp_id 1380
parent_id Uma chave estrangeira para o texto nivelado documentreferencecontent do qual o termo foi extraído. note_id 625
texto Texto da entidade como aparece no documento. lexical_variant Sem alergias conhecidas
Deslocamento Deslocamento de caracteres do termo extraído no texto de entrada documentreferencecontent. offset 294
data_source_entity_id ID da entidade no catálogo de origem especificado. note_nlp_concept_id e note_nlp_source_concept_id 37396387
nlp_last_executed A data do processamento da análise do texto documentreferencecontent. nlp_date_time e nlp_date 2023-05-17T00:00:00.0000000
modelo Nome e versão do sistema de NLP (Nome do sistema de NLP do Text Analytics for Health e a versão). nlp_system MSFT TA4H

Uma imagem exibindo o esquema com dados de NLP de exemplo.

Limites de serviço para Text Analytics for Health

  • O número máximo de caracteres por documento é limitado a 125.000.
  • O tamanho máximo dos documentos contidos em toda a solicitação é limitado a 1 MB.
  • O número máximo de documentos por solicitação é limitado a:
    • 25 para a API baseada na Web.
    • 1.000 para o contêiner.

Habilitar logs

Siga estas etapas para habilitar o log de solicitações e respostas para a API do Text Analytics for Health:

  • Habilite as configurações de diagnóstico para seu recurso Serviço de Linguagem do Azure usando as instruções em Habilitar log de diagnóstico para serviços de IA do Azure. Esse recurso é o mesmo serviço de linguagem que você criou durante a etapa de implantação do Configurar o serviço de linguagem do Azure.

    • Insira um nome de configuração de diagnóstico.
    • Defina a categoria como Logs de Solicitação e Resposta.
    • Para obter detalhes de destino, selecione Enviar para o workspace do Log Analytics e selecione o workspace necessário do Log Analytics. Se você não tiver um workspace, siga as instruções para criar um.
    • Salve as configurações.

    Uma captura de tela exibindo as configurações de diagnóstico do serviço de linguagem.

  • Acesse a seção Configuração de NLP no notebook do serviço de ingestão de NLP. Atualize o valor do parâmetro de configuração enable_text_analytics_logs para True. Para obter mais informações sobre este notebook, consulte Revisar a configuração do notebook.

Exibir logs no Azure Log Analytics

Para explorar os dados de análise de log:

  • Navegue até seu workspace do Log Analytics.
  • Localize e selecione Logs. Nessa página, você pode executar consultas em seus logs.

Consulta de exemplo

Veja a seguir uma consulta básica do Kusto que você pode usar para explorar seus dados de log. Essa consulta de exemplo recupera todas as solicitações com falha do provedor de recursos dos Serviços Cognitivos Azure no dia anterior, agrupadas por tipo de erro:

AzureDiagnostics
| where TimeGenerated > ago(1d)
| where Category == "RequestResponse"
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| where tostring(ResultSignature) startswith "4" or tostring(ResultSignature) startswith "5"
| summarize NumberOfFailedRequests = count() by ResultSignature