Utilizar o melhoramento de notas clínicas não estruturadas (pré-visualização) em soluções de dados de cuidados de saúde
[Este artigo é uma documentação de pré-lançamento e está sujeito a alterações.]
Nota
Este conteúdo está atualmente a ser atualizado.
O melhoramento de notas clínicas não estruturadas (pré-visualização) utiliza o serviço Text Analytics for Health da Linguagem da IA do Azure para extrair as principais entidades FHIR (Fast Healthcare Interoperability Resources) de notas clínicas não estruturadas. Cria dados estruturados a partir dessas notas clínicas. Em seguida, pode analisar esses dados estruturados para obter informações, previsões e medidas de qualidade destinadas a melhorar os resultados de saúde do paciente.
Para saber mais sobre a capacidade e entender como implementá-la e configurá-la, consulte:
- Descrição geral do melhoramento de notas clínicas não estruturadas (pré-visualização)
- Implementar e configurar o melhoramento de notas clínicas não estruturadas (pré-visualização)
O melhoramento de notas clínicas não estruturadas (pré-visualização) depende diretamente da capacidade de infraestruturas de dados de cuidados de saúde. Certifique-se de que configura e executa com êxito primeiro os pipelines de infraestruturas de dados de cuidados de saúde.
Pré-requisitos
- Implementar soluções de dados de cuidados de saúde no Microsoft Fabric
- Instale os blocos de notas e pipelines fundamentais em Implementar soluções de dados de cuidados de saúde.
- Configure o serviço de linguagem do Azure conforme explicado em Configurar o serviço de linguagem do Azure.
- Implementar e configurar o melhoramento de notas clínicas não estruturadas (pré-visualização)
- Implemente e configure transformações OMOP. Este passo é opcional.
Serviço de ingestão NLP
O bloco de notas healthcare#_msft_ta4h_silver_ingestion executa o módulo NLPIngestionService na biblioteca de soluções de dados de cuidados de saúde para invocar o serviço Text Analytics for Health. Este serviço extrai notas clínicas não estruturadas do recurso FHIR DocumentReference.Content para criar um resultado simplificado. Para saber mais, consulte Analisar a configuração do bloco de notas.
Armazenamento de dados na camada de prata
Após a análise da API de processamento de linguagem natural (NLP), o resultado estruturado e simplificado é armazenado nas seguintes tabelas nativas no lakehouse healthcare#_msft_silver:
- nlpentity: Contém as entidades simplificadas extraídas das notas clínicas não estruturadas. Cada linha é um único termo extraído do texto não estruturado após a realização da análise de texto.
- nlprelationship: Fornece a relação entre as entidades extraídas.
- nlpfhir: Contém o pacote de saída FHIR como uma cadeia de carateres JSON.
Para monitorizar o carimbo de data/hora atualizado pela última vez, o NLPIngestionService usa o campo parent_meta_lastUpdated
nas três tabelas do lakehouse de prata. Esta monitorização garante que o documento de origem DocumentReference, que é o recurso principal, seja armazenado primeiro para manter a integridade referencial. Este processo ajuda a evitar inconsistências nos dados e recursos órfãos.
Importante
Atualmente, o Text Analytics for Health devolve os vocabulários listados na Documentação de Vocabulário do Metathesaurus UMLS. Para obter orientação sobre estes vocabulários, consulte Importar dados do UMLS.
Para a versão de pré-visualização, usamos as terminologias SNOMED-CT (Systematized Nomenclature of Medicine - Clinical Terms), LOINC (Logical Observation Identifiers, Names, and Codes) e RxNorm que são incluídas no conjunto de dados de amostra OMOP com base na orientação da Observational Health Data Sciences and Informatics (OHDSI).
Transformação OMOP
As soluções de dados de cuidados de saúde no Microsoft Fabric também fornecem outra capacidade para transformações da Observational Medical Outcomes Partnership (OMOP). Quando executa esta capacidade, a transformação subjacente do lakehouse de prata para o lakehouse de ouro OMOP também transforma o resultado simplificado e estruturado da análise de notas clínicas não estruturadas. A transformação lê a partir da tabela nlpentity no lakehouse de prata e mapeia o resultado para a tabela NOTE_NLP no lakehouse de ouro OMOP.
Para obter mais informações, consulte: Descrição geral das transformações OMOP.
Aqui está o esquema para os resultados de PNL estruturados, com o mapeamento da coluna NOTE_NLP correspondente para o modelo de dados comum OMOP:
Referência do documento simplificado | Descrição | Mapeamento Note_NLP | Dados de exemplo |
---|---|---|---|
id | Identificador exclusivo da entidade. Chave composta de parent_id offset e length . |
note_nlp_id |
1380 |
parent_id | Uma chave externa para o texto simplificado documentreferencecontent do qual o termo foi extraído. | note_id |
625 |
texto | Texto da entidade conforme aparece no documento. | lexical_variant |
Sem alergias conhecidas |
Desvio | Desvio de carateres do termo extraído no texto de entrada documentreferencecontent. | offset |
294 |
data_source_entity_id | ID da entidade no catálogo de origem indicado. | note_nlp_concept_id e note_nlp_source_concept_id |
37396387 |
nlp_last_executed | A data do processamento da análise de texto de documentreferencecontent. | nlp_date_time e nlp_date |
2023-05-17T00:00:00.0000000 |
modelo | Nome e versão do sistema NLP (Nome do sistema NLP de Text Analytics for Health e a versão). | nlp_system |
MSFT TA4H |
Limites de serviço do Text Analytics for Health
- O número máximo de carateres por documento está limitado a 125.000.
- O tamanho máximo dos documentos contidos em todo o pedido está limitado a 1 MB.
- O número máximo de documentos por pedido está limitado a:
- 25 para a API baseada na Web.
- 1000 para o contentor.
Ativar registos
Siga estes passos para ativar o registo de pedidos e respostas para a API Text Analytics for Health:
Ative as definições de diagnóstico para o seu recurso do serviço de Linguagem do Azure usando as instruções em Ativar registo de diagnóstico para serviços Azure AI. Este recurso é o mesmo serviço de linguagem que criou durante o passo de implementação Configurar o serviço de linguagem do Azure.
- Introduza um nome da definição de diagnóstico.
- Defina a categoria como Registo de Pedidos e Respostas.
- Para obter detalhes sobre o destino, selecione Enviar para Área de trabalho do Log Analytics e selecione a área de trabalho do Log Analytics necessária. Se não tiver uma área de trabalho, siga as instruções para criar uma.
- Guardar as definições.
Aceda à secção Configuração de NLP no bloco de notas do serviço de ingestão de NLP. Atualize o valor do parâmetro de configuração
enable_text_analytics_logs
paraTrue
. Para mais informações sobre este bloco de notas, consulte Analisar a configuração do bloco de notas.
Ver registos no Log Analytics do Azure
Para explorar os dados de análise de registos:
- Navegue para a área de trabalho do Log Analytics.
- Localize e selecione Registos. Nesta página, pode executar consultas dos registos.
Consulta de amostra
A seguir está uma consulta básica Kusto que pode usar para explorar os seus dados de registo. Esta consulta de exemplo obtém todos os pedidos com falhas do fornecedor de recursos dos Serviços Cognitivos do Azure no dia anterior, agrupados por tipo de erro:
AzureDiagnostics
| where TimeGenerated > ago(1d)
| where Category == "RequestResponse"
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| where tostring(ResultSignature) startswith "4" or tostring(ResultSignature) startswith "5"
| summarize NumberOfFailedRequests = count() by ResultSignature