使用医疗保健数据解决方案中的 OMOP 转换示例笔记本
备注
此内容目前正在更新。
本部分向您展示两个观察性医疗结果伙伴关系 (OMOP) 示例应用场景。 这些应用场景反映了 OMOP 社区对患者群体中主要和次要药物暴露情况进行的常见临床研究调查。 从价值实现时间的角度来看,它展示了在 Fabric 工作区中可视化分析结果的速度有多快。 通过在数据管道之后执行示例笔记本,可分别在银牌和金牌湖屋中填充快速医疗保健互操作性资源 (FHIR) 临床数据,从而实现本可视化。
先决条件
在运行示例笔记本 healthcare#_msft_omop_drug_exposure_era_sample 和 healthcare#_msft_omop_drug_exposure_insights_sample 之前,请确保满足以下要求:
验证是否已创建 OMOP 数据库并填充了示例数据。
在您的环境中部署和设置 OMOP 示例数据,如部署 OMOP 转换中所述。
查看示例笔记本配置,如以下部分中所述:
示例方案
示例应用场景旨在确定按性别和年龄分层的患者队列,这些患者在使用同一主要药物时在一定时期内暴露于次要药物。 本流程包括以下步骤:
按性别和年龄对患者群体进行分层。
确定患者群体在一年内至少服用一次的药物(例如,低精蛋白胰岛素、人 70 UNT/ML/胰岛素、常规、人 30 单位)。
如果没有足够的数据,请考虑五年内服用的药物。
确定同一患者群体在同一时期内暴露的另一种药物(第二种药物)。
绘制次要药物在性别层级中暴露的分布。
生成记录并将分布可视化为直方图。
小费
示例应用场景引用 OHDSI 药物时代示例脚本和 OMOP 药物暴露查询。 您可以查看这些资源,以了解有关 OMOP 社区发布的类似示例的详细信息。
示例笔记本执行输入
开发设计的主要目标是生成药物时代记录,由 OMOP 标准化的派生表 drug_era 表示。 此表存储计算出的药物时代,包含按人员、药物成分和持久性时间范围分组的药物暴露的聚合信息。 它代表了假定暴露于特定活性成分的连续时间,与单个药物暴露记录不同。
该表包含以下列:
drug_era_id
:每个药物时代的唯一标识符。person_id
:引用暴露于药物的人员的外键,人员表中具有群体统计详细信息。drug_concept_id
:引用活性成分的标准化概念标识符的外键。drug_era_start_date
:药物时代的开始日期,源自第一次药物暴露。drug_era_end_date
:药物时代的结束日期,基于最后一次药物暴露。drug_exposure_count
:药物时代期间药物暴露的总次数。gap_days
:促成药物时代的药物暴露记录中未涵盖的天数。
若要生成药物时代记录,我们使用以下 OMOP 标准化临床表:
药物暴露:此表包含药物暴露数据,包括
drug_exposure_id
、person_id
、drug_concept_id
、drug_exposure_start_date
、drug_exposure_end_date
和days_supply
。概念原型:此表存储各种词汇(例如 RxNorm)中概念之间的层次结构关系。 它包括
ancestor_concept_id
(对较高级别概念的引用)和descendant_concept_id
(对较低级别概念的引用),表示从广义到狭义的概念连接。概念:此表包含概念数据,包括
concept_id
、concept_name
、domain_id
、vocabulary_id
和concept_class_id
。
示例输入参数
primary_drug
=1596977 - insulin
secondary_drug
=1308216 - lisinopril
year
=2022
示例笔记本输出
当您运行这两个示例笔记本时,它们会生成一个直方图,其中包含派生的 OMOP 表 omop.drug_era 中在特定时间段内确定的患者群体的性别和年龄层的次要药物暴露分布。 在此示例中,我们考虑一年的时间段。
您可以使用分布来分析以下方面:
- 按性别和年龄分层的暴露的影响。
- 受影响群体的平均分布。
- 描述群体特征的描述性统计信息。
需要记住的事项
若要测试自定义应用场景,请复制示例笔记本。 不要直接更新笔记本。
可视化笔记本使用以下参数,您可以配置这些参数来运行不同的分析:
primary_drug
:要分析的主要药物。secondary_drug
:要分析的次要药物。year
:应执行分析的年份。
多次运行药物暴露时代笔记本,首先会删除所有现有的 OMOP drug_era 记录,然后根据最新 OMOP 数据重新创建记录。