部署和配置医疗保健数据解决方案中的 CMS 索赔数据转换(预览版)

[本文为预发布文档,可能会发生变化。]

CMS 索赔数据转换(预览版)使您能够使用索赔数据转换管道将 CMS(医保与医助服务中心)CCLF(索赔和索赔行馈送)数据引入 OneLake。 在将医疗保健数据解决方案和医疗保健数据基础功能部署到 Fabric 工作区后,您可以部署和配置此功能。 本文概述了部署流程,并介绍了如何设置示例数据。

CMS 索赔数据转换(预览版)是 Microsoft Fabric 中医疗保健数据解决方案下的一项可选功能。 您可以根据具体需求或应用场景灵活地决定是否使用它。

先决条件

部署 CMS 索赔数据转换(预览版)

您可以使用医疗保健数据解决方案:部署医疗保健数据基础中所述的设置模块,部署该功能和关联的示例数据。 或者,您也可以稍后使用部署示例数据中的步骤部署示例数据。 此功能使用 8KCCLFClaims 示例数据集。

如果未使用设置模块部署该功能,而是希望改用功能磁贴,请按照以下步骤操作:

  1. 转到 Fabric 上的“医疗保健数据解决方案”主页。

  2. 选择“CMS 索赔数据转换(预览版)”磁贴。

    显示“功能”磁贴的屏幕截图。

  3. 在“功能”页面上,选择部署到工作区

    显示如何将该功能部署到工作区的屏幕截图。

  4. 完成部署可能需要几分钟时间。 部署过程中不要关闭选项卡或浏览器。 在等待期间,您可以在另一个选项卡中工作。

    部署完成后,您可以在消息栏上看到一条通知。

  5. 从消息栏中选择管理功能,以转到功能管理页面。

    在这里,您可以查看、配置和管理使用该功能部署的项目。

项目

该功能可在您的医疗保健数据解决方案环境中安装以下两个笔记本和数据管道:

项目 类型​​ 描述
healthcare#_msft_claims_cclf_extract_bronze_ingestion 笔记本 Process 文件夹中的原始 CCLF 数据转换到铜牌湖屋中的相应增量表。
healthcare#_msft_claims_cclf_fhir_conversion 笔记本 将相应增量表中存在的 CCLF 数据转换到铜牌湖屋中的 ExplanationOfBenefit FHIR 资源,并以 NDJSON 文件的格式保存输出。
healthcare#_msft_claims_cclf_data_ingestion 数据管道 按顺序运行以下笔记本,以将索赔数据从铜牌湖屋中的原始状态转换为银牌湖屋中的已转换状态:

• healthcare#_msft_raw_process_movement:从压缩 (ZIP) 文件中提取 CCLF 文件,并根据 YYYY/MM/DD 格式的执行日期将其移动到适当的文件夹结构。
• healthcare#_msft_claims_cclf_extract_bronze_ingestion:将 Process 文件夹中的原始 CCLF 数据转换为铜牌湖屋中的相应增量表。
• healthcare#_msft_claims_cclf_fhir_conversion:将相应增量表中存在的 CCLF 数据转换到铜牌湖屋中的 ExplanationOfBenefit FHIR 资源,并以 NDJSON 文件的格式保存输出。
• healthcare#_msft_fhir_ndjson_bronze_ingestion:将 FHIR ExplanationOfBenefit NDJSON 文件中的数据转换为铜牌湖屋中的 ExplanationOfBenefit 表,该表保留数据源的原始状态。
• healthcare#_msft_bronze_silver_flatten:将铜牌湖屋中 ExplanationOfBenefit 表中的数据转换为银牌湖屋中的 ExplanationOfBenefit 增量表。

healthcare#_msft_raw_process_movementhealthcare#_msft_fhir_ndjson_bronze_ingestionhealthcare#_msft_bronze_silver_flatten 是与医疗保健数据基础一起部署的基础笔记本。 若要了解有关这些笔记本的详细信息,请参阅医疗保健数据基础:项目

设置索赔示例数据

医疗保健数据解决方案提供的示例数据包括用于运行索赔数据转换管道的索赔示例数据集。 您还可以探索数据转换以及在铜牌和银牌湖屋中的进度。 提供的索赔示例数据可能没有临床意义,但它们在技术上是完整且全面的,可以演示解决方案的功能。

若要访问示例数据集,请验证是否已将索赔示例数据下载到铜牌湖屋中的以下文件夹中:SampleData\Claims\CCLF\CCLF-HDS部署示例数据步骤自动将 8KCCLFClaims 示例数据集部署到此文件夹。

显示部署在相应文件夹中的示例数据的屏幕截图。

接下来,您必须将示例数据上传到 Ingest 文件夹。 铜牌湖屋中的此文件夹用作放置(队列)文件夹。 您必须将索赔示例数据文件放置在此文件夹中,以便它们可以自动移动到铜牌湖屋内的井然有序的文件夹结构中。 若要了解有关统一文件夹结构的详细信息,请参阅统一文件夹结构

此功能不会在您的环境中自动创建文件夹路径 Ingest\Claims\CCLF\<namespace_folder> 。 在上传示例数据之前,必须手动创建此文件夹路径。

若要上传示例数据,请执行以下操作:

  1. 在铜牌湖屋中转到 Ingest\Claims\CCLF\<namespace_folder>
  2. 选择文件夹名称旁边的省略号 (...) >上传>上传文件
  3. 从示例数据索赔文件夹中选择并上传索赔数据集。

您可以上传本机索赔文件(CCLF 格式)或包含压缩索赔文件的 ZIP 文件。 ZIP 文件可以包括组织到多个嵌套子文件夹中的索赔文件。 对可以上传的索赔文件的数量或 ZIP 文件中子文件夹的数量、深度和嵌套没有限制。

或者,您可以在笔记本中运行以下代码片段,以将示例数据复制到 Ingest 文件夹中。

  1. 在您的医疗保健数据解决方案 Fabric 工作区中,选择 + 新建项目

  2. 新建项目窗格中,搜索并选择笔记本

  3. 将以下代码片段复制到笔记本中:

    source_path = f"abfss://<workspace_name>@onelake.dfs.fabric.microsoft.com/<bronze_lakehouse_name>/Files/SampleData/Claims/CCLF/CCLF-HDS/8KCCLFClaims"
    target_path = f"abfss://<workspace_name>@onelake.dfs.fabric.microsoft.com/<bronze_lakehouse_name>/Files/Ingest/Claims/CCLF/CCLF-HDS"
    
    files = mssparkutils.fs.ls(source_path)
    
    for file_info in files:
     if file_info.isFile:
      source_file_path = file_info.path
      file_name = source_file_path.split("/")[-1]  
      target_file_path = f"{target_path}/{file_name}"
      try:
       mssparkutils.fs.cp(source_file_path, target_file_path)
       print(f"Copied: {source_file_path} to {target_file_path}")
      except Exception as e:
       print(f"Error copying {source_file_path}: {e}")
    
  4. 运行笔记本。 示例索赔数据集现在移动到文件夹中的指定位置。

    显示 Ingest 文件夹中示例数据的屏幕截图。