你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是去识别化服务(预览版)?

Azure Health Data Services 中的去识别化服务(预览版)使医疗保健组织能够匿名化临床数据,以便生成的数据保持其临床相关性和分布,同时遵守 1996 年的 Health Insurance Portability and Accountability Act (HIPAA) 隐私规则。 该服务使用最先进的机器学习模型,从临床记录、转录、消息或临床试验研究等非结构化文本中自动提取、编辑或替代 28 个实体,包括 HIPAA 的 18 个受保护健康信息 (PHI) 标识符。

在研究、分析和机器学习中使用已去识别化的数据

去识别化服务(预览版)解锁了以前难以去识别化的数据,因此组织可以进行研究并通过分析获得见解。 去识别化服务支持三个操作:标记、编辑或替代 PHI。 去识别化服务提供了许多好处,包括:

  • 替代:替代或替换是用于保护 PHI 的最佳做法。 该服务可以用合理的替换值替换 PHI 元素,从而得到最能代表源数据的数据。 替代加强了隐私保护,因为任何假阴性 PHI 值在文档中都会被隐藏。

  • 一致的替换:一致的替换结果使组织能够保留底层数据集中发生的关系,这对研究、分析和机器学习至关重要。 通过在同一批中提交数据,我们的服务允许跨实体进行一致的替换,并保留事件之间的相对时间关系。

  • 扩大了 PHI 覆盖范围:该服务扩展到 18 个 HIPAA 标识符之外,以提供更强的隐私保护和实体类型之间更精细的区分,例如区分医生和患者。

安全有效地将临床数据去识别化

去识别化服务(预览版)提供了许多好处,包括:

  • PHI 合规性:去识别化服务是为受保护的健康信息 (PHI) 而设计的。 该服务使用机器学习通过“标记”操作来识别 PHI 实体,包括 HIPAA 的 18 个标识符。 编辑和替代操作将识别出的这些 PHI 值替换为实体类型的标记、替代值或假名。 该服务还满足所有区域合规性要求,包括 HIPAA、GDPR 和《加州消费者隐私法》(CCPA)。

  • 安全:去识别化服务是无状态服务。 客户数据保留在客户的租户中。

  • 基于角色的访问控制 (RBAC):使用 Azure 基于角色的访问控制 (RBAC),可以管理组织数据的处理、存储和访问方式。 你可以根据你为环境定义的角色决定谁有权访问去识别化数据集。

同步或异步终结点

去识别化服务(预览版)提供了两种方法来与 REST API 或客户端库 (Azure SDK) 进行交互。

  • 直接提交原始非结构化文本进行分析。 API 输出在应用程序中返回。
  • 将作业提交到异步终结点,以批量处理来自 Azure Blob 存储的文件,并在作业中一致地使用标记、编辑或替代。

输入要求和服务限制

去识别化服务(预览版)设计为接收非结构化文本。 要将 FHIR® 服务中存储的数据去识别化,请参阅“导出已去识别化的数据”

预览版中存在以下服务限制:

  • 请求不能超过 50 KB。
  • 作业处理的文档数不能超过 1,000 个。
  • 作业处理的每个文档不能超过 2 MB。

定价

与其他 Azure Health Data Services 一样,你只需为使用的功能付费。 你有一个每月配额,这使你可以免费试用该产品。

转换操作(每 MB) 最多 50 MB 超过 50 MB
非结构化文本去识别化 $0 $0.05

当你选择在 Azure Blob 存储中存储文档时,会根据 Azure 存储定价会你收费。

负责使用 AI

AI 系统包括技术、使用它的人员、受它影响的人员以及部署它的环境。 阅读有关去识别化服务(预览版)的透明度说明,了解如何在系统中负责任地使用和部署 AI。

后续步骤