你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是健康状况自定义文本分析?

注意

运行状况自定义文本分析(预览版)将于 2025 年 1 月 10 日停用,请迁移到其他自定义模型训练服务,例如 Azure AI 语言中的自定义命名实体识别。 从现在到 2025 年 1 月 10 日,可以在现有项目中继续使用自定义文本分析(预览版),而不会中断。 你无法创建新项目。 在 2025 年 1 月 10 日,在运行状况自定义文本分析上运行的工作负荷(预览版)将被删除,关联的项目数据将丢失。

自定义健康状况文本分析是 Azure AI 语言提供的自定义功能之一。 它是一种基于云的 API 服务,应用机器学习智能,使你能够基于健康状况文本分析生成用于自定义医疗保健实体识别任务的自定义模型。

健康状况自定义文本分析使用户能够生成自定义 AI 模型,以从非结构化文本(如临床笔记和报表)中提取特定于医疗保健的实体。 通过创建健康状况自定义文本分析项目,开发人员可以在提供模型供他人使用之前,以迭代方式定义新词汇、标记数据、训练、评估和改进模型性能。 已标记数据的质量会极大地影响模型性能。 为了简化生成和自定义模型,该服务提供了一个 Web 门户,可通过 Language Studio 访问该门户。 可以按照此快速入门中的步骤轻松开始使用该服务。

本文档包含以下文章类型:

  • 快速入门介绍了入门说明,指导你完成服务请求的创建。
  • 概念对服务的功能和特性进行了深入说明。
  • 操作指南包含以更具体的方式或自定义方式使用服务的说明。

使用方案示例

与健康状况文本分析类似,健康状况自定义文本分析可用于各种医疗保健行业的多个方案。 但是,此功能的主要用途是基于健康状况文本分析提供自定义层,以扩展其现有的实体映射。

项目开发生命周期

使用健康状况自定义文本分析通常包含几个不同的步骤。

显示使用自定义模型条件下的项目开发生命周期的示意图。

  • 定义架构:了解你的数据并定义要基于现有的健康状况文本分析实体映射提取的新实体。 避免歧义。

  • 标记数据:标记数据是确定模型性能的关键因素。 准确、一致、完整地标记。

    • 精确标记:始终将每个实体标记为正确的类型。 仅包含要提取的内容,避免标签中出现不必要的数据。
    • 一致标记:同一实体在所有文件中都应具有相同的标签。
    • 完全标记:标记所有文件中实体的所有实例。
  • 训练模型:模型始于从已标记数据进行学习。

  • 查看模型性能:完成训练后,查看模型的评估详细信息及其性能和改进方式指南。

  • 部署模型:部署模型后,可通过 API 使用它。

  • 提取实体:对实体提取任务使用自定义模型。

参考文档和代码示例

使用自定义健康状况文本分析时,请参阅针对 Azure AI 语言的以下参考文档:

API 参考文档
REST API(创作) REST API 文档
REST API(运行时) REST API 文档

负责任的 AI

AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 阅读健康状况文本分析的透明度说明,了解如何在系统中负责任地使用和部署 AI。 有关详细信息,还可以参阅以下文章:

后续步骤

  • 使用快速入门文章开始使用健康状况自定义文本分析。

  • 在完成项目开发生命周期时,请查看术语表,详细了解整个文档中使用的有关此功能的术语。

  • 请记得查看服务限制,以了解区域可用性等信息。