了解 Azure AI 语言服务的预生成功能
Azure AI 语言服务提供各种功能来理解人类语言。 可以使用每项特征更好地与用户通信,更好地了解传入通信,或者使用多项特征以便更深入地了解用户所表达内容、意向和询问内容。
Azure AI 语言服务功能分为两类:预配置的功能和习得的功能。 学习到的特征需要生成和训练一个模型来正确预测适当的标签,本模块即将推出的单元将对此进行介绍。
本单元会介绍 Azure AI 语言服务的大部分功能,但请参考 Azure AI 语言服务文档获取完整列表,其中包括快速入门和所有可用内容的完整说明。
在应用中使用这些特征需要将查询发送到相应的终结点。 用于查询特定特征的终结点各不相同,但所有这些终结点都带有在 Azure 帐户中创建的 Azure AI 语言资源前缀,无论是生成 REST 请求,还是使用 SDK 定义客户端。 可以在下一个单元中找到每个示例。
预配置的功能
Azure AI 语言服务提供的部分功能不需要任何模型标记和训练。 创建资源后,可以发送数据并在应用中使用返回的结果。
以下功能都是预配置的。
汇总
摘要可用于文档和对话,可将文本汇总到关键句中,系统通过对关键句进行预测来概括输入的含义。
命名实体识别
命名实体识别可以提取和标识实体(如人员、地点或公司),使应用能够识别不同类型的实体,从而改进自然语言响应。 例如能从“The waterfront pier is my favorite Seattle attraction”中识别出“Seattle”,并将其分类为地点。
个人身份信息 (PII) 检测
使用 PII 检测,可以识别、分类和编辑可能被视为敏感信息的信息,例如电子邮件地址、家庭地址、IP 地址、姓名和受保护的运行状况信息。 例如,如果查询中包含文本“email@contoso.com”,则可以识别和修改整个电子邮件地址。
关键短语提取
关键短语提取是可快速从提供的文本中提取主要概念的功能。 例如,该服务能从“Text Analytics is one of the features in Azure AI Services.”中识别出“Azure AI Services”和“Text Analytics”。
情绪分析
情绪分析标识字符串或文档是正面还是负面的。 例如该服务能从“Great hotel. Close to plenty of food and attractions we could walk to”中识别出正面的结果,且具有相对较高的置信度分数。
语言检测
语言检测采用一个或多个文档,并识别每个文档的语言。 例如该服务能从其中一份“Bonjour”文档识别出法语的结果。
学习的功能
学习的功能要求你标记数据、训练和部署模型,使其可在应用程序中使用。 这些功能允许自定义预测或提取的信息。
注意
数据质量极大地影响模型的准确性。 请留意使用的数据、数据的标记情况以及训练数据的多样化程度。 有关详细信息,请参阅有关标记数据的建议,其中包括针对标记数据的宝贵指南。 另请参阅评估指标,可帮助你了解模型需要改进的地方。
对话语言理解 (CLU)
CLU 是 Azure AI 语言提供的核心自定义功能之一。 CLU 可帮助用户生成自定义自然语言理解模型来预测整体意向,并从传入言语中提取重要信息。 CLU 要求用户标记数据,以让其学习如何准确预测意向和实体。
本模块中的练习将生成 CLU 模型并在应用中使用它。
自定义命名实体识别
自定义实体识别采用自定义标记数据,并从非结构化文本中提取指定的实体。 例如,如果有需要从中提取当事人的各种合同文档,可以通过训练模型让模型知道如何进行预测。
自定义文本分类
使用自定义文本分类,用户可以将文本或文档分类为自定义组。 例如,可以训练模型来查看新闻文章,并确定这些信息的所述类别,例如“新闻”或“娱乐”。
问答
问题解答是一项在大多数情况下会预配的功能,可解答作为输入提供的问题。 回答这些问题的数据来自常见问题解答或手册等文档。
例如,假设你想要在公司网站上创建虚拟聊天助手来回答常见问题。 可以使用公司常见问题解答作为输入文档来创建问题和答案对。 部署后,聊天助手可以将输入问题传递给服务,并以结果形式获取解答。
若要查看功能的完整列表以及使用方法,请参阅 Azure AI 语言文档。