解释抽取式摘要

已完成

抽取式摘要直接从原始文本中提取基本句子来生成摘要。 它不生成新文本,而是使用自然语言处理技术来查找统一传达文档主要思想或上下文的句子。

抽取式摘要是使用 azure_ai 扩展的 azure_cognitive 架构中的 summarize_extractive() 函数实现的。 azure_cognitive 架构包含 summarize_extractive() 函数的三个重载。 三个函数重载所需的参数列表包括:

参数 类型 默认 说明
text texttext[] 要为其生成摘要的文本。
language_text texttext[] 语言代码(或语言代码数组)表示要汇总的文本的语言。 查看支持的语言列表以检索所需的语言代码。
sentence_count integer 3 要生成的摘要句子的数量。
sort_by text “偏移量” 生成的摘要句子的排序顺序。 可接受的值为“偏移量”和“排名”,其中偏移量表示原始内容中每个提取的句子的起始位置,排名是 AI 生成的指示句子与内容主要思想相关程度的指示器。
batch_size integer 25 仅适用于需要 text[] 输入的两个重载。 指定一次要处理的记录数。
disable_service_logs boolean false 用于指示是否关闭服务日志的标志。
timeout_ms integer Null 超时的毫秒数,超过该时间后操作将停止。
throw_on_error boolean 指示函数是否应在出错时引发异常,从而导致包装事务回滚的标志。
max_attempts integer 1 在发生故障时尝试重新调用 Azure AI 服务的次数。
retry_delay_ms integer 1000 尝试重新调用 Azure AI 服务终结点之前等待的时间(以毫秒为单位)。

每个函数使用 azure_cognitive.sentence 复合类型返回一组提取的句子以及每个句子的排名分数,如下表所示:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

azure_cognitive.sentence 是一种复合类型,其中包含提取句子的文本和每个句子的排名分数。 排名分数是 0 到 1(包括 0 和 1)之间的值,表示句子与原始文档主要思想的相关程度。 文档摘要对提取的句子进行排名,可以使用函数的 sort_by 参数确定这些句子是按出现的顺序返回还是根据其排名返回。

为属性描述生成抽取式摘要

作为 Margie's Travel 的开发人员,你想要评估可通过 azure_ai 扩展和 Azure AI 服务访问的抽取式摘要技术,并评估该方法为冗长的属性描述生成简洁的自然语言摘要的功能,例如,数据库中第一个列表中的以下描述:

“这套位于安妮女王山西侧中心地带的精致一居室公寓,有种宾至如归的感觉。 这间装修典雅的私人公寓(复式套房的第一层单元)采用开放式楼面结构,铺设了竹地板,配备了设施齐全的厨房、电视机、DVD 播放机、基本的有线电视,以及带大号床的舒适卧室。 该单元最多可容纳 4 人入住(卧室可住两人,舒适的折叠沙发上可睡两人,含亚麻织物),并提供免费 Wi-Fi 和洗衣服务。 公寓外面有一个私人露台,其上配有烧烤架,可以俯瞰花园和黑竹林。 公寓位置优越,距离公交线路仅距一个街区,搭乘公交车可在 15 分钟内抵达西雅图市中心,10 分钟内可抵达巴拉德历史古迹。 步行五分钟即可抵达天然食品杂货店和咖啡店。 步行十五分钟可抵达安妮女王山顶,那里有各种不拘一格的店铺、酒吧和餐馆。”

使用以下查询请求上述酒店描述的两句话摘要:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

抽取式摘要返回原始文本中得分最高的两个句子,以及每个句子的排名得分:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}