你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

FormWord 类

表示从输入文档中识别的单词。

v2.1 版中的新增功能:支持 to_dictfrom_dict 方法

继承
azure.ai.formrecognizer._models.FormElement
FormWord

构造函数

FormWord(**kwargs: Any)

方法

from_dict

将 FormWord 形状的 dict 转换为模型本身。

to_dict

返回 FormWord 的 dict 表示形式。

from_dict

将 FormWord 形状的 dict 转换为模型本身。

from_dict(data: Dict) -> FormWord

参数

data
dict
必需

FormWord 形状的字典。

返回

FormWord

返回类型

to_dict

返回 FormWord 的 dict 表示形式。

to_dict() -> Dict

返回

dict

返回类型

属性

bounding_box

一个包含 4 个点的列表,表示四边边界框,该框概述了文本。 这些点按顺时针顺序列出:左上、右上、右下、左下。 图像单位以像素为单位,PDF 单位以英寸为单位。

bounding_box: List[Point]

confidence

度量识别结果的确定性程度。 值介于 [0.0, 1.0] 之间。

confidence: float

kind

对于 FormWord,这是“word”。

kind: str

page_number

包含此内容的页面的从 1 开始的编号。

page_number: int

text

单词的文本内容。

text: str