你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
FormPage 类
表示从输入文档识别的页面。 包含行、字词、选择标记、表和页面元数据。
版本 v2.1 中的新增功能: selection_marks 属性、 对to_dict 和 from_dict 方法的支持
- 继承
-
builtins.objectFormPage
构造函数
FormPage(**kwargs: Any)
方法
from_dict |
将 FormPage 形状中的 dict 转换为模型本身。 |
to_dict |
返回 FormPage 的 dict 表示形式。 |
from_dict
将 FormPage 形状中的 dict 转换为模型本身。
from_dict(data: Dict) -> FormPage
参数
返回
FormPage
返回类型
to_dict
属性
height
图像/PDF 的高度(以像素/英寸为单位)。
height: float
lines
当 include_field_elements 设置为 true 时,将返回已识别文本行的列表。 对于识别内容的调用,始终填充此列表。 返回的最大行数为每页 300 行。 这些行按从上到下、从左到右排序,但在某些情况下,邻近度以更高的优先级进行处理。 由于排序顺序取决于检测到的文本,因此它可能会在图像和 OCR 版本更新中更改。 因此,应基于实际行位置而不是订单构建业务逻辑。 行的读取顺序可由 reading_order 关键字 (keyword) 参数指定 (注意:reading_order仅在begin_recognize_content和begin_recognize_content_from_url) 中受支持。
lines: List[FormLine]
page_number
包含此内容的页面的从 1 开始的编号。
page_number: int
selection_marks
从页面中提取的选择标记的列表。
selection_marks: List[FormSelectionMark]
tables
页中包含的提取表的列表。
tables: List[FormTable]
text_angle
顺时针方向的文本的一般方向,以 (-180, 180 之间的度为单位。
text_angle: float
unit
宽度 LengthUnit 、高度和边界框属性使用的 。 对于图像,单位为“像素”。 对于 PDF,单位为“英寸”。
unit: str
width
图像/PDF 的宽度(以像素/英寸为单位)。
width: float