你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Analyzer - Get Analyze Receipt Result
跟踪进度并获取分析回执操作的结果。
GET {endpoint}/formrecognizer/v2.1/prebuilt/receipt/analyzeResults/{resultId}
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
endpoint
|
path | True |
string |
支持的认知服务终结点 (协议和主机名,例如: https://westus2.api.cognitive.microsoft.com) 。 |
result
|
path | True |
string uuid |
分析操作结果标识符。 |
请求头
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
响应
名称 | 类型 | 说明 |
---|---|---|
200 OK |
成功 |
|
Other Status Codes |
附带非成功响应的响应实体,其中包含有关错误的其他详细信息。 |
安全性
Ocp-Apim-Subscription-Key
类型:
apiKey
在:
header
示例
Get analyze receipt result
示例请求
GET {endpoint}/formrecognizer/v2.1/prebuilt/receipt/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f
示例响应
{
"status": "running",
"createdDateTime": "2019-05-01T10:53:21Z",
"lastUpdatedDateTime": "2019-05-01T10:53:23Z",
"analyzeResult": {
"version": "v2.1",
"readResults": [],
"pageResults": [],
"documentResults": [],
"errors": []
}
}
定义
名称 | 说明 |
---|---|
Analyze |
排队分析操作的状态和结果。 |
Analyze |
分析操作结果。 |
Appearance |
表示文本行外观的 对象。 |
Data |
有关页面中包含的提取表的信息。 |
Data |
有关表中提取的单元格的信息。 |
Document |
与输入文档对应的一组提取字段。 |
Error |
|
Error |
|
Field |
识别的字段值。 |
Field |
字段值的语义数据类型。 |
Key |
有关键值对中提取的键或值的信息。 |
Key |
有关提取的键值对的信息。 |
Key |
键值元素的语义数据类型。 |
Length |
宽度、高度和 boundingBox 属性使用的单位。 对于图像,单位为“像素”。 对于 PDF,单位为“英寸”。 |
Operation |
排队操作的状态。 |
Page |
从单个页面提取的信息。 |
Read |
从输入文档中的页面提取的文本。 |
Selection |
有关提取的选择标记的信息。 |
Style |
一个对象,表示文本行的样式。 |
Text |
表示提取的文本行的 对象。 |
Text |
文本线条样式名称,包括手写和其他。 |
Text |
表示单词的 对象。 |
AnalyzeOperationResult
排队分析操作的状态和结果。
名称 | 类型 | 说明 |
---|---|---|
analyzeResult |
分析操作的结果。 |
|
createdDateTime |
string |
提交分析操作时 (UTC) 日期和时间。 |
lastUpdatedDateTime |
string |
上次更新状态时 (UTC) 日期和时间。 |
status |
操作状态。 |
AnalyzeResult
分析操作结果。
名称 | 类型 | 说明 |
---|---|---|
documentResults |
从输入中提取的文档级信息。 |
|
errors |
分析操作期间报告的错误列表。 |
|
pageResults |
从输入中提取的页面级信息。 |
|
readResults |
从输入中提取的文本。 |
|
version |
string |
用于此结果的架构版本。 |
Appearance
表示文本行外观的 对象。
名称 | 类型 | 说明 |
---|---|---|
style |
表示文本行样式的 对象。 |
DataTable
有关页面中包含的提取表的信息。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
number[] |
表的边界框。 |
cells |
表中包含的单元格列表。 |
|
columns |
integer |
列数。 |
rows |
integer |
行数。 |
DataTableCell
有关表中提取的单元格的信息。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
boundingBox |
number[] |
单元格的边界框。 |
|
columnIndex |
integer |
单元格的列索引。 |
|
columnSpan |
integer |
1 |
此单元格跨越的列数。 |
confidence |
number |
置信度值。 |
|
elements |
string[] |
当 includeTextDetails 设置为 true 时,表示对构成此表单元格的文本元素的引用列表。 |
|
isFooter |
boolean |
False |
当前单元格是否为页脚单元格? |
isHeader |
boolean |
False |
当前单元格是标题单元格吗? |
rowIndex |
integer |
单元格的行索引。 |
|
rowSpan |
integer |
1 |
此单元格跨越的行数。 |
text |
string |
单元格的文本内容。 |
DocumentResult
与输入文档对应的一组提取字段。
名称 | 类型 | 说明 |
---|---|---|
docType |
string |
文档类型。 |
docTypeConfidence |
number |
预测的文档类型置信度。 |
fields |
<string,
Field |
命名字段值的字典。 |
modelId |
string |
模型标识符。 |
pageRange |
integer[] |
找到文档的第一页和最后一页。 |
ErrorInformation
名称 | 类型 | 说明 |
---|---|---|
code |
string |
|
message |
string |
ErrorResponse
名称 | 类型 | 说明 |
---|---|---|
error |
FieldValue
识别的字段值。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
number[] |
字段值的边界框(如果适用)。 |
confidence |
number |
置信度分数。 |
elements |
string[] |
当 includeTextDetails 设置为 true 时,表示对构成此字段的文本元素的引用列表。 |
page |
integer |
输入文档中从 1 开始的页码。 |
text |
string |
提取的字段的文本内容。 |
type |
字段值的类型。 |
|
valueArray |
字段值的数组。 |
|
valueCountryRegion |
string |
3 字母国家/地区代码 (ISO 3166-1 alpha-3) 。 |
valueDate |
string |
日期值。 |
valueInteger |
integer |
整数值。 |
valueNumber |
number |
浮点值。 |
valueObject |
<string,
Field |
命名字段值的字典。 |
valuePhoneNumber |
string |
电话号码值。 |
valueSelectionMark |
enum:
|
选择标记值。 |
valueString |
string |
字符串值。 |
valueTime |
string |
时间值。 |
FieldValueType
字段值的语义数据类型。
名称 | 类型 | 说明 |
---|---|---|
array |
string |
|
countryRegion |
string |
|
date |
string |
|
integer |
string |
|
number |
string |
|
object |
string |
|
phoneNumber |
string |
|
selectionMark |
string |
|
string |
string |
|
time |
string |
KeyValueElement
有关键值对中提取的键或值的信息。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
number[] |
键或值的边界框。 |
elements |
string[] |
如果 includeTextDetails 设置为 true,则表示对构成此键或值的文本元素的引用列表。 |
text |
string |
键或值的文本内容。 |
type |
键值元素的语义数据类型。 |
KeyValuePair
有关提取的键值对的信息。
名称 | 类型 | 说明 |
---|---|---|
confidence |
number |
置信度值。 |
key |
有关键值对中提取的键的信息。 |
|
label |
string |
键/值对条目的用户定义标签。 |
value |
有关键值对中提取的值的信息。 |
KeyValueType
键值元素的语义数据类型。
名称 | 类型 | 说明 |
---|---|---|
selectionMark |
string |
|
string |
string |
LengthUnit
宽度、高度和 boundingBox 属性使用的单位。 对于图像,单位为“像素”。 对于 PDF,单位为“英寸”。
名称 | 类型 | 说明 |
---|---|---|
inch |
string |
|
pixel |
string |
OperationStatus
排队操作的状态。
名称 | 类型 | 说明 |
---|---|---|
failed |
string |
|
notStarted |
string |
|
running |
string |
|
succeeded |
string |
PageResult
从单个页面提取的信息。
名称 | 类型 | 说明 |
---|---|---|
clusterId |
integer |
群集标识符。 |
keyValuePairs |
从页面中提取的键值对列表。 |
|
page |
integer |
页码。 |
tables |
从页面提取的数据表列表。 |
ReadResult
从输入文档中的页面提取的文本。
名称 | 类型 | 说明 |
---|---|---|
angle |
number |
顺时针方向文本的一般方向,以 (-180, 180 之间的度为单位度量。 |
height |
number |
图像/PDF 的高度(以像素/英寸为单位)。 |
lines |
Text |
当 includeTextDetails 设置为 true 时,会列出已识别的文本行。 返回的最大行数为每页 300 行。 这些行按从上到下、从左到右进行排序,但在某些情况下,以更高的优先级处理邻近度。 由于排序顺序取决于检测到的文本,因此它可能会因图像和 OCR 版本更新而更改。 因此,业务逻辑应基于实际行位置而不是顺序构建。 |
page |
integer |
输入文档中从 1 开始的页码。 |
selectionMarks |
从页面中提取的选择标记的列表。 |
|
unit |
宽度、高度和 boundingBox 属性使用的单位。 对于图像,单位为“像素”。 对于 PDF,单位为“英寸”。 |
|
width |
number |
图像/PDF 的宽度(以像素/英寸为单位)。 |
SelectionMark
有关提取的选择标记的信息。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
number[] |
选择标记的边界框。 |
confidence |
number |
置信度值。 |
state |
enum:
|
选择标记的状态。 |
Style
一个对象,表示文本行的样式。
名称 | 类型 | 说明 |
---|---|---|
confidence |
number |
文本线条样式的置信度。 |
name |
文本线条样式名称,包括手写和其他。 |
TextLine
表示提取的文本行的 对象。
名称 | 类型 | 说明 |
---|---|---|
appearance |
文本外观属性。 |
|
boundingBox |
number[] |
提取行的边界框。 |
text |
string |
行的文本内容。 |
words |
Text |
文本行中的单词列表。 |
TextStyle
文本线条样式名称,包括手写和其他。
名称 | 类型 | 说明 |
---|---|---|
handwriting |
string |
|
other |
string |
TextWord
表示单词的 对象。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
number[] |
提取的单词的边界框。 |
confidence |
number |
置信度值。 |
text |
string |
单词的文本内容。 |