你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
RecognizeContentOptions 类
- java.
lang. Object - com.
azure. ai. formrecognizer. models. RecognizeContentOptions
- com.
public final class RecognizeContentOptions
在 表单识别器 客户端上使用识别内容 API 时可能传递的选项。
构造函数摘要
构造函数 | 说明 |
---|---|
RecognizeContentOptions() |
创建 |
方法摘要
修饰符和类型 | 方法和描述 |
---|---|
Form |
getContentType()
获取窗体的类型。 |
Form |
getLanguage()
获取文档中文本的 BCP-47 语言代码。 |
List<String> |
getPages()
(PDF/TIFF) 获取多页文档的自定义页码。 |
Duration |
getPollInterval()
获取每次轮询操作状态之间的持续时间。 |
Form |
getReadingOrder()
获取已识别文本行的返回顺序。 |
Recognize |
setContentType(FormContentType contentType)
设置窗体的类型。 |
Recognize |
setLanguage(FormRecognizerLanguage language)
设置文档中文本的 BCP-47 语言代码。 |
Recognize |
setPages(List<String> pages)
(PDF/TIFF) 设置多页文档的自定义页码。 |
Recognize |
setPollInterval(Duration pollInterval)
设置每次轮询操作状态之间的持续时间。 |
Recognize |
setReadingOrder(FormReadingOrder readingOrder)
指定已识别文本行的返回顺序。 |
方法继承自 java.lang.Object
构造函数详细信息
RecognizeContentOptions
public RecognizeContentOptions()
创建 RecognizeContentOptions
对象。
方法详细信息
getContentType
public FormContentType getContentType()
获取窗体的类型。 支持的媒体类型,包括 .pdf、.jpg、.png 或 .tiff 类型文件流。
Returns:
contentType
值。getLanguage
public FormRecognizerLanguage getLanguage()
获取文档中文本的 BCP-47 语言代码。 请参阅此处支持的语言代码。
Returns:
getPages
public List
(PDF/TIFF) 获取多页文档的自定义页码。 输入要获取其识别结果的页数。
对于页面范围,请使用连字符,例如 [“1-3”]。 用逗号分隔每个页面或页面范围,例如 [“1-3”, 4]。
Returns:
getPollInterval
public Duration getPollInterval()
获取每次轮询操作状态之间的持续时间。 如果未指定,则使用默认值 5 秒。
Returns:
pollInterval
值。getReadingOrder
public FormReadingOrder getReadingOrder()
获取已识别文本行的返回顺序。
Returns:
setContentType
public RecognizeContentOptions setContentType(FormContentType contentType)
设置窗体的类型。 支持的媒体类型,包括 .pdf、.jpg、.png 或 .tiff 类型文件流。
Parameters:
Returns:
RecognizeContentOptions
的值。setLanguage
public RecognizeContentOptions setLanguage(FormRecognizerLanguage language)
设置文档中文本的 BCP-47 语言代码。 请参阅此处支持的语言代码。
Parameters:
Returns:
RecognizeContentOptions
的值。setPages
public RecognizeContentOptions setPages(List
(PDF/TIFF) 设置多页文档的自定义页码。 输入要获取其识别结果的页数。
对于页面范围,请使用连字符,例如 [“1-3”]。 用逗号分隔每个页面或页面范围,例如 [“1-3”, 4]。
Parameters:
Returns:
RecognizeContentOptions
的值。setPollInterval
public RecognizeContentOptions setPollInterval(Duration pollInterval)
设置每次轮询操作状态之间的持续时间。 如果未指定,则使用默认值 5 秒。
Parameters:
Returns:
RecognizeContentOptions
的值。setReadingOrder
public RecognizeContentOptions setReadingOrder(FormReadingOrder readingOrder)
指定已识别文本行的返回顺序。 由于排序顺序取决于检测到的文本,因此它可能会因图像和 OCR 版本更新而更改。 因此,业务逻辑应基于实际行位置而不是顺序构建。
Parameters:
Returns:
RecognizeContentOptions
的值。