你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

RecognizeContentOptions 类

  • java.lang.Object
    • com.azure.ai.formrecognizer.models.RecognizeContentOptions

public final class RecognizeContentOptions

在 表单识别器 客户端上使用识别内容 API 时可能传递的选项。

构造函数摘要

构造函数 说明
RecognizeContentOptions()

创建 RecognizeContentOptions 对象。

方法摘要

修饰符和类型 方法和描述
FormContentType getContentType()

获取窗体的类型。

FormRecognizerLanguage getLanguage()

获取文档中文本的 BCP-47 语言代码。

List<String> getPages()

(PDF/TIFF) 获取多页文档的自定义页码。

Duration getPollInterval()

获取每次轮询操作状态之间的持续时间。

FormReadingOrder getReadingOrder()

获取已识别文本行的返回顺序。

RecognizeContentOptions setContentType(FormContentType contentType)

设置窗体的类型。

RecognizeContentOptions setLanguage(FormRecognizerLanguage language)

设置文档中文本的 BCP-47 语言代码。

RecognizeContentOptions setPages(List<String> pages)

(PDF/TIFF) 设置多页文档的自定义页码。

RecognizeContentOptions setPollInterval(Duration pollInterval)

设置每次轮询操作状态之间的持续时间。

RecognizeContentOptions setReadingOrder(FormReadingOrder readingOrder)

指定已识别文本行的返回顺序。

方法继承自 java.lang.Object

构造函数详细信息

RecognizeContentOptions

public RecognizeContentOptions()

创建 RecognizeContentOptions 对象。

方法详细信息

getContentType

public FormContentType getContentType()

获取窗体的类型。 支持的媒体类型,包括 .pdf、.jpg、.png 或 .tiff 类型文件流。

Returns:

contentType值。

getLanguage

public FormRecognizerLanguage getLanguage()

获取文档中文本的 BCP-47 语言代码。 请参阅此处支持的语言代码。

Returns:

文档中文本的语言代码。

getPages

public List getPages()

(PDF/TIFF) 获取多页文档的自定义页码。 输入要获取其识别结果的页数。

对于页面范围,请使用连字符,例如 [“1-3”]。 用逗号分隔每个页面或页面范围,例如 [“1-3”, 4]。

Returns:

多页文档的自定义页码列表。

getPollInterval

public Duration getPollInterval()

获取每次轮询操作状态之间的持续时间。 如果未指定,则使用默认值 5 秒。

Returns:

pollInterval值。

getReadingOrder

public FormReadingOrder getReadingOrder()

获取已识别文本行的返回顺序。

Returns:

识别行的返回顺序。

setContentType

public RecognizeContentOptions setContentType(FormContentType contentType)

设置窗体的类型。 支持的媒体类型,包括 .pdf、.jpg、.png 或 .tiff 类型文件流。

Parameters:

contentType - 提供的表单内容类型。

Returns:

更新 RecognizeContentOptions 的值。

setLanguage

public RecognizeContentOptions setLanguage(FormRecognizerLanguage language)

设置文档中文本的 BCP-47 语言代码。 请参阅此处支持的语言代码。

Parameters:

language - 要设置的语言代码值。

Returns:

更新 RecognizeContentOptions 的值。

setPages

public RecognizeContentOptions setPages(List pages)

(PDF/TIFF) 设置多页文档的自定义页码。 输入要获取其识别结果的页数。

对于页面范围,请使用连字符,例如 [“1-3”]。 用逗号分隔每个页面或页面范围,例如 [“1-3”, 4]。

Parameters:

pages - 要设置的自定义页码值。

Returns:

更新 RecognizeContentOptions 的值。

setPollInterval

public RecognizeContentOptions setPollInterval(Duration pollInterval)

设置每次轮询操作状态之间的持续时间。 如果未指定,则使用默认值 5 秒。

Parameters:

pollInterval - 每次轮询操作状态之间要指定的持续时间。

Returns:

更新 RecognizeContentOptions 的值。

setReadingOrder

public RecognizeContentOptions setReadingOrder(FormReadingOrder readingOrder)

指定已识别文本行的返回顺序。 由于排序顺序取决于检测到的文本,因此它可能会因图像和 OCR 版本更新而更改。 因此,业务逻辑应基于实际行位置而不是顺序构建。

Parameters:

readingOrder - 顺序指定返回的文本行

Returns:

更新 RecognizeContentOptions 的值。

适用于