FormPage クラス

リファレンス

入力ドキュメントから認識されるページを表します。行、単語、選択マーク、テーブル、およびページメタデータが含まれます。

バージョン v2.1 の新機能: selection_marks プロパティ、 to_dict メソッドと from_dict メソッドのサポート

継承: builtins.object

FormPage

コンストラクター

FormPage(**kwargs: Any)

メソッド

from_dict	FormPage の図形のディクテーションをモデル自体に変換します。
to_dict	FormPage の dict 表現を返します。

from_dict

FormPage の図形のディクテーションをモデル自体に変換します。

from_dict(data: Dict) -> FormPage

パラメーター

data: dict

必須

FormPage の図形のディクショナリ。

戻り値

FormPage

の戻り値の型 :

FormPage

to_dict

FormPage の dict 表現を返します。

to_dict() -> Dict

戻り値

dict

の戻り値の型 :

dict

属性

height

画像/PDF の高さ (ピクセル/インチ単位)。

height: float

lines

include_field_elementsが true に設定されている場合は、認識されたテキスト行の一覧が返されます。コンテンツを認識する呼び出しの場合、このリストは常に設定されます。返される行の最大数は 1 ページあたり 300 行です。行は上から下、左から右に並べ替えられますが、場合によっては近接性が高い優先順位で処理されます。並べ替え順序は、検出されたテキストによって異なるため、イメージ間で変更され、OCR バージョンが更新される可能性があります。したがって、ビジネスロジックは、順序ではなく実際の行の場所に基づいて構築する必要があります。行の読み取り順序は、reading_order キーワード (keyword) 引数で指定できます (注: reading_orderbegin_recognize_contentとbegin_recognize_content_from_urlでのみサポートされます)。

lines: List[FormLine]

page_number

このコンテンツが存在するページの 1 から始まる番号。

page_number: int

selection_marks

ページから抽出された選択マークの一覧。

selection_marks: List[FormSelectionMark]

tables

ページに含まれる抽出されたテーブルの一覧。

tables: List[FormTable]

text_angle

時計回りの方向のテキストの一般的な向き(-180,180]の間の角度で測定されます。

text_angle: float

unit

LengthUnit幅、高さ、および境界ボックスのプロパティで使用される。画像の場合、単位は "ピクセル" です。 PDF の場合、単位は "inch" です。

unit: str

width

画像/PDF の幅をピクセル/インチ単位で指定します。

width: float

次の方法で共有

FormPage クラス

コンストラクター

メソッド

from_dict

パラメーター

戻り値

の戻り値の型 :

to_dict

戻り値

の戻り値の型 :

属性

height

lines

page_number

selection_marks

tables

text_angle

unit

width

その他のリソース