FormPage クラス
入力ドキュメントから認識されるページを表します。 行、単語、選択マーク、テーブル、およびページ メタデータが含まれます。
バージョン v2.1 の新機能: selection_marks プロパティ、 to_dict メソッドと from_dict メソッドのサポート
- 継承
-
builtins.objectFormPage
コンストラクター
FormPage(**kwargs: Any)
メソッド
from_dict |
FormPage の図形のディクテーションをモデル自体に変換します。 |
to_dict |
FormPage の dict 表現を返します。 |
from_dict
FormPage の図形のディクテーションをモデル自体に変換します。
from_dict(data: Dict) -> FormPage
パラメーター
戻り値
FormPage
の戻り値の型 :
to_dict
属性
height
画像/PDF の高さ (ピクセル/インチ単位)。
height: float
lines
include_field_elementsが true に設定されている場合は、認識されたテキスト行の一覧が返されます。 コンテンツを認識する呼び出しの場合、このリストは常に設定されます。 返される行の最大数は 1 ページあたり 300 行です。 行は上から下、左から右に並べ替えられますが、場合によっては近接性が高い優先順位で処理されます。 並べ替え順序は、検出されたテキストによって異なるため、イメージ間で変更され、OCR バージョンが更新される可能性があります。 したがって、ビジネス ロジックは、順序ではなく実際の行の場所に基づいて構築する必要があります。 行の読み取り順序は、reading_order キーワード (keyword) 引数で指定できます (注: reading_orderbegin_recognize_contentとbegin_recognize_content_from_urlでのみサポートされます)。
lines: List[FormLine]
page_number
このコンテンツが存在するページの 1 から始まる番号。
page_number: int
selection_marks
ページから抽出された選択マークの一覧。
selection_marks: List[FormSelectionMark]
tables
ページに含まれる抽出されたテーブルの一覧。
tables: List[FormTable]
text_angle
時計回りの方向のテキストの一般的な向き(-180,180]の間の角度で測定されます。
text_angle: float
unit
LengthUnit幅、高さ、および境界ボックスのプロパティで使用される 。 画像の場合、単位は "ピクセル" です。 PDF の場合、単位は "inch" です。
unit: str
width
画像/PDF の幅をピクセル/インチ単位で指定します。
width: float
Azure SDK for Python