テキスト認識事前構築済みモデル

[アーティクル]
12/09/2024

テキスト認識事前構築済みモデルを使用すると、ドキュメントや画像から、コンピューターで読み取り可能な文字ストリームに単語を抽出できます。そこでは、画像内の印刷されたテキストと手書きのテキストを検出するために、最新の光学式文字認識 (OCR) が使用されています。

このモデルでは、画像やドキュメントファイルが処理され、印刷されたテキストや手書きのテキストの行が抽出されます。

Power Apps で使用する

テキスト認識の事前構築済みモデルは、Power Apps でテキスト認識エンジンコンポーネントを使用することで利用できます。詳細:Power Apps でテキスト認識エンジンコンポーネントを使用する

Power Automate で使用する

Power Automate でのこのモデルの使用方法については、Power Automate でテキスト認識の事前構築済みモデルを使用するを参照してください。

サポートされている言語、形式、サイズ

テキスト認識モデルを使用してスキャンできるファイルは、次の特性が必要です:

印刷テキストの言語: アフリカーンス語、アルバニア語、アンギカ語 (デヴァナギリ語)、アラビア語、アストゥリアス語、アワディヒンディー語 (デヴァナギリ語)、アゼルバイジャン語 (ラテン語)、バゲリ語、バスク語、ベラルーシ語 (キリル語)、ベラルーシ語 (ラテン語)、ボージュプリヒンディー語 (デーヴァナギリ語)、ビスラマ語、ボードー(デバナギリ語)、ボスニア語 (ラテン語)、ブラジバ語、ブルトン語、ブルガリア語、ブンデリ語、ブリヤート語 (キリル語)、カタロニア語、セブアノ語、チャムリン語、チャモロ語、チャッティースガルヒ語 (デバナギリ語)、中国語 (簡体字)、中国語 (繁体字)、コーンウォール語、コルシカ語、クリミア語タタール語（ラテン語）、クロアチア語、チェコ語、デンマーク語、ダリ語、Dhimal (デヴァナギリ)、Dogri (デヴァナギリ)、オランダ語、英語、Erzya (キリル)、エストニア語、フェロー語、フィジー語、フィリピン語、フィンランド語、フランス語、フリウリ語、ガガウズ語 (ラテン語)、ガリシア語、ドイツ語、ギルベルタ語、ゴンディ語 (デヴァナギリ)、グリーンランド語、グルン語 (デヴァナギリ)、ハイチクレオール語、ハルビ (デヴァナギリ)、ハニ語、ハリヤンビ語、ハワイ語、ヒンディー語、モンドー（ラテン語）、ホー語（デヴァナギリ語）、ハンガリー語、アイスランド語、イナリ・サーミ語、インドネシア語、インターリングア、イヌクティトゥット語（ラテン語）、アイルランド語、イタリア語、日本語、ジャウンサリ語（デヴァナギリ語）、ジャワ語、カブベルディヌ語、カチン語（ラテン語）、カングリ語（デヴァナギリ語）、カラチャイ・バルカル語、カラ・カルパク (キリル文字)、カラ・カルパク (ラテン語)、カシュブ語、カザフ語 (キリル文字)、カザフ語 (ラテン語)、カーリン語、カーシ語、キチェ語、韓国語、コルク語、コリャク語、コスラ語、クムク語 (キリル語)、クルド語 (アラビア語)、クルド語 (ラテン語)、クルク語 (デヴァナギリ語)、キルギス語 (キリル語)、ラコタ語、ラテン語、リトアニア語、低ソルブ語、ルレサーミ語、ルクセンブルク語、マハスパハリ語 (デヴァナギリ語)、マレー語 (ラテン)、マルタ語、マルト語(デバナギリ語)、マンクス語、マオリ語、マラーティー語、モンゴル語 (キリル語)、モンテネグリン語 (キリル語)、モンテネグリン語 (ラテン語)、ナポリ語、ネパール語、ニウエ語、ノガイ語、北サーミ語 (ラテン語)、ノルウェー語、オック語、オセト語、パシュトゥー語、ペルシア語、ポーランド語、ポルトガル語、パンジャブ語 (アラビア語)、リプア語、ルーマニア語、ロマンシュ語、ロシア語、サドリ語（デヴァナギリ語）、サモア語（ラテン語）、サンスクリット語(デーバナーガリー語)、サンタリ語 (デーバナーガリー語)、スコットランド語、スコットランド・ゲール語、セルビア語 (ラテン語)、シェルパ語 (デーバナーガリー語)、シルマウリ語 (デーバナーガリー語)、スコルト・サーミ語、スロバキア語、スロベニア語、ソマリ語 (アラビア語)、南サーミ語、スペイン語、スワヒリ語 (ラテン語)、スウェーデン語、タジク語（キリル文字）、タタール語（ラテン文字）、テトゥン語、タンミ語、トンガ語、トルコ語、トルクメン語（ラテン文字）、トゥバ語、上ソルビア語、ウルドゥー語、ウイグル語（アラビア文字）、ウズベク語（アラビア文字）、ウズベク語（キリル文字）、ウズベク語（ラテン語）、ヴォラピュク語、ヴァルザー語、ウェールズ語、西フリジア語、ユカテク語、マヤ語、チワン語、ズールー語
手書きテキストの言語: 英語、中国語（簡体字）、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、スペイン語
フォーマット:
- JPG
- PNG
- BMP
- PDF
サイズ: 最大20 MB
PDF ドキュメントの場合、最初の 2,000 ページのみが処理されます。

モデルの出力

テキスト認識モデルがドキュメントを検出すると次の情報を出力します。

結果: 入力テキストから抽出された行のリスト。
Text: 検出されたテキスト行を含む文字列。
BoundingBox: 境界ボックスを表す4つの値。幅と高さに加えて、上と左の位置を使用して記述されます。

制限

操作	制限	更新期間
テキスト認識呼び出し (環境ごと)	480	60 秒

トレーニング: AI Builder でテキストを認識する (モジュール)

次の方法で共有

テキスト認識事前構築済みモデル

Power Apps で使用する

Power Automate で使用する

サポートされている言語、形式、サイズ

モデルの出力

制限

フィードバック

その他のリソース

次の方法で共有

テキスト認識事前構築済みモデル

Power Apps で使用する

Power Automate で使用する

サポートされている言語、形式、サイズ

モデルの出力

制限

関連情報

フィードバック

その他のリソース