テキストを読み取るための Azure AI Vision オプションを調べる

3 分

Azure AI には、ドキュメントと画像からテキストを読み取る 2 つの異なる機能が用意されています。1 つは Azure AI Vision Service で、もう 1 つは Azure AI ドキュメントインテリジェンスです。各サービスで提供される内容には重複がありますが、各サービスは入力内容に応じて結果用に最適化されています。

画像分析 光学式文字認識 (OCR):
- この機能は、テキストの量が少ない一般的な非構造化ドキュメントや、テキストを含む画像に使用します。
- 結果は、1 つの API 呼び出しからすぐに (同期的に) 返されます。
- オブジェクト検出、画像の記述または分類、スマートトリミングされたサムネイルの生成など、テキストを抽出した後の画像を分析する機能があります。
- たとえば、道路標識、手書きのメモ、店舗の看板などがあります。
ドキュメントインテリジェンスの:
- このサービスを使用して、画像や PDF ドキュメントから少量から大量のテキストを読み取ります。
- このサービスでは、ドキュメントのコンテキストと構造を使用して精度を向上させます。
- 最初の関数呼び出しは非同期操作 ID を返します。非同期操作 ID は、後続の呼び出しで結果を取得するために使用する必要があります。
- たとえば、領収書、アーティクル、請求書などです。

REST API またはクライアントライブラリを使用して、両方のテクノロジにアクセスできます。このモジュールでは、Image Analysisの OCR 機能に焦点を当てます。ドキュメントインテリジェンスの詳細については、このモジュール参照してください。

テキストを読み取るための Azure AI Vision オプションを調べる

フィードバック