テキストの読み取りに関する Azure AI Vision のオプションを調べる
Azure AI には、ドキュメントと画像からテキストを読み取る 2 種類の機能があります。1 つは Azure AI Vision Service、もう 1 つは Azure AI Document Intelligence です。 各サービスが提供する内容には重複がありますが、それぞれ、入力内容に応じた結果に合わせて最適化されています。
- 画像分析の光学式文字認識 (OCR):
- この機能は、テキストの量が少ない一般的な非構造化ドキュメント、またはテキストを含む画像に使います。
- 結果は、1 回の API 呼び出しからすぐに (同期的に) 返されます。
- テキストの抽出にとどまらず、物体検出、画像の説明または分類、スマートトリミングされたサムネイルの生成などの画像を分析するための機能があります。
- たとえば、道路標識、手書きのメモ、店舗の看板などです。
- ドキュメント インテリジェンス:
- 少量から大量のテキストを画像や PDF ドキュメントから読み取るには、このサービスを使います。
- このサービスでは、ドキュメントのコンテキストと構造を使って精度を高めます。
- 最初の関数呼び出しから返される非同期操作 ID を使用して、結果を取得するための以降の呼び出しを行う必要があります。
- たとえば、領収書、記事、請求書などです。
どちらのテクノロジにも、REST API またはクライアント ライブラリを使用してアクセスできます。 このモジュールでは、画像分析の OCR 機能に焦点を当てます。 さらに Document Intelligence について詳しく確認する場合は、入門書としてこちらのモジュールを参照することをお勧めします。