はじめに
何千もの画像を渡され、画像のテキストをコンピューター データベースに転送するよう要求されたところを想像してみてください。 スキャンされた画像のテキストはさまざまな形式で編成されており、複数の言語が含まれています。 妥当な時間でプロジェクトを完了し、データが高い精度で入力されるようにするには、どのような方法があるでしょうか。
世界中の企業が、同じようなシナリオに毎日苦労しています。 AI サービスがなくては、特に大規模に変更する場合は、プロジェクトを完了するのは困難です。
AI サービスを使用すると、このプロジェクトを Azure AI Vision のシナリオとして扱い、光学式文字認識 (OCR) を適用できます。 OCR を使用すると、道路標識や製品の写真などの画像や、手書きドキュメントや非構造化ドキュメントなどのドキュメントからテキストを抽出できます。
自動化された AI ソリューションを構築するには、多くのユース ケースに対応するように機械学習モデルをトレーニングする必要があります。 Azure AI Vision サービスは、画像を処理するための高度なアルゴリズムにアクセスし、セキュリティで保護されたストレージにデータを返します。
このモジュールでは、次の方法を学習します。
- Azure AI Vision サービスを使用することで、画像からテキストを読み取る方法を確認する
- SDK と REST API で Azure AI Vision サービスを使用する
- 印刷されたテキストと手書きのテキストを読み取るアプリケーションを開発する