読み取り API を使用する

3 分

読み取り OCR 機能を使用するには、ImageAnalysis 関数 (REST API または同等の SDK メソッド) を呼び出し、画像 URL またはバイナリデータを渡し、必要に応じて、性別に依存しないキャプションまたはテキストが書き込まれる言語を指定します (既定値は英語の場合は en)。

ImageAnalysis をする OCR 要求を行うには、ビジュアル機能を READとして指定します。

ImageAnalysisResult result = client.Analyze(
    <image-to-analyze>,
    VisualFeatures.Read);

Python

result = client.analyze(
    image_url=<image_to_analyze>,
    visual_features=[VisualFeatures.READ]
)

REST API を使用する場合は、readとして機能を指定します。

https://<endpoint>/computervision/imageanalysis:analyze?features=read&...

Read OCR 関数の結果は、JSON または同様の構造の言語固有のオブジェクトとして同期的に返されます。これらの結果は、(現在のサービスで 1 つのブロックのみを使用して) ブロック に分け、行し、単語をします。さらに、テキスト値は、行レベルと単語レベルの両方に含まれるため、個々の単語レベルでテキストを抽出する必要がない場合は、テキスト行全体を読みやすくなります。

{
    "metadata":
    {
        "width": 500,
        "height": 430
    },
    "readResult":
    {
        "blocks":
        [
            {
                "lines":
                [
                    {
                        "text": "Hello World!",
                        "boundingPolygon":
                        [
                            {"x":251,"y":265},
                            {"x":673,"y":260},
                            {"x":674,"y":308},
                            {"x":252,"y":318}
                        ],
                        "words":
                        [
                            {
                                "text":"Hello",
                                "boundingPolygon":
                                [
                                    {"x":252,"y":267},
                                    {"x":307,"y":265},
                                    {"x":307,"y":318},
                                    {"x":253,"y":318}
                                ],
                            "confidence":0.996
                            },
                            {
                                "text":"World!",
                                "boundingPolygon":
                                [
                                    {"x":318,"y":264},
                                    {"x":386,"y":263},
                                    {"x":387,"y":316},
                                    {"x":319,"y":318}
                                ],
                                "confidence":0.99
                            }
                        ]
                    },
                ]
            }
        ]
    }
}

読み取り API を使用する

フィードバック