Verwenden der Lese-API

3 Minuten

Rufen Sie die ImageAnalysis-Funktion (REST-API oder entsprechende SDK-Methode) auf, übergeben Sie die Bild-URL oder binäre Daten, und geben Sie optional eine geschlechtsneutrale Beschriftung oder die Sprache an, in der der Text geschrieben wird (mit dem Standardwert en für Englisch).

Um eine OCR-Anforderung an ImageAnalysis-zu stellen, geben Sie das visuelle Feature als READan.

ImageAnalysisResult result = client.Analyze(
    <image-to-analyze>,
    VisualFeatures.Read);

Python

result = client.analyze(
    image_url=<image_to_analyze>,
    visual_features=[VisualFeatures.READ]
)

Wenn Sie die REST-API verwenden, geben Sie das Feature als readan.

https://<endpoint>/computervision/imageanalysis:analyze?features=read&...

Die Ergebnisse der Read OCR-Funktion werden synchron zurückgegeben, entweder als JSON oder als sprachspezifisches Objekt einer ähnlichen Struktur. Diese Ergebnisse werden in Blöcken (wobei der aktuelle Dienst nur einen Block verwendet), dann Zeilenund dann Wörter. Darüber hinaus werden die Textwerte sowohl in der Zeile als auch in Wort- Ebenen enthalten, sodass ganze Textzeilen einfacher gelesen werden können, wenn Sie Text nicht auf der ebene einzelne Wort extrahieren müssen.

{
    "metadata":
    {
        "width": 500,
        "height": 430
    },
    "readResult":
    {
        "blocks":
        [
            {
                "lines":
                [
                    {
                        "text": "Hello World!",
                        "boundingPolygon":
                        [
                            {"x":251,"y":265},
                            {"x":673,"y":260},
                            {"x":674,"y":308},
                            {"x":252,"y":318}
                        ],
                        "words":
                        [
                            {
                                "text":"Hello",
                                "boundingPolygon":
                                [
                                    {"x":252,"y":267},
                                    {"x":307,"y":265},
                                    {"x":307,"y":318},
                                    {"x":253,"y":318}
                                ],
                            "confidence":0.996
                            },
                            {
                                "text":"World!",
                                "boundingPolygon":
                                [
                                    {"x":318,"y":264},
                                    {"x":386,"y":263},
                                    {"x":387,"y":316},
                                    {"x":319,"y":318}
                                ],
                                "confidence":0.99
                            }
                        ]
                    },
                ]
            }
        ]
    }
}

Verwenden der Lese-API

Feedback