Verwenden der Lese-API
Rufen Sie die ImageAnalysis-Funktion (REST-API oder entsprechende SDK-Methode) auf, übergeben Sie die Bild-URL oder binäre Daten, und geben Sie optional eine geschlechtsneutrale Beschriftung oder die Sprache an, in der der Text geschrieben wird (mit dem Standardwert en für Englisch).
Um eine OCR-Anforderung an ImageAnalysis-zu stellen, geben Sie das visuelle Feature als READ
an.
C#
ImageAnalysisResult result = client.Analyze(
<image-to-analyze>,
VisualFeatures.Read);
Python
result = client.analyze(
image_url=<image_to_analyze>,
visual_features=[VisualFeatures.READ]
)
Wenn Sie die REST-API verwenden, geben Sie das Feature als read
an.
https://<endpoint>/computervision/imageanalysis:analyze?features=read&...
Die Ergebnisse der Read OCR-Funktion werden synchron zurückgegeben, entweder als JSON oder als sprachspezifisches Objekt einer ähnlichen Struktur. Diese Ergebnisse werden in Blöcken (wobei der aktuelle Dienst nur einen Block verwendet), dann Zeilenund dann Wörter. Darüber hinaus werden die Textwerte sowohl in der Zeile als auch in Wort- Ebenen enthalten, sodass ganze Textzeilen einfacher gelesen werden können, wenn Sie Text nicht auf der ebene einzelne Wort extrahieren müssen.
{
"metadata":
{
"width": 500,
"height": 430
},
"readResult":
{
"blocks":
[
{
"lines":
[
{
"text": "Hello World!",
"boundingPolygon":
[
{"x":251,"y":265},
{"x":673,"y":260},
{"x":674,"y":308},
{"x":252,"y":318}
],
"words":
[
{
"text":"Hello",
"boundingPolygon":
[
{"x":252,"y":267},
{"x":307,"y":265},
{"x":307,"y":318},
{"x":253,"y":318}
],
"confidence":0.996
},
{
"text":"World!",
"boundingPolygon":
[
{"x":318,"y":264},
{"x":386,"y":263},
{"x":387,"y":316},
{"x":319,"y":318}
],
"confidence":0.99
}
]
},
]
}
]
}
}