Использование API чтения
Чтобы использовать функцию OCR чтения, вызовите функцию ImageAnalysis (REST API или эквивалентный метод SDK), передав URL-адрес изображения или двоичные данные, а также при необходимости укажите половую нейтральную подпись или язык, на который написан текст (со значением по умолчанию en для английского языка).
Чтобы выполнить запрос OCR к ImageAnalysis, укажите визуальную функцию как READ
.
C#
ImageAnalysisResult result = client.Analyze(
<image-to-analyze>,
VisualFeatures.Read);
Python
result = client.analyze(
image_url=<image_to_analyze>,
visual_features=[VisualFeatures.READ]
)
При использовании REST API укажите функцию как read
.
https://<endpoint>/computervision/imageanalysis:analyze?features=read&...
Результаты функции OCR чтения возвращаются синхронно либо в формате JSON, либо в определенном языке объект аналогичной структуры. Эти результаты разбиты на блоки (с текущей службой только с одним блоком), а затем строки и слова. Кроме того, текстовые значения включаются на уровне строк и слов, что упрощает чтение целых строк текста, если нет необходимости извлекать текст на уровне отдельных слов.
{
"metadata":
{
"width": 500,
"height": 430
},
"readResult":
{
"blocks":
[
{
"lines":
[
{
"text": "Hello World!",
"boundingPolygon":
[
{"x":251,"y":265},
{"x":673,"y":260},
{"x":674,"y":308},
{"x":252,"y":318}
],
"words":
[
{
"text":"Hello",
"boundingPolygon":
[
{"x":252,"y":267},
{"x":307,"y":265},
{"x":307,"y":318},
{"x":253,"y":318}
],
"confidence":0.996
},
{
"text":"World!",
"boundingPolygon":
[
{"x":318,"y":264},
{"x":386,"y":263},
{"x":387,"y":316},
{"x":319,"y":318}
],
"confidence":0.99
}
]
},
]
}
]
}
}