使用 Read API
若要使用讀取 OCR 功能,請呼叫 ImageAnalysis 函式 (REST 或對等的 SDK 方法)、傳遞影像 URL 或二進位資料,並選擇性地指定中性標題或撰寫文字的語言 (英文的預設值為 en)。
若要對 ImageAnalysis 提出 OCR 要求,請將視覺物件功能指定為 READ
。
C#
ImageAnalysisResult result = client.Analyze(
<image-to-analyze>,
VisualFeatures.Read);
Python
result = client.analyze(
image_url=<image_to_analyze>,
visual_features=[VisualFeatures.READ]
)
如果使用 REST API,請將功能指定為 read
。
https://<endpoint>/computervision/imageanalysis:analyze?features=read&...
讀取 OCR 函式的結果會以同步方式傳回,以 JSON 或類似結構的語言特定物件形式傳回。 這些結果會在區塊中細分 (目前服務只使用一個區塊),然後是行,再來是單字。 此外,文字值也會同時包含在 行 和 單字 層級中,如果您不需要在個別 單字 層級上取出文字,就可以更輕鬆地讀取整行文字。
{
"metadata":
{
"width": 500,
"height": 430
},
"readResult":
{
"blocks":
[
{
"lines":
[
{
"text": "Hello World!",
"boundingPolygon":
[
{"x":251,"y":265},
{"x":673,"y":260},
{"x":674,"y":308},
{"x":252,"y":318}
],
"words":
[
{
"text":"Hello",
"boundingPolygon":
[
{"x":252,"y":267},
{"x":307,"y":265},
{"x":307,"y":318},
{"x":253,"y":318}
],
"confidence":0.996
},
{
"text":"World!",
"boundingPolygon":
[
{"x":318,"y":264},
{"x":386,"y":263},
{"x":387,"y":316},
{"x":319,"y":318}
],
"confidence":0.99
}
]
},
]
}
]
}
}