Image Analysis - Analyze Stream
分析輸入影像。 要求包含任何內容類型為 ['image/*'、'application/octet-stream'] 的影像數據流,或 JSON 承載,其中包含要用來擷取影像數據流的 URL 屬性。
POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview
POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview
URI 參數
名稱 | 位於 | 必要 | 類型 | Description |
---|---|---|---|---|
api-version
|
query | True |
string |
要求的 API 版本。 |
features
|
query |
要求的視覺功能:標記、對象、標題、密集Captions、read、smartCrops、people。 如果未指定參數 「model-name」 ,則必須指定此參數。 |
||
gender-neutral-caption
|
query |
boolean |
布爾值旗標,用於啟用標題和密集Captions功能的性別中性輔助字幕。 如果未指定此參數,預設值為 「false」。 |
|
language
|
query |
string |
輸出產生所需的語言。 如果未指定此參數,預設值為 “en”。 如需支援的語言清單,請參閱 https://aka.ms/cv-languages。 |
|
model-name
|
query |
string |
自定義定型模型的名稱。 如果未指定參數 「features」 ,則必須指定此參數。 |
|
smartcrops-aspect-ratios
|
query |
string |
用於 smartCrops 功能的外觀比例清單。 外觀比例的計算方式是將目標裁剪寬度除以高度。 支援的值介於 0.75 和 1.8 之間(含)。 多個值應該以逗號分隔。 如果未指定此參數,服務會傳回一個裁剪建議,其外觀比例會介於 0.5 和 2.0 之間。 |
要求本文
Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"
名稱 | 類型 | Description |
---|---|---|
body |
string (byte) |
影像數據流。 |
回應
名稱 | 類型 | Description |
---|---|---|
200 OK |
成功 |
|
Other Status Codes |
錯誤 標題 x-ms-error-code: string |
範例
AnalyzeImageFromImageStream_CustomModel
範例要求
POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview
"Ynl0ZXM="
範例回覆
{
"modelVersion": "2023-04-01-preview",
"customModelResult": {
"objectsResult": {
"values": [
{
"id": "1",
"boundingBox": {
"x": 197,
"y": 68,
"w": 356,
"h": 394
},
"tags": [
{
"name": "class1",
"confidence": 0.92431640625
}
]
},
{
"id": "2",
"boundingBox": {
"x": 0,
"y": 77,
"w": 241,
"h": 359
},
"tags": [
{
"name": "class1",
"confidence": 0.87890625
}
]
}
]
}
},
"metadata": {
"width": 660,
"height": 495
}
}
定義
名稱 | Description |
---|---|
Adult |
描述成人內容相符的物件。 |
Adult |
物件,描述影像是否包含成人導向的內容和/或猥褻。 |
Bounding |
影像內區域的周框方塊。 |
Caption |
影像描述的簡短描述。 |
Crop |
識別為智慧裁剪的區域。 每個要求的外觀比例都會傳回一個區域。 |
Dense |
影像描述的簡短描述。 |
Dense |
標題清單。 |
Detected |
描述影像中偵測到的物件。 |
Detected |
影像中偵測到的人員。 |
Document |
內容行物件,由相鄰的內容元素序列組成,例如文字和選取標記。 |
Document |
從輸入頁面擷取的內容和版面配置專案。 |
Document |
串連內容屬性的連續區域,指定為位移和長度。 |
Document |
物件,表示觀察到的文字樣式。 |
Document |
由連續字元序列組成的 word 物件。 對於非空格分隔的語言,例如中文、日文和韓文,每個字元都會以自己的單字表示。 |
Error |
發生錯誤時傳回的回應。 |
Error |
錯誤資訊。 |
Error |
詳細的錯誤。 |
Image |
描述不同類型的影像分析合併結果。 |
Image |
影像元數據資訊,例如高度和寬度。 |
Image |
描述影像的預測結果。 |
Objects |
描述影像中偵測到的物件。 |
People |
物件,描述影像是否包含人員。 |
Read |
讀取作業的結果。 |
Smart |
智慧裁剪結果。 |
Tag |
影像中的實體觀察,以及信賴分數。 |
Tags |
具有信賴等級的標籤清單。 |
Visual |
要求的視覺功能:標記、對象、標題、密集Captions、read、smartCrops、people。 如果未指定參數 「model-name」 ,則必須指定此參數。 |
AdultMatch
描述成人內容相符的物件。
名稱 | 類型 | Description |
---|---|---|
confidence |
number (double) minimum: 0maximum: 1 |
值,表示相符成人內容的信賴等級。 |
isMatch |
boolean |
值,指出影像是否符合成人內容。 |
AdultResult
物件,描述影像是否包含成人導向的內容和/或猥褻。
名稱 | 類型 | Description |
---|---|---|
adult |
描述成人內容相符的物件。 |
|
gore |
描述成人內容相符的物件。 |
|
racy |
描述成人內容相符的物件。 |
BoundingBox
影像內區域的周框方塊。
名稱 | 類型 | Description |
---|---|---|
h |
integer (int32) minimum: 1 |
從區域左上方點測量的高度,以像素為單位。 |
w |
integer (int32) minimum: 1 |
以像素為單位,從區域左上方點測量的寬度。 |
x |
integer (int32) minimum: 0 |
區域左上方點的左座標,以像素為單位。 |
y |
integer (int32) minimum: 0 |
區域左上方點的頂端座標,以像素為單位。 |
CaptionResult
影像描述的簡短描述。
名稱 | 類型 | Description |
---|---|---|
confidence |
number (double) minimum: 0maximum: 1 |
服務在標題中具有的信賴等級。 |
text |
string minLength: 1 |
標題的文字。 |
CropRegion
識別為智慧裁剪的區域。 每個要求的外觀比例都會傳回一個區域。
名稱 | 類型 | Description |
---|---|---|
aspectRatio |
number (double) |
作物區域的外觀比例。 |
boundingBox |
影像內區域的周框方塊。 |
DenseCaption
影像描述的簡短描述。
名稱 | 類型 | Description |
---|---|---|
boundingBox |
影像內區域的周框方塊。 |
|
confidence |
number (double) minimum: 0maximum: 1 |
服務在標題中具有的信賴等級。 |
text |
string minLength: 1 |
標題的文字。 |
DenseCaptionsResult
標題清單。
名稱 | 類型 | Description |
---|---|---|
values |
標題清單。 |
DetectedObject
描述影像中偵測到的物件。
名稱 | 類型 | Description |
---|---|---|
boundingBox |
影像內區域的周框方塊。 |
|
id |
string minLength: 1 |
偵測到物件的標識碼。 |
tags |
Tag[] |
偵測到物件的分類信賴度。 |
DetectedPerson
影像中偵測到的人員。
名稱 | 類型 | Description |
---|---|---|
boundingBox |
影像內區域的周框方塊。 |
|
confidence |
number (double) minimum: 0maximum: 1 |
在影像中觀察到人員的信心分數,其值為 0 到 1。 |
DocumentLine
內容行物件,由相鄰的內容元素序列組成,例如文字和選取標記。
名稱 | 類型 | Description |
---|---|---|
boundingBox |
number[] (double) |
線條的周框方塊。 |
content |
string minLength: 1 |
以讀取順序串連包含之元素的內容。 |
spans |
閱讀順序中串連內容的行位置。 |
DocumentPage
從輸入頁面擷取的內容和版面配置專案。
名稱 | 類型 | Description |
---|---|---|
angle |
number (double) |
以順時針方向測量內容的一般方向,以度為單位 (-180, 180]。 |
height |
number (double) |
影像/PDF 的高度,分別以圖元/英吋為單位。 |
lines |
從頁面擷取的行,可能同時包含文字和視覺元素。 |
|
pageNumber |
integer (int32) |
輸入檔中以 1 起始的頁碼。 |
spans |
讀取順序中頁面的位置串連內容。 |
|
width |
number (double) |
影像/PDF 的寬度,分別以圖元/英吋為單位。 |
words |
從頁面擷取的字組。 |
DocumentSpan
串連內容屬性的連續區域,指定為位移和長度。
名稱 | 類型 | Description |
---|---|---|
length |
integer (int32) |
範圍所代表內容中的字元數。 |
offset |
integer (int32) |
範圍所表示之內容之以零起始的索引。 |
DocumentStyle
物件,表示觀察到的文字樣式。
名稱 | 類型 | Description |
---|---|---|
confidence |
number (double) |
正確識別樣式的信賴度。 |
isHandwritten |
boolean |
這是內容手寫或否。 |
spans |
樣式所套用之串連內容中的文字專案位置。 |
DocumentWord
由連續字元序列組成的 word 物件。 對於非空格分隔的語言,例如中文、日文和韓文,每個字元都會以自己的單字表示。
名稱 | 類型 | Description |
---|---|---|
boundingBox |
number[] (double) |
文字的周框方塊。 |
confidence |
number (double) |
正確擷取單字的信心。 |
content |
string minLength: 1 |
文字內容的文字內容。 |
span |
串連內容屬性的連續區域,指定為位移和長度。 |
ErrorResponse
發生錯誤時傳回的回應。
名稱 | 類型 | Description |
---|---|---|
error |
錯誤資訊。 |
ErrorResponseDetails
錯誤資訊。
名稱 | 類型 | Description |
---|---|---|
code |
string |
錯誤碼。 |
details |
詳細的錯誤清單。 |
|
innererror |
詳細的錯誤。 |
|
message |
string |
錯誤資訊。 |
target |
string |
錯誤的目標。 |
ErrorResponseInnerError
詳細的錯誤。
名稱 | 類型 | Description |
---|---|---|
code |
string |
錯誤碼。 |
innererror |
詳細的錯誤。 |
|
message |
string |
錯誤資訊。 |
ImageAnalysisResult
描述不同類型的影像分析合併結果。
名稱 | 類型 | Description |
---|---|---|
adultResult |
物件,描述影像是否包含成人導向的內容和/或猥褻。 |
|
captionResult |
影像描述的簡短描述。 |
|
customModelResult |
描述影像的預測結果。 |
|
denseCaptionsResult |
標題清單。 |
|
metadata |
影像元數據資訊,例如高度和寬度。 |
|
modelVersion |
string minLength: 1 |
模型版本。 |
objectsResult |
描述影像中偵測到的物件。 |
|
peopleResult |
物件,描述影像是否包含人員。 |
|
readResult |
讀取作業的結果。 |
|
smartCropsResult |
智慧裁剪結果。 |
|
tagsResult |
具有信賴等級的標籤清單。 |
ImageMetadataApiModel
影像元數據資訊,例如高度和寬度。
名稱 | 類型 | Description |
---|---|---|
height |
integer (int32) minimum: 1 |
影像的高度,以像素為單位。 |
width |
integer (int32) minimum: 1 |
影像的寬度,以像素為單位。 |
ImagePredictionResult
描述影像的預測結果。
名稱 | 類型 | Description |
---|---|---|
objectsResult |
描述影像中偵測到的物件。 |
|
tagsResult |
具有信賴等級的標籤清單。 |
ObjectsResult
描述影像中偵測到的物件。
名稱 | 類型 | Description |
---|---|---|
values |
偵測到物件的陣列。 |
PeopleResult
物件,描述影像是否包含人員。
名稱 | 類型 | Description |
---|---|---|
values |
偵測到的人員陣列。 |
ReadResult
讀取作業的結果。
名稱 | 類型 | Description |
---|---|---|
content |
string minLength: 1 |
依閱讀順序串連所有文字和視覺元素的字串表示。 |
pages |
分析的頁面清單。 |
|
stringIndexType |
string minLength: 1 |
用來計算字串位移和長度的方法,可能的值包括:'textElements'、'unicodeCodePoint'、'utf16CodeUnit' 等。 |
styles |
擷取的字型樣式。 |
SmartCropsResult
智慧裁剪結果。
名稱 | 類型 | Description |
---|---|---|
values |
裁剪影像的建議區域。 |
Tag
影像中的實體觀察,以及信賴分數。
名稱 | 類型 | Description |
---|---|---|
confidence |
number (double) minimum: 0maximum: 1 |
觀察到實體的信賴等級。 |
name |
string minLength: 1 |
實體的名稱。 |
TagsResult
具有信賴等級的標籤清單。
名稱 | 類型 | Description |
---|---|---|
values |
Tag[] |
具有信賴等級的標籤清單。 |
VisualFeature
要求的視覺功能:標記、對象、標題、密集Captions、read、smartCrops、people。 如果未指定參數 「model-name」 ,則必須指定此參數。
值 | Description |
---|---|
caption | |
denseCaptions | |
objects | |
people | |
read | |
smartCrops | |
tags |