Analyze Image In Stream - Analyze Image In Stream
這項作業會根據影像內容擷取一組豐富的視覺功能。 支援兩個輸入法 -- (1) 上傳影像或 (2) 指定影像 URL。 在您的要求中,有選擇性參數可讓您選擇要傳回的功能。 根據預設,影像類別會在響應中傳回。 成功的回應將會以 JSON 傳回。 如果要求失敗,回應會包含錯誤碼和訊息,以協助了解發生錯誤的原因。
POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?overload=stream&visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}
URI 參數
名稱 | 位於 | 必要 | 類型 | Description |
---|---|---|---|---|
Endpoint
|
path | True |
string |
支援的認知服務端點。 |
description
|
query |
產生描述時關閉指定的領域模型。 |
||
details
|
query |
Details[] |
字串,表示要傳回哪些網域特定詳細數據。 多個值應該以逗號分隔。 有效的視覺功能類型包括:名人 - 識別影像中偵測到的名人、地標 - 識別影像中值得注意的地標。 |
|
language
|
query |
string |
輸出產生所需的語言。 如果未指定此屬性,則預設值為 "en"。 如需支援的語言清單,請參閱 https://aka.ms/cv-languages 。 |
|
model-version
|
query |
string |
選擇性參數,可指定 AI 模型的版本。 接受的值包括:“latest”、“2021-04-01”、“2021-05-01”。 預設為 「latest」。。 Regex 模式: |
|
visual
|
query |
字串,表示要傳回哪些視覺功能類型。 多個值應該以逗號分隔。 有效的視覺功能類型包括:類別 - 根據檔中定義的分類法分類影像內容。 標記 - 使用與影像內容相關的詳細單字清單來標記影像。 說明 - 用完整的英文句子說明映像內容。 臉部 - 偵測臉部是否存在。 若有的話,會產生座標、性別和年齡。 ImageType - 偵測映像是美工圖案或線條繪圖。 色彩 - 決定輔色、主要色彩,以及影像是否為黑色&白色。 成人 - 偵測影像在本質上是否為暴力, (描述裸體或性行為) , (或是鑞描述極端暴力或血) 。 也會偵測出性暗示內容 (也就是挑逗內容)。 物件 - 偵測影像內的各種物件,包括近似位置。 物品引數僅於英文版中提供。 品牌 - 偵測影像內的各種品牌,包括近似位置。 品牌引數僅於英文版中提供。 |
要求標頭
Media Types: "application/octet-stream", "multipart/form-data"
名稱 | 必要 | 類型 | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
要求本文
Media Types: "application/octet-stream", "multipart/form-data"
名稱 | 類型 | Description |
---|---|---|
Image |
object |
影像數據流。 |
回應
名稱 | 類型 | Description |
---|---|---|
200 OK |
回應包含 JSON 格式的擷取特徵。 以下是列舉型別的定義: ClipartType 非 - 美工圖案 = 0,模棱兩可 = 1,一般 - 美工圖案 = 2,良好 - 美工圖案 = 3。 LineDrawingTypeNon - LineDrawing = 0,LineDrawing = 1。 |
|
Other Status Codes |
錯誤回應。 |
安全性
Ocp-Apim-Subscription-Key
類型:
apiKey
位於:
header
範例
Successful AnalyzeImage request
範例要求
POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?overload=stream&visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
"{binary}"
範例回覆
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
],
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9978346
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"modelVersion": "2021-04-01",
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
定義
名稱 | Description |
---|---|
Adult |
物件,描述影像是否包含成人導向的內容和/或猥褻。 |
Bounding |
影像內區域的周框方塊。 |
Category |
描述已識別類別的物件。 |
Category |
描述其他類別詳細數據的物件。 |
Celebrities |
描述可能名人識別的物件。 |
Color |
提供描述色彩屬性之其他元數據的物件。 |
Computer |
API 要求錯誤。 |
Computer |
錯誤碼。 |
Computer |
API 錯誤回應。 |
Computer |
API 要求錯誤的詳細數據。 |
Computer |
錯誤碼。 |
Description |
產生描述時關閉指定的領域模型。 |
Details |
字串,表示要傳回哪些網域特定詳細數據。 多個值應該以逗號分隔。 有效的視覺功能類型包括:名人 - 識別影像中偵測到的名人、地標 - 識別影像中值得注意的地標。 |
Detected |
在影像中偵測到的品牌。 |
Detected |
在影像中偵測到的物件。 |
Face |
物件,描述影像中所識別的臉部。 |
Face |
描述臉部矩形的物件。 |
Gender |
臉部的可能性別。 |
Image |
AnalyzeImage 作業的結果。 |
Image |
影像 標題,也就是影像描述的簡短描述。 |
Image |
內容標記的集合,以及依信賴等級和影像元數據排序的標題清單。 |
Image |
影像元數據。 |
Image |
影像中的實體觀察,以及信賴分數。 |
Image |
物件,提供可能的影像類型和比對信賴等級。 |
Landmarks |
影像中辨識的地標。 |
Object |
在影像內偵測到的物件。 |
Visual |
字串,表示要傳回哪些視覺功能類型。 多個值應該以逗號分隔。 有效的視覺功能類型包括:類別 - 根據檔中定義的分類法分類影像內容。 標記 - 使用與影像內容相關的詳細單字清單來標記影像。 說明 - 用完整的英文句子說明映像內容。 臉部 - 偵測臉部是否存在。 若有的話,會產生座標、性別和年齡。 ImageType - 偵測映像是美工圖案或線條繪圖。 色彩 - 決定輔色、主要色彩,以及影像是否為黑色&白色。 成人 - 偵測影像在本質上是否為暴力, (描述裸體或性行為) , (或是鑞描述極端暴力或血) 。 也會偵測出性暗示內容 (也就是挑逗內容)。 物件 - 偵測影像內的各種物件,包括近似位置。 物品引數僅於英文版中提供。 品牌 - 偵測影像內的各種品牌,包括近似位置。 品牌引數僅於英文版中提供。 |
AdultInfo
物件,描述影像是否包含成人導向的內容和/或猥褻。
名稱 | 類型 | Description |
---|---|---|
adultScore |
number |
從 0 到 1 的分數,指出內容在影像中視為成人導向的程度。 |
goreScore |
number |
從 0 到 1 的分數,指出 gory 是影像的方式。 |
isAdultContent |
boolean |
值,指出影像是否包含成人導向的內容。 |
isGoryContent |
boolean |
值,指出影像是否為 Gory。 |
isRacyContent |
boolean |
值,指出影像是否不雅。 |
racyScore |
number |
從 0 到 1 的分數,指出影像的建議程度。 |
BoundingRect
影像內區域的周框方塊。
名稱 | 類型 | Description |
---|---|---|
h |
integer |
以像素為單位,從區域左上方點測量的高度。 |
w |
integer |
從區域左上方點測量的寬度,以像素為單位。 |
x |
integer |
區域左上方點的 X 座標,以像素為單位。 |
y |
integer |
區域左上方點的 Y 座標,以像素為單位。 |
Category
描述已識別類別的物件。
名稱 | 類型 | Description |
---|---|---|
detail |
已識別類別的詳細數據。 |
|
name |
string |
類別名稱。 |
score |
number |
類別的評分。 |
CategoryDetail
描述其他類別詳細數據的物件。
名稱 | 類型 | Description |
---|---|---|
celebrities |
如果已識別任何名人,則為名人數組。 |
|
landmarks |
如果識別任何地標,則為地標數位列。 |
CelebritiesModel
描述可能名人識別的物件。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
名人辨識的信賴等級,其值為 0 到 1。 |
faceRectangle |
影像中識別臉部的位置。 |
|
name |
string |
名人的名稱。 |
ColorInfo
提供描述色彩屬性之其他元數據的物件。
名稱 | 類型 | Description |
---|---|---|
accentColor |
string |
可能的輔色。 |
dominantColorBackground |
string |
可能的主要背景色彩。 |
dominantColorForeground |
string |
可能的主要前景色彩。 |
dominantColors |
string[] |
可能的主要色彩陣列。 |
isBWImg |
boolean |
值,指出影像是否為黑白。 |
ComputerVisionError
API 要求錯誤。
名稱 | 類型 | Description |
---|---|---|
code |
錯誤碼。 |
|
innererror |
內部錯誤包含更明確的資訊。 |
|
message |
string |
說明服務所報告錯誤的訊息。 |
ComputerVisionErrorCodes
錯誤碼。
名稱 | 類型 | Description |
---|---|---|
InternalServerError |
string |
|
InvalidArgument |
string |
|
InvalidRequest |
string |
|
ServiceUnavailable |
string |
ComputerVisionErrorResponse
API 錯誤回應。
名稱 | 類型 | Description |
---|---|---|
error |
錯誤內容。 |
ComputerVisionInnerError
API 要求錯誤的詳細數據。
名稱 | 類型 | Description |
---|---|---|
code |
錯誤碼。 |
|
message |
string |
錯誤訊息。 |
ComputerVisionInnerErrorCodeValue
錯誤碼。
名稱 | 類型 | Description |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
DescriptionExclude
產生描述時關閉指定的領域模型。
名稱 | 類型 | Description |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
Details
字串,表示要傳回哪些網域特定詳細數據。 多個值應該以逗號分隔。 有效的視覺功能類型包括:名人 - 識別影像中偵測到的名人、地標 - 識別影像中值得注意的地標。
名稱 | 類型 | Description |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
DetectedBrand
在影像中偵測到的品牌。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
在影像中觀察到品牌信賴分數,其值為 0 到 1。 |
name |
string |
品牌標籤。 |
rectangle |
偵測到品牌的近似位置。 |
DetectedObject
在影像中偵測到的物件。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
在影像中觀察到物件的信賴分數,其值為0到1。 |
object |
string |
對象的標籤。 |
parent |
父物件,從分類法的觀點來看。 父對像是這個物件的較泛型形式。 例如,'bulldog' 的父系為 'dog'。 |
|
rectangle |
偵測到物件的近似位置。 |
FaceDescription
物件,描述影像中所識別的臉部。
名稱 | 類型 | Description |
---|---|---|
age |
integer |
臉部的可能年齡。 |
faceRectangle |
影像中含有已識別臉部的矩形。 |
|
gender |
臉部的可能性別。 |
FaceRectangle
描述臉部矩形的物件。
名稱 | 類型 | Description |
---|---|---|
height |
integer |
從臉部左上方點測量的高度,以像素為單位。 |
left |
integer |
臉部左上方點的 X 座標,以像素為單位。 |
top |
integer |
臉部左上方點的 Y 座標,以像素為單位。 |
width |
integer |
從臉部左上方點測量的寬度,以像素為單位。 |
Gender
臉部的可能性別。
名稱 | 類型 | Description |
---|---|---|
Female |
string |
|
Male |
string |
ImageAnalysis
AnalyzeImage 作業的結果。
名稱 | 類型 | Description |
---|---|---|
adult |
物件,描述影像是否包含成人導向的內容和/或猥褻。 |
|
brands |
影像中偵測到的品牌陣列。 |
|
categories |
Category[] |
表示已識別類別的陣列。 |
color |
提供描述色彩屬性之其他元數據的物件。 |
|
description |
內容標記的集合,以及依信賴等級和影像元數據排序的標題清單。 |
|
faces |
影像中可能臉部的陣列。 |
|
imageType |
物件,提供可能的影像類型和比對信賴等級。 |
|
metadata |
影像元數據。 |
|
modelVersion |
string |
AI 模型的版本。 |
objects |
對象陣列,描述影像中偵測到的專案。 |
|
requestId |
string |
REST API 要求的標識碼。 |
tags |
Image |
具有信賴等級的標籤清單。 |
ImageCaption
影像 標題,也就是影像描述的簡短描述。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
服務在 標題 中擁有的信賴等級。 |
text |
string |
標題的文字。 |
ImageDescriptionDetails
內容標記的集合,以及依信賴等級和影像元數據排序的標題清單。
名稱 | 類型 | Description |
---|---|---|
captions |
依信賴等級排序的標題清單。 |
|
tags |
string[] |
影像標記的集合。 |
ImageMetadata
影像元數據。
名稱 | 類型 | Description |
---|---|---|
format |
string |
影像格式。 |
height |
integer |
影像高度,以像素為單位。 |
width |
integer |
影像寬度,以像素為單位。 |
ImageTag
影像中的實體觀察,以及信賴分數。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
觀察到實體的信賴等級。 |
hint |
string |
此標記的選擇性提示/詳細數據。 |
name |
string |
實體的名稱。 |
ImageType
物件,提供可能的影像類型和比對信賴等級。
名稱 | 類型 | Description |
---|---|---|
clipArtType |
integer |
影像為美工圖案的信賴等級。 |
lineDrawingType |
integer |
影像為線條繪圖的信賴等級。 |
LandmarksModel
影像中辨識的地標。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
地標辨識的信賴等級,其值為 0 到 1。 |
name |
string |
地標的名稱。 |
ObjectHierarchy
在影像內偵測到的物件。
名稱 | 類型 | Description |
---|---|---|
confidence |
number |
在影像中觀察到物件的信賴分數,其值為0到1。 |
object |
string |
對象的標籤。 |
parent |
父物件,從分類法的觀點來看。 父對像是這個物件的較泛型形式。 例如,'bulldog' 的父系為 'dog'。 |
VisualFeatureTypes
字串,表示要傳回哪些視覺功能類型。 多個值應該以逗號分隔。 有效的視覺功能類型包括:類別 - 根據檔中定義的分類法分類影像內容。 標記 - 使用與影像內容相關的詳細單字清單來標記影像。 說明 - 用完整的英文句子說明映像內容。 臉部 - 偵測臉部是否存在。 若有的話,會產生座標、性別和年齡。 ImageType - 偵測映像是美工圖案或線條繪圖。 色彩 - 決定輔色、主要色彩,以及影像是否為黑色&白色。 成人 - 偵測影像在本質上是否為暴力, (描述裸體或性行為) , (或是鑞描述極端暴力或血) 。 也會偵測出性暗示內容 (也就是挑逗內容)。 物件 - 偵測影像內的各種物件,包括近似位置。 物品引數僅於英文版中提供。 品牌 - 偵測影像內的各種品牌,包括近似位置。 品牌引數僅於英文版中提供。
名稱 | 類型 | Description |
---|---|---|
Adult |
string |
|
Brands |
string |
|
Categories |
string |
|
Color |
string |
|
Description |
string |
|
Faces |
string |
|
ImageType |
string |
|
Objects |
string |
|
Tags |
string |