你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Analyze - Image Stream
分析输入图像。 请求包含具有任何内容类型 ['image/*', 'application/octet-stream'] 的图像流。
POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01
POST /imageanalysis:analyze?overload=stream&features={features}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
api-version
|
query | True |
string |
请求的 API 版本。 |
features
|
query |
请求的视觉特征。 必须至少指定一个视觉特征。 |
||
gender-neutral-caption
|
query |
boolean |
布尔标志,用于为 caption 和 denseCaptions 功能启用不分性别的字幕。 如果未指定此参数,则默认值为“false”。 |
|
language
|
query |
string |
输出生成所需的语言。 如果未指定此属性,则默认值为“en”。 有关支持的语言列表,请参阅 https://aka.ms/cv-languages 。 |
|
smartcrops-aspect-ratios
|
query |
array[] |
要用于 smartCrops 功能的纵横比列表。 纵横比的计算方法是将目标裁剪宽度除以高度。 支持的值介于 0.75 和 1.8 之间, (包含) 。 多个值应以逗号分隔。 如果未指定此参数,则服务将返回一个裁剪建议,该建议的纵横比在 0.5 到 2.0 之间, (包含) 。 |
请求正文
Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"
名称 | 类型 | 说明 |
---|---|---|
body |
string |
图像流。 |
响应
名称 | 类型 | 说明 |
---|---|---|
200 OK |
Success |
|
Other Status Codes |
错误 标头 x-ms-error-code: string |
示例
Image |
Image |
ImageAnalysis_Analyze_MaximumSet_Gen
示例请求
POST /imageanalysis:analyze?overload=stream&features=tags&language=zizuomdsxccdx&smartcrops-aspect-ratios=vqkmzmvchiwlxdaikxqrsbrpvyq&gender-neutral-caption=True&api-version=2024-02-01
"Ynl0ZXM="
示例响应
{
"captionResult": {
"text": "wjtogwbozwgawzxikwsvs",
"confidence": 0
},
"objectsResult": {
"values": [
{
"id": "bcvupjoxcviiz",
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
},
"tags": [
{
"name": "ikiqzvbmyrbuskhpphgjjuzvl",
"confidence": 0
}
]
}
]
},
"readResult": {
"blocks": [
{
"lines": [
{
"text": "ufmjctoebx",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"words": [
{
"text": "cpcsgoi",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"confidence": 0
}
]
}
]
}
]
},
"denseCaptionsResult": {
"values": [
{
"text": "hgvxqwxwqgtjfippp",
"confidence": 0,
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
}
}
]
},
"modelVersion": "lymqyonwrxckwzrsxjihbceclts",
"metadata": {
"width": 28,
"height": 7
},
"tagsResult": {
"values": [
{
"name": "ikiqzvbmyrbuskhpphgjjuzvl",
"confidence": 0
}
]
},
"smartCropsResult": {
"values": [
{
"aspectRatio": 7,
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
}
}
]
},
"peopleResult": {
"values": [
{
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
},
"confidence": 0
}
]
}
}
ImageAnalysis_Analyze_MinimumSet_Gen
示例请求
POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01
"Ynl0ZXM="
示例响应
{
"modelVersion": "lymqyonwrxckwzrsxjihbceclts",
"metadata": {
"width": 28,
"height": 7
}
}
定义
名称 | 说明 |
---|---|
Bounding |
图像内部区域的边框。 |
Caption |
图像所描述的内容的简要说明。 |
Content |
图像中的实体观察值以及置信度分数。 |
Crop |
为智能裁剪标识的区域。 将为每个请求的纵横比返回一个区域。 |
Dense |
图像所描述的内容的简要说明。 |
Dense |
标题列表。 |
Detected |
描述在图像中检测到的对象。 |
Detected |
在图像中检测到的人员。 |
Detected |
检测到的文本块。 |
Detected |
检测到的文本行。 |
Detected |
由连续字符序列组成的检测到的单词。 对于非空格分隔语言(如中文、日语和朝鲜语),每个字符都表示为自己的单词。 |
Error |
发生错误时返回的响应。 |
Error |
错误信息。 |
Error |
详细错误。 |
Image |
描述不同类型的图像分析的组合结果。 |
Image |
图像元数据信息,例如高度和宽度。 |
Image |
表示图像中某个点的 对象。 |
Objects |
描述图像中检测到的对象。 |
People |
描述图像是否包含人员的对象。 |
Read |
读取操作的结果。 |
Smart |
智能裁剪结果。 |
Tags |
具有置信度级别的标记列表。 |
Visual |
请求的视觉特征。 必须至少指定一个视觉特征。 |
BoundingBox
图像内部区域的边框。
名称 | 类型 | 说明 |
---|---|---|
h |
integer |
从区域左上角点测得的高度(以像素为单位)。 |
w |
integer |
从区域左上角点测得的宽度(以像素为单位)。 |
x |
integer |
区域左上角点的左坐标(以像素为单位)。 |
y |
integer |
区域左上角点的上坐标(以像素为单位)。 |
CaptionResult
图像所描述的内容的简要说明。
名称 | 类型 | 说明 |
---|---|---|
confidence |
number |
服务在标题中的置信度级别。 置信度分数的范围在 0.0 到 1.0 (非独占) ,值越高表示匹配置信度越高。 |
text |
string |
标题的文本。 |
ContentTag
图像中的实体观察值以及置信度分数。
名称 | 类型 | 说明 |
---|---|---|
confidence |
number |
观察到实体的置信度。 置信度分数的范围在 0.0 到 1.0 (非独占) ,值越高表示匹配置信度越高。 |
name |
string |
实体的名称。 |
CropRegion
为智能裁剪标识的区域。 将为每个请求的纵横比返回一个区域。
名称 | 类型 | 说明 |
---|---|---|
aspectRatio |
number |
裁剪区域的纵横比。 |
boundingBox |
图像内部区域的边框。 |
DenseCaption
图像所描述的内容的简要说明。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
图像内部区域的边框。 |
|
confidence |
number |
服务在标题中的置信度级别。 置信度分数的范围在 0.0 到 1.0 (非独占) ,值越高表示匹配置信度越高。 |
text |
string |
标题的文本。 |
DenseCaptionsResult
标题列表。
名称 | 类型 | 说明 |
---|---|---|
values |
标题列表。 |
DetectedObject
描述在图像中检测到的对象。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
图像内部区域的边框。 |
|
id |
string |
检测到的对象 ID。 |
tags |
检测到的对象的分类置信度。 |
DetectedPerson
在图像中检测到的人员。
名称 | 类型 | 说明 |
---|---|---|
boundingBox |
图像内部区域的边框。 |
|
confidence |
number |
观察到图像中的人的置信度分数。 置信度分数的范围在 0.0 到 1.0 (非独占) ,值越高表示匹配置信度越高。 |
DetectedTextBlock
检测到的文本块。
名称 | 类型 | 说明 |
---|---|---|
lines |
文本块中的文本行列表。 |
DetectedTextLine
检测到的文本行。
名称 | 类型 | 说明 |
---|---|---|
boundingPolygon |
文本行的边界多边形。 |
|
text |
string |
检测到的文本行的文本内容。 |
words |
文本行中的单词列表。 |
DetectedTextWord
由连续字符序列组成的检测到的单词。 对于非空格分隔语言(如中文、日语和朝鲜语),每个字符都表示为自己的单词。
名称 | 类型 | 说明 |
---|---|---|
boundingPolygon |
单词的边界多边形。 |
|
confidence |
number |
检测到单词的置信度。 置信度分数的范围在 0.0 到 1.0 (非独占) ,值越高表示匹配置信度越高。 |
text |
string |
单词的文本内容。 |
ErrorResponse
发生错误时返回的响应。
名称 | 类型 | 说明 |
---|---|---|
error |
错误信息。 |
ErrorResponseDetails
错误信息。
名称 | 类型 | 说明 |
---|---|---|
code |
string |
错误代码。 |
details |
详细错误列表。 |
|
innererror |
详细错误。 |
|
message |
string |
错误消息。 |
target |
string |
错误的目标。 |
ErrorResponseInnerError
详细错误。
名称 | 类型 | 说明 |
---|---|---|
code |
string |
错误代码。 |
innererror |
详细错误。 |
|
message |
string |
错误消息。 |
ImageAnalysisResult
描述不同类型的图像分析的组合结果。
名称 | 类型 | 说明 |
---|---|---|
captionResult |
图像所描述的内容的简要说明。 |
|
denseCaptionsResult |
标题列表。 |
|
metadata |
图像元数据信息,例如高度和宽度。 |
|
modelVersion |
string |
模型版本。 |
objectsResult |
描述图像中检测到的对象。 |
|
peopleResult |
描述图像是否包含人员的对象。 |
|
readResult |
读取操作的结果。 |
|
smartCropsResult |
智能裁剪结果。 |
|
tagsResult |
具有置信度级别的标记列表。 |
ImageMetadata
图像元数据信息,例如高度和宽度。
名称 | 类型 | 说明 |
---|---|---|
height |
integer |
图像的高度(以像素为单位)。 |
width |
integer |
图像的宽度(以像素为单位)。 |
ImagePoint
表示图像中某个点的 对象。
名称 | 类型 | 说明 |
---|---|---|
x |
integer |
此点的 x 坐标。 |
y |
integer |
此点的 y 坐标。 |
ObjectsResult
描述图像中检测到的对象。
名称 | 类型 | 说明 |
---|---|---|
values |
检测到的对象数组。 |
PeopleResult
描述图像是否包含人员的对象。
名称 | 类型 | 说明 |
---|---|---|
values |
检测到的人员数组。 |
ReadResult
读取操作的结果。
名称 | 类型 | 说明 |
---|---|---|
blocks |
文本块的列表。 |
SmartCropsResult
智能裁剪结果。
名称 | 类型 | 说明 |
---|---|---|
values |
建议用于裁剪图像的区域。 |
TagsResult
具有置信度级别的标记列表。
名称 | 类型 | 说明 |
---|---|---|
values |
具有置信度级别的标记列表。 |
VisualFeature
请求的视觉特征。 必须至少指定一个视觉特征。
名称 | 类型 | 说明 |
---|---|---|
caption |
string |
摘要图像内容的说明或标题。 |
denseCaptions |
string |
提供图像内容的深入说明的详细标题。 |
objects |
string |
在图像中识别和标记的特定对象。 |
people |
string |
检测和分析图像中的人员。 |
read |
string |
从图像中提取的文本内容,例如标志或标签。 |
smartCrops |
string |
自动生成的裁剪版本的图像,专注于重要内容。 |
tags |
string |
表示图像中检测到的对象的视觉标记。 |