Analyze - Image
Analise a imagem de entrada. A solicitação contém fluxo de imagem com qualquer tipo de conteúdo ['image/*', 'application/octet-stream'], ou um conteúdo JSON que inclui uma propriedade de URL a ser usada para recuperar o fluxo de imagem.
POST /imageanalysis:analyze?api-version=2024-02-01
POST /imageanalysis:analyze?features={features}&language={language}&model-version={model-version}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01
Parâmetros de URI
Nome | Em | Obrigatório | Tipo | Description |
---|---|---|---|---|
api-version
|
query | True |
string |
Versão da API solicitada. |
features
|
query |
Os recursos visuais solicitados. Pelo menos um recurso visual deve ser especificado. |
||
gender-neutral-caption
|
query |
boolean |
Sinalizador booliano para habilitar legendas neutras de gênero para recursos de legenda e denseCaptions. Se esse parâmetro não for especificado, o valor padrão será "false". |
|
language
|
query |
string |
A linguagem desejada para geração de saída. Se este parâmetro não for especificado, o valor padrão é “en”. Consulte https://aka.ms/cv-languages para obter uma lista de idiomas com suporte. |
|
model-version
|
query |
string |
Versão do modelo. |
|
smartcrops-aspect-ratios
|
query |
array[] |
Uma lista de proporções a serem usadas para o recurso smartCrops. As taxas de proporção são calculadas dividindo a largura da cultura de destino pela altura. Os valores com suporte estão entre 0,75 e 1,8 (inclusive). Vários valores devem ser separados por vírgulas. Se esse parâmetro não for especificado, o serviço retornará uma sugestão de corte com uma taxa de proporção que achar adequada entre 0,5 e 2,0 (inclusive). |
Corpo da solicitação
Nome | Obrigatório | Tipo | Description |
---|---|---|---|
url | True |
string |
URL acessível publicamente de uma imagem. |
Respostas
Nome | Tipo | Description |
---|---|---|
200 OK |
Êxito |
|
Other Status Codes |
Erro Cabeçalhos x-ms-error-code: string |
Exemplos
Image |
Image |
ImageAnalysis_Analyze_MaximumSet_Gen
Solicitação de exemplo
POST /imageanalysis:analyze?features=tags&language=hduryxtlvjjvwnmpjiojibvjy&model-version=kkblitshktun&smartcrops-aspect-ratios=&gender-neutral-caption=True&api-version=2024-02-01
{
"url": "https://microsoft.com/a"
}
Resposta de exemplo
{
"captionResult": {
"text": "azcggjzjuvbytsq",
"confidence": 0
},
"objectsResult": {
"values": [
{
"id": "iaofvdltgfjrsffgltupmo",
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
},
"tags": [
{
"name": "expoctetvqe",
"confidence": 0
}
]
}
]
},
"readResult": {
"blocks": [
{
"lines": [
{
"text": "npk",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"words": [
{
"text": "wljuxeeadklupdpxgcinka",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"confidence": 0
}
]
}
]
}
]
},
"denseCaptionsResult": {
"values": [
{
"text": "pqrcyrtz",
"confidence": 0,
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
}
}
]
},
"modelVersion": "hslbdtpcuyabri",
"metadata": {
"width": 10,
"height": 27
},
"tagsResult": {
"values": [
{
"name": "expoctetvqe",
"confidence": 0
}
]
},
"smartCropsResult": {
"values": [
{
"aspectRatio": 23,
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
}
}
]
},
"peopleResult": {
"values": [
{
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
},
"confidence": 0
}
]
}
}
ImageAnalysis_Analyze_MinimumSet_Gen
Solicitação de exemplo
POST /imageanalysis:analyze?api-version=2024-02-01
{
"url": "https://www.abc.com"
}
Resposta de exemplo
{
"modelVersion": "cvhbhwpfswz",
"metadata": {
"width": 10,
"height": 23
}
}
Definições
Nome | Description |
---|---|
Bounding |
Uma caixa delimitadora para uma área dentro de uma imagem. |
Caption |
Uma breve descrição do que a imagem descreve. |
Content |
Uma observação de entidade na imagem, juntamente com a pontuação de confiança. |
Crop |
Uma região identificada para corte inteligente. Haverá uma região retornada para cada taxa de proporção solicitada. |
Dense |
Uma breve descrição do que a imagem descreve. |
Dense |
Uma lista de legendas. |
Detected |
Descreve um objeto detectado em uma imagem. |
Detected |
Uma pessoa detectada em uma imagem. |
Detected |
Um bloco de texto detectado. |
Detected |
Uma linha de texto detectada. |
Detected |
Uma palavra detectada que consiste em uma sequência contígua de caracteres. Para idiomas delimitados por espaço, como chinês, japonês e coreano, cada caractere é representado como sua própria palavra. |
Error |
Resposta retornada quando ocorre um erro. |
Error |
Informações de erro. |
Error |
Erro detalhado. |
Image |
Descrever os resultados combinados de diferentes tipos de análise de imagem. |
Image |
As informações de metadados da imagem, como altura e largura. |
Image |
Um objeto que representa um ponto na imagem. |
Image |
Um documento JSON com uma URL apontando para a imagem publicamente acessível a ser analisada. |
Objects |
Descreve objetos detectados em uma imagem. |
People |
Um objeto que descreve se a imagem contém pessoas. |
Read |
Os resultados de uma operação de Leitura. |
Smart |
Resultado do corte inteligente. |
Tags |
Uma lista de marcas com nível de confiança. |
Visual |
Os recursos visuais solicitados. Pelo menos um recurso visual deve ser especificado. |
BoundingBox
Uma caixa delimitadora para uma área dentro de uma imagem.
Nome | Tipo | Description |
---|---|---|
h |
integer |
Altura medida do ponto superior esquerdo da área, em pixels. |
w |
integer |
Largura medida do ponto superior esquerdo da área, em pixels. |
x |
integer |
Coordenada esquerda do ponto superior esquerdo da área, em pixels. |
y |
integer |
Coordenada superior do ponto superior esquerdo da área, em pixels. |
CaptionResult
Uma breve descrição do que a imagem descreve.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
O nível de confiança que o serviço tem na legenda. As pontuações de confiança abrangem o intervalo de 0,0 a 1,0 (inclusive), com valores mais altos indicando uma maior confiança de uma correspondência. |
text |
string |
O texto da legenda. |
ContentTag
Uma observação de entidade na imagem, juntamente com a pontuação de confiança.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
O nível de confiança que a entidade foi observada. As pontuações de confiança abrangem o intervalo de 0,0 a 1,0 (inclusive), com valores mais altos indicando uma maior confiança de uma correspondência. |
name |
string |
Nome da entidade. |
CropRegion
Uma região identificada para corte inteligente. Haverá uma região retornada para cada taxa de proporção solicitada.
Nome | Tipo | Description |
---|---|---|
aspectRatio |
number |
A taxa de proporção da região de corte. |
boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
DenseCaption
Uma breve descrição do que a imagem descreve.
Nome | Tipo | Description |
---|---|---|
boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
confidence |
number |
O nível de confiança que o serviço tem na legenda. As pontuações de confiança abrangem o intervalo de 0,0 a 1,0 (inclusive), com valores mais altos indicando uma maior confiança de uma correspondência. |
text |
string |
O texto da legenda. |
DenseCaptionsResult
Uma lista de legendas.
Nome | Tipo | Description |
---|---|---|
values |
Uma lista de legendas. |
DetectedObject
Descreve um objeto detectado em uma imagem.
Nome | Tipo | Description |
---|---|---|
boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
id |
string |
ID do objeto detectado. |
tags |
Confianças de classificação do objeto detectado. |
DetectedPerson
Uma pessoa detectada em uma imagem.
Nome | Tipo | Description |
---|---|---|
boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
confidence |
number |
Pontuação de confiança de ter observado a pessoa na imagem. As pontuações de confiança abrangem o intervalo de 0,0 a 1,0 (inclusive), com valores mais altos indicando uma maior confiança de uma correspondência. |
DetectedTextBlock
Um bloco de texto detectado.
Nome | Tipo | Description |
---|---|---|
lines |
Lista de linhas de texto no bloco de texto. |
DetectedTextLine
Uma linha de texto detectada.
Nome | Tipo | Description |
---|---|---|
boundingPolygon |
Polígono delimitando a linha de texto. |
|
text |
string |
Conteúdo de texto da linha de texto detectada. |
words |
Lista de palavras na linha de texto. |
DetectedTextWord
Uma palavra detectada que consiste em uma sequência contígua de caracteres. Para idiomas delimitados por espaço, como chinês, japonês e coreano, cada caractere é representado como sua própria palavra.
Nome | Tipo | Description |
---|---|---|
boundingPolygon |
Polígono delimitando a palavra. |
|
confidence |
number |
O nível de confiança de que a palavra foi detectada. As pontuações de confiança abrangem o intervalo de 0,0 a 1,0 (inclusive), com valores mais altos indicando uma maior confiança de uma correspondência. |
text |
string |
Conteúdo de texto da palavra. |
ErrorResponse
Resposta retornada quando ocorre um erro.
Nome | Tipo | Description |
---|---|---|
error |
Informações de erro. |
ErrorResponseDetails
Informações de erro.
Nome | Tipo | Description |
---|---|---|
code |
string |
Código do erro. |
details |
Lista de erros detalhados. |
|
innererror |
Erro detalhado. |
|
message |
string |
Mensagem de erro. |
target |
string |
Destino do erro. |
ErrorResponseInnerError
Erro detalhado.
Nome | Tipo | Description |
---|---|---|
code |
string |
Código do erro. |
innererror |
Erro detalhado. |
|
message |
string |
Mensagem de erro. |
ImageAnalysisResult
Descrever os resultados combinados de diferentes tipos de análise de imagem.
Nome | Tipo | Description |
---|---|---|
captionResult |
Uma breve descrição do que a imagem descreve. |
|
denseCaptionsResult |
Uma lista de legendas. |
|
metadata |
As informações de metadados da imagem, como altura e largura. |
|
modelVersion |
string |
Versão do modelo. |
objectsResult |
Descreve objetos detectados em uma imagem. |
|
peopleResult |
Um objeto que descreve se a imagem contém pessoas. |
|
readResult |
Os resultados de uma operação de Leitura. |
|
smartCropsResult |
Resultado do corte inteligente. |
|
tagsResult |
Uma lista de marcas com nível de confiança. |
ImageMetadata
As informações de metadados da imagem, como altura e largura.
Nome | Tipo | Description |
---|---|---|
height |
integer |
A altura da imagem em pixels. |
width |
integer |
A largura da imagem em pixels. |
ImagePoint
Um objeto que representa um ponto na imagem.
Nome | Tipo | Description |
---|---|---|
x |
integer |
A coordenada x deste ponto. |
y |
integer |
A coordenada y deste ponto. |
ImageUrl
Um documento JSON com uma URL apontando para a imagem publicamente acessível a ser analisada.
Nome | Tipo | Description |
---|---|---|
url |
string |
URL acessível publicamente de uma imagem. |
ObjectsResult
Descreve objetos detectados em uma imagem.
Nome | Tipo | Description |
---|---|---|
values |
Uma matriz de objetos detectados. |
PeopleResult
Um objeto que descreve se a imagem contém pessoas.
Nome | Tipo | Description |
---|---|---|
values |
Uma matriz de pessoas detectadas. |
ReadResult
Os resultados de uma operação de Leitura.
Nome | Tipo | Description |
---|---|---|
blocks |
Uma lista de blocos de texto. |
SmartCropsResult
Resultado do corte inteligente.
Nome | Tipo | Description |
---|---|---|
values |
Regiões recomendadas para cortar a imagem. |
TagsResult
Uma lista de marcas com nível de confiança.
Nome | Tipo | Description |
---|---|---|
values |
Uma lista de marcas com nível de confiança. |
VisualFeature
Os recursos visuais solicitados. Pelo menos um recurso visual deve ser especificado.
Nome | Tipo | Description |
---|---|---|
caption |
string |
Uma descrição ou uma legenda resumindo o conteúdo da imagem. |
denseCaptions |
string |
Legendas detalhadas que fornecem descrições detalhadas do conteúdo da imagem. |
objects |
string |
Objetos específicos reconhecidos e rotulados na imagem. |
people |
string |
Detecção e análise de pessoas na imagem. |
read |
string |
Conteúdo textual extraído da imagem, como sinais ou rótulos. |
smartCrops |
string |
As versões cortadas geradas automaticamente da imagem se concentram em conteúdo importante. |
tags |
string |
Marcas visuais que representam objetos detectados na imagem. |