Image Analysis - Analyze Stream
Analysez l’image d’entrée. La requête contient soit un flux d’image avec n’importe quel type de contenu ['image/*', 'application/octet-stream'] ou une charge utile JSON qui inclut une propriété url à utiliser pour récupérer le flux d’image.
POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview
POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
api-version
|
query | True |
string |
Version de l’API demandée. |
features
|
query |
Les fonctionnalités visuelles demandées : balises, objets, légende, denseCaptions, lecture, smartCrops, personnes. Ce paramètre doit être spécifié si le paramètre « model-name » n’est pas spécifié. |
||
gender-neutral-caption
|
query |
boolean |
Indicateur booléen pour activer le sous-titrage sans sexe pour les fonctionnalités de légende et denseCaptions. Si ce paramètre n’est pas spécifié, la valeur par défaut est « false ». |
|
language
|
query |
string |
Langue souhaitée pour la génération de sortie. Si ce paramètre n’est pas spécifié, la valeur par défaut est « en ». Consultez https://aka.ms/cv-languages la liste des langues prises en charge. |
|
model-name
|
query |
string |
Nom du modèle entraîné personnalisé. Ce paramètre doit être spécifié si le paramètre « features » n’est pas spécifié. |
|
smartcrops-aspect-ratios
|
query |
string |
Liste des proportions à utiliser pour la fonctionnalité smartCrops. Les proportions sont calculées en divisant la largeur du rognage cible par la hauteur. Les valeurs prises en charge sont comprises entre 0,75 et 1,8 (inclus). Plusieurs valeurs doivent être séparées par des virgules. Si ce paramètre n’est pas spécifié, le service retourne une suggestion de rognage avec un rapport d’aspect compris entre 0,5 et 2,0 (inclus). |
Corps de la demande
Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"
Nom | Type | Description |
---|---|---|
body |
string |
Flux d’images. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
Succès |
|
Other Status Codes |
Error En-têtes x-ms-error-code: string |
Exemples
AnalyzeImageFromImageStream_CustomModel
Exemple de requête
POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview
"Ynl0ZXM="
Exemple de réponse
{
"modelVersion": "2023-04-01-preview",
"customModelResult": {
"objectsResult": {
"values": [
{
"id": "1",
"boundingBox": {
"x": 197,
"y": 68,
"w": 356,
"h": 394
},
"tags": [
{
"name": "class1",
"confidence": 0.92431640625
}
]
},
{
"id": "2",
"boundingBox": {
"x": 0,
"y": 77,
"w": 241,
"h": 359
},
"tags": [
{
"name": "class1",
"confidence": 0.87890625
}
]
}
]
}
},
"metadata": {
"width": 660,
"height": 495
}
}
Définitions
Nom | Description |
---|---|
Adult |
Objet décrivant la correspondance de contenu pour adultes. |
Adult |
Objet décrivant si l’image contient du contenu destiné aux adultes et/ou si elle est racé. |
Bounding |
Cadre englobant pour une zone à l’intérieur d’une image. |
Caption |
Brève description de ce que l’image représente. |
Crop |
Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée. |
Dense |
Brève description de ce que l’image représente. |
Dense |
Liste de légendes. |
Detected |
Décrit un objet détecté dans une image. |
Detected |
Personne détectée dans une image. |
Document |
Objet de ligne de contenu constitué d’une séquence adjacente d’éléments de contenu, tels que des mots et des marques de sélection. |
Document |
Éléments de contenu et de disposition extraits d’une page à partir de l’entrée. |
Document |
Région contiguë de la propriété de contenu concaténé, spécifiée sous forme de décalage et de longueur. |
Document |
Objet représentant les styles de texte observés. |
Document |
Objet word constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot. |
Error |
Réponse retournée lorsqu’une erreur se produit. |
Error |
Informations sur l’erreur. |
Error |
Erreur détaillée. |
Image |
Décrire les résultats combinés de différents types d’analyse d’images. |
Image |
Informations de métadonnées d’image telles que la hauteur et la largeur. |
Image |
Décrit le résultat de prédiction d’une image. |
Objects |
Décrit les objets détectés dans une image. |
People |
Objet indiquant si l’image contient des personnes. |
Read |
Résultats d’une opération de lecture. |
Smart |
Résultat du rognage intelligent. |
Tag |
Une observation d’entité dans l’image, ainsi que le score de confiance. |
Tags |
Liste d’étiquettes avec un niveau de confiance. |
Visual |
Les fonctionnalités visuelles demandées : balises, objets, légende, denseCaptions, lecture, smartCrops, personnes. Ce paramètre doit être spécifié si le paramètre « model-name » n’est pas spécifié. |
AdultMatch
Objet décrivant la correspondance de contenu pour adultes.
Nom | Type | Description |
---|---|---|
confidence |
number |
Valeur indiquant le niveau de confiance du contenu pour adultes correspondant. |
isMatch |
boolean |
Valeur indiquant si l’image correspond au contenu pour adultes. |
AdultResult
Objet décrivant si l’image contient du contenu destiné aux adultes et/ou si elle est racé.
Nom | Type | Description |
---|---|---|
adult |
Objet décrivant la correspondance de contenu pour adultes. |
|
gore |
Objet décrivant la correspondance de contenu pour adultes. |
|
racy |
Objet décrivant la correspondance de contenu pour adultes. |
BoundingBox
Cadre englobant pour une zone à l’intérieur d’une image.
Nom | Type | Description |
---|---|---|
h |
integer |
Hauteur mesurée à partir du point supérieur gauche de la zone, en pixels. |
w |
integer |
Largeur mesurée à partir du point supérieur gauche de la zone, en pixels. |
x |
integer |
Coordonnée gauche du point supérieur gauche de la zone, en pixels. |
y |
integer |
Coordonnée supérieure du point supérieur gauche de la zone, en pixels. |
CaptionResult
Brève description de ce que l’image représente.
Nom | Type | Description |
---|---|---|
confidence |
number |
Niveau de confiance du service dans la légende. |
text |
string |
Texte de la légende. |
CropRegion
Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée.
Nom | Type | Description |
---|---|---|
aspectRatio |
number |
Proportions de la région de rognage. |
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
DenseCaption
Brève description de ce que l’image représente.
Nom | Type | Description |
---|---|---|
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
|
confidence |
number |
Niveau de confiance du service dans la légende. |
text |
string |
Texte de la légende. |
DenseCaptionsResult
Liste de légendes.
Nom | Type | Description |
---|---|---|
values |
Liste de légendes. |
DetectedObject
Décrit un objet détecté dans une image.
Nom | Type | Description |
---|---|---|
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
|
id |
string |
ID de l’objet détecté. |
tags |
Tag[] |
Confiances de classification de l’objet détecté. |
DetectedPerson
Personne détectée dans une image.
Nom | Type | Description |
---|---|---|
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
|
confidence |
number |
Score de confiance d’avoir observé la personne dans l’image, sous la forme d’une valeur comprise entre 0 et 1. |
DocumentLine
Objet de ligne de contenu constitué d’une séquence adjacente d’éléments de contenu, tels que des mots et des marques de sélection.
Nom | Type | Description |
---|---|---|
boundingBox |
number[] |
Zone englobante de la ligne. |
content |
string |
Contenu concaténé des éléments contenus dans l’ordre de lecture. |
spans |
Emplacement de la ligne dans le contenu concaténé de l’ordre de lecture. |
DocumentPage
Éléments de contenu et de disposition extraits d’une page à partir de l’entrée.
Nom | Type | Description |
---|---|---|
angle |
number |
Orientation générale du contenu dans le sens des aiguilles d’une montre, mesurée en degrés compris entre (-180, 180). |
height |
number |
Hauteur de l’image/PDF en pixels/pouces, respectivement. |
lines |
Lignes extraites de la page, contenant potentiellement des éléments textuels et visuels. |
|
pageNumber |
integer |
Numéro de page basé sur 1 dans le document d’entrée. |
spans |
Emplacement de la page dans le contenu concaténé dans l’ordre de lecture. |
|
width |
number |
Largeur de l’image/PDF en pixels/pouces, respectivement. |
words |
Mots extraits de la page. |
DocumentSpan
Région contiguë de la propriété de contenu concaténé, spécifiée sous forme de décalage et de longueur.
Nom | Type | Description |
---|---|---|
length |
integer |
Nombre de caractères dans le contenu représenté par l’étendue. |
offset |
integer |
Index de base zéro du contenu représenté par l’étendue. |
DocumentStyle
Objet représentant les styles de texte observés.
Nom | Type | Description |
---|---|---|
confidence |
number |
Confiance d’identifier correctement le style. |
isHandwritten |
boolean |
Contenu manuscrit ou non. |
spans |
Emplacement des éléments de texte dans le contenu concaténé auquel le style s’applique. |
DocumentWord
Objet word constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.
Nom | Type | Description |
---|---|---|
boundingBox |
number[] |
Cadre englobant du mot. |
confidence |
number |
Confiance de l’extraction correcte du mot. |
content |
string |
Contenu textuel du mot. |
span |
Zone contiguë de la propriété de contenu concaténé, spécifiée en tant que décalage et longueur. |
ErrorResponse
Réponse retournée lorsqu’une erreur se produit.
Nom | Type | Description |
---|---|---|
error |
Informations sur l’erreur. |
ErrorResponseDetails
Informations sur l’erreur.
Nom | Type | Description |
---|---|---|
code |
string |
Code d’erreur. |
details |
Liste des erreurs détaillées. |
|
innererror |
Erreur détaillée. |
|
message |
string |
Message d’erreur. |
target |
string |
Cible de l’erreur. |
ErrorResponseInnerError
Erreur détaillée.
Nom | Type | Description |
---|---|---|
code |
string |
Code d’erreur. |
innererror |
Erreur détaillée. |
|
message |
string |
Message d’erreur. |
ImageAnalysisResult
Décrire les résultats combinés de différents types d’analyse d’images.
Nom | Type | Description |
---|---|---|
adultResult |
Objet décrivant si l’image contient du contenu destiné aux adultes et/ou si elle est racé. |
|
captionResult |
Brève description de ce que l’image représente. |
|
customModelResult |
Décrit le résultat de prédiction d’une image. |
|
denseCaptionsResult |
Liste de légendes. |
|
metadata |
Informations de métadonnées d’image telles que la hauteur et la largeur. |
|
modelVersion |
string |
Version de modèle. |
objectsResult |
Décrit les objets détectés dans une image. |
|
peopleResult |
Objet indiquant si l’image contient des personnes. |
|
readResult |
Résultats d’une opération de lecture. |
|
smartCropsResult |
Résultat du rognage intelligent. |
|
tagsResult |
Liste d’étiquettes avec un niveau de confiance. |
ImageMetadataApiModel
Informations de métadonnées d’image telles que la hauteur et la largeur.
Nom | Type | Description |
---|---|---|
height |
integer |
La hauteur de l’image est en pixels. |
width |
integer |
La largeur de l’image est en pixels. |
ImagePredictionResult
Décrit le résultat de prédiction d’une image.
Nom | Type | Description |
---|---|---|
objectsResult |
Décrit les objets détectés dans une image. |
|
tagsResult |
Liste d’étiquettes avec un niveau de confiance. |
ObjectsResult
Décrit les objets détectés dans une image.
Nom | Type | Description |
---|---|---|
values |
Tableau d’objets détectés. |
PeopleResult
Objet indiquant si l’image contient des personnes.
Nom | Type | Description |
---|---|---|
values |
Tableau de personnes détectées. |
ReadResult
Résultats d’une opération de lecture.
Nom | Type | Description |
---|---|---|
content |
string |
Concaténer une représentation sous forme de chaîne de tous les éléments textuels et visuels dans l’ordre de lecture. |
pages |
Liste des pages analysées. |
|
stringIndexType |
string |
Méthode utilisée pour calculer le décalage et la longueur de chaîne, les valeurs possibles sont « textElements », « unicodeCodePoint », « utf16CodeUnit », etc. |
styles |
Styles de police extraits. |
SmartCropsResult
Résultat du rognage intelligent.
Nom | Type | Description |
---|---|---|
values |
Régions recommandées pour le rognage de l’image. |
Tag
Une observation d’entité dans l’image, ainsi que le score de confiance.
Nom | Type | Description |
---|---|---|
confidence |
number |
Niveau de confiance que l’entité a été observée. |
name |
string |
Nom de l’entité. |
TagsResult
Liste d’étiquettes avec un niveau de confiance.
Nom | Type | Description |
---|---|---|
values |
Tag[] |
Liste d’étiquettes avec un niveau de confiance. |
VisualFeature
Les fonctionnalités visuelles demandées : balises, objets, légende, denseCaptions, lecture, smartCrops, personnes. Ce paramètre doit être spécifié si le paramètre « model-name » n’est pas spécifié.
Nom | Type | Description |
---|---|---|
caption |
string |
|
denseCaptions |
string |
|
objects |
string |
|
people |
string |
|
read |
string |
|
smartCrops |
string |
|
tags |
string |