Analyze - Image
Analysez l’image d’entrée. La requête contient un flux d’image avec n’importe quel type de contenu ['image/*', 'application/octet-stream'] ou une charge utile JSON qui inclut une propriété URL à utiliser pour récupérer le flux d’image.
POST /imageanalysis:analyze?api-version=2024-02-01
POST /imageanalysis:analyze?features={features}&language={language}&model-version={model-version}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
api-version
|
query | True |
string |
Version de l’API demandée. |
features
|
query |
Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée. |
||
gender-neutral-caption
|
query |
boolean |
Indicateur booléen pour activer le sous-titrage non genré pour les fonctionnalités de légende et denseCaptions. Si ce paramètre n’est pas spécifié, la valeur par défaut est « false ». |
|
language
|
query |
string |
Langue souhaitée pour la génération de sortie. Si ce paramètre n’est pas spécifié, la valeur par défaut est « en ». Consultez https://aka.ms/cv-languages pour obtenir la liste des langues prises en charge. |
|
model-version
|
query |
string |
Version du modèle. |
|
smartcrops-aspect-ratios
|
query |
array[] |
Liste des proportions à utiliser pour la fonctionnalité smartCrops. Les proportions sont calculées en divisant la largeur de rognage cible par la hauteur. Les valeurs prises en charge sont comprises entre 0,75 et 1,8 (inclus). Plusieurs valeurs doivent être séparées par des virgules. Si ce paramètre n’est pas spécifié, le service retourne une suggestion de rognage avec des proportions comprises entre 0,5 et 2,0 (inclus). |
Corps de la demande
Nom | Obligatoire | Type | Description |
---|---|---|---|
url | True |
string |
URL accessible publiquement d’une image. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
Succès |
|
Other Status Codes |
Error En-têtes x-ms-error-code: string |
Exemples
Image |
Image |
ImageAnalysis_Analyze_MaximumSet_Gen
Exemple de requête
POST /imageanalysis:analyze?features=tags&language=hduryxtlvjjvwnmpjiojibvjy&model-version=kkblitshktun&smartcrops-aspect-ratios=&gender-neutral-caption=True&api-version=2024-02-01
{
"url": "https://microsoft.com/a"
}
Exemple de réponse
{
"captionResult": {
"text": "azcggjzjuvbytsq",
"confidence": 0
},
"objectsResult": {
"values": [
{
"id": "iaofvdltgfjrsffgltupmo",
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
},
"tags": [
{
"name": "expoctetvqe",
"confidence": 0
}
]
}
]
},
"readResult": {
"blocks": [
{
"lines": [
{
"text": "npk",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"words": [
{
"text": "wljuxeeadklupdpxgcinka",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"confidence": 0
}
]
}
]
}
]
},
"denseCaptionsResult": {
"values": [
{
"text": "pqrcyrtz",
"confidence": 0,
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
}
}
]
},
"modelVersion": "hslbdtpcuyabri",
"metadata": {
"width": 10,
"height": 27
},
"tagsResult": {
"values": [
{
"name": "expoctetvqe",
"confidence": 0
}
]
},
"smartCropsResult": {
"values": [
{
"aspectRatio": 23,
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
}
}
]
},
"peopleResult": {
"values": [
{
"boundingBox": {
"x": 0,
"y": 0,
"w": 27,
"h": 13
},
"confidence": 0
}
]
}
}
ImageAnalysis_Analyze_MinimumSet_Gen
Exemple de requête
POST /imageanalysis:analyze?api-version=2024-02-01
{
"url": "https://www.abc.com"
}
Exemple de réponse
{
"modelVersion": "cvhbhwpfswz",
"metadata": {
"width": 10,
"height": 23
}
}
Définitions
Nom | Description |
---|---|
Bounding |
Cadre englobant pour une zone à l’intérieur d’une image. |
Caption |
Brève description de ce que l’image représente. |
Content |
Une observation d’entité dans l’image, ainsi que le score de confiance. |
Crop |
Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée. |
Dense |
Brève description de ce que l’image représente. |
Dense |
Liste de légendes. |
Detected |
Décrit un objet détecté dans une image. |
Detected |
Personne détectée dans une image. |
Detected |
Bloc de texte détecté. |
Detected |
Ligne de texte détectée. |
Detected |
Mot détecté constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot. |
Error |
Réponse retournée lorsqu’une erreur se produit. |
Error |
Informations sur l’erreur. |
Error |
Erreur détaillée. |
Image |
Décrire les résultats combinés de différents types d’analyse d’images. |
Image |
Informations de métadonnées d’image telles que la hauteur et la largeur. |
Image |
Objet représentant un point dans l’image. |
Image |
Document JSON avec une URL pointant vers l’image accessible publiquement à analyser. |
Objects |
Décrit les objets détectés dans une image. |
People |
Objet indiquant si l’image contient des personnes. |
Read |
Résultats d’une opération de lecture. |
Smart |
Résultat du rognage intelligent. |
Tags |
Liste d’étiquettes avec un niveau de confiance. |
Visual |
Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée. |
BoundingBox
Cadre englobant pour une zone à l’intérieur d’une image.
Nom | Type | Description |
---|---|---|
h |
integer |
Hauteur mesurée à partir du point supérieur gauche de la zone, en pixels. |
w |
integer |
Largeur mesurée à partir du point supérieur gauche de la zone, en pixels. |
x |
integer |
Coordonnée gauche du point supérieur gauche de la zone, en pixels. |
y |
integer |
Coordonnée supérieure du point supérieur gauche de la zone, en pixels. |
CaptionResult
Brève description de ce que l’image représente.
Nom | Type | Description |
---|---|---|
confidence |
number |
Niveau de confiance du service dans la légende. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance. |
text |
string |
Texte de la légende. |
ContentTag
Une observation d’entité dans l’image, ainsi que le score de confiance.
Nom | Type | Description |
---|---|---|
confidence |
number |
Niveau de confiance que l’entité a été observée. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance. |
name |
string |
Nom de l’entité. |
CropRegion
Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée.
Nom | Type | Description |
---|---|---|
aspectRatio |
number |
Proportions de la région de rognage. |
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
DenseCaption
Brève description de ce que l’image représente.
Nom | Type | Description |
---|---|---|
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
|
confidence |
number |
Niveau de confiance du service dans la légende. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance. |
text |
string |
Texte de la légende. |
DenseCaptionsResult
Liste de légendes.
Nom | Type | Description |
---|---|---|
values |
Liste de légendes. |
DetectedObject
Décrit un objet détecté dans une image.
Nom | Type | Description |
---|---|---|
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
|
id |
string |
ID de l’objet détecté. |
tags |
Confiances de classification de l’objet détecté. |
DetectedPerson
Personne détectée dans une image.
Nom | Type | Description |
---|---|---|
boundingBox |
Cadre englobant pour une zone à l’intérieur d’une image. |
|
confidence |
number |
Score de confiance d’avoir observé la personne dans l’image. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance. |
DetectedTextBlock
Bloc de texte détecté.
Nom | Type | Description |
---|---|---|
lines |
Liste des lignes de texte dans le bloc de texte. |
DetectedTextLine
Ligne de texte détectée.
Nom | Type | Description |
---|---|---|
boundingPolygon |
Polygone englobant de la ligne de texte. |
|
text |
string |
Contenu textuel de la ligne de texte détectée. |
words |
Liste des mots dans la ligne de texte. |
DetectedTextWord
Mot détecté constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.
Nom | Type | Description |
---|---|---|
boundingPolygon |
Polygone englobant du mot. |
|
confidence |
number |
Niveau de confiance que le mot a été détecté. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance. |
text |
string |
Contenu textuel du mot. |
ErrorResponse
Réponse retournée lorsqu’une erreur se produit.
Nom | Type | Description |
---|---|---|
error |
Informations sur l’erreur. |
ErrorResponseDetails
Informations sur l’erreur.
Nom | Type | Description |
---|---|---|
code |
string |
Code d’erreur. |
details |
Liste des erreurs détaillées. |
|
innererror |
Erreur détaillée. |
|
message |
string |
Message d’erreur. |
target |
string |
Cible de l’erreur. |
ErrorResponseInnerError
Erreur détaillée.
Nom | Type | Description |
---|---|---|
code |
string |
Code d’erreur. |
innererror |
Erreur détaillée. |
|
message |
string |
Message d’erreur. |
ImageAnalysisResult
Décrire les résultats combinés de différents types d’analyse d’images.
Nom | Type | Description |
---|---|---|
captionResult |
Brève description de ce que l’image représente. |
|
denseCaptionsResult |
Liste de légendes. |
|
metadata |
Informations de métadonnées d’image telles que la hauteur et la largeur. |
|
modelVersion |
string |
Version de modèle. |
objectsResult |
Décrit les objets détectés dans une image. |
|
peopleResult |
Objet indiquant si l’image contient des personnes. |
|
readResult |
Résultats d’une opération de lecture. |
|
smartCropsResult |
Résultat du rognage intelligent. |
|
tagsResult |
Liste d’étiquettes avec un niveau de confiance. |
ImageMetadata
Informations de métadonnées d’image telles que la hauteur et la largeur.
Nom | Type | Description |
---|---|---|
height |
integer |
La hauteur de l’image est en pixels. |
width |
integer |
La largeur de l’image est en pixels. |
ImagePoint
Objet représentant un point dans l’image.
Nom | Type | Description |
---|---|---|
x |
integer |
Coordonnée x de ce point. |
y |
integer |
Coordonnée y de ce point. |
ImageUrl
Document JSON avec une URL pointant vers l’image accessible publiquement à analyser.
Nom | Type | Description |
---|---|---|
url |
string |
URL accessible publiquement d’une image. |
ObjectsResult
Décrit les objets détectés dans une image.
Nom | Type | Description |
---|---|---|
values |
Tableau d’objets détectés. |
PeopleResult
Objet indiquant si l’image contient des personnes.
Nom | Type | Description |
---|---|---|
values |
Tableau de personnes détectées. |
ReadResult
Résultats d’une opération de lecture.
Nom | Type | Description |
---|---|---|
blocks |
Liste de blocs de texte. |
SmartCropsResult
Résultat du rognage intelligent.
Nom | Type | Description |
---|---|---|
values |
Régions recommandées pour le rognage de l’image. |
TagsResult
Liste d’étiquettes avec un niveau de confiance.
Nom | Type | Description |
---|---|---|
values |
Liste d’étiquettes avec un niveau de confiance. |
VisualFeature
Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.
Nom | Type | Description |
---|---|---|
caption |
string |
Description ou légende résumant le contenu de l’image. |
denseCaptions |
string |
Légendes détaillées fournissant des descriptions détaillées du contenu de l’image. |
objects |
string |
Objets spécifiques reconnus et étiquetés dans l’image. |
people |
string |
Détection et analyse des personnes dans l’image. |
read |
string |
Contenu textuel extrait de l’image, tel que des signes ou des étiquettes. |
smartCrops |
string |
Les versions rognées générées automatiquement de l’image se concentrent sur du contenu important. |
tags |
string |
Balises visuelles représentant les objets détectés dans l’image. |