Analyze - Image

Référence

Service:: Azure AI Services

Version d'API:: 2024-02-01

Analysez l’image d’entrée. La requête contient un flux d’image avec n’importe quel type de contenu ['image/*', 'application/octet-stream'] ou une charge utile JSON qui inclut une propriété URL à utiliser pour récupérer le flux d’image.

POST /imageanalysis:analyze?api-version=2024-02-01

Avec des paramètres facultatifs:

POST /imageanalysis:analyze?features={features}&language={language}&model-version={model-version}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01

Paramètres URI

Nom	Dans	Obligatoire	Type	Description
api-version	query	True	string	Version de l’API demandée.
features	query		VisualFeature[]	Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.
gender-neutral-caption	query		boolean	Indicateur booléen pour activer le sous-titrage non genré pour les fonctionnalités de légende et denseCaptions. Si ce paramètre n’est pas spécifié, la valeur par défaut est « false ».
language	query		string	Langue souhaitée pour la génération de sortie. Si ce paramètre n’est pas spécifié, la valeur par défaut est « en ». Consultez https://aka.ms/cv-languages pour obtenir la liste des langues prises en charge.
model-version	query		string	Version du modèle.
smartcrops-aspect-ratios	query		array[]	Liste des proportions à utiliser pour la fonctionnalité smartCrops. Les proportions sont calculées en divisant la largeur de rognage cible par la hauteur. Les valeurs prises en charge sont comprises entre 0,75 et 1,8 (inclus). Plusieurs valeurs doivent être séparées par des virgules. Si ce paramètre n’est pas spécifié, le service retourne une suggestion de rognage avec des proportions comprises entre 0,5 et 2,0 (inclus).

Corps de la demande

Nom	Obligatoire	Type	Description
url	True	string	URL accessible publiquement d’une image.

Réponses

Nom	Type	Description
200 OK	ImageAnalysisResult	Succès
Other Status Codes	ErrorResponse	Error En-têtes x-ms-error-code: string

Nom

Type

Description

200 OK

ImageAnalysisResult

Succès

Other Status Codes

ErrorResponse

Error

En-têtes

x-ms-error-code: string

Exemples

ImageAnalysis_Analyze_MaximumSet_Gen

ImageAnalysis_Analyze_MinimumSet_Gen

ImageAnalysis_Analyze_MaximumSet_Gen

Exemple de requête

HTTP

POST /imageanalysis:analyze?features=tags&language=hduryxtlvjjvwnmpjiojibvjy&model-version=kkblitshktun&smartcrops-aspect-ratios=&gender-neutral-caption=True&api-version=2024-02-01

{
  "url": "https://microsoft.com/a"
}

Exemple de réponse

Code d’état:: 200

{
  "captionResult": {
    "text": "azcggjzjuvbytsq",
    "confidence": 0
  },
  "objectsResult": {
    "values": [
      {
        "id": "iaofvdltgfjrsffgltupmo",
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        },
        "tags": [
          {
            "name": "expoctetvqe",
            "confidence": 0
          }
        ]
      }
    ]
  },
  "readResult": {
    "blocks": [
      {
        "lines": [
          {
            "text": "npk",
            "boundingPolygon": [
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              }
            ],
            "words": [
              {
                "text": "wljuxeeadklupdpxgcinka",
                "boundingPolygon": [
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  }
                ],
                "confidence": 0
              }
            ]
          }
        ]
      }
    ]
  },
  "denseCaptionsResult": {
    "values": [
      {
        "text": "pqrcyrtz",
        "confidence": 0,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        }
      }
    ]
  },
  "modelVersion": "hslbdtpcuyabri",
  "metadata": {
    "width": 10,
    "height": 27
  },
  "tagsResult": {
    "values": [
      {
        "name": "expoctetvqe",
        "confidence": 0
      }
    ]
  },
  "smartCropsResult": {
    "values": [
      {
        "aspectRatio": 23,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        }
      }
    ]
  },
  "peopleResult": {
    "values": [
      {
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        },
        "confidence": 0
      }
    ]
  }
}

ImageAnalysis_Analyze_MinimumSet_Gen

Exemple de requête

HTTP

POST /imageanalysis:analyze?api-version=2024-02-01

{
  "url": "https://www.abc.com"
}

Exemple de réponse

Code d’état:: 200

{
  "modelVersion": "cvhbhwpfswz",
  "metadata": {
    "width": 10,
    "height": 23
  }
}

Définitions

Nom	Description
BoundingBox	Cadre englobant pour une zone à l’intérieur d’une image.
CaptionResult	Brève description de ce que l’image représente.
ContentTag	Une observation d’entité dans l’image, ainsi que le score de confiance.
CropRegion	Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée.
DenseCaption	Brève description de ce que l’image représente.
DenseCaptionsResult	Liste de légendes.
DetectedObject	Décrit un objet détecté dans une image.
DetectedPerson	Personne détectée dans une image.
DetectedTextBlock	Bloc de texte détecté.
DetectedTextLine	Ligne de texte détectée.
DetectedTextWord	Mot détecté constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.
ErrorResponse	Réponse retournée lorsqu’une erreur se produit.
ErrorResponseDetails	Informations sur l’erreur.
ErrorResponseInnerError	Erreur détaillée.
ImageAnalysisResult	Décrire les résultats combinés de différents types d’analyse d’images.
ImageMetadata	Informations de métadonnées d’image telles que la hauteur et la largeur.
ImagePoint	Objet représentant un point dans l’image.
ImageUrl	Document JSON avec une URL pointant vers l’image accessible publiquement à analyser.
ObjectsResult	Décrit les objets détectés dans une image.
PeopleResult	Objet indiquant si l’image contient des personnes.
ReadResult	Résultats d’une opération de lecture.
SmartCropsResult	Résultat du rognage intelligent.
TagsResult	Liste d’étiquettes avec un niveau de confiance.
VisualFeature	Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.

BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

Nom	Type	Description
h	integer	Hauteur mesurée à partir du point supérieur gauche de la zone, en pixels.
w	integer	Largeur mesurée à partir du point supérieur gauche de la zone, en pixels.
x	integer	Coordonnée gauche du point supérieur gauche de la zone, en pixels.
y	integer	Coordonnée supérieure du point supérieur gauche de la zone, en pixels.

CaptionResult

Brève description de ce que l’image représente.

Nom	Type	Description
confidence	number	Niveau de confiance du service dans la légende. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.
text	string	Texte de la légende.

ContentTag

Une observation d’entité dans l’image, ainsi que le score de confiance.

Nom	Type	Description
confidence	number	Niveau de confiance que l’entité a été observée. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.
name	string	Nom de l’entité.

CropRegion

Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée.

Nom	Type	Description
aspectRatio	number	Proportions de la région de rognage.
boundingBox	BoundingBox	Cadre englobant pour une zone à l’intérieur d’une image.

DenseCaption

Brève description de ce que l’image représente.

Nom	Type	Description
boundingBox	BoundingBox	Cadre englobant pour une zone à l’intérieur d’une image.
confidence	number	Niveau de confiance du service dans la légende. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.
text	string	Texte de la légende.

DenseCaptionsResult

Liste de légendes.

Nom	Type	Description
values	DenseCaption[]	Liste de légendes.

DetectedObject

Décrit un objet détecté dans une image.

Nom	Type	Description
boundingBox	BoundingBox	Cadre englobant pour une zone à l’intérieur d’une image.
id	string	ID de l’objet détecté.
tags	ContentTag[]	Confiances de classification de l’objet détecté.

DetectedPerson

Personne détectée dans une image.

Nom	Type	Description
boundingBox	BoundingBox	Cadre englobant pour une zone à l’intérieur d’une image.
confidence	number	Score de confiance d’avoir observé la personne dans l’image. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.

DetectedTextBlock

Bloc de texte détecté.

Nom	Type	Description
lines	DetectedTextLine[]	Liste des lignes de texte dans le bloc de texte.

DetectedTextLine

Ligne de texte détectée.

Nom	Type	Description
boundingPolygon	ImagePoint[]	Polygone englobant de la ligne de texte.
text	string	Contenu textuel de la ligne de texte détectée.
words	DetectedTextWord[]	Liste des mots dans la ligne de texte.

DetectedTextWord

Mot détecté constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.

Nom	Type	Description
boundingPolygon	ImagePoint[]	Polygone englobant du mot.
confidence	number	Niveau de confiance que le mot a été détecté. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.
text	string	Contenu textuel du mot.

ErrorResponse

Réponse retournée lorsqu’une erreur se produit.

Nom	Type	Description
error	ErrorResponseDetails	Informations sur l’erreur.

ErrorResponseDetails

Informations sur l’erreur.

Nom	Type	Description
code	string	Code d’erreur.
details	ErrorResponseDetails[]	Liste des erreurs détaillées.
innererror	ErrorResponseInnerError	Erreur détaillée.
message	string	Message d’erreur.
target	string	Cible de l’erreur.

ErrorResponseInnerError

Erreur détaillée.

Nom	Type	Description
code	string	Code d’erreur.
innererror	ErrorResponseInnerError	Erreur détaillée.
message	string	Message d’erreur.

ImageAnalysisResult

Décrire les résultats combinés de différents types d’analyse d’images.

Nom	Type	Description
captionResult	CaptionResult	Brève description de ce que l’image représente.
denseCaptionsResult	DenseCaptionsResult	Liste de légendes.
metadata	ImageMetadata	Informations de métadonnées d’image telles que la hauteur et la largeur.
modelVersion	string	Version de modèle.
objectsResult	ObjectsResult	Décrit les objets détectés dans une image.
peopleResult	PeopleResult	Objet indiquant si l’image contient des personnes.
readResult	ReadResult	Résultats d’une opération de lecture.
smartCropsResult	SmartCropsResult	Résultat du rognage intelligent.
tagsResult	TagsResult	Liste d’étiquettes avec un niveau de confiance.

ImageMetadata

Informations de métadonnées d’image telles que la hauteur et la largeur.

Nom	Type	Description
height	integer	La hauteur de l’image est en pixels.
width	integer	La largeur de l’image est en pixels.

ImagePoint

Objet représentant un point dans l’image.

Nom	Type	Description
x	integer	Coordonnée x de ce point.
y	integer	Coordonnée y de ce point.

ImageUrl

Document JSON avec une URL pointant vers l’image accessible publiquement à analyser.

Nom	Type	Description
url	string	URL accessible publiquement d’une image.

ObjectsResult

Décrit les objets détectés dans une image.

Nom	Type	Description
values	DetectedObject[]	Tableau d’objets détectés.

PeopleResult

Objet indiquant si l’image contient des personnes.

Nom	Type	Description
values	DetectedPerson[]	Tableau de personnes détectées.

ReadResult

Résultats d’une opération de lecture.

Nom	Type	Description
blocks	DetectedTextBlock[]	Liste de blocs de texte.

SmartCropsResult

Résultat du rognage intelligent.

Nom	Type	Description
values	CropRegion[]	Régions recommandées pour le rognage de l’image.

TagsResult

Liste d’étiquettes avec un niveau de confiance.

Nom	Type	Description
values	ContentTag[]	Liste d’étiquettes avec un niveau de confiance.

VisualFeature

Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.

Nom	Type	Description
caption	string	Description ou légende résumant le contenu de l’image.
denseCaptions	string	Légendes détaillées fournissant des descriptions détaillées du contenu de l’image.
objects	string	Objets spécifiques reconnus et étiquetés dans l’image.
people	string	Détection et analyse des personnes dans l’image.
read	string	Contenu textuel extrait de l’image, tel que des signes ou des étiquettes.
smartCrops	string	Les versions rognées générées automatiquement de l’image se concentrent sur du contenu important.
tags	string	Balises visuelles représentant les objets détectés dans l’image.

Partager via

Analyze - Image

Paramètres URI

Corps de la demande

Réponses

Exemples

ImageAnalysis_Analyze_MaximumSet_Gen

Exemple de requête

Exemple de réponse

ImageAnalysis_Analyze_MinimumSet_Gen

Exemple de requête

Exemple de réponse

Définitions

BoundingBox

CaptionResult

ContentTag

CropRegion

DenseCaption

DenseCaptionsResult

DetectedObject

DetectedPerson

DetectedTextBlock

DetectedTextLine

DetectedTextWord

ErrorResponse

ErrorResponseDetails

ErrorResponseInnerError

ImageAnalysisResult

ImageMetadata

ImagePoint

ImageUrl

ObjectsResult

PeopleResult

ReadResult

SmartCropsResult

TagsResult

VisualFeature

Ressources supplémentaires