Partager via


Analyze - Image Stream

Analysez l’image d’entrée. La requête contient un flux d’image avec n’importe quel type de contenu ['image/*', 'application/octet-stream'].

POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01
POST /imageanalysis:analyze?overload=stream&features={features}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01

Paramètres URI

Nom Dans Obligatoire Type Description
api-version
query True

string

Version de l’API demandée.

features
query

VisualFeature[]

Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.

gender-neutral-caption
query

boolean

Indicateur booléen pour activer le sous-titrage sans sexe pour les fonctionnalités de légende et denseCaptions. Si ce paramètre n’est pas spécifié, la valeur par défaut est « false ».

language
query

string

Langue souhaitée pour la génération de sortie. Si ce paramètre n’est pas spécifié, la valeur par défaut est « en ». Consultez https://aka.ms/cv-languages la liste des langues prises en charge.

smartcrops-aspect-ratios
query

array[]

Liste des proportions à utiliser pour la fonctionnalité smartCrops. Les proportions sont calculées en divisant la largeur du rognage cible par la hauteur. Les valeurs prises en charge sont comprises entre 0,75 et 1,8 (inclus). Plusieurs valeurs doivent être séparées par des virgules. Si ce paramètre n’est pas spécifié, le service retourne une suggestion de rognage avec un rapport d’aspect compris entre 0,5 et 2,0 (inclus).

Corps de la demande

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

Nom Type Description
body

string

Flux d’images.

Réponses

Nom Type Description
200 OK

ImageAnalysisResult

Succès

Other Status Codes

ErrorResponse

Error

En-têtes

x-ms-error-code: string

Exemples

ImageAnalysis_Analyze_MaximumSet_Gen
ImageAnalysis_Analyze_MinimumSet_Gen

ImageAnalysis_Analyze_MaximumSet_Gen

Exemple de requête

POST /imageanalysis:analyze?overload=stream&features=tags&language=zizuomdsxccdx&smartcrops-aspect-ratios=vqkmzmvchiwlxdaikxqrsbrpvyq&gender-neutral-caption=True&api-version=2024-02-01

"Ynl0ZXM="

Exemple de réponse

{
  "captionResult": {
    "text": "wjtogwbozwgawzxikwsvs",
    "confidence": 0
  },
  "objectsResult": {
    "values": [
      {
        "id": "bcvupjoxcviiz",
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        },
        "tags": [
          {
            "name": "ikiqzvbmyrbuskhpphgjjuzvl",
            "confidence": 0
          }
        ]
      }
    ]
  },
  "readResult": {
    "blocks": [
      {
        "lines": [
          {
            "text": "ufmjctoebx",
            "boundingPolygon": [
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              }
            ],
            "words": [
              {
                "text": "cpcsgoi",
                "boundingPolygon": [
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  }
                ],
                "confidence": 0
              }
            ]
          }
        ]
      }
    ]
  },
  "denseCaptionsResult": {
    "values": [
      {
        "text": "hgvxqwxwqgtjfippp",
        "confidence": 0,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        }
      }
    ]
  },
  "modelVersion": "lymqyonwrxckwzrsxjihbceclts",
  "metadata": {
    "width": 28,
    "height": 7
  },
  "tagsResult": {
    "values": [
      {
        "name": "ikiqzvbmyrbuskhpphgjjuzvl",
        "confidence": 0
      }
    ]
  },
  "smartCropsResult": {
    "values": [
      {
        "aspectRatio": 7,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        }
      }
    ]
  },
  "peopleResult": {
    "values": [
      {
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        },
        "confidence": 0
      }
    ]
  }
}

ImageAnalysis_Analyze_MinimumSet_Gen

Exemple de requête

POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01

"Ynl0ZXM="

Exemple de réponse

{
  "modelVersion": "lymqyonwrxckwzrsxjihbceclts",
  "metadata": {
    "width": 28,
    "height": 7
  }
}

Définitions

Nom Description
BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

CaptionResult

Brève description de ce que l’image représente.

ContentTag

Une observation d’entité dans l’image, ainsi que le score de confiance.

CropRegion

Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée.

DenseCaption

Brève description de ce que l’image représente.

DenseCaptionsResult

Liste de légendes.

DetectedObject

Décrit un objet détecté dans une image.

DetectedPerson

Personne détectée dans une image.

DetectedTextBlock

Bloc de texte détecté.

DetectedTextLine

Ligne de texte détectée.

DetectedTextWord

Mot détecté constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.

ErrorResponse

Réponse retournée lorsqu’une erreur se produit.

ErrorResponseDetails

Informations sur l’erreur.

ErrorResponseInnerError

Erreur détaillée.

ImageAnalysisResult

Décrire les résultats combinés de différents types d’analyse d’images.

ImageMetadata

Informations de métadonnées d’image telles que la hauteur et la largeur.

ImagePoint

Objet représentant un point dans l’image.

ObjectsResult

Décrit les objets détectés dans une image.

PeopleResult

Objet indiquant si l’image contient des personnes.

ReadResult

Résultats d’une opération de lecture.

SmartCropsResult

Résultat du rognage intelligent.

TagsResult

Liste d’étiquettes avec un niveau de confiance.

VisualFeature

Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.

BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

Nom Type Description
h

integer

Hauteur mesurée à partir du point supérieur gauche de la zone, en pixels.

w

integer

Largeur mesurée à partir du point supérieur gauche de la zone, en pixels.

x

integer

Coordonnée gauche du point supérieur gauche de la zone, en pixels.

y

integer

Coordonnée supérieure du point supérieur gauche de la zone, en pixels.

CaptionResult

Brève description de ce que l’image représente.

Nom Type Description
confidence

number

Niveau de confiance du service dans la légende. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.

text

string

Texte de la légende.

ContentTag

Une observation d’entité dans l’image, ainsi que le score de confiance.

Nom Type Description
confidence

number

Niveau de confiance que l’entité a été observée. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.

name

string

Nom de l’entité.

CropRegion

Région identifiée pour le rognage intelligent. Une région sera retournée pour chaque proportion demandée.

Nom Type Description
aspectRatio

number

Proportions de la région de rognage.

boundingBox

BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

DenseCaption

Brève description de ce que l’image représente.

Nom Type Description
boundingBox

BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

confidence

number

Niveau de confiance du service dans la légende. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.

text

string

Texte de la légende.

DenseCaptionsResult

Liste de légendes.

Nom Type Description
values

DenseCaption[]

Liste de légendes.

DetectedObject

Décrit un objet détecté dans une image.

Nom Type Description
boundingBox

BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

id

string

ID de l’objet détecté.

tags

ContentTag[]

Confiances de classification de l’objet détecté.

DetectedPerson

Personne détectée dans une image.

Nom Type Description
boundingBox

BoundingBox

Cadre englobant pour une zone à l’intérieur d’une image.

confidence

number

Score de confiance d’avoir observé la personne dans l’image. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.

DetectedTextBlock

Bloc de texte détecté.

Nom Type Description
lines

DetectedTextLine[]

Liste des lignes de texte dans le bloc de texte.

DetectedTextLine

Ligne de texte détectée.

Nom Type Description
boundingPolygon

ImagePoint[]

Polygone englobant de la ligne de texte.

text

string

Contenu textuel de la ligne de texte détectée.

words

DetectedTextWord[]

Liste des mots dans la ligne de texte.

DetectedTextWord

Mot détecté constitué d’une séquence contiguë de caractères. Pour les langues non délimitées par l’espace, telles que le chinois, le japonais et le coréen, chaque caractère est représenté comme son propre mot.

Nom Type Description
boundingPolygon

ImagePoint[]

Polygone englobant du mot.

confidence

number

Niveau de confiance que le mot a été détecté. Les scores de confiance couvrent la plage de 0,0 à 1,0 (inclus), avec des valeurs plus élevées indiquant une confiance plus élevée d’une correspondance.

text

string

Contenu textuel du mot.

ErrorResponse

Réponse retournée lorsqu’une erreur se produit.

Nom Type Description
error

ErrorResponseDetails

Informations sur l’erreur.

ErrorResponseDetails

Informations sur l’erreur.

Nom Type Description
code

string

Code d’erreur.

details

ErrorResponseDetails[]

Liste des erreurs détaillées.

innererror

ErrorResponseInnerError

Erreur détaillée.

message

string

Message d’erreur.

target

string

Cible de l’erreur.

ErrorResponseInnerError

Erreur détaillée.

Nom Type Description
code

string

Code d’erreur.

innererror

ErrorResponseInnerError

Erreur détaillée.

message

string

Message d’erreur.

ImageAnalysisResult

Décrire les résultats combinés de différents types d’analyse d’images.

Nom Type Description
captionResult

CaptionResult

Brève description de ce que l’image représente.

denseCaptionsResult

DenseCaptionsResult

Liste de légendes.

metadata

ImageMetadata

Informations de métadonnées d’image telles que la hauteur et la largeur.

modelVersion

string

Version de modèle.

objectsResult

ObjectsResult

Décrit les objets détectés dans une image.

peopleResult

PeopleResult

Objet indiquant si l’image contient des personnes.

readResult

ReadResult

Résultats d’une opération de lecture.

smartCropsResult

SmartCropsResult

Résultat du rognage intelligent.

tagsResult

TagsResult

Liste d’étiquettes avec un niveau de confiance.

ImageMetadata

Informations de métadonnées d’image telles que la hauteur et la largeur.

Nom Type Description
height

integer

La hauteur de l’image est en pixels.

width

integer

La largeur de l’image est en pixels.

ImagePoint

Objet représentant un point dans l’image.

Nom Type Description
x

integer

Coordonnée x de ce point.

y

integer

Coordonnée y de ce point.

ObjectsResult

Décrit les objets détectés dans une image.

Nom Type Description
values

DetectedObject[]

Tableau d’objets détectés.

PeopleResult

Objet indiquant si l’image contient des personnes.

Nom Type Description
values

DetectedPerson[]

Tableau de personnes détectées.

ReadResult

Résultats d’une opération de lecture.

Nom Type Description
blocks

DetectedTextBlock[]

Liste de blocs de texte.

SmartCropsResult

Résultat du rognage intelligent.

Nom Type Description
values

CropRegion[]

Régions recommandées pour le rognage de l’image.

TagsResult

Liste d’étiquettes avec un niveau de confiance.

Nom Type Description
values

ContentTag[]

Liste d’étiquettes avec un niveau de confiance.

VisualFeature

Fonctionnalités visuelles demandées. Au moins une fonctionnalité visuelle doit être spécifiée.

Nom Type Description
caption

string

Description ou légende résumant le contenu de l’image.

denseCaptions

string

Légendes détaillées fournissant des descriptions détaillées du contenu de l’image.

objects

string

Objets spécifiques reconnus et étiquetés dans l’image.

people

string

Détection et analyse des personnes dans l’image.

read

string

Contenu textuel extrait de l’image, tel que des signes ou des étiquettes.

smartCrops

string

Les versions rognées générées automatiquement de l’image se concentrent sur du contenu important.

tags

string

Balises visuelles représentant les objets détectés dans l’image.