In dit artikel wordt gedemonstreerde hoe u de API voor afbeeldingsanalyse versie 3.2 aanroept om informatie te retourneren over de visuele functies van een afbeelding. U ziet ook hoe u de geretourneerde informatie kunt parseren met behulp van de client-SDK's of REST API.
De code in deze handleiding maakt gebruik van externe afbeeldingen waarnaar wordt verwezen door de URL. U kunt zelf verschillende afbeeldingen proberen om de volledige mogelijkheden van de functies voor afbeeldingsanalyse te bekijken.
Bij het analyseren van een externe afbeelding geeft u de URL van de afbeelding op door de hoofdtekst van de aanvraag als volgt op te maken: {"url":""}
Als u een lokale afbeelding wilt analyseren, plaatst u de binaire afbeeldingsgegevens in de hoofdtekst van de HTTP-aanvraag.
Sla in de hoofdklasse een verwijzing op naar de URL van de afbeelding die u wilt analyseren.
// URL image used for analyzing an image (image of puppy)
private const string ANALYZE_URL_IMAGE = "";
Als u een lokale afbeelding wilt analyseren, raadpleegt u de ComputerVisionClient-methoden , zoals AnalyzeImageInStreamAsync
. Of bekijk de voorbeeldcode op GitHub voor scenario's met betrekking tot lokale afbeeldingen.
Sla in de hoofdklasse een verwijzing op naar de URL van de afbeelding die u wilt analyseren.
String pathToRemoteImage = "";
Als u een lokale afbeelding wilt analyseren, raadpleegt u de ComputerVision-methoden , zoals AnalyzeImage
. Of bekijk de voorbeeldcode op GitHub voor scenario's met betrekking tot lokale afbeeldingen.
Sla in de hoofdfunctie een verwijzing op naar de URL van de afbeelding die u wilt analyseren.
const describeURL = '';
Als u een lokale afbeelding wilt analyseren, raadpleegt u de ComputerVisionClient-methoden , zoals describeImageInStream
. Of bekijk de voorbeeldcode op GitHub voor scenario's met betrekking tot lokale afbeeldingen.
Sla een verwijzing op naar de URL van de afbeelding die u wilt analyseren.
remote_image_url = ""
Als u een lokale afbeelding wilt analyseren, raadpleegt u de ComputerVisionClientOperationsMixin-methoden , zoals analyze_image_in_stream
. Of bekijk de voorbeeldcode op GitHub voor scenario's met betrekking tot lokale afbeeldingen.
De Analyze-API biedt u toegang tot alle functies van de afbeeldingsanalyse van de service. Kies welke bewerkingen u wilt uitvoeren op basis van uw eigen use-case. Zie het Overzicht van Azure AI Vision voor een beschrijving van elke functie. In de voorbeelden in de volgende secties worden alle beschikbare visuele functies toegevoegd, maar voor praktisch gebruik hebt u waarschijnlijk slechts één of twee nodig.
U kunt opgeven welke functies u wilt gebruiken door de URL-queryparameters van de Analyse-API in te stellen. Een parameter kan meerdere waarden hebben, gescheiden door komma's. Elke functie die u opgeeft, vereist meer rekentijd, dus geef alleen op wat u nodig hebt.
URL-parameter |
Weergegeven als |
Beschrijving |
features |
Read |
leest de zichtbare tekst in de afbeelding en voert deze uit als gestructureerde JSON-gegevens |
features |
Description |
beschrijft de inhoud van de afbeelding met een volledige zin in ondersteunde talen |
features |
SmartCrops |
zoekt naar de rechthoekcoördinaten die de afbeelding bijsnijden tot een gewenste hoogte-breedteverhouding, terwijl het interessegebied behouden blijft |
features |
Objects |
detecteert verschillende objecten in een afbeelding, inclusief de geschatte locatie. Het Objects argument is alleen beschikbaar in het Engels |
features |
Tags |
tagt de afbeelding met een gedetailleerde lijst met woorden die betrekking hebben op de inhoud van de afbeelding |
Een ingevulde URL kan er als volgt uitzien:
Definieer uw nieuwe methode voor het analyseren van afbeeldingen. Voeg de volgende code toe, waarmee visuele functies worden opgegeven die u wilt ophalen in uw analyse. Zie de opsomming VisualFeatureTypes voor een volledige lijst.
* Analyze URL image. Extracts captions, categories, tags, objects, faces, racy/adult/gory content,
* brands, celebrities, landmarks, color scheme, and image types.
public static async Task AnalyzeImageUrl(ComputerVisionClient client, string imageUrl)
Console.WriteLine("ANALYZE IMAGE - URL");
// Creating a list that defines the features to be extracted from the image.
List<VisualFeatureTypes?> features = new List<VisualFeatureTypes?>()
VisualFeatureTypes.Categories, VisualFeatureTypes.Description,
VisualFeatureTypes.Faces, VisualFeatureTypes.ImageType,
VisualFeatureTypes.Tags, VisualFeatureTypes.Adult,
VisualFeatureTypes.Color, VisualFeatureTypes.Brands,
Geef op welke visuele functies u wilt ophalen in uw analyse. Zie de opsomming VisualFeatureTypes voor een volledige lijst.
// This list defines the features to be extracted from the image.
List<VisualFeatureTypes> featuresToExtractFromRemoteImage = new ArrayList<>();
Geef op welke visuele functies u wilt ophalen in uw analyse. Zie de opsomming VisualFeatureTypes voor een volledige lijst.
// Get the visual feature for analysis
const features = ['Categories','Brands','Adult','Color','Description','Faces','Image_type','Objects','Tags'];
const domainDetails = ['Celebrities','Landmarks'];
Geef op welke visuele functies u wilt ophalen in uw analyse. Zie de opsomming VisualFeatureTypes voor een volledige lijst.
print("===== Analyze an image - remote =====")
# Select the visual feature(s) you want.
remote_image_features = [VisualFeatureTypes.categories,VisualFeatureTypes.brands,,VisualFeatureTypes.color,VisualFeatureTypes.description,VisualFeatureTypes.faces,VisualFeatureTypes.image_type,VisualFeatureTypes.objects,VisualFeatureTypes.tags]
remote_image_details = [Details.celebrities,Details.landmarks]
U kunt ook de taal van de geretourneerde gegevens opgeven.
Met de volgende URL-queryparameter wordt de taal opgegeven. De standaardwaarde is en
URL-parameter |
Weergegeven als |
Beschrijving |
language |
en |
Engels |
language |
es |
Spaans |
language |
ja |
Japans |
language |
pt |
Portugees |
language |
zh |
Vereenvoudigd Chinees |
Een ingevulde URL kan er als volgt uitzien:
Gebruik de taalparameter van de aanroep AnalyzeImageAsync om een taal op te geven.
Taal |
Weergegeven als |
Engels |
en |
Spaans |
es |
Japans |
ja |
Portugees |
pt |
Vereenvoudigd Chinees |
zh |
Een methode-aanroep waarmee een taal wordt opgegeven, kan er als volgt uitzien.
ImageAnalysis results = await client.AnalyzeImageAsync(imageUrl, visualFeatures: features, language: "en");
Gebruik de invoer AnalyzeImageOptionalParameter in uw Analyse-aanroep om een taal op te geven.
Taal |
Weergegeven als |
Engels |
en |
Spaans |
es |
Japans |
ja |
Portugees |
pt |
Vereenvoudigd Chinees |
zh |
Een methode-aanroep waarmee een taal wordt opgegeven, kan er als volgt uitzien.
ImageAnalysis analysis = compVisClient.computerVision().analyzeImage().withUrl(pathToRemoteImage)
Gebruik de language
eigenschap van de invoer ComputerVisionClientAnalyzeImageOptionalParams in uw analyseaanroep om een taal op te geven.
Taal |
Weergegeven als |
Engels |
en |
Spaans |
es |
Japans |
ja |
Portugees |
pt |
Vereenvoudigd Chinees |
zh |
Een methode-aanroep waarmee een taal wordt opgegeven, kan er als volgt uitzien.
const result = (await computerVisionClient.analyzeImage(imageURL,{visualFeatures: features, language: 'en'}));
Gebruik de language
parameter van uw analyze_image aanroep om een taal op te geven.
Taal |
Weergegeven als |
Engels |
en |
Spaans |
es |
Japans |
ja |
Portugees |
pt |
Vereenvoudigd Chinees |
zh |
Een methode-aanroep waarmee een taal wordt opgegeven, kan er als volgt uitzien.
results_remote = computervision_client.analyze_image(remote_image_url , remote_image_features, remote_image_details, 'en')
In deze sectie ziet u hoe u de resultaten van de API-aanroep kunt parseren. Het bevat de API-aanroep zelf.
De service retourneert een 200
HTTP-antwoord en de hoofdtekst bevat de geretourneerde gegevens in de vorm van een JSON-tekenreeks. De volgende tekst is een voorbeeld van een JSON-antwoord.
"width": 300,
"height": 200
"name": "grass",
"confidence": 0.9960499405860901
"name": "outdoor",
"confidence": 0.9956876635551453
"name": "building",
"confidence": 0.9893627166748047
"name": "property",
"confidence": 0.9853052496910095
"name": "plant",
"confidence": 0.9791355729103088
Bekijk de volgende lijst met mogelijke fouten en de oorzaken ervan:
- 400
- Afbeeldings-URL is onjuist opgemaakt of niet toegankelijk
- Invoergegevens zijn geen geldige afbeelding
- Invoerafbeelding is te groot
- Het opgegeven functietype is niet geldig
- Niet-ondersteunde afbeelding, bijvoorbeeld kinderporno
- Niet-ondersteunde detail
- De aangevraagde bewerking wordt niet ondersteund in de opgegeven taal
- Meer informatie vindt u in het foutbericht
- 415 - Fout bij niet-ondersteund mediatype. Het inhoudstype bevindt zich niet in de toegestane typen:
- Voor een afbeeldings-URL moet inhoudstype zijn
- Voor binaire afbeeldingsgegevens moet inhoudstype zijn
of multipart/form-data
- 500
- Time-out voor het verwerken van afbeeldingen
Met de volgende code wordt de Afbeeldingsanalyse-API aangeroepen en worden de resultaten naar de console afgedrukt.
// Analyze the URL image
ImageAnalysis results = await client.AnalyzeImageAsync(imageUrl, visualFeatures: features);
// Summarizes the image content.
foreach (var caption in results.Description.Captions)
Console.WriteLine($"{caption.Text} with confidence {caption.Confidence}");
// Display categories the image is divided into.
foreach (var category in results.Categories)
Console.WriteLine($"{category.Name} with confidence {category.Score}");
// Image tags and their confidence score
foreach (var tag in results.Tags)
Console.WriteLine($"{tag.Name} {tag.Confidence}");
// Objects
foreach (var obj in results.Objects)
Console.WriteLine($"{obj.ObjectProperty} with confidence {obj.Confidence} at location {obj.Rectangle.X}, " +
$"{obj.Rectangle.X + obj.Rectangle.W}, {obj.Rectangle.Y}, {obj.Rectangle.Y + obj.Rectangle.H}");
// Faces
foreach (var face in results.Faces)
Console.WriteLine($"A {face.Gender} of age {face.Age} at location {face.FaceRectangle.Left}, " +
$"{face.FaceRectangle.Left}, {face.FaceRectangle.Top + face.FaceRectangle.Width}, " +
$"{face.FaceRectangle.Top + face.FaceRectangle.Height}");
// Adult or racy content, if any.
Console.WriteLine($"Has adult content: {results.Adult.IsAdultContent} with confidence {results.Adult.AdultScore}");
Console.WriteLine($"Has racy content: {results.Adult.IsRacyContent} with confidence {results.Adult.RacyScore}");
Console.WriteLine($"Has gory content: {results.Adult.IsGoryContent} with confidence {results.Adult.GoreScore}");
// Well-known (or custom, if set) brands.
foreach (var brand in results.Brands)
Console.WriteLine($"Logo of {brand.Name} with confidence {brand.Confidence} at location {brand.Rectangle.X}, " +
$"{brand.Rectangle.X + brand.Rectangle.W}, {brand.Rectangle.Y}, {brand.Rectangle.Y + brand.Rectangle.H}");
// Celebrities in image, if any.
foreach (var category in results.Categories)
if (category.Detail?.Celebrities != null)
foreach (var celeb in category.Detail.Celebrities)
Console.WriteLine($"{celeb.Name} with confidence {celeb.Confidence} at location {celeb.FaceRectangle.Left}, " +
$"{celeb.FaceRectangle.Top}, {celeb.FaceRectangle.Height}, {celeb.FaceRectangle.Width}");
// Popular landmarks in image, if any.
foreach (var category in results.Categories)
if (category.Detail?.Landmarks != null)
foreach (var landmark in category.Detail.Landmarks)
Console.WriteLine($"{landmark.Name} with confidence {landmark.Confidence}");
// Identifies the color scheme.
Console.WriteLine("Color Scheme:");
Console.WriteLine("Is black and white?: " + results.Color.IsBWImg);
Console.WriteLine("Accent color: " + results.Color.AccentColor);
Console.WriteLine("Dominant background color: " + results.Color.DominantColorBackground);
Console.WriteLine("Dominant foreground color: " + results.Color.DominantColorForeground);
Console.WriteLine("Dominant colors: " + string.Join(",", results.Color.DominantColors));
// Detects the image types.
Console.WriteLine("Image Type:");
Console.WriteLine("Clip Art Type: " + results.ImageType.ClipArtType);
Console.WriteLine("Line Drawing Type: " + results.ImageType.LineDrawingType);
Met de volgende code wordt de Afbeeldingsanalyse-API aangeroepen en worden de resultaten naar de console afgedrukt.
// Call the Computer Vision service and tell it to analyze the loaded image.
ImageAnalysis analysis = compVisClient.computerVision().analyzeImage().withUrl(pathToRemoteImage)
// Display image captions and confidence values.
System.out.println("\nCaptions: ");
for (ImageCaption caption : analysis.description().captions()) {
System.out.printf("\'%s\' with confidence %f\n", caption.text(), caption.confidence());
// Display image category names and confidence values.
System.out.println("\nCategories: ");
for (Category category : analysis.categories()) {
System.out.printf("\'%s\' with confidence %f\n",, category.score());
// Display image tags and confidence values.
System.out.println("\nTags: ");
for (ImageTag tag : analysis.tags()) {
System.out.printf("\'%s\' with confidence %f\n",, tag.confidence());
// Display any faces found in the image and their location.
System.out.println("\nFaces: ");
for (FaceDescription face : analysis.faces()) {
System.out.printf("\'%s\' of age %d at location (%d, %d), (%d, %d)\n", face.gender(), face.age(),
face.faceRectangle().left(), face.faceRectangle().top(),
face.faceRectangle().left() + face.faceRectangle().width(),
face.faceRectangle().top() + face.faceRectangle().height());
// Display whether any adult or racy content was detected and the confidence
// values.
System.out.println("\nAdult: ");
System.out.printf("Is adult content: %b with confidence %f\n",,;
System.out.printf("Has racy content: %b with confidence %f\n",,;
// Display the image color scheme.
System.out.println("\nColor scheme: ");
System.out.println("Is black and white: " + analysis.color().isBWImg());
System.out.println("Accent color: " + analysis.color().accentColor());
System.out.println("Dominant background color: " + analysis.color().dominantColorBackground());
System.out.println("Dominant foreground color: " + analysis.color().dominantColorForeground());
System.out.println("Dominant colors: " + String.join(", ", analysis.color().dominantColors()));
// Display any celebrities detected in the image and their locations.
System.out.println("\nCelebrities: ");
for (Category category : analysis.categories()) {
if (category.detail() != null && category.detail().celebrities() != null) {
for (CelebritiesModel celeb : category.detail().celebrities()) {
System.out.printf("\'%s\' with confidence %f at location (%d, %d), (%d, %d)\n",,
celeb.confidence(), celeb.faceRectangle().left(), celeb.faceRectangle().top(),
celeb.faceRectangle().left() + celeb.faceRectangle().width(),
celeb.faceRectangle().top() + celeb.faceRectangle().height());
// Display any landmarks detected in the image and their locations.
System.out.println("\nLandmarks: ");
for (Category category : analysis.categories()) {
if (category.detail() != null && category.detail().landmarks() != null) {
for (LandmarksModel landmark : category.detail().landmarks()) {
System.out.printf("\'%s\' with confidence %f\n",, landmark.confidence());
// Display what type of clip art or line drawing the image is.
System.out.println("\nImage type:");
System.out.println("Clip art type: " + analysis.imageType().clipArtType());
System.out.println("Line drawing type: " + analysis.imageType().lineDrawingType());
Met de volgende code wordt de Afbeeldingsanalyse-API aangeroepen en worden de resultaten naar de console afgedrukt.
const result = (await computerVisionClient.analyzeImage(facesImageURL,{visualFeatures: features},{details: domainDetails}));
// Detect faces
// Print the bounding box, gender, and age from the faces.
const faces = result.faces
if (faces.length) {
console.log(`${faces.length} face${faces.length == 1 ? '' : 's'} found:`);
for (const face of faces) {
console.log(` Gender: ${face.gender}`.padEnd(20)
+ ` Age: ${face.age}`.padEnd(10) + `at ${formatRectFaces(face.faceRectangle)}`);
} else { console.log('No faces found.'); }
// Formats the bounding box
function formatRectFaces(rect) {
return `top=${}`.padEnd(10) + `left=${rect.left}`.padEnd(10) + `bottom=${ + rect.height}`.padEnd(12)
+ `right=${rect.left + rect.width}`.padEnd(10) + `(${rect.width}x${rect.height})`;
// Detect Objects
const objects = result.objects;
// Print objects bounding box and confidence
if (objects.length) {
console.log(`${objects.length} object${objects.length == 1 ? '' : 's'} found:`);
for (const obj of objects) { console.log(` ${obj.object} (${obj.confidence.toFixed(2)}) at ${formatRectObjects(obj.rectangle)}`); }
} else { console.log('No objects found.'); }
// Formats the bounding box
function formatRectObjects(rect) {
return `top=${rect.y}`.padEnd(10) + `left=${rect.x}`.padEnd(10) + `bottom=${rect.y + rect.h}`.padEnd(12)
+ `right=${rect.x + rect.w}`.padEnd(10) + `(${rect.w}x${rect.h})`;
// Detect tags
const tags = result.tags;
console.log(`Tags: ${formatTags(tags)}`);
// Format tags for display
function formatTags(tags) {
return => (`${} (${tag.confidence.toFixed(2)})`)).join(', ');
// Detect image type
const types = result.imageType;
console.log(`Image appears to be ${describeType(types)}`);
function describeType(imageType) {
if (imageType.clipArtType && imageType.clipArtType > imageType.lineDrawingType) return 'clip art';
if (imageType.lineDrawingType && imageType.clipArtType < imageType.lineDrawingType) return 'a line drawing';
return 'a photograph';
// Detect Category
const categories = result.categories;
console.log(`Categories: ${formatCategories(categories)}`);
// Formats the image categories
function formatCategories(categories) {
categories.sort((a, b) => b.score - a.score);
return => `${} (${cat.score.toFixed(2)})`).join(', ');
// Detect Brands
const brands = result.brands;
// Print the brands found
if (brands.length) {
console.log(`${brands.length} brand${brands.length != 1 ? 's' : ''} found:`);
for (const brand of brands) {
console.log(` ${} (${brand.confidence.toFixed(2)} confidence)`);
} else { console.log(`No brands found.`); }
// Detect Colors
const color = result.color;
// Print a detected color scheme
function printColorScheme(colors) {
console.log(`Image is in ${colors.isBwImg ? 'black and white' : 'color'}`);
console.log(`Dominant colors: ${colors.dominantColors.join(', ')}`);
console.log(`Dominant foreground color: ${colors.dominantColorForeground}`);
console.log(`Dominant background color: ${colors.dominantColorBackground}`);
console.log(`Suggested accent color: #${colors.accentColor}`);
// Detect landmarks
const domain = result.landmarks;
// Prints domain-specific, recognized objects
if (domain.length) {
console.log(`${domain.length} ${domain.length == 1 ? 'landmark' : 'landmarks'} found:`);
for (const obj of domain) {
console.log(` ${}`.padEnd(20) + `(${obj.confidence.toFixed(2)} confidence)`.padEnd(20) + `${formatRectDomain(obj.faceRectangle)}`);
} else {
console.log('No landmarks found.');
// Formats bounding box
function formatRectDomain(rect) {
if (!rect) return '';
return `top=${}`.padEnd(10) + `left=${rect.left}`.padEnd(10) + `bottom=${ + rect.height}`.padEnd(12) +
`right=${rect.left + rect.width}`.padEnd(10) + `(${rect.width}x${rect.height})`;
// Detect Adult content
// Function to confirm racy or not
const isIt = flag => flag ? 'is' : "isn't";
const adult =;
console.log(`This probably ${isIt(adult.isAdultContent)} adult content (${adult.adultScore.toFixed(4)} score)`);
console.log(`This probably ${isIt(adult.isRacyContent)} racy content (${adult.racyScore.toFixed(4)} score)`);
Met de volgende code wordt de Afbeeldingsanalyse-API aangeroepen en worden de resultaten naar de console afgedrukt.
# Call API with URL and features
results_remote = computervision_client.analyze_image(remote_image_url , remote_image_features, remote_image_details)
# Print results with confidence score
print("Categories from remote image: ")
if (len(results_remote.categories) == 0):
print("No categories detected.")
for category in results_remote.categories:
print("'{}' with confidence {:.2f}%".format(, category.score * 100))
# Detect faces
# Print the results with gender, age, and bounding box
print("Faces in the remote image: ")
if (len(results_remote.faces) == 0):
print("No faces detected.")
for face in results_remote.faces:
print("'{}' of age {} at location {}, {}, {}, {}".format(face.gender, face.age, \
face.face_rectangle.left,, \
face.face_rectangle.left + face.face_rectangle.width, \ + face.face_rectangle.height))
# Adult content
# Print results with adult/racy score
print("Analyzing remote image for adult or racy content ... ")
print("Is adult content: {} with confidence {:.2f}".format(, * 100))
print("Has racy content: {} with confidence {:.2f}".format(, * 100))
# Detect colors
# Print results of color scheme
print("Getting color scheme of the remote image: ")
print("Is black and white: {}".format(results_remote.color.is_bw_img))
print("Accent color: {}".format(results_remote.color.accent_color))
print("Dominant background color: {}".format(results_remote.color.dominant_color_background))
print("Dominant foreground color: {}".format(results_remote.color.dominant_color_foreground))
print("Dominant colors: {}".format(results_remote.color.dominant_colors))
# Detect image type
# Prints type results with degree of accuracy
print("Type of remote image:")
if results_remote.image_type.clip_art_type == 0:
print("Image is not clip art.")
elif results_remote.image_type.line_drawing_type == 1:
print("Image is ambiguously clip art.")
elif results_remote.image_type.line_drawing_type == 2:
print("Image is normal clip art.")
print("Image is good clip art.")
if results_remote.image_type.line_drawing_type == 0:
print("Image is not a line drawing.")
print("Image is a line drawing")
# Detect brands
print("Detecting brands in remote image: ")
if len(results_remote.brands) == 0:
print("No brands detected.")
for brand in results_remote.brands:
print("'{}' brand detected with confidence {:.1f}% at location {}, {}, {}, {}".format( \, brand.confidence * 100, brand.rectangle.x, brand.rectangle.x + brand.rectangle.w, \
brand.rectangle.y, brand.rectangle.y + brand.rectangle.h))
# Detect objects
# Print detected objects results with bounding boxes
print("Detecting objects in remote image:")
if len(results_remote.objects) == 0:
print("No objects detected.")
for object in detect_objects_results_remote.objects:
print("object at location {}, {}, {}, {}".format( \
object.rectangle.x, object.rectangle.x + object.rectangle.w, \
object.rectangle.y, object.rectangle.y + object.rectangle.h))
# Describe image
# Get the captions (descriptions) from the response, with confidence level
print("Description of remote image: ")
if (len(results_remote.description.captions) == 0):
print("No description detected.")
for caption in results_remote.description.captions:
print("'{}' with confidence {:.2f}%".format(caption.text, caption.confidence * 100))
# Return tags
# Print results with confidence score
print("Tags in the remote image: ")
if (len(results_remote.tags) == 0):
print("No tags detected.")
for tag in results_remote.tags:
print("'{}' with confidence {:.2f}%".format(, tag.confidence * 100))
# Detect celebrities
print("Celebrities in the remote image:")
if (len(results_remote.categories.detail.celebrities) == 0):
print("No celebrities detected.")
for celeb in results_remote.categories.detail.celebrities:
# Detect landmarks
print("Landmarks in the remote image:")
if len(results_remote.categories.detail.landmarks) == 0:
print("No landmarks detected.")
for landmark in results_remote.categories.detail.landmarks: