Azure AI Vision

3 minuten

Hoewel u uw eigen machine learning-modellen voor Computer Vision kunt trainen, kan de architectuur voor Computer Vision-modellen complex zijn; en u hebt aanzienlijke hoeveelheden trainingsafbeeldingen en rekenkracht nodig om het trainingsproces uit te voeren.

De Azure AI Vision-service van Microsoft biedt vooraf samengestelde en aanpasbare computer vision-modellen die zijn gebaseerd op het basismodel van Florence en bieden verschillende krachtige mogelijkheden. Met Azure AI Vision kunt u snel en eenvoudig geavanceerde Computer Vision-oplossingen maken; profiteren van 'off-the-shelf'-functionaliteit voor veel veelvoorkomende Computer Vision-scenario's, terwijl u de mogelijkheid behoudt om aangepaste modellen te maken met uw eigen afbeeldingen.

Azure-resources voor Azure AI Vision-service

Als u Azure AI Vision wilt gebruiken, moet u er een resource voor maken in uw Azure-abonnement. U kunt een van de volgende resourcetypen gebruiken:

Azure AI Vision-: een specifieke resource voor de Azure AI Vision-service. Gebruik dit resourcetype als u geen andere Azure AI-services wilt gebruiken of als u het gebruik en de kosten voor uw Azure AI Vision-resource afzonderlijk wilt bijhouden.
Azure AI-services: een algemene resource met Azure AI Vision en vele andere Azure AI-services; zoals Azure AI Language, Azure AI Custom Vision, Azure AI Translator en andere. Gebruik dit resourcetype als u van plan bent om meerdere AI-services te gebruiken en het beheer en de ontwikkeling te vereenvoudigen.

Afbeeldingen analyseren met de Azure AI Vision-service

Nadat u een geschikte resource in uw abonnement hebt gemaakt, kunt u afbeeldingen verzenden naar de Azure AI Vision-service om een breed scala aan analytische taken uit te voeren.

Azure AI Vision biedt ondersteuning voor meerdere mogelijkheden voor afbeeldingsanalyse, waaronder:

Optische tekenherkenning (OCR) - tekst extraheren uit afbeeldingen.
Bijschriften en beschrijvingen van afbeeldingen genereren.
Detectie van duizenden algemene objecten in afbeeldingen.
Visuele functies in afbeeldingen taggen

Deze taken en meer kunnen worden uitgevoerd in Azure AI Vision Studio-.

Schermopname van Vision Studio.

Optische tekenherkenning

De Azure AI Vision-service kan ocr-mogelijkheden (optical character recognition) gebruiken om tekst in afbeeldingen te detecteren. Denk bijvoorbeeld aan de volgende afbeelding van een voedingslabel op een product in een supermarkt:

diagram van een voedingslabel.

De Azure AI Vision-service kan deze afbeelding analyseren en de volgende tekst extraheren:

Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet

Tip

U kunt de OCR-mogelijkheden van Azure AI Vision verder verkennen in de Tekst lezen met azure AI Vision module op Microsoft Learn.

Een afbeelding beschrijven met bijschriften

Azure AI Vision biedt de mogelijkheid om een afbeelding te analyseren, de gedetecteerde objecten te evalueren en een door mensen leesbare woordgroep of zin te genereren die kan beschrijven wat er in de afbeelding is gedetecteerd. Bekijk bijvoorbeeld de volgende afbeelding:

Diagram van een man op een skateboard.

Azure AI Vision retourneert het volgende bijschrift voor deze afbeelding:

Een man die op een skateboard springt

Algemene objecten in een afbeelding detecteren

Azure AI Vision kan duizenden algemene objecten in afbeeldingen identificeren. Wanneer azure AI Vision bijvoorbeeld wordt gebruikt om objecten in de skateboarder-afbeelding te detecteren die eerder zijn besproken, retourneert Azure AI Vision de volgende voorspellingen:

Skateboard (90,40%)
Persoon (95,5%)

De voorspellingen bevatten een betrouwbaarheidsscore die aangeeft welke waarschijnlijkheid het model heeft berekend voor de voorspelde objecten.

Inclusief de gedetecteerde objectlabels en hun waarschijnlijkheden, meldt Azure AI Vision begrenzingsvak coördinaten terug die de top, de linkerzijde, de breedte en hoogte van het gedetecteerde object aangeven. U kunt deze coördinaten gebruiken om te bepalen waar in de afbeelding elk object is gedetecteerd, zoals deze:

Diagram van een skateboarder met begrenzingsvakken rond gedetecteerde objecten.

Visuele kenmerken labelen

Azure AI Vision kan tags voorstellen voor een afbeelding op basis van de inhoud. Deze tags kunnen worden gekoppeld aan de afbeelding als metagegevens die kenmerken van de afbeelding samenvatten en kunnen handig zijn als u een afbeelding wilt indexeren, samen met een set belangrijke termen die kunnen worden gebruikt om te zoeken naar afbeeldingen met specifieke kenmerken of inhoud.

De tags die worden geretourneerd voor de skateboarder-afbeelding (met bijbehorende betrouwbaarheidsscores) zijn bijvoorbeeld:

sport (99,60%)
persoon (99,56%)
schoeisel (98.05%)
schaatsen (96.27%)
boardsport (95,58%)
skateboardapparatuur (94.43%)
kleding (94.02%)
wand (93,81%)
skateboarden (93,78%)
skateboarder (93,25%)
individuele sporten (92,80%)
street stunts (90.81%)
saldo (90,81%)
springen (89,87%)
sportuitrusting (88,61%)
extreme sport (88,35%)
kickflip (88.18%)
stunt (87.27%)
skateboard (86.87%)
stunt performer (85,83%)
knie (85.30%)
sport (85,24%)
longboard (84,61%)
longboarding (84,45%)
rijden (73.37%)
skate (67.27%)
lucht (64,83%)
jong (63.29%)
buiten (61.39%)

Trainen van aangepaste modellen

Als de ingebouwde modellen van Azure AI Vision niet aan uw behoeften voldoen, kunt u de service gebruiken om een aangepast model te trainen voor afbeeldingsclassificatie of objectdetectie. Azure AI Vision bouwt aangepaste modellen op het vooraf getrainde basismodel, wat betekent dat u geavanceerde modellen kunt trainen met behulp van relatief weinig trainingsafbeeldingen.

Afbeeldingsclassificatie

Een afbeeldingsclassificatiemodel wordt gebruikt om de categorie te voorspellen of klasse van een afbeelding. U kunt bijvoorbeeld een model trainen om te bepalen welk type fruit wordt weergegeven in een afbeelding, zoals:

Appel	Banaan	Oranje

Objectdetectie

Objectdetectiemodellen detecteren en classificeren objecten in een afbeelding, waarbij begrenzingsvakcoördinaten worden geretourneerd om elk object te vinden. Naast de ingebouwde mogelijkheden voor objectdetectie in Azure AI Vision kunt u een aangepast objectdetectiemodel trainen met uw eigen afbeeldingen. U kunt bijvoorbeeld foto's van fruit gebruiken om een model te trainen dat meerdere vruchten in een afbeelding detecteert, zoals:

diagram van meerdere gedetecteerde vruchten in een afbeelding.

Notitie

Details over het gebruik van Azure AI Vision voor het trainen van een aangepast model vallen buiten het bereik van deze module. U vindt informatie over aangepaste modeltraining in de Azure AI Vision-documentatie.