Azure AI Vision
Hoewel u uw eigen machine learning-modellen voor Computer Vision kunt trainen, kan de architectuur voor Computer Vision-modellen complex zijn; en u hebt aanzienlijke hoeveelheden trainingsafbeeldingen en rekenkracht nodig om het trainingsproces uit te voeren.
De Azure AI Vision-service van Microsoft biedt vooraf samengestelde en aanpasbare computer vision-modellen die zijn gebaseerd op het basismodel van Florence en bieden verschillende krachtige mogelijkheden. Met Azure AI Vision kunt u snel en eenvoudig geavanceerde Computer Vision-oplossingen maken; profiteren van 'off-the-shelf'-functionaliteit voor veel veelvoorkomende Computer Vision-scenario's, terwijl u de mogelijkheid behoudt om aangepaste modellen te maken met uw eigen afbeeldingen.
Azure-resources voor Azure AI Vision-service
Als u Azure AI Vision wilt gebruiken, moet u er een resource voor maken in uw Azure-abonnement. U kunt een van de volgende resourcetypen gebruiken:
- Azure AI Vision: een specifieke resource voor de Azure AI Vision-service. Gebruik dit resourcetype als u geen andere Azure AI-services wilt gebruiken of als u het gebruik en de kosten voor uw Azure AI Vision-resource afzonderlijk wilt bijhouden.
- Azure AI-services: een algemene resource die Azure AI Vision bevat, samen met vele andere Azure AI-services, zoals Azure AI Language, Azure AI Custom Vision, Azure AI Vertalen en andere. Gebruik dit resourcetype als u van plan bent om meerdere AI-services te gebruiken en het beheer en de ontwikkeling te vereenvoudigen.
Afbeeldingen analyseren met de Azure AI Vision-service
Nadat u een geschikte resource in uw abonnement hebt gemaakt, kunt u afbeeldingen verzenden naar de Azure AI Vision-service om een breed scala aan analytische taken uit te voeren.
Azure AI Vision biedt ondersteuning voor meerdere mogelijkheden voor afbeeldingsanalyse, waaronder:
- Optische tekenherkenning (OCR) - tekst extraheren uit afbeeldingen.
- Het genereren van onderschrift s en beschrijvingen van afbeeldingen.
- Detectie van duizenden algemene objecten in afbeeldingen.
- Visuele functies in afbeeldingen taggen
Deze taken en meer kunnen worden uitgevoerd in Azure AI Vision Studio.
Optische tekenherkenning
De Azure AI Vision-service kan ocr-mogelijkheden (optical character recognition) gebruiken om tekst in afbeeldingen te detecteren. Denk bijvoorbeeld aan de volgende afbeelding van een voedingslabel op een product in een supermarkt:
De Azure AI Vision-service kan deze afbeelding analyseren en de volgende tekst extraheren:
Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet
Fooi
U kunt de OCR-mogelijkheden van Azure AI Vision verder verkennen in de leestekst met de Azure AI Vision-module op Microsoft Learn.
Een afbeelding beschrijven met onderschrift s
Azure AI Vision biedt de mogelijkheid om een afbeelding te analyseren, de gedetecteerde objecten te evalueren en een door mensen leesbare woordgroep of zin te genereren die kan beschrijven wat er in de afbeelding is gedetecteerd. Kijk bijvoorbeeld eens naar de volgende afbeelding:
Azure AI Vision retourneert de volgende onderschrift voor deze afbeelding:
Een man die op een skateboard springt
Algemene objecten in een afbeelding detecteren
Azure AI Vision kan duizenden algemene objecten in afbeeldingen identificeren. Wanneer azure AI Vision bijvoorbeeld wordt gebruikt om objecten in de skateboarder-afbeelding te detecteren die eerder zijn besproken, retourneert Azure AI Vision de volgende voorspellingen:
- Skateboard (90,40%)
- Persoon (95,5%)
De voorspellingen bevatten een betrouwbaarheidsscore die aangeeft welke waarschijnlijkheid het model heeft berekend voor de voorspelde objecten.
Naast de gedetecteerde objectlabels en hun waarschijnlijkheden retourneert Azure AI Vision begrenzingsvakcoördinaten die de boven-, linker-, breedte- en hoogte van het gedetecteerde object aangeven. U kunt deze coördinaten gebruiken om te bepalen waar in de afbeelding elk object is gedetecteerd, zoals deze:
Visuele kenmerken taggen
Azure AI Vision kan tags voor een afbeelding voorstellen op basis van de inhoud. Deze tags kunnen worden gekoppeld aan de afbeelding als metagegevens die kenmerken van de afbeelding samenvatten en kunnen handig zijn als u een afbeelding wilt indexeren, samen met een set belangrijke termen die kunnen worden gebruikt om te zoeken naar afbeeldingen met specifieke kenmerken of inhoud.
De tags die worden geretourneerd voor de skateboarder-afbeelding (met bijbehorende betrouwbaarheidsscores) zijn bijvoorbeeld:
- sport (99,60%)
- persoon (99,56%)
- schoeisel (98,05%)
- schaatsen (96,27%)
- boardsport (95,58%)
- skateboarding apparatuur (94,43%)
- kleding (94,02%)
- wand (93,81%)
- skateboarden (93,78%)
- skateboarder (93,25%)
- individuele sporten (92,80%)
- straat stunts (90,81%)
- saldo (90,81%)
- springen (89,87%)
- sportuitrusting (88,61%)
- extreme sport (88,35%)
- kickflip (88,18%)
- stunt (87,27%)
- skateboard (86,87%)
- stunt performer (85,83%)
- knie (85,30%)
- sporten (85,24%)
- longboard (84,61%)
- longboarding (84,45%)
- rijden (73,37%)
- skate (67,27%)
- lucht (64,83%)
- jong (63,29%)
- buiten (61,39%)
Aangepaste modellen trainen
Als de ingebouwde modellen van Azure AI Vision niet aan uw behoeften voldoen, kunt u de service gebruiken om een aangepast model te trainen voor afbeeldingsclassificatie of objectdetectie. Azure AI Vision bouwt aangepaste modellen op het vooraf getrainde basismodel, wat betekent dat u geavanceerde modellen kunt trainen met behulp van relatief weinig trainingsafbeeldingen.
Afbeeldingsclassificatie
Een afbeeldingsclassificatiemodel wordt gebruikt om de categorie of klasse van een afbeelding te voorspellen. U kunt bijvoorbeeld een model trainen om te bepalen welk type fruit wordt weergegeven in een afbeelding, zoals:
Apple | Banaan | Orange |
---|---|---|
Objectdetectie
Objectdetectiemodellen detecteren en classificeren objecten in een afbeelding, waarbij begrenzingsvakcoördinaten worden geretourneerd om elk object te vinden. Naast de ingebouwde mogelijkheden voor objectdetectie in Azure AI Vision kunt u een aangepast objectdetectiemodel trainen met uw eigen afbeeldingen. U kunt bijvoorbeeld foto's van fruit gebruiken om een model te trainen dat meerdere vruchten in een afbeelding detecteert, zoals:
Notitie
Details over het gebruik van Azure AI Vision voor het trainen van een aangepast model vallen buiten het bereik van deze module. U vindt informatie over aangepaste modeltrainingen in de Documentatie van Azure AI Vision.