Informatie over Computer Vision
Computer Vision is een gebied van kunstmatige intelligentie dat zich bezighoudt met visuele verwerking. Laten we eens een aantal mogelijkheden van Computer Vision bekijken.
De app Seeing AI is een goed voorbeeld van het vermogen van Computer Vision. De app Seeing AI is ontwikkeld voor gebruikers met een visuele beperking en laat goed zien hoe de visuele wereld met behulp van kunstmatige intelligentie ook voor hen toegankelijk wordt, met beschrijvingen van personen, tekst en voorwerpen in de buurt.
Bekijk de volgende video voor meer informatie over Seeing AI.
Ga naar de webpagina van Seeing AI voor meer informatie.
Computer Vision-modellen en -mogelijkheden
De meeste Computer Vision-oplossingen zijn gebaseerd op machine learning-modellen die kunnen worden toegepast op visuele invoer van camera's, video's of afbeeldingen. In de volgende tabel worden algemene Computer Vision-taken beschreven.
Taak | Beschrijving |
---|---|
Afbeeldingsclassificatie | Voor de classificatie van afbeeldingen moet een machine learning-model worden getraind om afbeeldingen te kunnen classificeren op basis van hun inhoud. In een verkeersbewakingsoplossing moet u bijvoorbeeld een afbeeldingsclassificatiemodel gebruiken om afbeeldingen te classificeren op basis van het type voertuig dat de afbeelding bevat, zoals taxi's, bussen, fietsers, enzovoort. |
Objectdetectie | Machine learning-modellen voor objectdetectie worden getraind om afzonderlijke objecten in een afbeelding te classificeren en hun locatie te identificeren met een begrenzingsvak. Een verkeersbewakingsoplossing gebruikt bijvoorbeeld objectdetectie om de locatie van verschillende voertuigklassen te identificeren. |
Semantische segmentatie | Semantische segmentatie is een geavanceerde machine learning-techniek waarbij afzonderlijke pixels in de afbeelding worden geclassificeerd volgens het object waar ze bij horen. Een verkeersbewakingsoplossing projecteert bijvoorbeeld verkeersafbeeldingen met 'maskeerlagen' om verschillende voertuigen te markeren met behulp van specifieke kleuren. |
Afbeeldingsanalyse | U kunt oplossingen maken waarin machine learning-modellen worden gecombineerd met geavanceerde afbeeldingsanalysetechnieken om informatie te krijgen uit afbeeldingen, inclusief 'tags' waarmee de afbeelding kan worden gecatalogiseerd of zelfs beschrijvende onderschriften waarin de scène die in de afbeelding wordt getoond, wordt samengevat. |
Gezichtsdetectie, analyse en herkenning | Gezichtsdetectie is een gespecialiseerde vorm van objectdetectie waarmee gezichten van mensen in een afbeelding worden gedetecteerd. Dit kan worden gecombineerd met classificatie- en gezichtsgeometrieanalysetechnieken om individuen te herkennen op basis van hun gezichtskenmerken. |
Optische tekenherkenning (OCR) | Optische tekenherkenning is een techniek die wordt gebruikt voor het detecteren en lezen van tekst in afbeeldingen. U kunt OCR gebruiken om tekst in foto's te lezen (bijvoorbeeld verkeersborden of winkelgevels) of om informatie uit gescande documenten af te lezen zoals brieven, facturen of formulieren. |
Computer Vision-services in Microsoft Azure
U kunt De Azure AI Vision van Microsoft gebruiken om computer Vision-oplossingen te ontwikkelen. De servicefuncties zijn beschikbaar voor gebruik en testen in Azure Vision Studio en andere programmeertalen. Enkele functies van Azure AI Vision zijn:
- Afbeeldingsanalyse: mogelijkheden voor het analyseren van afbeeldingen en video's en het extraheren van beschrijvingen, tags, objecten en tekst.
- Face: mogelijkheden waarmee u gezichtsdetectie- en gezichtsherkenningsoplossingen kunt bouwen.
- Optical Character Recognition (OCR): mogelijkheden voor het extraheren van gedrukte of handgeschreven tekst uit afbeeldingen, waardoor toegang tot een digitale versie van de gescande tekst mogelijk is.