Einführung

Abgeschlossen

A screenshot showing bounding boxes around words in an advert.

Angenommen, Sie haben Bilddateien von Straßenschildern, Werbung oder Schrift auf einer Kreidetafel. Maschinen können den Text in den Bildern mithilfe der optischen Zeichenerkennung (OCR) lesen. OCR ist die Fähigkeit der künstlichen Intelligenz (KI), Wörter in Bildern in maschinenlesbaren Text umzuwandeln.

In diesem Modul konzentrieren wir uns auf die Verwendung von OCR-Technologien, um Text in Bildern zu erkennen und in ein textbasiertes Datenformat zu konvertieren, das dann gespeichert, gedruckt oder als Eingabe für die weitere Verarbeitung oder Analyse verwendet werden kann.

Verwendung von OCR

Die Automatisierung der Textverarbeitung kann die Geschwindigkeit und Effizienz der Arbeit verbessern, da die manuelle Dateneingabe entfällt. Die Fähigkeit, gedruckten und handgeschriebenen Text in Bildern zu erkennen, ist in Szenarien wie dem Anfertigen von Notizen, dem Digitalisieren von Krankenakten oder historischen Dokumenten, dem Scannen von Schecks für Bankeinzahlungen und vielem mehr von Vorteil.