Kurzfassung
Die vorliegende Diplomarbeit erörtert den Stand der Technik im Bereich der automatischen Texterkennung in Bild- und Videomaterial. Die Erkenntnisse dieses Subbereichs der automatischen Bildverarbeitung werden in Systemen wie zum Beispiel der automatischen Indizierung von Videomaterial, der automatischen Identifizierung von Hinweistafeln inklusive deren Übersetzung und Sprachausgabeprogrammen für blinde oder sehbehinderte Mitmenschen verwendet. Diese Diplomarbeit bietet eine Zusammenfassung vorhandener Methoden zur Textinformationsextrahierung (TIE) und zeigt Gemeinsamkeiten und Unterschiede der verschiedenen Herangehensweisen auf. Der Text-Spotting Agent ist ein in dieser Diplomarbeit vorgestellter Algorithmus, der in TIE-Systemen zur Lokalisierung von Szenentext in Bildern verwendet werden kann. Er erkennt Textelemente im Ausgangsbild anhand typischer in Buchstaben vorkommender Kombinationen von Kantenrichtungen. Weiters werden eine prototypische Java Implementierung des Text-Spotting Agent vorgestellt und dessen Ergebnisse diskutiert.