Zum Inhalt springen

Visuelles Erkennen von Objekten mit Ausprägungsvarianzen

Dissertation von Jens Teichert (2011)

Maschinelle visuelle Objekterkennung hat ein großes Anwendungspotential. Neben etablierten Anwendungen in der Automatisierungstechnik wären viele andere Anwendungsbereiche denkbar, wenn die Verfahren mehr von den Fähigkeiten biologischer Objekterkennung besäßen. Eine besondere Herausforderung liegt darin, dass Objekte in der realen Welt in den unterschiedlichsten Ausprägungen auftreten. Ein universelles Objekterkennungssystem muss damit umgehen können. Bisher ist nicht klar, welche Funktionsprinzipien dazu notwendig sind. Erkenntnisse über die biologische Funktionsweise sind immer noch unvollständig und erlauben keinen direkten Nachbau. es bleibt also nur, Funktionsprinzipien anzunehmen und in Objekterkennungssystemen auszuprobieren.
In diesem Beitrag wird eine explizite Kodierung von Ausprägungen untersucht. Dazu wird ein Objekterkennungssystem erstellt, welches einige neue Verarbeitungseigenschaften besitzt. So erfolgt die Analyse von visuellem Kontext nicht wie üblich mithilfe starrer Filtermasken, sondern anhand von neu entwickelten Diffusionsverfahren. Für das Verfahren wird keine Vorverarbeitung benötigt. Es wird eine schichtenweise Repräsentation von Teilobjekten vorgenommen, die nicht wie üblich eine stufenweise Reduktion der Auflösung erfordert. Teildetektionen können von beliebigen vorausgehenden Teildetektionen abhängen und nicht wie üblich nur von der vorgeschalteten Verarbeitungsschicht.
Die Evaluierung des neu entwickelten Objekterkennungsverfahrens zeigt, dass die explizite Kodierung von Ausprägungen erfolgreich eingesetzt werden kann.

Thesis online

Aktualisiert von: Webteam DMLab