Projekt | PaREn

Laufzeit: 01.11.2007 - 31.10.2010

Pattern Recognition Engineering

Mustererkennung und maschinelles Lernen sind Techniken, die bereits in vielen Spezialanwendungen verwendet werden (Spam-Klassifikation, Handschrifterkennung, OCR, Werbungsplatzierung, etc.). Das Potential dieser Techniken in Bezug auf die Art und Weise, wie wir mit dem Computer interagieren ist jedoch bedeutend größer. Viele Funktionen und Verhaltensweisen des Computers basieren heute auf festen, von Hand erstellten Regeln, die Programmiererfahrung, Software-Engineering und ausführliches Testen bei der Erstellung erfordern. Die Ersetzung solchen Quellcodes durch adaptive und trainierbare Module, die auf Techniken der Mustererkennung und des maschinellen Lernens basieren, verspricht, den Arbeitsaufwand für die Erstellung von Software zu reduzieren, die Software robuster zu machen und bessere Lösungen für reale Probleme zu liefern.

Während das Software-Engineering in den vergangenen zwei Jahrzehnten große Fortschritte gemacht hat, wird Programmcode für Mustererkennung und maschinelles Lernen noch weitestgehend auf Einzelfall-Basis von Spezialisten entwickelt. Außerdem unterscheiden sich die Methoden für die Entwicklung, das Trainieren und das Testen von Mustererkennungsmodulen stark von denen anderer Softwaresysteme, da Mustererkennung und maschinelles Lernen Daten-getriebene Methoden sind und sich das Verhalten eines Systems für bestimmte Eingabedaten deutlich ändern kann, wenn neue Trainingsdaten vorliegen.

Das Ziel des PaREn-Projektes ist es, die Methoden und Werkzeuge zu entwickeln, die nötig sind, um auch Laien und Anfängern die Möglichkeit zu geben, Mustererkennungsmodule in Softwaresystemen zu benutzen, zu trainieren, zu testen und einzusetzen. Der erwartete Vorteil dieses Ansatzes ist eine deutlich weitere Verbreitung der Techniken der Mustererkennung und des maschinellen Lernens, was sowohl zu einer höheren Qualität der Entscheidungen und des Verhaltens von Softwaresystemen als auch zu geringeren Entwicklungskosten führen kann.

Das wohl größte Hindernis, das bei der Anwendung und Integration von Techniken der Mustererkennung und des maschinellen Lernens zu überwinden ist, ist die mathematische Komplexität und Erfahrenheit, die nötig ist, um sie für konkrete Fälle anzupassen. Dies ist nicht lediglich ein Problem des Software-Engineerings; es ist auch ein grundlegendes Problem der Methoden selbst: häufig haben sie viele Parameter und ihr Verhalten ist sehr empfindlich in Bezug auf die Vorgehensweise bei der Verbindung der Mustererkennungsmodule. Während auch klassische Softwaresysteme mit vielen Komponenten viele Parameter haben, die ihr Verhalten beeinflussen, entsprechen diese Parameter häufig Konzepten, die für die Entwickler bestimmte Bedeutungen haben und durch Versuch und Irrtum optimiert werden können. Ein großes Bestreben wird im PaREn-Projekt daher die Entwicklung von neuen statistischen Methoden und Algorithmen sein, die wesentlich sind für die Reduktion der Anzahl der Parameter, für die Automatisierung von Parameter- Optimierung, für die Modellauswahl, für die Konstruktion von Mustererkennungssystemen, und um schnelles Testen, schnelle Validierung und On-Line Adaptivität zu unterstützen.

Schließlich werden wir innerhalb des Projektes auch neue, kollaborative Umgebungen und Benutzerschnittstellen für die Entwicklung und das Training von Mustererkennungssystemen erarbeiten, die geeignet sind sowohl die Lehre im Bereich Mustererkennung als auch die Entwicklung von Mustererkennungssystemen in realen Umgebungen zu unterstützen.

Keyfacts

Beteiligte Forschungsbereiche

Webseite

http://paren.iupr.com/

Publikationen

Alle Publikationen

Automatic classifier selection for non-experts
Matthias Reif; Faisal Shafait; Markus Goldstein; Thomas Breuel; Andreas Dengel
In: Pattern Analysis and Applications (PAA), Vol. July 2012, Pages 1-14, Springer-Verlag, 7/2012.
The Effect of Border Noise on the Performance of Projection Based Page Segmentation Methods
Faisal Shafait; Thomas Breuel
In: IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 33, No. 4, Pages 846-851, IEEE, 4/2011.
Improved document image segmentation algorithm using multiresolution morphology
Syed Saqib Bukhari; Faisal Shafait; Thomas Breuel
In: SPIE Document Recognition and Retrieval XVIII. SPIE Conference on Document Recognition and Retrieval (DRR-11), January 23-27, San Francisco, CA, USA, SPIE, 1/2011.

Projekt | PaREn

Pattern Recognition Engineering

Keyfacts

Beteiligte Forschungsbereiche

Webseite

Publikationen

Automatic classifier selection for non-experts

The Effect of Border Noise on the Performance of Projection Based Page Segmentation Methods

Improved document image segmentation algorithm using multiresolution morphology

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung

Projekt teilen auf:

Keyfacts

Beteiligte Forschungsbereiche

Webseite

Verwandte Projekte

Automatic classifier selection for non-experts

The Effect of Border Noise on the Performance of Projection Based Page Segmentation Methods

Improved document image segmentation algorithm using multiresolution morphology

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung