© Liashko/Shutterstock.com
Entwickler Magazin
Entwicklung einer Handschriftenerkennung auf Basis eines CNN

Was ist möglich mit Neuronalen Netzen?

Die Suche nach einem Ansatz zur Entwicklung einer Lösung für die Erkennung von Handschriften trieb ein ganzes Entwicklerteam um. In diesem Technologiebericht werden die Erfahrungen in diesem Projekt und die Gründe für die Nutzung eines Convolutional Neuronal Networks (CNN) wiedergegeben.

Ralf-Thomas Pietsch


Seit dem 1. Januar 2018 müssen Banken und Sparkassen die Steueridentifikationsnummer (Steuer-ID) ihrer Kunden erfassen, wenn diese einen Konsumentenkredit in Höhe von 12 000 Euro und mehr in Anspruch nehmen. Für Finanzdienstleister bedeutet diese Gesetzesänderung unter anderem, dass sie die Steuer-IDs ihrer Bestandskunden anfordern und nachträglich in ihrem bestandsführenden System erfassen müssen. Im Zuge der Prozessimplementierung zur Nachforderung der Steuer-ID fragte ein langjähriger Kunde bei uns im Rahmen eines Scrum-Meetings an, wie die per Fax, E-Mail und Post eingehenden handschriftlich ausgefüllten Formulare automatisiert erfasst werden können. Zu diesem Zeitpunkt hatte man bereits Erfassungsformulare an seine Bestandskunden versendet und erhielt die ersten Rückläufer (Abb. 1). Um eine passende Lösung zu finden, sollten in einer Analysestory zunächst der Lösungsweg und die einzusetzenden Technologien geklärt werden.

Abb. 1: Formularrückläufer

Analysestory

In der Analysestory sondierten die Entwickler des Projekts den Markt nach möglichen Lösungen, die sich nahtlos in die bestehende Java-Anwendung integrieren ließen. Schnell war klar, dass OCR-Lösungen für die Erkennung von Handschriften nicht in Frage kamen, da sie nur gedruckten Text erkennen und umwandeln können. Als weiterer Ansatz wurde untersucht, inwiefern statistische Verfahren dazu geeignet sind, Handschriften zu erkennen. Auch dieser Ansatz erwies sich schnell als ungeeignet, da er zu aufwändig und zu ungenau ist. Weit größeren Erfolg versprach der Ansatz, eine Lösung auf Basis neuronaler Netze zu entwickeln.

Zwar hatten die in das Projekt involvierten Entwickler bis dato nur im Studium und auch dort nur wenige Berührungspunkte mit dieser KI-Technologie. Aber eine erste Literaturrecherche und die Beschreibungen der einschlägigen Open-Source-Bibliotheken versprachen, dass sich die Aufgabe auf diesem Wege lösen ließ. Aufgrund von Datenschutzbedenken schied die Verwendung von Cloud Services aus, eine Eigenentwicklung war daher unumgänglich.

Das Analyseergebnis stellten die Entwickler dem Kunden in einem weiteren Sprint-Meeting vor. Sie erhielten daraufhin das Mandat, einen Prototyp auf Basis eines geeigneten neuronalen Netzwerks zu bauen.

Bau des ersten Prototyps

Der erste Prototyp basierte auf einem einfachen Feed-Forward-Netzwerk. Da Java als Programmiersprache eingesetzt werden sollte, entschieden sich die Entwickler für die sehr gute und ausführlich dokumentierte Java-Bibliothek SNIPE [1]...

Entwickler Magazin
Entwicklung einer Handschriftenerkennung auf Basis eines CNN

Was ist möglich mit Neuronalen Netzen?

Die Suche nach einem Ansatz zur Entwicklung einer Lösung für die Erkennung von Handschriften trieb ein ganzes Entwicklerteam um. In diesem Technologiebericht werden die Erfahrungen in diesem Projekt und die Gründe für die Nutzung eines Convolutional Neuronal Networks (CNN) wiedergegeben.

Ralf-Thomas Pietsch


Seit dem 1. Januar 2018 müssen Banken und Sparkassen die Steueridentifikationsnummer (Steuer-ID) ihrer Kunden erfassen, wenn diese einen Konsumentenkredit in Höhe von 12 000 Euro und mehr in Anspruch nehmen. Für Finanzdienstleister bedeutet diese Gesetzesänderung unter anderem, dass sie die Steuer-IDs ihrer Bestandskunden anfordern und nachträglich in ihrem bestandsführenden System erfassen müssen. Im Zuge der Prozessimplementierung zur Nachforderung der Steuer-ID fragte ein langjähriger Kunde bei uns im Rahmen eines Scrum-Meetings an, wie die per Fax, E-Mail und Post eingehenden handschriftlich ausgefüllten Formulare automatisiert erfasst werden können. Zu diesem Zeitpunkt hatte man bereits Erfassungsformulare an seine Bestandskunden versendet und erhielt die ersten Rückläufer (Abb. 1). Um eine passende Lösung zu finden, sollten in einer Analysestory zunächst der Lösungsweg und die einzusetzenden Technologien geklärt werden.

Abb. 1: Formularrückläufer

Analysestory

In der Analysestory sondierten die Entwickler des Projekts den Markt nach möglichen Lösungen, die sich nahtlos in die bestehende Java-Anwendung integrieren ließen. Schnell war klar, dass OCR-Lösungen für die Erkennung von Handschriften nicht in Frage kamen, da sie nur gedruckten Text erkennen und umwandeln können. Als weiterer Ansatz wurde untersucht, inwiefern statistische Verfahren dazu geeignet sind, Handschriften zu erkennen. Auch dieser Ansatz erwies sich schnell als ungeeignet, da er zu aufwändig und zu ungenau ist. Weit größeren Erfolg versprach der Ansatz, eine Lösung auf Basis neuronaler Netze zu entwickeln.

Zwar hatten die in das Projekt involvierten Entwickler bis dato nur im Studium und auch dort nur wenige Berührungspunkte mit dieser KI-Technologie. Aber eine erste Literaturrecherche und die Beschreibungen der einschlägigen Open-Source-Bibliotheken versprachen, dass sich die Aufgabe auf diesem Wege lösen ließ. Aufgrund von Datenschutzbedenken schied die Verwendung von Cloud Services aus, eine Eigenentwicklung war daher unumgänglich.

Das Analyseergebnis stellten die Entwickler dem Kunden in einem weiteren Sprint-Meeting vor. Sie erhielten daraufhin das Mandat, einen Prototyp auf Basis eines geeigneten neuronalen Netzwerks zu bauen.

Bau des ersten Prototyps

Der erste Prototyp basierte auf einem einfachen Feed-Forward-Netzwerk. Da Java als Programmiersprache eingesetzt werden sollte, entschieden sich die Entwickler für die sehr gute und ausführlich dokumentierte Java-Bibliothek SNIPE [1]...

Neugierig geworden?


   
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang