© Excellent backgrounds/Shutterstock.com
Java Magazin
Android-Anwendungen mit optischer Zeichenerkennung

Android-Anwendungen mit optischer Zeichenerkennung

Visitenkarten abfotografieren und direkt als Kontakt speichern, ein Schild mit der Smartphonekamera aufnehmen und direkt in eine andere Sprache übersetzen - in vielen Situationen kann optische Zeichenerkennung das Leben erleichtern. Mit den Tesseract-Android-Tools kann Optical Character Recognition (OCR) problemlos im eigenen Projekt realisiert werden. Erfahren Sie, wie man Google Tesseract offline in der eigenen Anwendung nutzt.

Mathias Gebbe


Die optische Zeichenerkennung bietet im mobilen Sektor vielseitige Anwendungsmöglichkeiten. Ein großer Vorteil hierbei ist, dass die meisten Smartphones heutzutage von Haus aus mit einer hochauflösenden Kamera ausgerüstet sind. So lassen sich mit Android-Apps zum Beispiel Visitenkarten abfotografieren, die dann direkt als Kontakt gespeichert werden. Oder das gerade aufgenommene Schild wird automatisch in eine andere Sprache übersetzt. Interessant wird es für den Entwickler, die eigene, bereits bestehende Anwendung durch das neue Feature der Zeichenerkennung aufzupeppen. Eine App zur Prüfung der Lotto-Gewinnzahlen wird durch die automatische Ziffernerkennung attraktiver als die Konkurrenzprodukte, da die mühsame und zeitaufwändige manuelle Eingabe des Lottoscheins wegfällt. Das Los wird nun einfach abfotografiert, und die eingelesenen Gewinnzahlen werden automatisch verglichen. Dabei muss die Programmlogik nicht verändert werden. Lediglich eine Erweiterung des Einlesevorgangs ist vonnöten. Allerdings gilt zu berücksichtigen, dass keine Texterkennung perfekt funktioniert. So ist eine Kontrolle und Korrektur durch den Endanwender erforderlich, da die Ergebnisse der automatischen Zeichenerkennung stark von den äußeren Umweltfaktoren abhängen, unter denen das Bild aufgenommen wurde. Wenn sich schon auf dem Foto keine brauchbare Information befindet, können auch von der Software keine sinnvollen Zeichen extrahiert werden. Dieser Artikel gibt einen kurzen und einfachen Einstieg in die Android-Entwicklung mit Tesseract [1] anhand eines kleinen ­Eclipse-­Projekts. Dort wird die Zeichenerkennung auf ein vorher mit der Kamera aufgenommenes Bild angewandt. Nach der Verarbeitung wird ein editierbares Textfeld mit dem automatisch erkannten Text befüllt.

Tesser-wer?

Tesseract gilt als eine der genauesten frei verfügbaren OCR Engines auf dem Markt [2] und steht unter der freien Apache-Lizenz. Die Engine dient der optischen Zeichenerkennung und besitzt keine grafische Oberfläche. Das Programm wird direkt über die Kommandozeile gesteuert und benötigt für die Erkennung von Zeichen keinen Internetzugriff. Durch Trainingsdaten ist Tesseract in der Lage, neue Sprachdaten zu generieren. Diese Sprachdaten liegen bereits in über sechzig verschiedenen Sprachen vor – darunter Chinesisch, Arabisch und Hebräisch. Wer will, kann aber auch selbst Sprachdaten erzeugen. Ursprünglich wurde Tesseract von Hewlett-Packard in den Jahren 1985 bis 1995 als proprietäre Software entwickelt. Nachd...

Java Magazin
Android-Anwendungen mit optischer Zeichenerkennung

Android-Anwendungen mit optischer Zeichenerkennung

Visitenkarten abfotografieren und direkt als Kontakt speichern, ein Schild mit der Smartphonekamera aufnehmen und direkt in eine andere Sprache übersetzen - in vielen Situationen kann optische Zeichenerkennung das Leben erleichtern. Mit den Tesseract-Android-Tools kann Optical Character Recognition (OCR) problemlos im eigenen Projekt realisiert werden. Erfahren Sie, wie man Google Tesseract offline in der eigenen Anwendung nutzt.

Mathias Gebbe


Die optische Zeichenerkennung bietet im mobilen Sektor vielseitige Anwendungsmöglichkeiten. Ein großer Vorteil hierbei ist, dass die meisten Smartphones heutzutage von Haus aus mit einer hochauflösenden Kamera ausgerüstet sind. So lassen sich mit Android-Apps zum Beispiel Visitenkarten abfotografieren, die dann direkt als Kontakt gespeichert werden. Oder das gerade aufgenommene Schild wird automatisch in eine andere Sprache übersetzt. Interessant wird es für den Entwickler, die eigene, bereits bestehende Anwendung durch das neue Feature der Zeichenerkennung aufzupeppen. Eine App zur Prüfung der Lotto-Gewinnzahlen wird durch die automatische Ziffernerkennung attraktiver als die Konkurrenzprodukte, da die mühsame und zeitaufwändige manuelle Eingabe des Lottoscheins wegfällt. Das Los wird nun einfach abfotografiert, und die eingelesenen Gewinnzahlen werden automatisch verglichen. Dabei muss die Programmlogik nicht verändert werden. Lediglich eine Erweiterung des Einlesevorgangs ist vonnöten. Allerdings gilt zu berücksichtigen, dass keine Texterkennung perfekt funktioniert. So ist eine Kontrolle und Korrektur durch den Endanwender erforderlich, da die Ergebnisse der automatischen Zeichenerkennung stark von den äußeren Umweltfaktoren abhängen, unter denen das Bild aufgenommen wurde. Wenn sich schon auf dem Foto keine brauchbare Information befindet, können auch von der Software keine sinnvollen Zeichen extrahiert werden. Dieser Artikel gibt einen kurzen und einfachen Einstieg in die Android-Entwicklung mit Tesseract [1] anhand eines kleinen ­Eclipse-­Projekts. Dort wird die Zeichenerkennung auf ein vorher mit der Kamera aufgenommenes Bild angewandt. Nach der Verarbeitung wird ein editierbares Textfeld mit dem automatisch erkannten Text befüllt.

Tesser-wer?

Tesseract gilt als eine der genauesten frei verfügbaren OCR Engines auf dem Markt [2] und steht unter der freien Apache-Lizenz. Die Engine dient der optischen Zeichenerkennung und besitzt keine grafische Oberfläche. Das Programm wird direkt über die Kommandozeile gesteuert und benötigt für die Erkennung von Zeichen keinen Internetzugriff. Durch Trainingsdaten ist Tesseract in der Lage, neue Sprachdaten zu generieren. Diese Sprachdaten liegen bereits in über sechzig verschiedenen Sprachen vor – darunter Chinesisch, Arabisch und Hebräisch. Wer will, kann aber auch selbst Sprachdaten erzeugen. Ursprünglich wurde Tesseract von Hewlett-Packard in den Jahren 1985 bis 1995 als proprietäre Software entwickelt. Nachd...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang