© Liashko/Shutterstock.com
Entwickler Magazin
Maschinelle Bilderkennung mit Big Data und Deep Learning

Einblicke in die Königsdisziplin

Die Arbeit mit unstrukturierten Daten dient gerne als Paradebeispiel für Big Data, weil die technologischen Möglichkeiten das Speichern und Verarbeiten großer Datenmengen erlauben und die Mehrheit dieser Daten unstrukturiert ist [1]. Allerdings ist im Zusammenhang mit unstrukturierten Daten meist von der Analyse und der Extraktion von Informationen aus Texten die Rede. Viel weniger hingegen wird das Thema der Bildanalyse thematisiert. Diese gilt aber nach wie vor als eine Königdisziplin der modernen Computerwissenschaft.

Dimitri Gross


Wie unstrukturierte Texte, so tragen auch Bilder zahlreiche Informationen in sich. Ein Mensch kann diese Zusammenhänge sofort erkennen und Erkenntnisse daraus für sich ableiten. Maschinen haben es da schwerer und benötigen für die Bildanalyse komplexe Verarbeitungsmechanismen. Vor allem brauchen sie hierfür aber auch zwei technologische Grundbedingungen: Sie brauchen eine skalierbare Plattform zum Speichern der Bilder und eine ebenfalls skalierbare und objektunabhängige Methode zur Extraktion der Merkmale aus den Bildern.

Eine maschinelle Bildanalyse teilt sich in viele Unterbereiche auf, vom einfachen Sortieren nach Farbstimmungen bis hin zum komplexen Themen, die heutzutage unter Computer Vision zusammengefasst werden. Auf drei wichtige Bereiche gehen wir näher ein: ähnliche Bilder anzeigen, Objekterkennung und Objektklassifizierung.

Fangen wir mit der einfachsten Problemstellung in der Bildanalytik an, nämlich dem Zeigen von allen ähnlichen Bildern in einer Datenbank. Hierzu machen sich die Entwickler Hashing- und Histogrammverfahren zu Nutze. Sie erstellen pro Bild ein Histogramm und kodieren dieses entweder in einem Vektor oder einem Hash. Anschließend clustern sie die sortierten Vektoren entsprechend ihrem Abstand zueinander und errechnen aus diesen Clustern einen Index. LIRE, ein Plug-in für Lucene, funktioniert z. B. auf diese Weise und ermöglicht so eine Bildersuche nach ähnlich aussehenden Bildern (Lucene Image Retrieval). Dabei geht LIRE nach einem fest definierten Regelsatz vor. Das System unterscheidet nicht zwischen einem Pferd und einem Menschen, sondern abstrahiert die Farbstimmung des Bilds.

In der Bildanalytik geht es aber noch deutlich komplexer. So benötigt ein Programm für die Objekt­erken­nung eine genaue Vorgabe und muss wissen, nach welchen Alleinstellungsmerkmalen (Features) in einem Bild gesucht werden soll. Damit nur eine bestimmte Art von Objekten gefunden wird, gibt ein Entwickler den Algorithmus vor, mit dem Features aus einem Bild extrahiert werden. So werden beispielsweise für eine Gesichtserkennung mehrere Merkmale definiert, die ein menschliches Gesicht ausmachen. Meist sind das Hell-Dunkel-Unterschiede (Haar Cascades), die der Maschine eine Schablone für die Suche vorgeben. Findet der Algorithmus in einem Bild eine gewisse Anzahl an Übereinstimmungen mit dieser Featureschablone, wird das Bild als TRUE klassifiziert. Zur Klassifizierung der gefundenen Features kommen meist Support Vector Machines (SVM) zum Einsatz. OpenCV ...

Entwickler Magazin
Maschinelle Bilderkennung mit Big Data und Deep Learning

Einblicke in die Königsdisziplin

Die Arbeit mit unstrukturierten Daten dient gerne als Paradebeispiel für Big Data, weil die technologischen Möglichkeiten das Speichern und Verarbeiten großer Datenmengen erlauben und die Mehrheit dieser Daten unstrukturiert ist [1]. Allerdings ist im Zusammenhang mit unstrukturierten Daten meist von der Analyse und der Extraktion von Informationen aus Texten die Rede. Viel weniger hingegen wird das Thema der Bildanalyse thematisiert. Diese gilt aber nach wie vor als eine Königdisziplin der modernen Computerwissenschaft.

Dimitri Gross


Wie unstrukturierte Texte, so tragen auch Bilder zahlreiche Informationen in sich. Ein Mensch kann diese Zusammenhänge sofort erkennen und Erkenntnisse daraus für sich ableiten. Maschinen haben es da schwerer und benötigen für die Bildanalyse komplexe Verarbeitungsmechanismen. Vor allem brauchen sie hierfür aber auch zwei technologische Grundbedingungen: Sie brauchen eine skalierbare Plattform zum Speichern der Bilder und eine ebenfalls skalierbare und objektunabhängige Methode zur Extraktion der Merkmale aus den Bildern.

Eine maschinelle Bildanalyse teilt sich in viele Unterbereiche auf, vom einfachen Sortieren nach Farbstimmungen bis hin zum komplexen Themen, die heutzutage unter Computer Vision zusammengefasst werden. Auf drei wichtige Bereiche gehen wir näher ein: ähnliche Bilder anzeigen, Objekterkennung und Objektklassifizierung.

Fangen wir mit der einfachsten Problemstellung in der Bildanalytik an, nämlich dem Zeigen von allen ähnlichen Bildern in einer Datenbank. Hierzu machen sich die Entwickler Hashing- und Histogrammverfahren zu Nutze. Sie erstellen pro Bild ein Histogramm und kodieren dieses entweder in einem Vektor oder einem Hash. Anschließend clustern sie die sortierten Vektoren entsprechend ihrem Abstand zueinander und errechnen aus diesen Clustern einen Index. LIRE, ein Plug-in für Lucene, funktioniert z. B. auf diese Weise und ermöglicht so eine Bildersuche nach ähnlich aussehenden Bildern (Lucene Image Retrieval). Dabei geht LIRE nach einem fest definierten Regelsatz vor. Das System unterscheidet nicht zwischen einem Pferd und einem Menschen, sondern abstrahiert die Farbstimmung des Bilds.

In der Bildanalytik geht es aber noch deutlich komplexer. So benötigt ein Programm für die Objekt­erken­nung eine genaue Vorgabe und muss wissen, nach welchen Alleinstellungsmerkmalen (Features) in einem Bild gesucht werden soll. Damit nur eine bestimmte Art von Objekten gefunden wird, gibt ein Entwickler den Algorithmus vor, mit dem Features aus einem Bild extrahiert werden. So werden beispielsweise für eine Gesichtserkennung mehrere Merkmale definiert, die ein menschliches Gesicht ausmachen. Meist sind das Hell-Dunkel-Unterschiede (Haar Cascades), die der Maschine eine Schablone für die Suche vorgeben. Findet der Algorithmus in einem Bild eine gewisse Anzahl an Übereinstimmungen mit dieser Featureschablone, wird das Bild als TRUE klassifiziert. Zur Klassifizierung der gefundenen Features kommen meist Support Vector Machines (SVM) zum Einsatz. OpenCV ...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang