© Excellent backgrounds/Shutterstock.com
Java Magazin
Exploiting Deep Learning: die wichtigsten Bits und Pieces

Sieh zu und lerne

Deep Learning gilt heutzutage oft als „heiliger Gral“, wenn es bei der Entwicklung von intelligenten Systemen zum Einsatz kommt. Während vollautomatisches und autonomes maschinelles Lernen auf dem Weg ist, erfordern aktuelle Lösungen noch das Verständnis eines Softwareentwicklers oder Ingenieurs. Deep Learning - im Gegensatz dazu - ist ein Teilgebiet des maschinellen Lernens, das ohne menschliches Eingreifen tief greifende Lernerfolge verspricht und an der Funktion und der Arbeitsweise der neuronalen Netze im menschlichen Gehirn orientiert ist.

Björn Schuller, Maximilian Schmitt, Shahin Amiriparian


Video: It’s all about Machines and creating their Minds

Maschinelles Lernen allgemein bezeichnet datenbasierte Methoden der künstlichen Intelligenz. Ein Computer lernt ein Modell anhand von Beispieldaten. Künstliche Intelligenz spielt eine bedeutende Rolle in der Mensch-Maschine-Interaktion. Ein Beispiel dafür ist der in Abbildung 1 gezeigte Roboter Zeno. Er ist ein Therapiewerkzeug für autistische Kinder, denen er helfen soll, Emotionen besser auszudrücken und zu verstehen. Zeno erkennt die Emotion seines Gegenübers anhand dessen Sprache und Gesichtsausdruck und reagiert entsprechend. Dazu müssen die aufgenommenen Sensordaten in Echtzeit durch Verfahren des maschinellen Lernens analysiert werden.

Abb. 1: Der Roboter Zeno dient zur Therapie autistischer Kinder

Deep Learning basiert auf Netzwerken aus künstlichen Neuronen, die Eingangs- und Ausgangsneuronen sowie mehrere Schichten von Zwischenneuronen (verborgene Schichten) besitzen. Jedes Neuron verarbeitet einen Eingangsvektor basierend auf einer Methode, die der Funktionsweise menschlicher Nervenzellen ähnlich ist: Es wird eine gewichtete Summe aller Eingangswerte berechnet und das Resultat mit einer nicht linearen Funktion, der sogenannten Aktivierungsfunktion, transformiert. Über die Eingangsneuronen werden die Daten, wie unverarbeitete Audiosignale, aufgenommen und in das neuronale Netz eingespeist. Die Audiodaten durchlaufen die Zwischenneuronen aller verborgenen Schichten und werden dabei verarbeitet. Anschließend werden die verarbeiteten Signale und die berechneten Ergebnisse über die Ausgangsneuronen ausgegeben, die dann das Endergebnis liefern. Die Parameter der einzelnen Neuronen werden während des Trainings des Netzes mit den Trainingsdaten berechnet. Je größer die Anzahl der Neuronen und der Schichten ist, desto komplexere Probleme können behandelt werden.

Prinzipiell gilt, dass eine größere Datenmenge auch zu robusteren Modellen führt (solange die Daten nicht unausgewogen sind). Sind zu wenige Daten vorhanden und ist die ausgewählte Netzarchitektur zu komplex, besteht die Gefahr des Overfitting. Dies bedeutet, dass die Modellparameter während des Trainings zu stark auf die gegebenen Daten optimiert werden und das Modell nicht mehr genügend generalisiert, das heißt mit unabhängigen Testdaten nicht mehr gut funktioniert. Mögliche Problemstellungen lassen sich durch drei Lernmethoden bewältigen: (1) überwachtes Lernen, (2) semiüberwachtes Lernen und (3) unüberwachtes Lernen.

Beim überwac...

Java Magazin
Exploiting Deep Learning: die wichtigsten Bits und Pieces

Sieh zu und lerne

Deep Learning gilt heutzutage oft als „heiliger Gral“, wenn es bei der Entwicklung von intelligenten Systemen zum Einsatz kommt. Während vollautomatisches und autonomes maschinelles Lernen auf dem Weg ist, erfordern aktuelle Lösungen noch das Verständnis eines Softwareentwicklers oder Ingenieurs. Deep Learning - im Gegensatz dazu - ist ein Teilgebiet des maschinellen Lernens, das ohne menschliches Eingreifen tief greifende Lernerfolge verspricht und an der Funktion und der Arbeitsweise der neuronalen Netze im menschlichen Gehirn orientiert ist.

Björn Schuller, Maximilian Schmitt, Shahin Amiriparian


Video: It’s all about Machines and creating their Minds

Maschinelles Lernen allgemein bezeichnet datenbasierte Methoden der künstlichen Intelligenz. Ein Computer lernt ein Modell anhand von Beispieldaten. Künstliche Intelligenz spielt eine bedeutende Rolle in der Mensch-Maschine-Interaktion. Ein Beispiel dafür ist der in Abbildung 1 gezeigte Roboter Zeno. Er ist ein Therapiewerkzeug für autistische Kinder, denen er helfen soll, Emotionen besser auszudrücken und zu verstehen. Zeno erkennt die Emotion seines Gegenübers anhand dessen Sprache und Gesichtsausdruck und reagiert entsprechend. Dazu müssen die aufgenommenen Sensordaten in Echtzeit durch Verfahren des maschinellen Lernens analysiert werden.

Abb. 1: Der Roboter Zeno dient zur Therapie autistischer Kinder

Deep Learning basiert auf Netzwerken aus künstlichen Neuronen, die Eingangs- und Ausgangsneuronen sowie mehrere Schichten von Zwischenneuronen (verborgene Schichten) besitzen. Jedes Neuron verarbeitet einen Eingangsvektor basierend auf einer Methode, die der Funktionsweise menschlicher Nervenzellen ähnlich ist: Es wird eine gewichtete Summe aller Eingangswerte berechnet und das Resultat mit einer nicht linearen Funktion, der sogenannten Aktivierungsfunktion, transformiert. Über die Eingangsneuronen werden die Daten, wie unverarbeitete Audiosignale, aufgenommen und in das neuronale Netz eingespeist. Die Audiodaten durchlaufen die Zwischenneuronen aller verborgenen Schichten und werden dabei verarbeitet. Anschließend werden die verarbeiteten Signale und die berechneten Ergebnisse über die Ausgangsneuronen ausgegeben, die dann das Endergebnis liefern. Die Parameter der einzelnen Neuronen werden während des Trainings des Netzes mit den Trainingsdaten berechnet. Je größer die Anzahl der Neuronen und der Schichten ist, desto komplexere Probleme können behandelt werden.

Prinzipiell gilt, dass eine größere Datenmenge auch zu robusteren Modellen führt (solange die Daten nicht unausgewogen sind). Sind zu wenige Daten vorhanden und ist die ausgewählte Netzarchitektur zu komplex, besteht die Gefahr des Overfitting. Dies bedeutet, dass die Modellparameter während des Trainings zu stark auf die gegebenen Daten optimiert werden und das Modell nicht mehr genügend generalisiert, das heißt mit unabhängigen Testdaten nicht mehr gut funktioniert. Mögliche Problemstellungen lassen sich durch drei Lernmethoden bewältigen: (1) überwachtes Lernen, (2) semiüberwachtes Lernen und (3) unüberwachtes Lernen.

Beim überwac...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang