© Excellent backgrounds/Shutterstock.com
Java Magazin
Bücher

Bücher: Applied Natural Language Processing with Python

Ein wenig bekanntes Detail der IT-Geschichte ist, dass einer der Hauptgründe für die umfangreiche Finanzierung früher IT-Experimente durch die DARPA (Defense Advanced Research Projects Agency) die Hoffnung auf automatisierte Übersetzungssysteme war. Taweh Beysolow II liefert bei Apress nun ein rund 160 Seiten langes Werk, das die Verarbeitung natürlicher Sprache mit Python demonstriert.

Tam Hanna


Der Autor beginnt mit einer kurzen Erwähnung des Kriegs zwischen stochastischen und symbolischen Rechenverfahren. Theranos, Keras und TensorFlow geben sich dann mit je einem kleinen Hello-World-Beispiel ein Stelldichein – Beysolow II zeigt so die Unterschiede zwischen den Frameworks.Verarbeitung natürlicher Sprache ist ohne neuronale Netze unvorstellbar. Der Autor präsentiert im zweiten Kapitel eine kompakte Zusammenfassung häufig verwendeter Netztopologien und nutzt sie zur Realisierung eines Prädiktors für Aktienkurse. Die Besprechung des Problems der Vanishing Gradients ist nicht nur für NL-Verarbeiter interessant.Eins der Learnings aus der Aktienanalyse ist, dass neuronale Netze stark von der Qualität der Trainingsdaten abhängig sind. Im dritten Kapitel beginnt der Autor mit der Tokenisierung, um im Anschluss Stoppworte und das Konzept des Bag of Words vorzustellen.Im nächsten Akt folgt die Erzeugung von Feature-Extraction-Algorithmen: Sie haben die Aufgabe, die in Texten vorherrschenden „Themen“ zu extrahieren. Beysolow II beginnt mit dem Latent-Dirichlet-Verfahren, das er sowohl mathematisch als auch mit Beispielcode illustriert. Die Komplexität sowohl dieses als auch der darauffolgenden Prozesse wie Word2Vec führt dazu, dass man als Leser einiges an Denkarbeit investieren muss – wer das Buch nur überfliegt, wird an dieser Stelle aus der Spur katapultiert.Neuronale Algorithmen beeindrucken Zuschauer durch die Erzeugung von Texten aus der Luft. Der Autor demonstriert diese neuartigen Verfahren mit kurzen Beispielen; neben einem lernenden Chatbot versucht er sein Glück auch an einem Programm, das einen älteren Harry-Potter-Text umschreibt.Angesichts der immensen Komplexität dieser Aufgaben ist es dem Autor nicht möglich, innerhalb des kompakten Rahmens eine vollständige Besprechung aller Variablen und Verfahren durchzuführen. Die Beispiele laden allerdings zum selbstständigen Experimentieren ein – wer etwas (auch Google-Such-)Aufwand investiert, hat die eine oder andere Stunde Spaß.Wie in alten Apress-Tagen sorgt das strenge Lektorat übrigens auch hier dafür, dass auch Nichtmuttersprachler mit dem Werk keine Probleme haben: Schulenglisch reicht zum Verständnis des nicht sonderlich langen Werks aus.Damit bleibt die Frage nach der Programmiersprache offen: Java-Programmierer haben in der Welt der künstlichen Intelligenz nur wenig zu lachen. Python hat sich als Quasistandard etabliert, die diversen Bibliotheken kommen meist ohne Java Bindings aus.Ob se...

Java Magazin
Bücher

Bücher: Applied Natural Language Processing with Python

Ein wenig bekanntes Detail der IT-Geschichte ist, dass einer der Hauptgründe für die umfangreiche Finanzierung früher IT-Experimente durch die DARPA (Defense Advanced Research Projects Agency) die Hoffnung auf automatisierte Übersetzungssysteme war. Taweh Beysolow II liefert bei Apress nun ein rund 160 Seiten langes Werk, das die Verarbeitung natürlicher Sprache mit Python demonstriert.

Tam Hanna


Der Autor beginnt mit einer kurzen Erwähnung des Kriegs zwischen stochastischen und symbolischen Rechenverfahren. Theranos, Keras und TensorFlow geben sich dann mit je einem kleinen Hello-World-Beispiel ein Stelldichein – Beysolow II zeigt so die Unterschiede zwischen den Frameworks.Verarbeitung natürlicher Sprache ist ohne neuronale Netze unvorstellbar. Der Autor präsentiert im zweiten Kapitel eine kompakte Zusammenfassung häufig verwendeter Netztopologien und nutzt sie zur Realisierung eines Prädiktors für Aktienkurse. Die Besprechung des Problems der Vanishing Gradients ist nicht nur für NL-Verarbeiter interessant.Eins der Learnings aus der Aktienanalyse ist, dass neuronale Netze stark von der Qualität der Trainingsdaten abhängig sind. Im dritten Kapitel beginnt der Autor mit der Tokenisierung, um im Anschluss Stoppworte und das Konzept des Bag of Words vorzustellen.Im nächsten Akt folgt die Erzeugung von Feature-Extraction-Algorithmen: Sie haben die Aufgabe, die in Texten vorherrschenden „Themen“ zu extrahieren. Beysolow II beginnt mit dem Latent-Dirichlet-Verfahren, das er sowohl mathematisch als auch mit Beispielcode illustriert. Die Komplexität sowohl dieses als auch der darauffolgenden Prozesse wie Word2Vec führt dazu, dass man als Leser einiges an Denkarbeit investieren muss – wer das Buch nur überfliegt, wird an dieser Stelle aus der Spur katapultiert.Neuronale Algorithmen beeindrucken Zuschauer durch die Erzeugung von Texten aus der Luft. Der Autor demonstriert diese neuartigen Verfahren mit kurzen Beispielen; neben einem lernenden Chatbot versucht er sein Glück auch an einem Programm, das einen älteren Harry-Potter-Text umschreibt.Angesichts der immensen Komplexität dieser Aufgaben ist es dem Autor nicht möglich, innerhalb des kompakten Rahmens eine vollständige Besprechung aller Variablen und Verfahren durchzuführen. Die Beispiele laden allerdings zum selbstständigen Experimentieren ein – wer etwas (auch Google-Such-)Aufwand investiert, hat die eine oder andere Stunde Spaß.Wie in alten Apress-Tagen sorgt das strenge Lektorat übrigens auch hier dafür, dass auch Nichtmuttersprachler mit dem Werk keine Probleme haben: Schulenglisch reicht zum Verständnis des nicht sonderlich langen Werks aus.Damit bleibt die Frage nach der Programmiersprache offen: Java-Programmierer haben in der Welt der künstlichen Intelligenz nur wenig zu lachen. Python hat sich als Quasistandard etabliert, die diversen Bibliotheken kommen meist ohne Java Bindings aus.Ob se...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang