© S&S Media GmbH
Bücher

Natural Language Processing mit PyTorch


Systeme wie Alexa oder Siri haben das Konzept des Natural Language Processing (NLP) in den Mittelpunkt der Aufmerksamkeit gerückt – wenig bekannt ist übrigens, dass es dazu in der Vergangenheit schon Versuche gab. Bei O’Reilly ist nun ein deutschsprachiges Lehrbuch erschienen, das Quereinsteigern das Natural Language Processing nahebringen will. Schon in der Einleitung versprechen die Autoren, dass sich das mit 250 Seiten nicht allzu dicke Buch nicht übermäßig mit Mathematik befasst – stattdessen soll es mit Hilfe der PyTorch-Bibliothek Anfängern beim schnellen Erreichen erster Ergebnisse helfen. Im ersten Kapitel werden Tensoren behandelt, wobei die Erklärung nicht allzu anspruchsvoll ausfällt. Im zweiten Kapitel geht es dann um Begriffe wie Lemmata, Trigramme und Tokens – Termini, denen man in der Welt des NLP immer wieder begegnet.

Der O’Reilly-Verlag lieferte mit „AI for Game Developers“ vor einigen Jahren ein Lehrbuch aus, das neuronale Netzwerke quasi nebenbei auf eine so klare Art und Weise erklärte, dass sich Entwickler bis heute daran erinnern. Das dritte Kapitel des neuen Buchs gibt eine ähnlich detaillierte Einführung in die hinter NLP stehenden Theorien. Danach wird ein erstes Experiment mit einer Vokabularklasse durchgeführt. Es folgen Experimente mit Feed-Forward-Netzen, die durch die Verknüpfung mehrerer Netzwerkebenen bei der Lösung komplizierter Probleme (und der berühmt-berüchtigten Xor-Funktion) helfen.

Eine alte Weisheit besagt, dass ein besseres Verständnis der Problemdomäne immer auch – direkt oder indirekt – zu besseren Programmergebnissen führt. Das fünfte Kapitel setzt sich deshalb mit der Einbettung von Wörtern und Typen auseinander. Die drei darauffolgenden Kapitel zeigen die Sequenzmodellierung zur weiteren Verbesserung der Verarbeitung von eingehenden Textinformationen. Um Missverständnissen vorzubeugen, sei angemerkt, dass sich Natural Language Processing mit PyTorch auf die Auswertung von im Stringformat vorliegenden Texten konzentriert – wer gesprochene Sprache à la Dragon transkribieren möchte, ist hier falsch.

Besonders interessant ist das achte Kapitel, das eine sehr einfache erste Version eines maschinellen Übersetzungsprogramms für natürliche Sprache realisiert. Hier findet sich auch der einzige wirkliche Übersetzungsschnitzer – einer der Untertitel ist auf Englisch stehen geblieben.

Das Buch endet mit einem rund zehn Seiten langen Kapitel, das dem Einsteiger den weiteren Weg demonstriert. Am Ende dieses Kapitels finde...

Exklusives Abo-Special

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang