© Liashko/Shutterstock.com
Entwickler Magazin
Infografik

Die Top-5-Python-Bibliotheken für Machine Learning

Python ist die beliebteste Programmiersprache, wenn es um das Erstellen eines Machine-Learning-Projekts geht. Warum eigentlich? Nun, zunächst einmal sind die Algorithmen so komplex, dass man sich nicht noch zusätzlich um technische Details kümmern, sondern sich ganz auf die Logik konzentrieren möchte. Python hilft dabei, dank der einfachen Syntax, der hohen Entwicklungsgeschwindigkeit und der großen Flexibilität. Aber es gibt noch einen anderen Grund für die Beliebtheit von Python in dieser Domäne: die stetig wachsende Anzahl an Data-Science-Bibliotheken. Hier sind ein paar der populärsten Python-Bibliotheken, die in der Welt des Machine Learning zum Einsatz kommen.

Ana-Maria Nichifor


NumPy NumPy ist eine essenzielle Bibliothek für Machine-Learning-Algorithmen, da sie mit komplexen multidimensionalen Arrays sowie Matrizen arbeiten und höhere mathematische Funktionen auf sie anwenden kann. Zudem kann NumPy praktisch jedwede Art von Daten verarbeiten, sodass sich die Bibliothek recht einfach in eine Vielzahl von Datenbasen integrieren lässt. NumPy ist Teil des SciPy-Projekts und basiert auf Numeric und Numarray, zwei Bibliotheken, die nun nicht mehr verwendet werden. Das Beispiel zeigt die Manipulation eines Iris-Datensets mit NumPy. import numpy as npfrom sklearn.datasets import load_iris iris = load_iris()iris_array = np.array(iris.data) iris_array.shape# Output:# (150, 4) # Umgestaltung unter Verwendung der # ursprünglichen Größeiris_reshaped = iris_array.reshape((100,6))iris_reshaped.shape# Output:# (100, 6) # Anpassung der Größe und der Form.iris_array.resize((100, 4))iris_array.shape# Output:# (100, 4) # eindimensionale Ausgabe einer Kopie des Arraysiris_array.flatten() # Ausgabe des Durchschnittswerts entlang einer # gegebenen Achse# 0 oder 1 im Fall eines zweidimensionalen Arraysiris_array.mean(axis=0) # Streuungiris_array.var(axis=0) # Standardabweichungiris_array.std(axis=0) # Summe und kumulative Summeiris_array.sum(axis=0)iris_array.cumsum(axis=0) # Produkt und kumulatives Produktiris_array.prod(axis=0)iris_array.cumprod(axis=0)

Matplotlib Matplotlib, eine großartige Bibliothek für die Datenvisualisierung, macht die Funktionalität von MATLAB für Python verfügbar. Sogar das bekannte Interface kann mit dem Modul Pyplot verwendet werden. Mit dieser Bibliothekt können Nutzer graphische Darstellungen, Histogramme und Balkendiagramme generieren. Das geht zuweilen mit wenigen Codezeilen, da der Fokus von Matplotlib auf der Nutzerfreundlichkeit liegt. Das Beispiel zeigt eine dreidimensionale Punktwolke, die mit Matplotlib erstellt wird. import randomfrom matplotlib import pyplotfrom mpl_toolkits.mplot3d import Axes3D figure = pyplot.figure()axes = Axes3D(figure)X = list(range(0, 500))Y = list(range(0, 500))Z = list(range(0, 500)) random.shuffle(X)random.shuffle(Y)random.shuffle(Z) axes.scatter(X, Y, Z)pyplot.show()

pandas Die Bibliothek pandas wird im Bereich Machine Learning für die Datenmanipulation und –analyse verwendet. Die wichtigsten Features sind die Tools für die Datenausrichtung, die Handhabung fehlender Daten, das Umgestalten, Verschmelzen und Verbinden von Datensets sowie das Slicing je nach La...

Entwickler Magazin
Infografik

Die Top-5-Python-Bibliotheken für Machine Learning

Python ist die beliebteste Programmiersprache, wenn es um das Erstellen eines Machine-Learning-Projekts geht. Warum eigentlich? Nun, zunächst einmal sind die Algorithmen so komplex, dass man sich nicht noch zusätzlich um technische Details kümmern, sondern sich ganz auf die Logik konzentrieren möchte. Python hilft dabei, dank der einfachen Syntax, der hohen Entwicklungsgeschwindigkeit und der großen Flexibilität. Aber es gibt noch einen anderen Grund für die Beliebtheit von Python in dieser Domäne: die stetig wachsende Anzahl an Data-Science-Bibliotheken. Hier sind ein paar der populärsten Python-Bibliotheken, die in der Welt des Machine Learning zum Einsatz kommen.

Ana-Maria Nichifor


NumPy NumPy ist eine essenzielle Bibliothek für Machine-Learning-Algorithmen, da sie mit komplexen multidimensionalen Arrays sowie Matrizen arbeiten und höhere mathematische Funktionen auf sie anwenden kann. Zudem kann NumPy praktisch jedwede Art von Daten verarbeiten, sodass sich die Bibliothek recht einfach in eine Vielzahl von Datenbasen integrieren lässt. NumPy ist Teil des SciPy-Projekts und basiert auf Numeric und Numarray, zwei Bibliotheken, die nun nicht mehr verwendet werden. Das Beispiel zeigt die Manipulation eines Iris-Datensets mit NumPy. import numpy as npfrom sklearn.datasets import load_iris iris = load_iris()iris_array = np.array(iris.data) iris_array.shape# Output:# (150, 4) # Umgestaltung unter Verwendung der # ursprünglichen Größeiris_reshaped = iris_array.reshape((100,6))iris_reshaped.shape# Output:# (100, 6) # Anpassung der Größe und der Form.iris_array.resize((100, 4))iris_array.shape# Output:# (100, 4) # eindimensionale Ausgabe einer Kopie des Arraysiris_array.flatten() # Ausgabe des Durchschnittswerts entlang einer # gegebenen Achse# 0 oder 1 im Fall eines zweidimensionalen Arraysiris_array.mean(axis=0) # Streuungiris_array.var(axis=0) # Standardabweichungiris_array.std(axis=0) # Summe und kumulative Summeiris_array.sum(axis=0)iris_array.cumsum(axis=0) # Produkt und kumulatives Produktiris_array.prod(axis=0)iris_array.cumprod(axis=0)

Matplotlib Matplotlib, eine großartige Bibliothek für die Datenvisualisierung, macht die Funktionalität von MATLAB für Python verfügbar. Sogar das bekannte Interface kann mit dem Modul Pyplot verwendet werden. Mit dieser Bibliothekt können Nutzer graphische Darstellungen, Histogramme und Balkendiagramme generieren. Das geht zuweilen mit wenigen Codezeilen, da der Fokus von Matplotlib auf der Nutzerfreundlichkeit liegt. Das Beispiel zeigt eine dreidimensionale Punktwolke, die mit Matplotlib erstellt wird. import randomfrom matplotlib import pyplotfrom mpl_toolkits.mplot3d import Axes3D figure = pyplot.figure()axes = Axes3D(figure)X = list(range(0, 500))Y = list(range(0, 500))Z = list(range(0, 500)) random.shuffle(X)random.shuffle(Y)random.shuffle(Z) axes.scatter(X, Y, Z)pyplot.show()

pandas Die Bibliothek pandas wird im Bereich Machine Learning für die Datenmanipulation und –analyse verwendet. Die wichtigsten Features sind die Tools für die Datenausrichtung, die Handhabung fehlender Daten, das Umgestalten, Verschmelzen und Verbinden von Datensets sowie das Slicing je nach La...

Neugierig geworden?


   
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang