© dianpurdi41/Shutterstock.com
Entwickler Magazin
Nutzen Sie Ihre Kenntnisse in SQL, um R zu lernen

R: Streng, funktional, dynamisch

Sie sind neugierig, wie Sie Probleme in R lösen können, und haben möglicherweise schon Erfahrung mit SQL? Dann sind Sie bei diesem Artikel genau richtig! Wir beginnen mit den grundlegenden Elementen der Sprache - mit jeder Menge konkretem Beispielcode. Dann werfen wir einen Blick darauf, wie wir mit Daten umgehen können (hier helfen SQL-Grundkenntnisse - sind aber nicht erforderlich). Und zu guter Letzt widmen wir uns noch Anwendungsfällen, die typischerweise mit R gelöst werden können.

Markus Ehrenmüller-Jensen


R ist als Programmiersprache streng, aber dynamisch typisiert, funktional und wird interpretiert (also nicht kompiliert). Beliebt ist sie bei sogenannten Data Scientists unter anderem, weil es (kostenlose) Pakete gibt, mit denen man statistische Berechnungen (wie z. B. Matrixkalkulationen oder beschreibende Statistik) durchführen kann. Außerdem lässt sich Machine Learning (z. B. lineare Regression, Clustering, neuronale Netzwerke etc.) implementieren. Die Ergebnisse der Berechnungen können effizient und effektiv visualisiert werden.

R ist der Open-Source-Nachfolger der Programmiersprache S. Eine sehr aktive Community treibt die Entwicklung der Sprache und der verfügbaren Pakete voran. Zu Redaktionsschluss waren über 12 000 (in Worten: zwölftausend!) Pakete auf dem Comprehensive R Archive Network (CRAN) [1] verfügbar. Das ist sowohl ein Segen (weil z. B. neue Machine-Learning-Modelle, die in der akademischen Welt oder von Unternehmen entwickelt werden, sehr schnell verfügbar gemacht werden), als auch ein Fluch (weil natürlich kein Mensch einen auch nur annähernd vollständigen Überblick über alle Pakete haben kann). Sie werden im Zuge dieses Artikels eine Handvoll Pakete kennenlernen.

Eins ist jedenfalls sicher: Wenn Sie mit Daten arbeiten, werden Sie R schätzen lernen. Sie haben damit viele Möglichkeiten, auf Daten zuzugreifen, sie zu transformieren und zu bereinigen, um sie letztendlich analysieren zu können. Und Microsoft hat beginnend mit SQL Server 2016 die Programmiersprache R in ihre Data Platform integriert.

Scripte erstellen und ausführen

Die Beispiele können Sie selber ausführen, nachdem Sie R [2] und ein Integrated Development Environment (IDE), wie z. B. RStudio [3] oder R Tools for Visual Studio [4], bei sich installiert haben. Abbildung 1 zeigt den grundlegenden Aufbau der IDE. Links oben (in der Abbildung rot umrahmt) kann man ein Script erstellen und ganz oder schrittweise ausführen. Links unten (orange) ist die Eingabekonsole. Hier kann man einzelne Anweisungen direkt eingeben, ausführen und die Ergebnisse sehen. Wenn man das Script ausführt, wird es automatisch Zeile für Zeile in die Konsole kopiert. Rechts oben (grün) kann man zwischen einer Übersicht über die vorhandenen Variablen, einer Ausführungshistorie und vorhandenen Verbindungen wechseln. Rechts unten (blau) erhält man u. a. Zugriff auf die Script-Dateien, graphische Ausgaben (Plots) oder die Hilfe.

Abb. 1: Aufbau von RStudio

„Hello World“

Genug theoretisiert – jetzt ist es Zeit für ko...

Entwickler Magazin
Nutzen Sie Ihre Kenntnisse in SQL, um R zu lernen

R: Streng, funktional, dynamisch

Sie sind neugierig, wie Sie Probleme in R lösen können, und haben möglicherweise schon Erfahrung mit SQL? Dann sind Sie bei diesem Artikel genau richtig! Wir beginnen mit den grundlegenden Elementen der Sprache - mit jeder Menge konkretem Beispielcode. Dann werfen wir einen Blick darauf, wie wir mit Daten umgehen können (hier helfen SQL-Grundkenntnisse - sind aber nicht erforderlich). Und zu guter Letzt widmen wir uns noch Anwendungsfällen, die typischerweise mit R gelöst werden können.

Markus Ehrenmüller-Jensen


R ist als Programmiersprache streng, aber dynamisch typisiert, funktional und wird interpretiert (also nicht kompiliert). Beliebt ist sie bei sogenannten Data Scientists unter anderem, weil es (kostenlose) Pakete gibt, mit denen man statistische Berechnungen (wie z. B. Matrixkalkulationen oder beschreibende Statistik) durchführen kann. Außerdem lässt sich Machine Learning (z. B. lineare Regression, Clustering, neuronale Netzwerke etc.) implementieren. Die Ergebnisse der Berechnungen können effizient und effektiv visualisiert werden.

R ist der Open-Source-Nachfolger der Programmiersprache S. Eine sehr aktive Community treibt die Entwicklung der Sprache und der verfügbaren Pakete voran. Zu Redaktionsschluss waren über 12 000 (in Worten: zwölftausend!) Pakete auf dem Comprehensive R Archive Network (CRAN) [1] verfügbar. Das ist sowohl ein Segen (weil z. B. neue Machine-Learning-Modelle, die in der akademischen Welt oder von Unternehmen entwickelt werden, sehr schnell verfügbar gemacht werden), als auch ein Fluch (weil natürlich kein Mensch einen auch nur annähernd vollständigen Überblick über alle Pakete haben kann). Sie werden im Zuge dieses Artikels eine Handvoll Pakete kennenlernen.

Eins ist jedenfalls sicher: Wenn Sie mit Daten arbeiten, werden Sie R schätzen lernen. Sie haben damit viele Möglichkeiten, auf Daten zuzugreifen, sie zu transformieren und zu bereinigen, um sie letztendlich analysieren zu können. Und Microsoft hat beginnend mit SQL Server 2016 die Programmiersprache R in ihre Data Platform integriert.

Scripte erstellen und ausführen

Die Beispiele können Sie selber ausführen, nachdem Sie R [2] und ein Integrated Development Environment (IDE), wie z. B. RStudio [3] oder R Tools for Visual Studio [4], bei sich installiert haben. Abbildung 1 zeigt den grundlegenden Aufbau der IDE. Links oben (in der Abbildung rot umrahmt) kann man ein Script erstellen und ganz oder schrittweise ausführen. Links unten (orange) ist die Eingabekonsole. Hier kann man einzelne Anweisungen direkt eingeben, ausführen und die Ergebnisse sehen. Wenn man das Script ausführt, wird es automatisch Zeile für Zeile in die Konsole kopiert. Rechts oben (grün) kann man zwischen einer Übersicht über die vorhandenen Variablen, einer Ausführungshistorie und vorhandenen Verbindungen wechseln. Rechts unten (blau) erhält man u. a. Zugriff auf die Script-Dateien, graphische Ausgaben (Plots) oder die Hilfe.

Abb. 1: Aufbau von RStudio

„Hello World“

Genug theoretisiert – jetzt ist es Zeit für ko...

Neugierig geworden?


   
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang