Wie moderne Datenbanken arbeiten

NoSQL: Konzepte und Prinzipien

Kai Spichale, Eberhard Wolff


Im Persistenzbereich sind einige neue Herausforderungen zu meistern. Zunächst ändern sich die Strukturen der Daten:

Durch Hypertext im Web vernetzen sich die Daten stärker. Eine Webseite kann als ein Graph dargestellt werden: Es besteht aus Dokumenten mit Referenzen untereinander. Klassische Persistenzlösungen wie Dateien oder relationale Datenbanken sind keine ideale Technologie für das Speichern solcher Graphenstrukturen.Durch Blogs, Social-Media-Plattformen und anderen User Generated Content, aber auch durch Webseiten werden die Strukturen der Daten aufgelöst: Es gibt diese Strukturen zwar immer noch, aber sie sind viel flexibler. So kann User Generated Content aus Videos, Fotos oder Dokumenten bestehen oder gar aus einer Kombination dieser Elemente. Die Strukturen werden dann außerdem ad hoc geändert, zum Beispiel durch Benutzer. Die Daten sind also semi-strukturiert.Ebenso ändert sich der Zugriff auf die Daten. Früher haben Suchfunktionen nach bestimmten Eigenschaften gesucht – beispielsweise alle Kunden mit einem bestimmten Namen. Heutzutage wird Volltextsuche und Autovervollständigung bei Eingaben zunehmend wichtiger. Dazu müssen Daten anders durchsuchbar sein und daher auch anders abgelegt werden.

Vielleicht der wichtigste Trend ist das exponenzielle Datenwachstum; die Datenmengen wachsen immer schneller. Beispielsweise speichert die Plattform für Kurznachrichten Twitter täglich sieben Terrabyte Daten und Facebook pro Tag 25 Terrabyte Log-Daten. Das Marktforschungsunternehmen IDC schätzte die weltweit gespeicherten digitalen Daten im Jahr 2011 auf 1800 Exabyte. Das entspricht einer Verzehnfachung der Datenmenge in nur fünf Jahren.

Mehr zum Thema Wer sich intensiv mit dem Thema BigData und NoSQL beschäftigen möchte, sollte einen Blick auf die kommende BigDataCon werfen. Die Konferenz beschäftigt sich mit den in diesem Artikel beschriebenen technologischen Herausforderungen auf technischem und strategischem Niveau und findet parallel zu JAX 2012 in Mainz statt. Mehr Informationen gibt es unter http://www.bigdatacon.de.

Der Umgang mit großen Datenmengen ist nicht neu. Schon lange gibt es beispielsweise Data Warehouses. Sie werden typischerweise genutzt, um Kundenverhalten auszuwerten. Gerade im Internet gibt es Geschäftsmodelle, die letztendlich direkt auf solchen Ansätzen basieren. Dazu zählt unter anderem der gesamte Bereich des Onlinemarketings. Für diesen Bereich ist es unbedingt erforderlich, die Anzahl der Klicks auf Anzeigen zu ermitt...

Wie moderne Datenbanken arbeiten

NoSQL: Konzepte und Prinzipien

Kai Spichale, Eberhard Wolff


Im Persistenzbereich sind einige neue Herausforderungen zu meistern. Zunächst ändern sich die Strukturen der Daten:

Durch Hypertext im Web vernetzen sich die Daten stärker. Eine Webseite kann als ein Graph dargestellt werden: Es besteht aus Dokumenten mit Referenzen untereinander. Klassische Persistenzlösungen wie Dateien oder relationale Datenbanken sind keine ideale Technologie für das Speichern solcher Graphenstrukturen.Durch Blogs, Social-Media-Plattformen und anderen User Generated Content, aber auch durch Webseiten werden die Strukturen der Daten aufgelöst: Es gibt diese Strukturen zwar immer noch, aber sie sind viel flexibler. So kann User Generated Content aus Videos, Fotos oder Dokumenten bestehen oder gar aus einer Kombination dieser Elemente. Die Strukturen werden dann außerdem ad hoc geändert, zum Beispiel durch Benutzer. Die Daten sind also semi-strukturiert.Ebenso ändert sich der Zugriff auf die Daten. Früher haben Suchfunktionen nach bestimmten Eigenschaften gesucht – beispielsweise alle Kunden mit einem bestimmten Namen. Heutzutage wird Volltextsuche und Autovervollständigung bei Eingaben zunehmend wichtiger. Dazu müssen Daten anders durchsuchbar sein und daher auch anders abgelegt werden.

Vielleicht der wichtigste Trend ist das exponenzielle Datenwachstum; die Datenmengen wachsen immer schneller. Beispielsweise speichert die Plattform für Kurznachrichten Twitter täglich sieben Terrabyte Daten und Facebook pro Tag 25 Terrabyte Log-Daten. Das Marktforschungsunternehmen IDC schätzte die weltweit gespeicherten digitalen Daten im Jahr 2011 auf 1800 Exabyte. Das entspricht einer Verzehnfachung der Datenmenge in nur fünf Jahren.

Mehr zum Thema Wer sich intensiv mit dem Thema BigData und NoSQL beschäftigen möchte, sollte einen Blick auf die kommende BigDataCon werfen. Die Konferenz beschäftigt sich mit den in diesem Artikel beschriebenen technologischen Herausforderungen auf technischem und strategischem Niveau und findet parallel zu JAX 2012 in Mainz statt. Mehr Informationen gibt es unter http://www.bigdatacon.de.

Der Umgang mit großen Datenmengen ist nicht neu. Schon lange gibt es beispielsweise Data Warehouses. Sie werden typischerweise genutzt, um Kundenverhalten auszuwerten. Gerade im Internet gibt es Geschäftsmodelle, die letztendlich direkt auf solchen Ansätzen basieren. Dazu zählt unter anderem der gesamte Bereich des Onlinemarketings. Für diesen Bereich ist es unbedingt erforderlich, die Anzahl der Klicks auf Anzeigen zu ermitt...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang