© Excellent backgrounds/Shutterstock.com
Java Magazin
Grundlagen und technische Konzepte des Ceph-Storage-Clusters

Mächtig flexibel

Ceph ist ein Storage-Cluster, der auf handelsüblicher Serverhardware läuft und problemlos Speichermengen von wenigen hundert Gigabyte bis hin zu Peta- oder gar Exabytegröße bereitstellen kann. Dabei sorgt eine intelligente Peer-to-Peer-Kommunikation dafür, dass alle abgelegten Daten redundant und hochverfügbar gespeichert werden.

Daniel Schneller, Lukas Pustina


Dieser Artikel beleuchtet die grundlegenden Konzepte von Ceph am Beispiel unserer Installation. Diese stellt derzeit insgesamt 175 TB Speicherplatz – verteilt über 48 Festplatten in vier Servern – als hochperformanter Object Store und verteiltes Dateisystem zur Verfügung.

Abgrenzung zu SANs

Wenn schnelle Speicherkapazität in großer Menge benötigt wird, richten sich die Blicke traditionell in Richtung Storage Area Networks (SAN). Diese oft via Fibre Channel angebundenen Speichernetzwerke bieten den angeschlossenen Rechnern virtuelle Block-Devices zum Beispiel über das iSCSI-Protokoll an. Im Hintergrund sorgen sie für eine automatische Verteilung der Daten auf eine Anzahl individueller Festplatten. SANs sind weit verbreitet, haben aber einige Nachteile. Neben dem hohen Anschaffungspreis für die benötigten Komponenten begibt man sich in ein Abhängigkeitsverhältnis vom jeweiligen Hersteller, da trotz Bestrebungen in dieser Richtung eine Interoperabilität zwischen Systemen verschiedener Anbieter nicht gewährleistet ist.

Soll ein SAN hochverfügbar ausgelegt werden, bedeutet dies normalerweise eine Verdopplung der Hardware, einhergehend mit den entsprechenden Kosten. Eine nachträgliche Aufrüstung ist nur im Rahmen dessen möglich, was der Hersteller des Systems dafür an kompatiblen Optionen vorsieht.

Im Gegensatz dazu basiert Ceph vollständig auf handelsüblicher Serverhardware mit dazugehörigen einfachen, zum Beispiel via SAS verbundenen, Speichermedien. Diese können flexibel zu einem Storage-Cluster zusammengeschlossen werden.

Die Kommunikation zwischen den Komponenten erfolgt über 1-GBit- oder 10-GBit-Ethernet und kommt ohne zentrale Komponenten – wie zum Beispiel SAN-Controller – aus. Damit gibt es keinen Single Point of Failure. Die einzelnen Knoten tauschen sich untereinander über Peer-to-Peer-Kommunikation aus, um abgelegte Daten zuverlässig und schnell abzulegen bzw. darauf zugreifen zu können.

RADOS

Kernbestandteil von Ceph ist RADOS, das Reliable Autonomic Distributed Object Storage. Hierbei handelt es sich um einen verteilten Object Store, der die Intelligenz aller beteiligten Knoten nutzt, um die Notwendigkeit einer zentralen Verwaltungsinstanz zu vermeiden.

RADOS skaliert durch die horizontale Verteilung aller anfallenden Aufgaben nahezu beliebig und trägt dabei Sorge dafür, dass gespeicherte Daten dynamisch verteilt und bei Bedarf möglichst schnell und effizient reorganisiert werden, gleichzeitig aber jederzeit zugreifbar sind.

Ein Objekt im Sinne von RADO...

Java Magazin
Grundlagen und technische Konzepte des Ceph-Storage-Clusters

Mächtig flexibel

Ceph ist ein Storage-Cluster, der auf handelsüblicher Serverhardware läuft und problemlos Speichermengen von wenigen hundert Gigabyte bis hin zu Peta- oder gar Exabytegröße bereitstellen kann. Dabei sorgt eine intelligente Peer-to-Peer-Kommunikation dafür, dass alle abgelegten Daten redundant und hochverfügbar gespeichert werden.

Daniel Schneller, Lukas Pustina


Dieser Artikel beleuchtet die grundlegenden Konzepte von Ceph am Beispiel unserer Installation. Diese stellt derzeit insgesamt 175 TB Speicherplatz – verteilt über 48 Festplatten in vier Servern – als hochperformanter Object Store und verteiltes Dateisystem zur Verfügung.

Abgrenzung zu SANs

Wenn schnelle Speicherkapazität in großer Menge benötigt wird, richten sich die Blicke traditionell in Richtung Storage Area Networks (SAN). Diese oft via Fibre Channel angebundenen Speichernetzwerke bieten den angeschlossenen Rechnern virtuelle Block-Devices zum Beispiel über das iSCSI-Protokoll an. Im Hintergrund sorgen sie für eine automatische Verteilung der Daten auf eine Anzahl individueller Festplatten. SANs sind weit verbreitet, haben aber einige Nachteile. Neben dem hohen Anschaffungspreis für die benötigten Komponenten begibt man sich in ein Abhängigkeitsverhältnis vom jeweiligen Hersteller, da trotz Bestrebungen in dieser Richtung eine Interoperabilität zwischen Systemen verschiedener Anbieter nicht gewährleistet ist.

Soll ein SAN hochverfügbar ausgelegt werden, bedeutet dies normalerweise eine Verdopplung der Hardware, einhergehend mit den entsprechenden Kosten. Eine nachträgliche Aufrüstung ist nur im Rahmen dessen möglich, was der Hersteller des Systems dafür an kompatiblen Optionen vorsieht.

Im Gegensatz dazu basiert Ceph vollständig auf handelsüblicher Serverhardware mit dazugehörigen einfachen, zum Beispiel via SAS verbundenen, Speichermedien. Diese können flexibel zu einem Storage-Cluster zusammengeschlossen werden.

Die Kommunikation zwischen den Komponenten erfolgt über 1-GBit- oder 10-GBit-Ethernet und kommt ohne zentrale Komponenten – wie zum Beispiel SAN-Controller – aus. Damit gibt es keinen Single Point of Failure. Die einzelnen Knoten tauschen sich untereinander über Peer-to-Peer-Kommunikation aus, um abgelegte Daten zuverlässig und schnell abzulegen bzw. darauf zugreifen zu können.

RADOS

Kernbestandteil von Ceph ist RADOS, das Reliable Autonomic Distributed Object Storage. Hierbei handelt es sich um einen verteilten Object Store, der die Intelligenz aller beteiligten Knoten nutzt, um die Notwendigkeit einer zentralen Verwaltungsinstanz zu vermeiden.

RADOS skaliert durch die horizontale Verteilung aller anfallenden Aufgaben nahezu beliebig und trägt dabei Sorge dafür, dass gespeicherte Daten dynamisch verteilt und bei Bedarf möglichst schnell und effizient reorganisiert werden, gleichzeitig aber jederzeit zugreifbar sind.

Ein Objekt im Sinne von RADO...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang