Bei CEPH handelt es sich um eine "Software-Defined Storage-Lösung", diese Lösung läuft im Grunde auf jedem üblichen Computer und Server und bedarf keiner speziellen Hardware Appliances (von z.B. DELL EMC, NetApp, etc.) welche oftmals teuer von den Herstellern verkauft werden. Dadurch kann ein hochverfügbarer Storage Service auf kostengünstigen Systemen realisiert werden, deren Performance sich an den jeweiligen Anwendungsfall anpassen lässt. Der Austausch defekter Komponenten oder ein Upgrade auf neuere und schnellere Datenträger ist hierbei üblicherweise ohne Probleme möglich und kann sogar mit der bestehenden Infrastruktur kombiniert und genutzt werden.
Ein CEPH Cluster besteht typischerweise aus Monitor Nodes und den jeweiligen Storage Nodes. Die Anzahl der Monitor Nodes sollte immer ungerade sein und mindestens auch drei Stück bestehen. Die Anzahl der Storage Nodes richtet sich nach den aktuellen Anforderungen aus z.B. Speicherplatz oder auch IOPS und kann flexible nach oben und unten angepasst werden.
Die Datenträger in den Storage Nodes bezeichnet man üblicherweise als OSD (Object Storage Daemon) und bildet damit eine Verwaltungseinheit im CEPH, die losgelöst von einer z.B. mechanischen Festplatte oder SSD ist.
Durch den CRUSH Algorithmus (Controlled Replication Under Scalable Hashing) werden die Daten pseudozufällig auf die OSDs im CEPH Cluster verteilt. Der CRUSH Algorithmus ermittelt anhand festgelegter Kriterien, wo die Daten am sinnvollsten abgelegt werden können. Im Vorfeld werden entsprechende Regeln angelegt, welche einem Pool zugewiesen werden. In diesen Regeln ist z.B. definiert, dass die Daten dreifach repliziert werden sollen und sich die Replikas auf jeweils anderen Storage Nodes befinden müssen. Die Regeln sind so variable, dass sich hiermit auch die Aufteilung der Replikas auf drei Racks oder Rechenzentren realisieren liese. Der CRUSH Algorithmus sorgt also dafür, dass die Daten ein höchstmaß an Verfügbarkeit und Integrität erfahren.
Die Anzahl der Replikas hat auch maßgeblichen Einfluss auf die Verfügbarkeit der Daten bei z.B. einem Ausfall eines Storage Nodes. Nur wenn eine gewisse Anzahl an Replikation weiterhin vorhanden ist, wird CEPH ein Schreibzugriff auf diese Daten zulassen. Sollte die Anzahl der mindestens notwendigen Replikas unterschritten werden, wird der CEPH Storage diesen Pool automatisch in einen Read-Only Modus versetzen um so die Integrität der Daten zu gewährleisten. Sobald wieder ausreichend Replikas vorhanden sind werden diese wieder Synchronisiert und der CEPH Pool ist wieder mit einem Schreibend Zugriff möglich.
Bei unseren KVM vServer Produkten setzen wir ebenfalls auf die Vorteile von CEPH als Storage Lösung. Wir speichern Ihre Daten hierbei mit einer dreifachen Replikation. Ihre Daten liegen damit auf mindestens drei verschiedenen Nodes im Rechenzentrum. Dadurch kann eine OSD (bzw. SSD) ausfallen oder ein ganzer Node, dies wird die Verfügbarkeit Ihrer Daten nicht beeinträchtigen. Damit sind wir ebenfalls in der Lage Wartungsarbeiten im laufenden Betrieb durchzuführen.
Dank CEPH können wir die für Sie entstehenden Einschränkungen durch Wartungsarbeiten auf ein Minimum reduzieren und erreichen so eine sehr hohe Verfügbarkeit Ihrer Daten und damit auch Services.
- ceph, storage, ceph-storage, ceph storage, was ist ceph, crush, rbd, osd, emc, netapp, dell, sds, software-defined-storage, iops, Controlled Replication Under Scalable Hashing, Object Storage Daemon
- 37 Benutzer fanden dies hilfreich