© Excellent backgrounds/Shutterstock.com
Elasticsearch unter NoSQL-Gesichtspunkten

Suche mit anderen Augen


Gerade einmal etwas mehr als drei Jahre alt, hat Elasticsearch das Thema Suche gehörig durcheinander gewirbelt. Was steckt dahinter, und warum regt Elasticsearch die Fantasie der Entwickler und Architekten so stark an? Der vorliegende Artikel ist der erste von zwei Teilen einer einführenden Übersicht und soll vor allem die Möglichkeiten des Einsatzes als flexibler Data Store in den Vordergrund stellen. Er ist außerdem Teil 5 der großen NoSQL-Serie im Java Magazin.

Egal, ob in Blogbeiträgen, auf Konferenzen oder in Projektberichten, die technische Szene hat im Bereich Suche ein Lieblingsthema gefunden. Dabei war Open-Source-Suche zuvor so klar strukturiert: Apache Lucene als De-facto-Standard für Textanalyse, Indizierung von Daten und das Nachschlagen im Index; Apache Solr als Suchserver, der Apache Lucene einbettet und um komfortable Zusatzfunktionalität erweitert, quasi die All-inclusive-Variante. Wozu also eine weitere Open-Source-Lösung?

Auf der Berlin Buzzwords 2010 berichtete Shay Banon erstmals über sein neues Projekt Elasticsearch. Ich kannte Shay noch von seinem Vorgängerprojekt Compass, das Java-Persistenz-Mechanismen mit der Indizierung der Daten für Suche in einem API verband. Umso erstaunter war ich, als er berichtete, er habe das Projekt hinter sich gelassen, um sich Elasticsearch zuzuwenden, einem Suchserver auf Apache-Lucene-Basis, den er in ersten Versionen seit Anfang 2010 veröffentlicht habe [1]. Es handelt sich um einen automatisch skalierenden Suchserver, der sich um Sharding und Replikation eigenständig kümmert und auch zur Laufzeit neue Knoten des Clusters integriert und den Suchindex automatisch neu verteilt. Das alles ist kombiniert mit einem Interface, das konsequent per JSON über eine RESTful-HTTP-Schnittstelle genutzt wird, sowohl für administrative Aufgaben als auch für Indizierung und Suche. Noch interessanter war es, dass Mozilla auf der gleichen Berlin Buzzwords über den produktiven Einsatz im Rahmen ihres neuen Crash-Reporting-Metrik-Systems berichtete.

In der Folge drehte sich das Elasticsearch-Rad immer schneller. 2012 gründete ein Kernteam mit Shay und Apache-Lucene-Committer Simon Willnauer die gleichnamige Firma [2], die Support und Training anbietet. Und die Liste der Elasticsearch-Nutzer liest sich wie das Who is Who der Internet-Start-up-Szene: Foursquare, Quora, Stack Overflow, GitHub, WordPress oder auch in Deutschland SoundCloud und Immobilienscout24, alles Firmen mit nicht unerheblichen Datenmengen. GitHub beis...

Exklusives Abo-Special

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang