Java Magazin - 12.2014 - Elasticsearch & Apache Lucene


Preis: 9,80 €

Erhältlich ab:  November 2014

Umfang:  100

Autoren / Autorinnen: Sascha Zak, Dr. Jan Scheible, Dr. Christian Wende, Sebastian Meyen, Florian Hopf, Achim Nierbeck, Stefan Siprell, Bernhard Löwenstein, Tobias Kraft, Joachim Arrasz, Sebastian Heib, Stefan Müller, Dr. Gernot Starke, Stefan Zörner, Florian Müller, Sven Ruppert, Dr. Heinz Kabutz, Angelika Langer, Klaus Kreft, Arne Limburg, Lars Röwekamp, Shay Banon, Axel Morgner, Diana Kupfer, Michael Müller, Uwe Schindler, Arno Haase, Dr. Felix Jungermann, Thomas Louis

Am Anfang war die Suche – das trifft auf Google genauso zu wie auf Elasticsearch, das aufstrebende Unternehmen hinter der gleichnamigen Open-Source-Suchtechnologie. Die gewaltige Marktmacht, die Google in seinen sechzehn Jahren Existenz aufgebaut hat, und die mannigfaltigen IT-Bereiche, in denen der Suchmaschinenriese mittlerweile mitmischt, dürften hinlänglich bekannt sein. Auch Elasticsearch, das Apache Solr Konkurrenz macht und ebenso auf Doug Cuttings Software Apache Lucene aufsetzt, steht hoch im Kurs: Vergangenen Sommer sicherte sich das Unternehmen hinter der in Java entwickelten Suchtechnologie weitere 70 Millionen US-Dollar Venturekapital in einer C-Serien-Finanzierungsrunde. Erst vor vier Jahren hatte Shay Banon die erste Version seines Lucene-basierten, dokumentorientierten Suchprojekts vorgestellt. Bald darauf hatten sich ein Unternehmen und eine Community um das Projekt formiert, das mittlerweile eine Riege prominenter Nutzer vorweisen kann, darunter Foursquare, Netflix, Mozilla, Xing, Soundcloud, Wikimedia und GitHub.

Wenn Daten das neue Öl sind, so gehören Suchlösungen wohl zu den effizientesten Instrumenten zur Förderung dieses wertvollen Rohstoffs. Ihr Erfolg gründet auf einem menschlichen Grundbedürfnis – dem Durst nach Informationen – und der wohl intuitivsten Art und Weise, dieses zu stillen: die eigenständige Recherche in Datenbeständen. Verstärkt wird der Trend zur mehr oder minder gezielten Suche in riesigen Informationspools durch die täglich wachsende Menge an verfügbaren Daten und die immer verblüffendere Intelligenz der allgegenwärtigen Such-Engines.

Shay Banon, der für die vorliegende Ausgabe Fragen zu Geschichte und Gegenwart seiner technologischen Schöpfung beantwortete, erinnert sich ab S. 44 an die bescheidenen Ursprünge von Elasticsearch bzw. der Vorgängertechnologie Compass vor zehn Jahren: Seine Frau besuchte damals eine Kochschule, und Banon schwebte eine Applikation vor, die ihr frisch erworbenes Küchenwissen sammeln und rasch verfügbar machen würde – leicht aufzufinden dank eines Suchfelds, das den Kern der Anwendung darstellen sollte. So stieß er u. a. auf die Such-Engine Apache Lucene, die eine treue Begleiterin seiner weiteren Karriere als Unternehmer werden sollte. Obwohl seine Frau noch immer auf besagte Kochapplikation wartet, stellte sich Banons Idee, das ganze Potenzial von Volltextsuchen auszuschöpfen, als Erfolgsrezept heraus, das Apache Lucene und Elasticsearch gemeinsam stärker werden ließ.

Aber was bedeutet das eigentlich, „suchen“? Vielleicht liefert ja eine Suche, powered by Wikimedia (also Elasticsearch), Antworten. Wenn Sie sich die rekursive Spielerei erlauben und auf der deutschen Wikipedia-Seite das Wörtchen „suchen“ ins Suchfeld eingeben, werden Sie allerdings staunen: Der Begriff fördert keinen einzigen allgemeinen Wikipedia-Artikel zu diesem Verb zutage. Wie stark es bereits vom IT-Bereich vereinnahmt wird, zeigt indes der oberste Eintrag auf der Begriffsklärungsseite, der auf den Eintrag über Suchverfahren in der Informatik verlinkt.

In manchen Sprachen werden „suchen“ und „fragen“ synonym verwandt. Das englische Wort „query“ etwa leitet sich vom lateinischen „quaerere“ ab, das beides bedeuten kann. „Fragen“ scheint mit Blick auf Elasticsearch & Co. die geeignetere Vokabel. Schließlich muss eine moderne Suchlösung längst nicht mehr nur krude Daten liefern, sondern Antworten auf die immer spezielleren Fragen ihrer Nutzer.

Für Shay Banon bedeutet Suche schlicht, dass ein Nutzer je nach Kontext und (Geschäfts-)Ziel Informationen aus einem vorliegenden Datenreservoir zieht. Allgemeiner formuliert: Suche ist ein individualisierter Zugriff auf gespeicherte Informationen. Diese breite Definition lässt viel Raum für kreative Ansätze und praktische Anwendungsfälle aller Art. Nur eines ist sicher: Je größer die Datenmengen, desto wichtiger werden Suchlösungen für den Zugriff – und desto höher die unternehmerische Wertschöpfung aus ihnen.

Wir widmen dem wachsenden Stellenwert moderner Suchlösungen 17 Seiten dieser Ausgabe. Damit Sie nicht zu lange suchen müssen: Ab Seite 30 erläutern unsere Autoren den Zugriff auf Elasticsearch aus Java-Anwendungen, den ELK Stack, also die Kombination aus Elasticsearch, logstash und Kibana, und die Essentials von Apache Lucene. Abgerundet wird der Schwerpunkt durch das oben bereits erwähnte Interview mit Shay Banon.

Viel Spaß bei der Lektüre!

kupfer_diana_sw.tif_fmt1.jpgDiana Kupfer, Redakteurin

Website Twitter Google Xing

Neugierig geworden?


   
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang