© Excellent backgrounds/Shutterstock.com
Java Magazin
Finden von Ähnlichkeitsstrukturen in Kundenprofilen (Teil 2)

Kunden im Cluster

Bei der weiter voranschreitenden Digitalisierung der Geschäftswelt steigt auch die Kundenanzahl in E-Commerce-Systemen immer weiter an. Wie soll man diese kontinuierlich steigende Anzahl an Kunden im Überblick behalten, verwalten und optimale Werbung anbieten? Eine Methode: das Bilden von Kundenclustern.

Karsten Voigt, David Broßeit


Im ersten Teil der Reihe wurden personalisierte Produktempfehlungen mit Mahout [1] näher betrachtet, doch nicht immer sollen Kunden einzeln und persönlich angesprochen werden. Oft gibt es die Anforderung, Marketinginhalte nur einer bestimmten Gruppe von Kunden zugänglich zu machen. Standard-E-Commerce-Systeme wie Hybris oder IBM WebSphere Commerce können dabei einfache Kundensegmente selbst mithilfe demografischer Daten oder auf Basis des direkten Kaufverhaltens bilden. Abbildung 1 zeigt zum Beispiel die Anlage eines Kundensegments für weibliche Kunden zwischen 30 und 39 Jahren in IBM WebSphere Commerce. Interessant wird es aber, wenn man die Segmente nicht nur auf Basis von offensichtlichen Kriterien definieren möchte. Wie erkennt man zum Beispiel im B2B-Umfeld die Kundengruppe der Heizungsbauer und kann diese von der Kundengruppe der Elektroinstallateure unterscheiden?

Abb. 1: Kundensegmente in IBM WebSphere Commerce

Hier stellt Clustering – also das Finden von Ähnlichkeitsstrukturen in einer Datenbasis – eine interessante Option dar. Im Gegensatz zur Klassifizierung, welche im dritten Teil der Artikelserie näher betrachtet werden soll, versucht man beim Clustern von Daten neue Gruppen zu identifizieren und nicht bestehende Daten bekannten Gruppen zuzuordnen. Der Fokus liegt für diesen Artikel wieder auf der Analyse des Kaufverhaltens von Kunden, wobei die Clusterbildung in Mahout dafür keine Einschränkungen vorgibt. Kunden, die dabei als ähnlich ermittelt werden, werden in einem Cluster verwaltet. Ziel dieser Clusterbildung soll beispielsweise sein, Kunden gezielter Werbung anzuzeigen und speziell zugeschnittene Sonderangebote zu unterbreiten.

Algorithmen zur Clusterbildung

Wie auch schon für die Produktempfehlungen gibt es für das Clustern eine Vielzahl an unterschiedlichen Algorithmen. Welcher Algorithmus in welchem Szenario die besten Ergebnisse liefert, sollte man über entsprechende Tests evaluieren. Tabelle 1 zeigt eine Übersicht der in Mahout vorhandenen Algorithmen für das Clustern von Daten. Der Vollständigkeit halber muss erwähnt werden, dass hinter den Algorithmen wieder verschiedene Implementierungen liegen können.

AlgorithmusKurzbeschreibungk-Means Clusteringk-Means ist einer der ältesten Algorithmen für die Clusterbildung. Hierbei werden einer bekannten Anzahl von Gruppen einzelne Elemente zugeordnet. In mehreren Durchläufen wird versucht, die Abstände der Gruppenmitglieder zu den Zentren der Clustergruppen zu minimieren.Fuzzy k-Means Fuzzy k...

Java Magazin
Finden von Ähnlichkeitsstrukturen in Kundenprofilen (Teil 2)

Kunden im Cluster

Bei der weiter voranschreitenden Digitalisierung der Geschäftswelt steigt auch die Kundenanzahl in E-Commerce-Systemen immer weiter an. Wie soll man diese kontinuierlich steigende Anzahl an Kunden im Überblick behalten, verwalten und optimale Werbung anbieten? Eine Methode: das Bilden von Kundenclustern.

Karsten Voigt, David Broßeit


Im ersten Teil der Reihe wurden personalisierte Produktempfehlungen mit Mahout [1] näher betrachtet, doch nicht immer sollen Kunden einzeln und persönlich angesprochen werden. Oft gibt es die Anforderung, Marketinginhalte nur einer bestimmten Gruppe von Kunden zugänglich zu machen. Standard-E-Commerce-Systeme wie Hybris oder IBM WebSphere Commerce können dabei einfache Kundensegmente selbst mithilfe demografischer Daten oder auf Basis des direkten Kaufverhaltens bilden. Abbildung 1 zeigt zum Beispiel die Anlage eines Kundensegments für weibliche Kunden zwischen 30 und 39 Jahren in IBM WebSphere Commerce. Interessant wird es aber, wenn man die Segmente nicht nur auf Basis von offensichtlichen Kriterien definieren möchte. Wie erkennt man zum Beispiel im B2B-Umfeld die Kundengruppe der Heizungsbauer und kann diese von der Kundengruppe der Elektroinstallateure unterscheiden?

Abb. 1: Kundensegmente in IBM WebSphere Commerce

Hier stellt Clustering – also das Finden von Ähnlichkeitsstrukturen in einer Datenbasis – eine interessante Option dar. Im Gegensatz zur Klassifizierung, welche im dritten Teil der Artikelserie näher betrachtet werden soll, versucht man beim Clustern von Daten neue Gruppen zu identifizieren und nicht bestehende Daten bekannten Gruppen zuzuordnen. Der Fokus liegt für diesen Artikel wieder auf der Analyse des Kaufverhaltens von Kunden, wobei die Clusterbildung in Mahout dafür keine Einschränkungen vorgibt. Kunden, die dabei als ähnlich ermittelt werden, werden in einem Cluster verwaltet. Ziel dieser Clusterbildung soll beispielsweise sein, Kunden gezielter Werbung anzuzeigen und speziell zugeschnittene Sonderangebote zu unterbreiten.

Algorithmen zur Clusterbildung

Wie auch schon für die Produktempfehlungen gibt es für das Clustern eine Vielzahl an unterschiedlichen Algorithmen. Welcher Algorithmus in welchem Szenario die besten Ergebnisse liefert, sollte man über entsprechende Tests evaluieren. Tabelle 1 zeigt eine Übersicht der in Mahout vorhandenen Algorithmen für das Clustern von Daten. Der Vollständigkeit halber muss erwähnt werden, dass hinter den Algorithmen wieder verschiedene Implementierungen liegen können.

AlgorithmusKurzbeschreibungk-Means Clusteringk-Means ist einer der ältesten Algorithmen für die Clusterbildung. Hierbei werden einer bekannten Anzahl von Gruppen einzelne Elemente zugeordnet. In mehreren Durchläufen wird versucht, die Abstände der Gruppenmitglieder zu den Zentren der Clustergruppen zu minimieren.Fuzzy k-Means Fuzzy k...

Neugierig geworden?


    
Loading...

Angebote für Teams

Für Firmen haben wir individuelle Teamlizenzen. Wir erstellen Ihnen gerne ein passendes Angebot.

Das Library-Modell:
IP-Zugang

Das Company-Modell:
Domain-Zugang