Die Betreuung von Kunden rückt immer stärker in den Mittelpunkt größerer und mittelständischer Unternehmen. Hierbei wird immer mehr auf die Devise der Customer-Centricity gesetzt, also die Idee, den Kunden, statt das Produkt, in den Mittelpunkt zu stellen. Bei dieser Aufgabe sollen sogenannte Customer-Relationship-Management-Systeme, kurz CRM-Systeme, Abhilfe schaffen. Gleichzeitig durchlebt die digitale Welt momentan einen enormen Aufschwung im somit immer wichtiger werdenden Bereich des maschinellen Lernens und des Data Mining. Nun liegt es nahe, dass sich die Vorhersage-fähigkeit eines Machine-Learning-Modells mit den in einem CRM-System gesammelte Daten verbinden lassen kann, um spezifische Vorhersagen über Kundenbeziehungen und Verkäufe zu tätigen, namentlich die Idee der Predictive-Sales.
Ziel der Arbeit ist die Frage, welchen Mehrwert ein solches Modell für Predictive-Sales im aktuellen CRM-Prozess erbringt und ob eine aussagekräftige Auswertung auf den bis Dato im CRM-System gesammelten Daten in ihrem aktuellen Zustand möglich ist. Nicht zu vernachlässigen ist ebenfalls die Aufgabe, die erarbeiteten Erkenntnisse bestenfalls zu visualisieren und zu vermitteln.
In einem ersten Schritt erfolgt eine Analyse des CRM-Prozesses, welche ein Verständnis der Arbeitsweise und einen konkreten Use-Case für die Vorhersage liefert. Basierend auf den Daten des CRM-Systems wird für diesen Use-Case ineinem nächsten Schritt ein Modell erstellt. Dieser Schritt folgt dabei den Richtlinien des Industrie-Standards für maschinelles Lernen, CRISP-DM. Somit beinhaltet dieser Schritt sowohl eine Analyse als auch eine Aufbereitung der Daten, wobei vor allem die Aufbereitung den Großteil des Arbeitsaufwandes darstellt. Während der Analyse wird dabei nach Rücksprache mit den Prozess-Beteiligten, auch eine zu dem Use-Case passende Zielvariable gewählt. Diese umfasst 13 mögliche Ausprägungen, welche allerdings auf einen positiv/negativ Trend heruntergebrochen werden. Dabei werden für das Training des Modells Daten gewählt, welche eine der beiden Ausprägungen „gewonnen“ oder „verloren“ besitzen. Der eigentliche Bau des Modells verläuft letztendlich iterativ. So werden jeweils neue Modelle gebaut, bis die idealen Modell-Parameter für die Anpassung an die Daten gefunden wurden. Hierbei werden die Modelle nach ihrer Vorhersageleistung auf realen Testdaten bewertet. Eingesetzt werden Gradient-Tree-Boosting und Random-Forest-Modelle.
Im letzten Schritt wird das Modell zuerst im Kontext der verfügbaren Daten, dann im Gesamtkontext des CRM-Prozesses evaluiert. Dabei stehen in der ersten Auswertung die Vorhersagegenauigkeit und die Fehlerrate auf Testdaten im Mittelpunkt. Dabei wird vor allem der Informationsgehalt der im CRM-System gesammelten Daten bewertet. In der finalen Gesamtauswertung wird hingegen auf den Kontext der Vorhersage geachtet. Der Schwerpunkt hier liegt in der Frage, ob die Vorhersage im Rahmen des CRM-Prozesses aussagekräftig ist und das Modell über einen potenziellen Mehrwert verfügt. Das Ergebnis der Arbeit ist hierbei mehr als überraschend. Die durch das Modell getätigte Klassifizierung von Verkaufschancen in positiv oder negativ verlaufende Verkaufschancen übertrifft mit einer Vorhersagegenauigkeit von rund 90 Prozent auf den Testdaten bei weitem die an ein konzeptuelles Modell gestellten Erwartungen. Auch die Vorhersage im Gesamtkontext ist mehr als befriedigend, wobei eine Vorhersage auf allen Daten einen Großteil der Verkaufschancen korrekt einem eher positiven oder eher negativen Trend zuordnet. Die Visualisierung dieser Ergebnisse anhand von Entscheidungsbäumen und der Nachvollziehbarkeit der Vorhersagen trifft auch eine gute Resonanz der betroffenen Prozess-Beteiligten und offenbart vorher unentdeckte Zusammenhänge in den Daten. Trotz
einiger Probleme war es somit möglich, das Potenzial eines Predictive-Sales-Modells zu untermauern und diese Erkenntnis zu vermitteln. Der Grundbaustein für zukünftige weiterführende Arbeiten und Verbesserungen im Bereich der Datenpflege wurde schlussfolgernd erfolgreich gelegt.
Die Herausforderung bei der Erstellung dieses Modells lag einerseits an den verfügbaren Daten, darüber hinaus aber auch an dem vorhandenen Knowhow bei der genauen Vorgehensweise bei einer solchen Arbeit. So sind die bisher im System abgelegten Daten für den aktuellen Ablauf des CRM-Prozesses komplett ausreichend, befinden sich jedoch, vor allem aufgrund fehlender Werte und inkonsistenter Nutzung von Eingabefeldern, nicht in einem idealen Zustand für eine betriebsübergreifende Datenauswertung. Auch war diese Arbeit die erste ihrer Art im Betriebsumfeld. Somit bestand eine gewisse Unklarheit über die genaue Vorgehensweise. Auch der Zugriff auf die benötigten Daten stellte sich aufgrund von
Datenschutzverordnungen schwieriger dar als erwartet. So standen für diese Arbeit einige Teile der Daten nur zeitlich begrenzt, andere sogar überhaupt nicht zur Verfügung.
Artur Felic – CAS Future Labs
Artur Felic ist Leiter der CAS Future Labs bei der CAS Software AG in Karlsruhe und promoviert an der Friedrich-Schiller-Universität Jena im Bereich
semantisches Wissensmanagement. Sein Aufgabengebiet umfasst Trendscouting und die Exploration neuer Technologien in verschiedenen
Bereichen. Zusammen mit seinem Team aus Future Labs Scientists und einem wachsenden Ökosystem aus Universitäten, Hochschulen, Instituten und Partnern koordiniert er nationale und internationale Forschungs- und Innovationsprojekte, sowie Bachelor- und Masterarbeiten. Innerhalb der CAS Software AG arbeitet er eng mit den Smart Companies zusammen, um individuelle Forschungsbedarfe aufzunehmen, sie zu beraten und sie dabei zu unterstützen, die hervorgebrachten innovationen zur Marktreife zu führen.
Pol Zeimet – Hochschule Karlsruhe Technik und Wirtschaft
Pol Zeimet studiert im 7ten Semester Informatik an der Hochschule Karlsruhe für Technik und Wirtschaft und schreibt seine Thesis bei der CAS Software AG. Die ersten konkreten Kontakte mit maschinellem Lernen hatte er bei einem Austauschprogramm mit Studierenden aus Singapur. Bei dieser zweiwöchigen Block-veranstaltung über Data-Mining und Maschinelles Lernen wurde sein Interesse an der Thematik geweckt.