Data Science im MarTech Dschungel

Kann die erste Expedition in den MarTech Dschungel starten?

Im Bereich der Marketing Technologien (MarTech) sprechen wir gerne metaphorisch von einem Dschungel, denn die Thematik erweist sich als vielseitige Landschaft mit unterschiedlichen Terrains und Disziplinen. Aufgrund der schieren Masse läuft man leicht Gefahr den Überblick zu verlieren. Im Rahmen dieser Metaphorik lässt sich Data Science als nützliches Werkzeug-Set verstehen, welches zur Erkundung des Marketing Technologie Dschungels nicht fehlen sollte. In unserem Blogbeitrag „Data Science – Das Werkzeug-Set für die erste Expedition in den MarTech Dschungel“ haben wir bereits erläutert, was Data Science ist und welche Vorteile es für Kund*innen und Unternehmen gleichermaßen birgt. Nun möchten wir uns den grundlegenden Rahmenbedingungen, die eine Organisation für die Nutzung von Data Science sicherstellen sollte, widmen.

Damit Machine Learning, also die maschinelle und intelligente Mustererkennung in unüberschaubaren Datenmengen, im Rahmen von Data Science funktionieren kann, müssen gewisse Rahmenbedingungen erfüllt sein. Im Folgenden stellen wir zwei Voraussetzungen für gängige Machine-Learning-Methoden vor: die Datengrundlage und die Evaluierung.

1. Datengrundlage

Die Datengrundlage setzt sich aus historischen Kundendaten zusammen. Dazu zählen meist demographische Daten wie Alter, Geschlecht und Familienstand und geographische Angaben wie Adresse und Postleitzahl. Diese Basisdaten werden auch als unabhängige Variablen bezeichnet.

Abhängige Variablen oder Zielvariablen hingegen sind jene Variablen, die mithilfe von Machine Learning vorausgesagt werden sollen. Zum Beispiel: Wird ein Kunde oder eine Kundin abspringen? Ja oder nein. Wie hoch ist der Customer Lifetime Value (CLV)? Je nach Kontext der Anwendung sind unterschiedliche Daten relevant, zum Beispiel:

Für Unternehmen im E-Commerce:

Log-ins in das Kundenkonto
Käufe im Shop
Kategorien gekaufter Produkte
Sessions auf der Website
Newsletter-Klicks
Newsletter An- und Abmeldungen
Retouren
Service-Center-Anfragen

Entscheidend in Hinblick auf die Datengrundlage ist die Einheitlichkeit der Daten. Oft gibt es in großen Unternehmen sogenannte Datensilos. Das sind isolierte Datenbanken mit Daten aus unterschiedlichen Quellen, die pro Abteilung gesammelt werden und nicht in Bezug zueinander stehen. Diese Silos gilt es aufzulösen, indem die Daten vereinheitlicht und an einer zentralen Stelle allen Unternehmenseinheiten zugänglich gemacht werden. Customer Data Platforms (CDP) stellen hierfür eine gängige Lösung dar.

Anforderungen an die Datengrundlage:

Die Datengrundlage muss möglichst groß sein und in ausreichender Qualität vorliegen. Nur dann erkennen Machine-Learning-Methoden verlässlich Beziehungen, Muster, Korrelationen und andere Zusammenhänge. Pauschal gilt: Je größer der Datensatz, desto besser.

Die Datengrundlage sollte „lückenlos“ und vollständig sein. Informationen über den sozioökonomischen Status, aber auch das Kaufverhalten sollten für alle Kund*innen vorliegen und nicht nur für einige.

Die einzelnen Informationen (insbesondere die abhängigen Variablen) sollten gleich verteilt sein. Ein Datensatz sollte z. B. nicht nur Männer, sondern auch Frauen in einem ausgewogenen Verhältnis umfassen. Stichwort: Data Imbalance.

Die Daten müssen heterogen sein, um aussagekräftige Muster ausfindig machen zu können. Werden etwa nur Männer mittleren Alters beobachtet, können keine Muster das Verhalten junger Frauen betreffend abgeleitet werden.

Gegebenenfalls können deskriptive Metriken zur Bewertung des Datensatzes hinzugezogen werden. Dabei werden einzelne Attribute wie die Kündigungsquote für die Analyse herangezogen, um daraus Handlungsempfehlungen abzuleiten.

Tipp: Es ist generell ratsam, Datensätze vor ihrer Analyse auf menschliche Fehler zu überprüfen.

2. Evaluierung

Ebenso wichtig wie die Datengrundlage ist die Evaluierung des verwendeten Analysemodells. Dazu muss die Qualität der Algorithmen regelmäßig überprüft werden. In einem konkreten Fall kann das etwa so aussehen:

Es wird untersucht, wie viele Kund*innen im Kaufprozess abgesprungen sind (Customer Churn). Die logische Frage zur Kontrolle lautet: Wie viele dieser Kund*innen haben das Analysemodell erkannt und wie viele nicht?

Eine weitere wichtige Fragestellung im Rahmen der Evaluierung: Auf welcher Basis hat das Modell Entscheidungen getroffen, und welche Variablen hatten den größten Einfluss auf die Vorhersage?

Tipp: Unabhängig vom Kontext ist der sogenannte Gini-Index (ein statistisches Maß zur Messung der Ungleichheit einer Verteilung) ein geeignetes Tool zur Evaluation des maschinellen Lernens. Allerdings nur bei binären Zielvariablen: Kauf: Ja (0) – Nein (1)

Fazit

Data Science kann vielseitig als Werkzeug-Set für die erste Expedition in den MarTech Dschungel eingesetzt werden. Hierfür müssen allerdings erst gewisse Rahmenbedingungen erfüllt werden. Wir haben zwei Bedingungen für gängige Machine-Learning-Methoden vorgestellt: die Datengrundlage und die Evaluierung. Entscheidend in Hinblick auf die Datengrundlage ist deren Einheitlichkeit. Oft gibt es in großen Unternehmen sogenannte Datensilos. Das sind isolierte Datenbanken mit Daten aus unterschiedlichen Quellen, die pro Abteilung gesammelt werden und nicht in Bezug zueinander stehen. Diese Silos gilt es aufzulösen, indem die Daten vereinheitlicht und an einer zentralen Stelle allen Unternehmenseinheiten zugänglich gemacht werden.

Ebenso wichtig wie die Datengrundlage ist die Evaluierung des verwendeten Analysemodells. Dazu muss die Qualität der Algorithmen regelmäßig überprüft werden. Die logische Frage zur Kontrolle lautet: Wie viele davon hat das Analysemodell erkannt und wie viele nicht?

Eine weitere wichtige Fragestellung im Rahmen der Evaluierung: Auf welcher Basis hat das Modell Entscheidungen getroffen, und welche Variablen hatten den größten Einfluss auf die Vorhersage? Wenn die beschreibenden Rahmenbedingungen erfüllt sind, kann die Expedition in den MarTech Dschungel starten!

Whitepaper: Surviving the MarTech Jungle | Data Science

Neugierig geworden?

Tiefere Einblicke in das Thema MarTech gibt unser Guide „Surviving the MarTech Jungle“.

Jetzt MarTech Whitepaper runterladen

Auf in den MarTech Dschungel – Rahmenbedingungen für Data Science

Kann die erste Expedition in den MarTech Dschungel starten?

1. Datengrundlage

Anforderungen an die Datengrundlage:

2. Evaluierung

Fazit