
Data Science für Dummies:
So funktioniert Daten-Analyse (2): Social Media
Was für Daten kann man wie zusammenbringen, um Mehrwert fürs Marketing zu erhalten? Ralph Wirth, Global Head, Science & Technology bei Supercrunch by GfK klärt auf. Heute: Social Media-Daten.

Foto: Supercrunch by GfK
Fast jedes Unternehmen lebt auf einem Datenkompost; die meisten wissen gar nicht so genau, was da eigentlich wuselt. Wie kann man diese Rohstoffe nutzen? Und wo lauern Fallen?
In der W&V Nr. 49 zeigen wir, warum Data Scientists so gefragt sind, wie sie arbeiten und worauf Marketingmanager achten sollten. Einige Verständnisfragen stellen wir hier schon mal dem promovierten Marketingwissenschaftler Ralph Wirth. Er ist Global Head, Science & Technology bei Supercrunch by GfK in Nürnberg.
Herr Wirth, manche sagen, Social Media ersetzt die Marktforschung in vielen Bereichen. Stimmt das?
Vor ein paar Jahren war die ganz große Frage: Sind Informationen, die ich aus dem Social Web habe – wie zum Beispiel Buzz oder positives und negatives Sentiment – repräsentativ? Und: Darf ich sie verwenden? Was kann ich damit machen? Natürlich kann ich mit positivem und negativem Sentiment keine Sales-Vorhersage treffen. Aber als Informationssystem sind solche Daten absolut valide. Sie geben mir Antworten auf die Frage: Habe ich gerade ein Problem mit meiner Marke? Oder sie lassen erkennen, dass nach dem Produktlaunch etwas grundsätzlich schief läuft. Wir bewegen uns hier in einem Spannungsfeld der Marktforschung. Auf der einen Seite braucht der Marketingmanager das konkrete Abbild des realen Marktes. Aber es gibt ganz unterschiedliche Use Cases. Es gibt auch den Kunden, der ganz bewusst Social-Media-Daten neben Sales-Zahlen im Chart sehen will.
Gibt es aus Ihrer täglichen Arbeit auch überraschende Erkenntnisse?
Es ist eher ein Demystifizieren bestimmter Annahmen. Das passiert häufiger. Man ist geneigt, auf simpel erscheinende Zusammenhänge reinzufallen. Der Mensch tendiert zu einfachen Erklärungen.
Haben Sie ein Beispiel?
Vor zwei Jahren verfolgten wir in einem Fall die Sales-Entwicklung und den Buzz. Beides ging hoch. Die Entwicklung wurde nur bivariat betrachtet. Man hat einen starken Zusammenhang angenommen und gesagt: Wir müssen den Buzz hoch halten, dann verkaufen wir auch viel. Man hat ignoriert, dass hundert weitere Variablen eine Rolle gespielt haben. Eine Analyse der Daten zeigte dann, dass der Treiber sowohl für Sales als auch für Buzz das Marketingbudget war, das über den gemessenen Zeitraum hinweg erhöht worden war.
Das klingt so einfach. Warum braucht man dafür eine Analyse?
Weil es meist mehrere mögliche Antworten gibt. Ein Wachstum in Sales kann zum Beispiel auch ganz einfach damit zusammenhängen, dass ein Wettbewerber aus dem Markt gegangen ist. Deshalb muss man immer die Einzelfälle genau analysieren. Nochmal zu dem Beispiel: Dass positives Sentiment in Social Media die Verkäufe antreibt, ist eine häufige Vorstellung. Das ist zu einfach gedacht. Positives Sentiment kann natürlich Auswirkungen auf Sales haben. Aber eben z.B. eventuell mit zeitlichem Versatz – wir sprechen von „Lag-Effekten“. Wenn vor zwei Monaten ganz schlecht über mich gesprochen worden ist, dann kann das z.B. in zwei Monaten einen Effekt auf Sales haben. Es kann auch einen wechselseitigen Effekt mit einer anderen Variablen haben. Negativer Buzz kann zum Beispiel mit Lieferschwierigkeiten korrelieren. Die Ursachen für Effekte zu finden, ist oft nicht leicht.
Wie verwenden Sie Social-Media-Daten?
Dafür haben wir bei GfK ein eigenes Team, das Social Media Analytics-Center. Gerade hier gibt es datenschutzrechtlich viel zu beachten: Was darf ich an Daten ziehen? Und vor allem auch: Was darf ich von den gezogenen Daten verwenden?
Wie managen Sie Konformität zum Datenschutzrecht?
Wir arbeiten mit einer Agentur zusammen, die darauf spezialisiert ist. Und wir haben eigene Juristen innerhalb von GfK. Wir sind teilweise Katalysator für den gesamten Konzern. Ganz viele Herausforderungen kommen bei uns auf. Wir verhalten uns zu hundert Prozent korrekt. Bevor wir etwas anfassen, lassen wir das von unseren Juristen überprüfen. Gerade bei CRM-Daten muss man sehr sorgfältig sein. Da haben wir einen engen Draht zu den Juristen. Wenn man erzählt, klingt das so einfach. Wenn ich sage, wir laden CRM-Daten hoch, dann bedeutet das: Die CRM-Daten dürfen nie einen GfK-Server erreichen. Sie dürfen von uns nirgendwo gespeichert werden. Wir haben extra dafür technische Lösungen erarbeitet. Das sind Browser Plug-ins, die anonymisieren und filtern, was nicht zu GfK darf. Der Nutzer merkt die Komplexität nicht. Aber wir haben das über viele Wochen entwickelt, um sicherzustellen, dass die komplette Datenstrecke sicher ist. Daten werden teilweise im Arbeitsspeicher des Computers verarbeitet ohne sie weiter zu speichern. Wir haben viele Gespräche mit Juristen, die uns sagen, was erlaubt ist, und was nicht geht.
Wie Data Scientists Hand in Hand mit Designern, Technikern, Statistikern, Consultants, Softwareingenieuren und Projektmanagern zusammenarbeiten, lesen Sie in der W&V Nr. 49.