Von Ralf Keuper
Big Data steht unter dem Verdacht, allzu häufig Korrelationen mit Kausalitäten zu verwechseln (Vgl. dazu: Im Datenrausch). Mehr Daten bedeutet nicht zwangsläufig, dass Kausalbeziehungen leichter aufzufinden sind. Im Gegenteil: Eine große Datenmenge kann zu dem Phänomen des sog. Overfitting führen.
In The Book of Why. The New Science of Cause and Effect ruft der Computerwissenschaftler und Philosoph Judea Pearl eine Kausale Revolution aus. Bereits 2009 publizierte Pearl sein Buch Causality. Dennoch war eine weitere Publikation zu dem Thema nötig, wie es in der Buchbesprechung in der FAZ vom 24.08.18 (Auch Maschinen sollten Ursachen erkennen können) heisst:
Trotz all dieser Arbeiten seien in der Wissenschaft aber bis heute keine Methoden und keine Sprache entwickelt worden, um Kausalität zu fassen, so Pearl. Mit dem Effekt, dass wir das, was wir eigentlich wissen wollen und wissen müssen, um effektiv handeln zu können – Warum ist etwas passiert? Wie hätte man es verhindern können? Was wird als Nächstes geschehen? – wissenschaftlich nicht beantworten können. .. Die Konzentration auf die Korrelation habe dazu geführt, dem wichtigen Kommunikationsinstrument des kausalen Redens das mächtige Instrumentarium der Mathematik vorzuenthalten. Man behelfe sich mit maschinellen Lernverfahren, die immer wieder neu trainiert werden müssen, wenn sich die Datenbasis ändert, statt aus kausalem Verständnis zu entscheiden, ob ein Modell, etwa zur Vorhersage der Wirksamkeit von medizinischen Behandlungen, weiter verwendet werden kann.
Über das Wesen der Kausalen Revolution, wie Pearl sie versteht:
Der Kern von Pearls kausaler Revolution besteht nun in einem Verfahren, dieses Vorstellen, wie die Welt sein könnte, zu formalisieren. Dazu benutzt der Autor zum einen Pfeildiagramme, die zeigen, welche Faktoren eine Rolle spielen, welche Verbindungen zwischen ihnen angenommen werden und in welche Richtung Kausalität läuft. Diese Verbindungen oder ihr Fehlen stehen für statistisch überprüfbare Annahmen: Verbindet kein Pfeil die Punkte A und D, zeigen die Daten jedoch, dass beide zusammenhängen, muss das Modell überprüft werden.
Pearl fordert die Wissenschaftler dazu auf, die drei Stufen der Leiter der Kausalität zu erklimmen (Vgl. dazu: Review: ‘The Book of Why’ Examines the Science of Cause and Effect).
- Stufe 1: Observation – basically looking for regularities in past behavior.
- Stufe 2: From seeing to doing.
- Stufe 3: Counterfactual question
In seiner Rezension zieht Jonathan Knee das Fazit:
The sometimes challenging technical aspects of the book should not dissuade anyone interested in the promise of intelligent systems. “The Book of Why” not only delivers a valuable lesson on the history of ideas but provides the conceptual tools needed to judge just what big data can and cannot deliver. Notably, “causal questions can never be answered from data alone.”