Die KiKK-Studie und das Gesetz der kleinen Zahlen

Daniel Kahneman (*1934), ein israelisch-US-amerikanischer Psychologe und Wirtschafts-Nobelpreisträger des Jahres 2002, beschreibt in seinem legendären „Schnelles Denken, langsames Denken“ u.a. Urteilsheuristiken und kognitive Verzerrungen, auf die es sowohl die Journalisten als auch u.U. verantwortungslose „Wissenschaftler“ abgesehen haben. Von höchster Relevanz für die vorliegenden Betrachtungen ist das zusammen mit Amos Tversky untersuchte Gesetz der kleinen Zahlen.

Irgendwann mal die Tage jährt sich zum 10. Mal die sog. „KiKK-Studie“, des Bundesamtes für Strahlenschutz (BfS), die eine Korrelation zwischen Kinderleukämie und der Nähe des Wohnortes zu den Kernkraftwerken :roll: belegt haben wollte… und es wider besseres Wissen bis heute immer noch tut, wenn auch in einer inzwischen stark relativierten Form… Und es jährt somit auch und insbesondere die wohl größte Blamage für die deutsche Wissenschaft nach dem 2. Weltkrieg, denn nichts anderes als das ist wohl der Sermon, dessen aktuelle Form man sich auf der weiter unter verlinkten Website reinziehen kann.

Anno 2007 fand ich die Studie nicht nur falsch, sondern auch „kriminell“ und „verhetzerisch“. Theoretisch waren es auch diese und ähnliche Epitheta, die mir die Androhung rechtlicher Schritte durch einen anonymen Blogger (der ein Mitglied des Forscherteams gewesen sein wollte… 😉) eingebracht hatte… Doch faktisch ging es wohl um meinen durchaus wissenschaftlich fundierten Verriss ➡ der Studie, der den Herrschaften schwer zugesetzt haben musste.

Von solch plumpen Drohungen ließ ich mich gerade als bekennender Nichtjurist :mrgreen: freilich nicht beeindrucken – vielmehr zog ich unsere Wissenschaftler in den beiden KiQK-Studien bzw. in der KiKTK-Studie am Nasenring durch die Manege und genoss die dabei geerntete Zustimmung wie auch den hervorgerufenen Widerspruch in den sozialen Medien, seinerzeit noch in der pre-FB-Ära. Ob und inwieweit meine Aktivitäten dazu beigetragen haben, dass dem KiKK-Team anschließend die Düse allmählich zu gehen begann, vermag ich persönlich nicht zu beurteilen. Tatsache ist, dass in den darauffolgenden Monaten ein deutliches Zurückrudern einsetzte und die 50 Km-Cluster beispielsweise gänzlich aufgegeben wurden. Fortan las man nur noch etwas von 5 Km-Clustern, innerhalb derer man allerdings nach wie vor erhöhte Krebsraten diagnostiziert haben wollte.

➡ Ich zeigte u.a. auf, dass man 2 Kernkraftwerke (deren Cluster besonders niedrige Krebsarten aufwiesen) genauso weggelassen hatte, wie die grenznahen ausländischen Kernkraftwerke, obwohl diese Cluster bildeten, die einwandfrei im Bundesgebiet lagen. Ferner verwies ich darauf, dass 50 Km-Cluster bereits das Gros des westdeutschen Staatsgebietes überdecken würden – usw. Leider kann ich mit einem „Repaste“ von diesem Beitrag nicht dienen… :-(
.
KiKK-BfS
Quelle (C) 2017 Bundesamt für Strahlenschutz

Ich werfe nun eine für die „AG Energetik“ eher atypische Aufgabe in den Ring. Ich zitiere zwei wissenschaftliche Befunde, die ich aus Kahneman’s „Thinking, Fast and Slow“ habe und stelle dazu „Das Ergebnis“ der KiKK-Studie in der Version 2017:

1) Die Nierenkrebs-Häufigkeit in den über 3141 Counties der USA ist am niedrigsten in den ländlichen, traditionell republikanisch geprägten, dünn besiedelten Counties im mittleren Westen, Süden und im Westen der USA;

2) Die besten Schulergebnisse vorzuweisen haben kleine, auf dem Lande gelegene Schulen mit einer überschaubaren Anzahl der Schüler in einer Klasse;

3) KiKK-Studie: Im Umkreis von 5 Km um die deutschen Kernkraftwerke besteht für Kinder unter 5 Jahren ein etwa verdoppeltes Risiko an Leukämie zu erkranken. ➡

Die Frage an die AG lautet: Was haben all diese Aussagen gemeinsam?

Nun, zunächst suggerieren sie uns offensichtlich bestimmte Kausalitäten, die wissenschaftlich fundiert zu sein scheinen, wie wir aus der Art der Formulierung sowie des vorangegangenen Hinweises auf wissenschaftliche Studien schlussfolgern mögen. Und dennoch besteht die erste Gemeinsamkeit dieser Aussagen darin, dass alle drei schlichtweg… falsch sind. 👿

Doch bevor ich nun darlege warum dem so ist, also, warum alle drei Thesen falsch sind, möchte ich den Leser darauf hinweisen, dass er bereits wenige Augenblicke nach dem ersten Durchlesen alle diese Suggestionen innerlich angenommen hat, jedenfalls sofern er nicht vom Fach ist. Denn, klar – man braucht mir beispielsweise nichts von der „Atomkraft“ zu erzählen und einem Arzt oder Lehrer von Nierenkrebs bzw. Schulniveau auch nicht. Aber für jeden weniger Bewanderten in der jeweiligen Materie stellt sich dann doch die Frage, warum sollte denn das Leben auf dem Lande, mit sauberer Luft, sauberem Trinkwasser, frischen Lebensmitteln etc. nicht eine gute Vorbeugung gegen Nierenkrebs sein? Warum sollten kleine Schulen, mit viel persönlichem Kontakt zwischen Lehrer und Schüler nicht für gute schulische Leistungen ursächlich sein? Und zu guter Letzt: Warum sollte eine so starke Nähe zu den „Atomkraftwerken“ :roll: keinen Krebs verursachen, gerade unter Säuglingen?

 

➡ Wortwörtlich heißt es dort (Stand 2017): » Es zeigte sich im Nahbereich um deutsche Kernkraftwerke ein signifikant erhöhtes Risiko bei Kindern unter 5 Jahren, an Krebs zu erkranken. Dieser Befund beruhte im Wesentlichen auf dem Erkrankungsrisiko für Leukämien, wobei hier das Erkrankungsrisiko in etwa verdoppelt war. In Zahlen bedeutet dies, dass im 5-Kilometer-Umkreis um alle Standorte von Kernkraftwerken in Deutschland im Mittel nicht, wie zu erwarten wäre, etwa 1 Kind pro Jahr erkrankt, sondern dass die Krankheit jedes Jahr bei etwa 2 Kindern diagnostiziert wird.
.
Was die Hypothese eines Einflusses der radioaktiven Abgaben angeht, lässt sich aus den Ergebnissen keine sichere Aussage zur Kausalität zwischen der von Leistungsreaktoren ausgehenden Radioaktivität und erhöhten Erkrankungsraten machen. Nach dem derzeitigen wissenschaftlichen Kenntnisstand ist die resultierende Strahlenbelastung der Bevölkerung alleine zu niedrig, um den tatsächlich beobachteten Anstieg des Krebsrisikos zu erklären. Es ist ebenfalls unwahrscheinlich, dass andere in den Untersuchungen ebenfalls betrachtete Verursacher jeweils alleine den Befund erklären können.

.
Es gibt somit derzeit keine plausible Erklärung für den festgestellten Effekt, der über die 24 Jahre Untersuchungszeitraum ein insgesamt konsistentes Bild mit kleinen Schwankungen zeigt. Denkbar ist ein Zusammenspiel verschiedener Ursachen. Die Interaktion verschiedener Faktoren und die grundsätzlichen Entstehungsmechanismen von Leukämien bei Kindern bilden daher die Schwerpunkte der derzeit laufenden Forschungsarbeiten.
«
.

Die Antwort auf die obigen Fragen liefern insbesondere die beiden ersten Studien, die zwar obige Schlussfolgerungen durchaus liefern, aber eben nicht nur diese. Insofern sind diese Studien selbst, die hinter den ersten beiden Thesen stecken, streng genommen gar nicht falsch, zumal deren Ziel – im Gegensatz zu der KiKK-Studie – gar nicht darin bestanden hatte, uns irgendwelche Scheinkausalitäten unterzujubeln, von wegen Partei der Republikaner :mrgreen: oder o.ä. Vielmehr liefern sie gleichzeitig die Antworten auf komplementäre Fragestellungen und zwar:

1) die Nierenkrebs-Häufigkeit in den über 3141 Counties der USA ist am höchsten 💡 in den ländlichen, traditionell republikanisch geprägten, dünn besiedelten Counties im mittleren Westen, Süden und im Westen der USA;

2) die schlechtesten 💡 Schulergebnisse vorzuweisen haben kleine, auf dem Lande gelegene Schulen mit einer überschaubaren Anzahl der Schüler in einer Klasse.

Um diesen Widerspruch herum drückt sich das KiKK-Team bis heute. Denn eigentlich müsste die komplementäre Schlussfolgerung in etwa so lauten, wie ich bereits 2007 in dem zuvor erwähnten Verriss angedeutet habe:

3) KiKK-Studie: Im Umkreis von 5 Km um die deutschen Kernkraftwerke besteht für Kinder unter 5 Jahren eine erhöhte Wahrscheinlichkeit, an Leukämie überhaupt nicht 💡 zu erkranken.

Doch wie kann es sein? Wie kann ein Parameter gleichzeitig überdurchschnittlich hohe und unterdurchschnittlich niedrige Krebsraten (oder schulische Leistungen) verursachen? Nun, der entscheidende Parameter speist sich in beiden ersten Fällen in der Tat aus der ländlichen Umgebung, die definitorisch eine sehr geringe Bevölkerungszahl aufweist. Dies verringert aber den Umfang der Stichprobe in einem Maße, in dem statistische Aussagen ihre wissenschaftliche Zulässigkeit verlieren. Kahneman und Tversky nannten dies „das Gesetz der kleinen Zahlen“.

ksnet

Um dem Leser eben diese Gesetzmäßigkeit zu verdeutlichen, machen wir folgendes Gedankenexperiment: Stellen wir uns eine Kiste mit 1000 Murmeln vor, unter denen 100 silber sind und die restlichen blau (OK, schwarz und weiß hätte es auch getan, aber dann würde es nicht mehr zu dem Bild nebenan passen… 😉). Wir ziehen eine Murmel „blind“ aus der Kiste, notieren das Ergebnis, legen sie zurück, schütteln die Kiste kräftig durch, um statistisch gleiche Ausgangsbedingungen wiederherzustellen, und so weiter.

Wiederholen wir diese Ziehung oft genug, wird unsere statistische Erhebung bezüglich des Anteils der silbernen Murmeln garantiert gegen 10% gehen. Das spüren wir einfach aus unseren Erfahrungen, evtl. einem mehr oder weniger fundierten Wissen um das Gesetz der großen Zahlen.

Was passiert aber, wenn wir unsere Erhebung auf nur 10 Wiederholungen beschränken? Nun, wir könnten folgende Scheinresultate (oder genauer gesagt, Artefakte) mit den dazugehörigen Wahrscheinlichkeiten η erhalten:

  • 0%: „silberne Murmeln kommen überhaupt nicht vor“ η = 0.59
  • 10% : „es sind 10% silberne Murmeln vorhanden“ η = 0.35
  • 20% und mehr: „es gibt 20% oder mehr silberne Murmeln“ η = 0.06

Diese Zahlen, sprich Wahrscheinlichkeiten, insbesondere ein effektiv falsches Ergebnis rauszubekommen, sind richtig dramatisch. Denn es ist offensichtlich wahrscheinlicher, ein falsches Ergebnis zu ermitteln als das richtige (bei 5 Versuchen wäre es gar ausgeschlossen gewesen!). Und es kommt nur dadurch zustande, weil der Umfang der Stichproben zu gering war. Die Frage, die sich einem aufdrängt, ist freilich die, ob nicht bei der KiKK-Studie die Basis, also der Umfang der Stichproben, zu gering gewählt worden sein könnte?

Die Antwort lautet „und ob“ 👿 Denn die Fläche geht ja quadratisch mit dem Radius, also wurde zunächst die Basismenge, hier die Bewohner der „Cluster“, durch die Verringerung des Umfangs auf 5 km drastisch reduziert. Bedenkt man ferner, dass nicht allzu viele in der Nähe solcher Meiler wohnen und unter denen wiederum noch weniger unter 5 Jahre alt sind, stellen wir fest, dass die Abweichung von einem Fallkind im Jahr überhaupt keinen Kausalitätsschluss zulässt. Vielmehr sind solche Effekte mit einer ausgesprochen hohen Wahrscheinlichkeit einzig und alleine der angewandten Methode, hier der gewählten Messbasis, geschuldet. Sie sind also reine Artefakte und beweisen rein gar nichts!

Comments