Regression zum Mittelwert: Eine Einführung mit Beispielen
Die Regression zum Mittelwert ist ein häufiges statistisches Phänomen, das uns irreführen kann, wenn wir die Welt beobachten. Wenn wir lernen zu erkennen, wann eine Regression zum Mittelwert im Spiel ist, können wir vermeiden, Daten falsch zu interpretieren und Muster zu erkennen, die nicht existieren.
***
Es ist wichtig, Fälle von schlechtem Urteilsvermögen zu minimieren und die Schwachstellen in unserer Argumentation anzugehen. Das Erlernen der Regression zum Mittelwert kann uns helfen.Der mit dem Nobelpreis ausgezeichnete Psychologe Daniel Kahneman hat ein Buch über Vorurteile geschrieben, die unser Denken trüben und unsere Wahrnehmung der Realität verzerren. Es stellt sich heraus, dass es eine ganze Reihe logischer Fehler gibt, die wir begehen, weil unsere Intuition und unser Gehirn nicht gut mit einfachen Statistiken umgehen. Einer der Fehler, die er beim schnellen und langsamen Denken untersucht, ist die berüchtigte Regression zum Mittelwert.
Der Begriff der Regression zum Mittelwert wurde zuerst von Sir Francis Galton ausgearbeitet. Die Regel besagt, dass in jeder Reihe mit komplexen Phänomenen, die von vielen Variablen abhängig sind und bei denen der Zufall eine Rolle spielt, extremen Ergebnissen tendenziell moderatere folgen.
Auf der Suche nach Weisheit führt Peter Bevelin das Beispiel von John an, der mit der Leistung neuer Mitarbeiter unzufrieden war und sie in ein Programm zur Verbesserung der Fähigkeiten einbezog, in dem er die Fähigkeiten der Mitarbeiter maß:
Ihre Punktzahlen sind jetzt höher als beim ersten Test. Johns Fazit: „Das Programm zur Verbesserung der Fähigkeiten führte zu einer Verbesserung der Fähigkeiten.“ Das ist nicht unbedingt wahr. Ihre höheren Werte könnten das Ergebnis einer Regression zum Mittelwert sein. Da diese Personen am unteren Ende der Skill-Skala gemessen wurden, hätten sie eine Verbesserung gezeigt, selbst wenn sie das Skill-Enhancing-Programm nicht absolviert hätten. Und es könnte viele Gründe für ihre frühere Leistung geben — Stress, Müdigkeit, Krankheit, Ablenkung usw. Ihre wahre Fähigkeit hat sich vielleicht nicht geändert.
Unsere Leistung schwankt immer um eine durchschnittliche tatsächliche Leistung. Extreme Leistung wird beim nächsten Mal tendenziell weniger extrem. Warum? Testmessungen können niemals genau sein. Alle Messungen bestehen aus einem wahren Teil und einem zufälligen Fehlerteil. Wenn die Messungen extrem sind, werden sie wahrscheinlich teilweise durch Zufall verursacht. Chance ist wahrscheinlich weniger auf das zweite Mal, wenn wir die Leistung messen beitragen.Wenn wir von einer Art, etwas zu tun, zu einer anderen wechseln, nur weil wir erfolglos sind, ist es sehr wahrscheinlich, dass wir es beim nächsten Mal besser machen, selbst wenn die neue Art, etwas zu tun, gleich oder schlechter ist.
Dies ist einer der Gründe, warum es gefährlich ist, aus kleinen Stichprobengrößen zu extrapolieren, da die Daten möglicherweise nicht repräsentativ für die Verteilung sind. Es ist auch der Grund, warum James March argumentiert, dass je länger jemand in seinem Job bleibt, „desto geringer ist der wahrscheinliche Unterschied zwischen der beobachteten Leistungsbilanz und den tatsächlichen Fähigkeiten.“ Kurzfristig kann alles passieren, besonders bei jeder Anstrengung, die eine Kombination aus Geschick und Glück erfordert. (Das Verhältnis von Geschick zu Glück beeinflusst auch die Regression zum Mittelwert.)
„Die Regression zum Mittelwert ist kein Naturgesetz. Nur eine statistische Tendenz. Und es kann lange dauern, bis es passiert.“
— Peter Bevelin
Regression zum Mittelwert
Die Auswirkungen der Regression zum Mittelwert sind häufig im Sport zu beobachten, wo der Effekt viele ungerechtfertigte Spekulationen hervorruft.
In Thinking Fast and Slow erinnert sich Kahneman an die Skisprungschanze der Männer, eine Disziplin, bei der das Endergebnis eine Kombination aus zwei separaten Sprüngen ist. Kahneman war sich der Regression zum Mittelwert bewusst und erschrak, als er die Vorhersagen des Kommentators über den zweiten Sprung hörte. Er schreibt:
Norwegen hatte einen großartigen ersten Sprung; er wird angespannt sein, in der Hoffnung, seine Führung zu verteidigen und wird wahrscheinlich schlechter abschneiden“ oder „Schweden hatte einen schlechten ersten Sprung und jetzt weiß er, dass er nichts zu verlieren hat und wird entspannt sein, was ihm helfen sollte, es besser zu machen.
Kahneman weist darauf hin, dass der Kommentator die Regression zum Mittelwert bemerkt und eine Geschichte entwickelt hatte, für die es keine kausalen Beweise gab (siehe narrativer Irrtum). Dies bedeutet nicht, dass seine Geschichte nicht wahr sein könnte. Wenn wir die Herzfrequenz vor jedem Sprung messen würden, würden wir vielleicht sehen, dass sie entspannter sind, wenn der erste Sprung schlecht war. Das ist jedoch nicht der Punkt. Der Punkt ist, dass eine Regression zum Mittelwert stattfindet, wenn Glück eine Rolle spielt, wie es beim Ergebnis des ersten Sprungs der Fall war.
Die Lektion aus dem Sport gilt für jede Aktivität, bei der der Zufall eine Rolle spielt. Wir hängen oft Erklärungen unseres Einflusses auf einen bestimmten Prozess an den Fortschritt oder das Fehlen desselben an.In Wirklichkeit ist die Wissenschaft der Leistung komplex, situationsabhängig und oft ist vieles von dem, was wir denken, in unserer Kontrolle ist wirklich zufällig.
Bei Schanzen führt ein starker Wind gegen den Springer dazu, dass selbst der beste Athlet mittelmäßige Ergebnisse zeigt. Ebenso können starke Wind- und Skibedingungen zugunsten eines mittelmäßigen Springers zu einem erheblichen, aber vorübergehenden Anstieg seiner Ergebnisse führen. Diese Effekte verschwinden jedoch, sobald sich die Bedingungen ändern, und die Ergebnisse normalisieren sich wieder.
Dies kann schwerwiegende Auswirkungen auf das Coaching und die Leistungsverfolgung haben. Die Regeln der Regression legen nahe, dass wir uns bei der Bewertung von Leistung oder Einstellung mehr auf Erfolgsbilanzen als auf Ergebnisse bestimmter Situationen verlassen müssen. Ansonsten neigen wir dazu, enttäuscht zu werden.
Als Kahneman der israelischen Luftwaffe einen Vortrag über die Psychologie eines effektiven Trainings hielt, teilte einer der Offiziere seine Erfahrung mit, dass Lob an seine Untergebenen zu schlechteren Leistungen führte, während Schelte zu einer Verbesserung der nachfolgenden Bemühungen führte. Als Konsequenz, Er war großzügig mit negativem Feedback umgegangen und eher vorsichtig geworden, zu viel Lob zu geben.
Kahneman bemerkte sofort, dass es sich um eine Regression zum Mittelwert bei der Arbeit handelte. Er illustrierte das Missverständnis durch eine einfache Übung, die Sie vielleicht selbst ausprobieren möchten. Er zeichnete einen Kreis auf eine Tafel und bat die Offiziere nacheinander, ein Stück Kreide mit dem Rücken zur Tafel in die Mitte des Kreises zu werfen. Dann wiederholte er das Experiment und zeichnete die Leistung jedes Offiziers im ersten und zweiten Versuch auf.
Natürlich tendierten diejenigen, die beim ersten Versuch unglaublich gut abschnitten, dazu, beim zweiten Versuch schlechter abzuschneiden und umgekehrt. Der Trugschluss wurde sofort klar: Die Leistungsänderung erfolgt auf natürliche Weise. Das soll wiederum nicht heißen, dass Feedback überhaupt keine Rolle spielt – vielleicht tut es das, aber der Offizier hatte keine Beweise, um daraus zu schließen.
Die unvollkommene Korrelation und Chance
An dieser Stelle fragen Sie sich vielleicht, warum die Regression zum Mittelwert stattfindet und wie wir sicherstellen können, dass wir uns dessen bewusst sind, wenn es auftritt.
Um die Regression zum Mittelwert zu verstehen, müssen wir zuerst die Korrelation verstehen.
Der Korrelationskoeffizient zwischen zwei Maßen, der zwischen -1 und 1 variiert, ist ein Maß für das relative Gewicht der Faktoren, die sie teilen. Beispielsweise, Zwei Phänomene mit wenigen gemeinsamen Faktoren, wie Wasserverbrauch in Flaschen versus Suizidrate, sollte einen Korrelationskoeffizienten von nahe bei haben 0. Das heißt, wenn wir alle Länder der Welt betrachten und die Selbstmordraten eines bestimmten Jahres gegen den Pro-Kopf-Verbrauch von Wasser in Flaschen darstellen würden, würde die Darstellung überhaupt kein Muster zeigen.
Im Gegenteil, es gibt Maßnahmen, die ausschließlich von demselben Faktor abhängen. Ein gutes Beispiel dafür ist die Temperatur. Der einzige Faktor, der die Temperatur bestimmt – die Geschwindigkeit der Moleküle – wird von allen Skalen geteilt, daher hat jeder Grad Celsius genau einen entsprechenden Wert in Fahrenheit. Daher hat die Temperatur in Celsius und Fahrenheit einen Korrelationskoeffizienten von 1 und das Diagramm ist eine gerade Linie.
Es gibt nur wenige Phänomene in den Humanwissenschaften, die einen Korrelationskoeffizienten von 1 haben. Es gibt jedoch viele, bei denen die Assoziation schwach bis mäßig ist und zwischen den beiden Phänomenen eine gewisse Erklärungskraft besteht. Betrachten Sie die Korrelation zwischen Größe und Gewicht, die irgendwo zwischen 0 und 1 landen würde. Während praktisch jeder Dreijährige leichter und kürzer sein wird als jeder erwachsene Mann, Nicht alle erwachsenen Männer oder Dreijährigen gleicher Größe wiegen gleich.
Diese Variation und der entsprechend geringere Korrelationsgrad impliziert, dass die Höhe zwar im Allgemeinen ein guter Prädiktor ist, aber eindeutig andere Faktoren als die Höhe im Spiel sind. Wenn die Korrelation zweier Maße nicht perfekt ist, müssen wir auf die Auswirkungen der Regression auf den Mittelwert achten.
Kahneman beobachtete eine allgemeine Regel: Wann immer die Korrelation zwischen zwei Scores unvollkommen ist, wird es eine Regression zum Mittelwert geben.
Dies mag zunächst verwirrend und nicht sehr intuitiv erscheinen, aber der Grad der Regression zum Mittelwert hängt direkt mit dem Grad der Korrelation der Variablen zusammen. Dieser Effekt kann anhand eines einfachen Beispiels veranschaulicht werden.Angenommen, Sie sind auf einer Party und fragen, warum hochintelligente Frauen dazu neigen, Männer zu heiraten, die weniger intelligent sind als sie. Die meisten Menschen, auch diejenigen, die eine gewisse Ausbildung in Statistik haben, werden schnell mit einer Vielzahl von kausalen Erklärungen einspringen, die von der Vermeidung von Konkurrenz bis zu den Ängsten vor Einsamkeit reichen, denen diese Frauen gegenüberstehen. Ein Thema solcher Kontroversen wird wahrscheinlich eine große Debatte auslösen.Nun, was wäre, wenn wir fragen würden, warum die Korrelation zwischen den Intelligenzwerten von Ehepartnern weniger als perfekt ist? Diese Frage ist kaum so interessant und es gibt wenig zu erraten – wir alle wissen, dass dies wahr ist. Das Paradoxe liegt in der Tatsache, dass die beiden Fragen zufällig algebraisch äquivalent sind. Kahneman erklärt:
Wenn die Korrelation zwischen der Intelligenz von Ehepartnern weniger als perfekt ist (und wenn sich Männer und Frauen im Durchschnitt nicht in der Intelligenz unterscheiden), dann ist es eine mathematische Unvermeidlichkeit, dass hochintelligente Frauen mit Ehemännern verheiratet werden, die im Durchschnitt weniger intelligent sind als sie (und umgekehrt natürlich). Die beobachtete Regression zum Mittelwert kann nicht interessanter oder erklärbarer sein als die unvollkommene Korrelation.
Unter der Annahme, dass die Korrelation unvollkommen ist, sind die Chancen von zwei Partnern, die die oberen 1% in Bezug auf ein Merkmal darstellen, viel kleiner als ein Partner, der die oberen 1% und den anderen darstellt – die unteren 99%.
Ursache, Wirkung und Behandlung
Wir sollten bei der Regression zum mittleren Phänomen besonders vorsichtig sein, wenn wir versuchen, eine Kausalität zwischen zwei Faktoren festzustellen. Wann immer die Korrelation unvollkommen ist, scheint sich das Beste immer zu verschlechtern und das Schlimmste scheint sich im Laufe der Zeit zu verbessern, unabhängig von einer zusätzlichen Behandlung. Dies ist etwas, was die allgemeinen Medien und manchmal sogar ausgebildete Wissenschaftler nicht erkennen.
Betrachten Sie das Beispiel, das Kahneman gibt:
Depressive Kinder, die mit einem Energy-Drink behandelt werden, verbessern sich über einen Zeitraum von drei Monaten signifikant. Ich habe diese Schlagzeile erfunden, aber die Tatsache, dass es berichtet, ist wahr: wenn Sie eine Gruppe von depressiven Kindern für einige Zeit mit einem Energy-Drink behandelt, würden sie eine klinisch signifikante Verbesserung zeigen. Es ist auch so, dass depressive Kinder, die zwanzig Minuten am Tag einige Zeit auf dem Kopf stehen oder eine Katze umarmen, ebenfalls Verbesserungen zeigen.
Wenn man auf solche Schlagzeilen stößt, ist es sehr verlockend, zu dem Schluss zu kommen, dass Energy-Drinks, das Stehen auf dem Kopf oder das Umarmen von Katzen vollkommen praktikable Heilmittel für Depressionen sind. Diese Fälle verkörpern jedoch erneut die Regression zum Mittelwert:
Depressive Kinder sind eine extreme Gruppe, sie sind depressiver als die meisten anderen Kinder — und extreme Gruppen bilden sich im Laufe der Zeit auf den Mittelwert zurück. Die Korrelation zwischen den Depressionswerten bei aufeinanderfolgenden Tests ist nicht perfekt, so dass es zu einer Regression zum Mittelwert kommt: Depressive Kinder werden mit der Zeit etwas besser, selbst wenn sie keine Katzen umarmen und keinen Red Bull trinken.
Wir schreiben oft fälschlicherweise eine bestimmte Richtlinie oder Behandlung als Ursache für einen Effekt zu, wenn die Änderung in den extremen Gruppen ohnehin stattgefunden hätte. Dies stellt ein grundlegendes Problem dar: Wie können wir wissen, ob die Auswirkungen real sind oder einfach auf Variabilität zurückzuführen sind?
Zum Glück gibt es eine Möglichkeit, zwischen einer echten Verbesserung und einer Regression zum Mittelwert zu unterscheiden. Das ist die Einführung der sogenannten Kontrollgruppe, die sich allein durch Regression verbessern soll. Ziel der Forschung ist es festzustellen, ob sich die behandelte Gruppe mehr verbessert, als die Regression erklären kann.In realen Situationen mit der Leistung bestimmter Personen oder Teams, in denen der einzige wirkliche Maßstab die vergangene Leistung ist und keine Kontrollgruppe eingeführt werden kann, können die Auswirkungen der Regression schwierig, wenn nicht unmöglich zu entwirren sein. Wir können mit dem Branchendurchschnitt, Kollegen in der Kohortengruppe oder historischen Verbesserungsraten vergleichen, aber keines davon sind perfekte Maßnahmen.
***
Glücklicherweise ist das Bewusstsein für die Regression zum Mittelwertphänomen selbst bereits ein großer erster Schritt zu einem sorgfältigeren Ansatz zum Verständnis von Glück und Leistung.
Wenn es etwas aus der Regression zum Mittelwert zu lernen gibt, ist es die Bedeutung von Track Records, anstatt sich auf einmalige Erfolgsgeschichten zu verlassen. Ich hoffe, dass Sie beim nächsten Mal, wenn Sie auf eine extreme Qualität stoßen, die zum Teil dem Zufall unterliegt, feststellen werden, dass sich die Auswirkungen im Laufe der Zeit wahrscheinlich zurückbilden, und Ihre Erwartungen entsprechend anpassen werden.
Was als nächstes zu lesen ist
- Verbessere dein Denken mit 113 mentalen Modellen erklärt.
- Lesen Sie über das Denken auf der zweiten Ebene, um negative Konsequenzen zu vermeiden.