WARUM unsere Intuition uns irreleitet

 

Intuition "Eingebung, ahnendes Erfassen": Das Fremdwort wurde im 18. Jh. aus mlat. intuitio "unmittelbare Anschauung" entlehnt. Dies gehört zu lat. in-tueri "anschauen, betrachten" (zu lat. in "in" und tueri "schauen").
(Duden - Herkunftlexikon)

  1. erscheint dieser Aufsatz natürlich völlig zu Unrecht in der Rubrik ; vielmehr handelt er vom glatten Gegenteil, also der Unanschaulichkeit.

  2. gibt es mindestens drei Felder, auf denen uns die Intuition mächtig irreführen kann:

  1. sozial-emotional,

  2. in der Naturwissenschaft

(vgl. etwa  ),

  1. in der mehr oder minder angewandten Mathematik.

Die ersten beiden Felder sollen hier nicht mein Thema sein, sondern nur das dritte.

Dass "der gesunde Menschenverstand" uns "mathematisch" irreleitet, passiert aber wohl nirgends so oft wie in der Statistik/Wahrscheinlichkeitsrechnung.


Die Anlässe für diesen Aufsatz:

  1. "Daniel Ellsberg hat einmal ein Experiment durchgeführt, bei dem er seinem Publikum zwei Urnen zeigte. In der einen waren je zur Hälfte rote und schwarze Kugeln. In der anderen war das Verhältnis von rot zu schwarz unbekannt. Er bot jedem 100 Dollar, dem es gelingen würde, aus irgendeiner der beiden Urnen eine rote Kugel zu fischen. Welche Urne würden die Teilnehmer an dem Experiment wählen? Fast jeder probierte mit der Urne, deren Füllung bekannt war. Dann bot Ellsberg weitere 100 Dollar für eine schwarze Kugel. Die gleichen Teilnehmer wählten wieder die Urne mit dem Verhältnis 50 zu 50 - obwohl aus ihrer ersten Wahl eigentlich folgte, dass sie in der »unbekannten« Urne mehr schwarze als rote Kugeln vermutet hatten."

  2. "[...] Amos Tversky und Daniel Kahnemann entwickelten ein Szenario, das dem wahren Leben schon sehr nahe kommt: Ein Taxi streift in einer Winternacht ein anderes Auto. Es gibt in der Stadt zwei Taxigesellschaften: eine mit blauen Wagen, die andere mit grünen. Die mit grünen Wagen beherrscht 85 Prozent des Marktes. Eine Zeugin sagt aus, das Unfalltaxi sei blau gewesen. Unabhängige Tests ergeben, dass sie in 80 Prozent der Fälle eine richtige Aussage macht. Welche Farbe hatte das Taxi wirklich? Fast jeder wird glauben, dass es blau war, weil er sich auf die hohe Glaubwürdigkeit der Zeugin stützt. Die entscheidende Frage ist aber, wie weit ihre Glaubwürdigkeit die Tatsache beeinflusst, dass ein zufällig ausgewähltes Taxi mit 85-prozentiger Wahrscheinlichkeit grün ist. Kombiniert man die beiden Wahrscheinlichkeiten, ist die Chance, dass das fragliche Taxi grün war, 59 Prozent. Die Wahrscheinlichkeit für grün ist also größer als die für blau. Zu diesem Schluss können wir nie rein intuitiv kommen, dazu müssen wir rechnen."
    (beide Zitate aus , S. 22 bzw. 20)

Warum ist mir bei beiden (typischen) Beispielen so unwohl?:

  1. deuten die Autoren mit dem Teilsatz

"[...] ein Szenario, das dem wahren Leben schon sehr nahe kommt [...]"

selbst indirekt die Crux an: die meisten Probleme, bei denen unsere Intuition von der "Wahrheit" abweicht, kommen eben nicht "dem wahren Leben [...] sehr nahe", sondern sind meilenweit von ihm entfernt. D.h. unsere "Lebensintuition" hat ihre eigene Wahrheit und ist oftmals gar nicht für die mathematischen "Wahrheiten" geeignet.

Entsprechend konstruiert wirken auch all diese Aufgaben, bei denen die Intuition von der (mathematischen) Wahrheit abweicht: diese Aufgaben scheinen überhaupt nur zu dem einzigen Zwecke geschaffen zu sein, dass die Intuition "daneben" liegt. Sie haben also etwas Hinterhältig-Beschämendes an sich.

Mehr noch: derjenige, der die Aufgabe stellt (also im ersten o.g. Fall ein gewisser Daniel Ellsberg), weiß arg altklug ja schon vorher, was er beweisen will bzw. was (entgegen aller Intuition) herauskommt, d.h. er will gelinde gesagt überraschen, böse gesagt "beschämen".

Man schaue sich dazu sein Experiment nur mal genauer an:

"Wenn Du - wie gefordert - tatsächlich rot (und später schwarz) ziehst, bekommt Du von mir 100 Dollar. Wenn Du aber die falsche Farbe ziehst (also anfangs schwarz und hinterher rot), musst Du umgekehrt 100 Dollar an mich zahlen."

(Bei einem derart hohen eigenen Einsatz würden einige Teilnehmer aber vielleicht doch skeptisch, d.h. sie würden dem Experimentator nicht mehr blind glauben, sondern vorher um eine Überprüfung der beiden Urne bitten. Genau das aber würde das Experiment völlig zerstören, weil dann ja schon vorweg klar wäre, wie die Zustände in der zweiten Urne sind, und sich jeder später natürlich immer für diejenige Urne entscheiden würde, in der mehr rote bzw. schwarze Kugeln sind.)

Bei einem  beidseitigen Einsatz von 100 Dollar liegt die Chancenverteilung 1 : 1 nahe, die ja in der ersten Urne verwirklicht ist, was aber bei der zweiten unklar ist.

D.h. mit dem Angebot "100 gegen 100 Dollar" wird den Teilnehmern bereits suggeriert, in die erste und nicht in die zweite Urne zu greifen: der Experimentator Ellsberg lässt also den Teilnehmern gar keine echte Wahl - und darf sich daher später gar nicht wundern, dass sie sich "falsch" entscheiden.

Kommt hinzu, dass es völlig egal ist, was eigentlich wirklich in den Urnen drin ist: es zählt einzig und allein, was der Experimentator bzgl. der beiden Urnen behauptet. Er muss es also nicht mal selbst (genau) wissen. Mehr noch: es müssen auch gar nicht wirklich Kugeln gezogen werden (die Urnen können sogar beide leer sein), sondern es reicht bereits, dass die Teilnehmer Kugeln aus einer der beiden Urnen nehmen wollen.

Schauen wir uns aber auch an, was in der zweiten Urne los sein könnte:

  1. könnten mehr rote als schwarze Kugeln in ihr sein, so dass die "Gewinnchancen" gegenüber der ersten Urne (im ersten Experiment) höher bzw. (im zweiten Experiment) niedriger wären;

  2. könnten in der zweiten Urne (wie in der ersten) gleich viele rote und schwarze Kugeln sein, so dass die Gewinnchancen genauso groß wie bei der ersten Urne wären und es also egal wäre, in welche der beiden Urnen man fassen würde;

  3. könnten - spiegelbildlich zu a. - mehr schwarze als rote Kugeln in der zweiten Urne sein, so dass die "Gewinnchancen" gegenüber der ersten Urne (im ersten Experiment) niedriger bzw. (im zweiten Experiment) höher wären.

Weil das aber so spiegelbildlich ist, ist im es im ersten wie zweiten Experiment wirklich egal, in welche der beiden Urnen man fasst.

  1. hatte er es ihnen, wie schon gesagt, suggeriert,

  2. bedeutet der Ausfall des Experiments doch wohl schlicht und einfach, dass sich Menschen lieber auf Sicherheit (klare Farbverteilung in der ersten Urne) als Unwägbarkeit (unklares Verhältnis in der zweiten Urne) verlassen.

  3. scheint mir der Gag des Experiments darin zu liegen, dass die Teilnehmer die beiden Experimente (einmal das Ziehen einer roten, das andere Mal das Ziehen einer schwarzen Kugel) als völlig unabhängig voneinander ansehen

(was ein Experimentator beispielsweise auch dadurch unterstützen könnte, dass er zwischendurch Unmengen quasselt).

... womit wir, so scheint mir, schon einen Hauptgrund für das Irrelaufen der Intuition haben: dass "wir" Menschen größte Schwierigkeiten mit "bedingten" Wahrscheinlichkeiten haben und vielmehr dazu neigen,

  • entweder jeden neuen Fall als Einzelfall zu betrachten

  • oder in Serien zu denken ("wenn ich einmal in die erste Kugel gefasst habe, werde ich immer in diese fassen ... oder hübsch abwechselnd ... oder »pseudozufallsmäßig«").

  1. Einen weiteren Grund dafür, weshalb uns die Intuition irreleitet, kann man besser am zweiten o.g. (Taxi-)Beispiel herausfinden, weil (anders als beim Urnenbeispiel) da - wie die Autoren des Buchs ja selbst behaupten - tatsächlich gilt:

"Zu diesem Schluss können wir nie rein intuitiv kommen, dazu müssen wir rechnen."

Bemerkenswert finde ich es allemal doch, dass die Autoren diese Rechnung nur erwähnen, aber nicht vorführen.

Warum?:

Auf jeden Fall bleibt ohne Rechnung aber völlig unklar, warum unsere Intuition von der (mathematischen) Wahrheit abweicht.

Genau dieses "warum" (oder zumindest eine Ahnung davon) interessiert mich aber doch ganz besonders, weil es sonst nur bei der fatal-nichtssagenden Feststellung bleibt, dass "wir uns nunmal ab und zu irren".

Ich werde also unten tatsächlich mal die vollständige Rechnung/Überlegung vorführen.

Zwischendurch aber noch etwas anderes: schon mein Titel

"WARUM unsere Intuition uns irreleitet"

war doppelt pauschal:

  1. leitet uns unsere Intuition ja nicht immer, sondern nur manchmal

(in extra dafür konstruierten und unserer Lebenswelt völlig fremden Zusammenhängen?)

in die Irre - und ist sie oftmals sogar ein wichtiger und sehr guter Ratgeber

(s.u.; und zwar wohl insbesondere, wenn schnelle Entscheidungen getroffen werden müssen),

  1. ist natürlich auch "unsere/uns" und das damit implizierte "wir" (alle!) eine arge Pauschalisierung. Die Autoren des o.g. Buchs sind da vorsichtiger - und doch inkonsequent:

"Fast jeder wird glauben [...]",

"Zu diesem Schluss können wir [= alle!] nie [!] rein intuitiv kommen, dazu müssen [!] wir rechnen."

Man könnte sogar sagen: wenn die Autoren in ihrer Aufgabe schon so blöd

"Welche Farbe hatte das Taxi wirklich?"

fragen

(und das "wirklich" bereits unterstellt, dass die Zeugin falsch ausgesagt hat),

wird wohl das Gegenteil der Intuition richtig sein, antworte ich also sofort mit "grün".

Damit aber langsam zur Rechnung

(... wobei ich [im Folgenden] lieber mit Wahrscheinlichkeiten zwischen 0 und 1 als mit Prozentangaben rechne - was ja letztlich eh dasselbe ist: 0,8 = 80 %, 0,85 = 85 %):

ich finde es geradezu wohltuend, dass ich lange Zeit hin und her gerechnet habe und nicht auf das genannte Ergebnis "59 %" gekommen bin. Und irgendwann habe ich dann sogar gedacht, das müsse ein Druckfehler sein

(ich kam z.B. auf 0,8 0,85 = 0,68 = 68 %).

Ich finde meine Irrwege "wohltuend", weil man die Probleme von SchülerInneN vielleicht nur verstehen kann, wenn man sie auch noch selbst hat.

Dass ich so lange falsch lag, hatte zwei Gründe:

  1. finde ich die von den Autoren mitgelieferte Erklärung

"Die entscheidende Frage ist aber, wie weit ihre [der Zeugin] Glaubwürdigkeit die Tatsache beeinflusst, dass ein zufällig ausgewähltes Taxi mit 85-prozentiger Wahrscheinlichkeit grün ist."

wenig verständlich bis geradezu falsch: die Zeugenaussage hat doch nichts mit der Tatsache zu tun, "dass ein zufällig gewähltes Taxi mit 85-prozentiger Wahrscheinlichkeit grün ist".

  1. steht der entscheidende, von mir trotz Weiterlesens übersehene Tipp am Anfang des direkt nach dem Beispiel folgenden Absatzes:

"Wollen wir ein numerisches Modell der Ungewissheit basteln, müssen wir zu zählen versuchen, was sich ereignen kann, und es mit dem vergleichen, was sich wirklich ereignet."

Zwar ist dieser Tipp arg allgemein

(was heißt eigentlich "vergleichen"?; s.u.)

- und sollte doch metergroß in jeder Schulklasse aufgehängt werden, in der es gerade um Wahrscheinlichkeitstheorie geht!

Irgendwann hatte ich dann aber doch die Eingebung, auf welchem Weg die im Text genannten 59 % herauskommen.

Dazu schauen wir uns alle möglichen (!) Fälle dafür an, dass die Zeugin "blau" gesagt hat

(denn das hat sie ja unbestreitbar gesagt),

also

  1. das Unfalltaxi war grün, obwohl die Zeugin meinte, es sei blau,

  2. das Unfalltaxi war blau, und die Zeugin hat auch blau gesagt.

Nun zerlegen wir erst

  1. : - die Wahrscheinlichkeit, dass das Auto grün war, ist 0,85,
      - die Wahrscheinlichkeit, dass die Zeugin sich geirrt hat
       
    (also entgegen der Wahrheit "blau" gesagt hat),
        ist 1 - 0,8 = 0,2;
      - die Wahrscheinlichkeit, dass beides gleichzeitig vorlag, ist
        0,85 0,2 = 0,17.

(Dabei sei hier wie auch im Folgenden nicht erklärt, weshalb eine Multiplikation nötig ist.)

Und nun die Zerlegung von

  1. : - die Wahrscheinlichkeit, dass das Auto blau war,
        ist 1 - 0,85 = 0,15,
      - die Wahrscheinlichkeit, dass die Zeugin sich nicht geirrt hat
       
    (also der Wahrheit entsprechend "blau" gesagt hat),
        ist 0,8;
      - die Wahrscheinlichkeit, dass beides gleichzeitig vorlag, ist
        0,15 0,8 = 0,12.

Eigentlich bräuchte man gar nicht weiter zu rechnen: das Ergebnis 0,17 für a. ist (unserer Intuition widersprechend!) größer als das Ergebnis 0,12 für b.

(... was natürlich daran liegt, dass die beiden Werte 0,85 und 0,2 in a. minimal größer sind als die beiden Werte 0,8 und 0,15 in b.)

Wie aber sind die Autoren davon ausgehend auf 59 % gekommen? Dazu muss man das o.g. "vergleichen" als "ins Verhältnis zueinander setzen" auffassen, also .

(Nebenbei: relative Verhältnisse halte ich auch für arg anti-intuitiv und bereiten deshalb vielen SchülerInneN fast die ganze Schulzeit lang Probleme: dass die Bruch- und Prozentrechnung so einfach sei, sagt sich allzu leicht.)

Es gibt also insgesamt 17 + 12 = 29 Fälle, und der Anteil von 17 daran ist      0,59 = 59 %

(na endlich!!!).

Die entscheidende Frage ist nun aber: wieso ist diese Rechnung für "uns" derart abstrakt, dass sie unserer Intuition völlig widerspricht?:

  1. einfach deshalb, weil sie so vieler (unvermeidbarer!) Zwischenschritte bedarf,

  2. weil wir anscheinend üblicherweise nicht daran denken, beide möglichen Fälle (die Frau sagt nicht die Wahrheit/die Frau sagt sehr wohl die Wahrheit) gleichberechtigt zu behandeln,

  3. - wie die Autoren ja schon selbst sagen -:

"Fast jeder wird glauben, dass es [das Unfalltaxi] blau war, weil er sich auf die hohe Glaubwürdigkeit der Zeugin stützt."

Aber mal ganz abgesehen vom völlig unklaren Verfahren, mit dem die Glaubwürdigkeit der Zeugin bewertet wurde

("Unabhängige Tests ergeben, dass sie in 80 Prozent der Fälle eine richtige Aussage macht.")

und somit auch der Frage, was mit (Un-)Glaubwürdigkeit eigentlich gemeint ist

(lügt die Frau manchmal absichtlich - oder nimmt sie manchmal etwas versehentlich falsch wahr):

80 % hören sich zwar auf Anhieb nach viel an - und doch: mag man überhaupt noch einem Menschen trauen, der in 1/5 [!!!] aller Fälle nicht die Wahrheit sagt?!

  1. einerseits muss der "Vertrauenswert" v = 80 % natürlich relativ hoch liegen, damit wir auf die Aussage der Unfallzeugin reinfallen;

  2. muss der "Grünwert" g = 85 % noch ein bisschen höher liegen.

(Der ganze Gag funktioniert nur, wenn die "grüne" Taxifirma den Markt weitgehend dominiert.)

Läge hingegen g ein wenig unter v = 80 %, wäre also beispielsweise g = 75 %, so würde uns unsere Intuition nicht täuschen.

... und genau dieses Der-Aufgabe-auf-die-Schliche-Kommen hat doch seinen ganz eigenen Reiz

(sowas wird viel zu selten im Schulunterricht gemacht)

und entschädigt ein wenig für die anfängliche Demütigung, weil wir nun ganz am Ende genauso schlau wie die Aufgabensteller sind.

Ein weiterer Reiz der Aufgabe ist die "ästhetik" der beiden Rechnungen, bei denen

Dabei ist dieser Chiasmus allerdings nicht nur ästhetisch, sondern auch aus zwei anderen Gründen bedeutsam:

(darauf eben, dass auch die nicht in der Aufgabe genannten Werte 1 - 0,8 = 0,2 und 1 - 0,85 = 0,15 mit berücksichtigt werden müssen, kommt die Intuition wohl nicht!)


Manchmal scheint mir, es gibt überhaupt nur zwei Arten von statistisch-wahrscheinlichkeitstheoretischen Aufgaben:

  1. diejenigen, bei denen die Intuition der mathematischen Wahrheit entspricht, und diese Aufgaben sind einfach witzlos;

  2. diejenigen, bei denen die Intuition der mathematischen Wahrheit widerspricht, und diese Aufgaben sind nur permanente Beschämungen

es sei denn, man findet Spaß an dieser herrlichen Widerlegung der Intuition!

... einen Spaß, den man allerdings wohl nur empfinden kann, wenn man die Mathematik nicht als etwas eiskalt von außen Kommendes, sondern genauso als menschliche Leistung empfindet wie die primäre Intuition.


Inzwischen wird man wohl ahnen, dass die Wahrscheinlichkeitsrechnung SchülerInnen mit Recht ganz enorme Probleme bereitet.

Und überhaupt finde ich den Ansatz problematisch:

  1. ist es natürlich ein wichtiges allgemeines "Erziehungsziel", dass die SchülerInnen Vorurteilen und dem "gesunden" Menschenverstand bzw. dem Ersteindruck zu misstrauen lernen.

(Und Vorurteile haben natürlich nur die SchülerInnen, aber - Gott bewahre! - doch nicht wir LehrerInnen. Merkt eigentlich keiner, wie schnell Pädagogik und sogar die Mathematik da moralinsauer und erniedrigend werden?

Einem Vorurteil ist sowieso nur beizukommen, wenn ihre Alternative, also "die" Wahrheit, interessanter, bunter und lebenswerter erscheint als das Vorurteil - und wenn es befreiend wirkt, mehrere, einander ergänzende Wahrheiten zu haben.)

  1. haben SchülerInnen aber bei den typischen "anti-intuitiven" Matheaufgaben eh keine Chance, wenn sie nicht Standardverfahren lernen, also z.B. (s.o.)

"[...] müssen wir zu zählen versuchen, was sich ereignen kann, und es mit dem vergleichen, was sich wirklich ereignet."

  1. sind - wie hoffentlich überzeugend gezeigt - die Aufgaben meist per se sehr lebensfern, sind sie also vielleicht sogar besonders ungeeignet für das o.g. "Erziehungsziel".

Und was könnte denn der "praktische Nährwert"

(wenn der denn überhaupt ein Kriterium ist)

etwa der Taxiaufgabe z.B. für den die Zeugin vernehmenden Polizisten

(oder gar SchülerInnen, von denen später kaum jemand später PolizistIn wird)

sein?:

(und doch sind wir unbelehrbar, lassen uns also immer wieder aufs Neue durch unsere primären Intentionen täuschen).

(überhaupt noch rechnen können, wenn er schon lange aus der Schule ist),

D.h. aber doch, der Polizist braucht keine mathematische, sondern eine "menschliche" Skepsis.


Ich "befürchte" sogar noch einen ganz anderen Effekt der "anti-intuitiven" Aufgaben, nämlich dass jemand denkt:

"Ist doch scheißegal, unsere Intuition liegt ja sowieso falsch, und deshalb lohnt sich auch kein Rechnen, sondern handle ich - frischweg nach dem Motto »ist der Ruf erst ruiniert, lebt´s sich gänzlich ungeniert« - ab sofort nur noch intuitiv. Und mathematische Klugscheißer, die mich - wie banal! - garantiert eines Besseren belehren, haben mir gerade noch gefehlt."

Vielleicht ist die Intuition manchmal aber sogar ein besonders guter Ratgeber:

Die Intuition hat ja durchaus (evolutionär) ihren Sinn

(etwa dann, wenn schnell entschieden werden muss),

ist also keineswegs immer bzw. an sich schlecht. Genau diese Erkenntnis (und damit unser "innerstes Ich") wird aber fast schon bösartig denunziert, wenn die Intuition im Mathematikunterricht systematisch als irreleitend dargestellt wird

(wobei die zweitklassigen Mathematiker übersehen [sich gar nicht vorstellen können], dass erstklassige Mathematik oftmals auch intuitiv gefunden wird).

Bzw. eine andere Konsequenz könnte sein: wenn die Intuition uns sowieso täuscht

(oder die Randbedingungen für eine Entscheidung partiell unbekannt und die Wechselwirkungen allzu komplex, also nichtmal durch Rechnungen zu erfassen sind),

können wir auch frisch-fromm-fröhlich-frei einfach den Zufall entscheiden lassen: Wolf Singer: "Warum nicht würfeln?"

(... was mich doch an die Schulbürokratie erinnert: "Ist doch egal, was wir tun, Hauptsache, wir tun überhaupt etwas."

Allerdings sagt Singer auch: "Natürlich darf nicht zwischen Beliebigkeiten gewürfelt werden, sondern nur zwischen vernünftigen Handlungsoptionen.")

Welch herrlich mathematisch unbeschwertes Leben wir dann doch hätten!