oder
wie ein Programm aussehen sollte,
funktioniert,
zu benutzen ist

1. wie ein Programm aussehen sollte

Nach ewig langer Zeit habe ich mich doch wieder mal daran gesetzt, ein Programm für die Programmsammlung zu schreiben

(Download der zip-Datei des Programms   ; zusätzlich zu installieren: Visual-Basic-Treiber).

Damit wollte ich die markanten Unterschiede und jeweiligen Aussagefähigkeiten von

zeigen.

Nun gibt es sowas ja durchaus schon fertig im Internet:

Üblicherweise wird einE Mathelehrerin

(wenn sie/er überhaupt nach sowas sucht)

heilfroh über solch ein fertiges Programm sein und es umgehend im Unterricht einsetzen.

(Viele LehrerInnen können ja gar nicht selbst programmieren

[muss man ja auch nicht können!],

und wenn sie es doch können, lohnt oftmals der Aufwand nicht, wenn es schon ein fertiges Programm gibt.)

Und da wird dann

(evtl. abgesehen von einer kurzen Suche nach Alternativprogrammen)

auch nicht großartig überlegt, welche Vor- und Nachteile solch ein fertiges Programm hat.

Überhaupt werden mir ja Computerprogramme und Taschenrechner von den Computerfanatikern unter den MathelehrerInneN oftmals viel zu pauschal und unüberlegt eingesetzt

(vgl. und Bild ).

Hier aber sollen tatsächlich mal die Vor- und Nachteile des fertigen Programms

 

(und weiter unten auch meines eigenen Programms)

reflektiert werden:

  1. die Vorteile:

(beispielsweise kann man dann sehr leicht einen "Ausreißer", also einen von allen anderen Werten extrem abweichenden Wert herstellen).

Durch das kontinuierliche Verschieben der Datenwerte sind auch sehr schön die kontinuierlichen Auswirkungen auf Median, Quartile, Mittelwert und Standardabweichung erkennbar.

  1. die Nachteile:

(darauf wird unten bei der Frage, wie Programme zu benutzen sind, zurückzukommen sein: gibt es eine Motivation dafür, dass SchülerInnen erst mal von sich aus "einen Gang runterschalten" und weniger Datenwerte benutzen?)

(und dann werden diese Werte auch automatisch eingezeichnet),

man kann also nicht sehen, wie sie entstehen, und muss dem Programm die Ergebnisse einfach "glauben":

ein Nachteil, den (das sei vorweg erwähnt) auch mein Programm hat: es kommt halt

(wie bei all meinen Programmen aus der Sammlung  )

drauf an, wann man das Programm einsetzt, nämlich erst dann, wenn die Rechenverfahren schon gesichert und so langweilig und außerdem abstoßend umständlich geworden sind, dass man sie gerne dem Computer überlässt;

(was man allerdings durchaus auch als Vorteil sehen kann)

völlig abstrakt, denn die Datenwerte bedeuten nichts;

besonders deutlich wird das am voreingestellt-unveränderbaren Datenwerte-Bereich

,

also zwischen den willkürlich gewählten Zahlen -1,3 und +4,2

(-1,3 Kurbelwellen, + 4,2 Joghurtbecher ...?);

einziges Kriterium war wohl zu zeigen, dass ebenso gut negative wie positive Zahlen für die Datenwerte möglich sind.

Mit meinem eigenen Programm setze ich nun bei dem letztgenannten Nachteil an: zwar verstehe ich mich in der Regel als "reiner" Mathematiker, aber ich halte es dennoch für sinnvoll zu wissen, von welchen Datenwerten ausgehend Median, Quartilen, Mittelwert und Standardabweichung ermittelt werden.

Gesucht ist also ein allgemein bekannter und vielleicht auch interessanter Anwendungszusammenhang, und da finde ich

(wir sind nunmal in einer Schule)

den Ausfall von Klassenarbeiten allemal naheliegend, also z.B.

(Wenn man mal von

[hier nicht umgesetzten]

Notentendenzen

[also z.B. "befriedigend minus" oder "mangelhaft plus"]

absieht, so hat dieser "Ausfall von Klassenarbeiten" gegenüber dem o.g. fertigen Programm allerdings zugebenermaßen den Nachteil, dass man keine kontinuierliche Veränderung der Werte vornehmen kann.)

Nun gibt es verschiedene Möglichkeiten, eine Anschauung von dem Sachverhalt "Ausfall von Klassenarbeiten" zu bekommen:

  1. eben die rein numerische und gerade deshalb arg abgenagte Liste

(oftmals auch "Notenspiegel" genannt)

,

  1. eine schon anschaulichere grafische Darstellung

  2. als Stabdiagramm

             

  1. als Funktionsgraf (Spline, Interpolation ...)

(wobei wegen der stetigen Verbindung Zwischenwerte angezeigt werden, die realiter gar nicht existieren; und dennoch halte ich diese Notation für viel aussagekräftiger als das Stabdiagramm):

(Nebenbei: aus mir unklarem Grund werden in meinem Programm diese Funktionsgrafen nur kurze Zeit angezeigt, und danach bleiben doch wieder nur die Stabdiagramme sichtbar.) 

  1. Darstellungen, in denen nicht mehr die vielen einzelnen Datenwerte interessieren, sondern eher der "Trend", der sich in diese einzelnen Datenwerte zusammenfassenden

zeigt:

  1. Boxplot:

  1. Mittelwert / Standardabweichung:

Und das dann alles zwecks Vergleichbarkeit hübsch untereinander:

             

(Nebenbei: hier werden rechts auch noch die Zahlenwerte des Medians usw. angegeben, und zwar sogar dann mit einem Gleichheitszeichen, wenn gerundet wurde. Das ist natürlich mathematisch skandalös, aber ich hatte keine Lust mehr, noch umständlich fallweise ein Gleich- bzw. ein Ungefährzeichen zu "implementieren".

Überhaupt ließe sich über den pädagogischen Nährwert der Zahlenwerte, die ich genauso anzeigen lasse, wie der Autor des fertigen Programms es getan hat, trefflich streiten.)

Die

(unten noch zu überprüfende) 

Behauptung dabei ist natürlich, dass

besonders eindrückliche oder gar neue Aussagen über die ursprüngliche Verteilung der Datenwerte ermöglichen. Wieso sonst sollte man sie im Unterricht durchnehmen?

"wie ein Programm aussehen sollte" ist natürlich auch eine pädagogische Frage. Vgl. dazu unten

3. wie ein Programm zu benutzen ist.


2. wie ein Programm funktioniert

Wie schon gesagt: solche Programme sollte man erst einsetzen,

"[...] wenn die Rechenverfahren schon gesichert und so langweilig und außerdem abstoßend umständlich geworden sind, dass man sie gerne dem Computer überlässt;, solche Programme sollte man erst einführen [...]".

Der Übergang zu den Programmen könnte dann eben gerade in der Überlegung bestehen, wie ein Computer denn "intern" Median, Quartile, Mittelwert und die Standardabweichung berechnet, d.h. welche Anweisungen man ihm geben muss und wie er damit umgehen soll.

Nehmen wir nur mal das Beispiel des Boxplots:

dieses Verfahren wird ja wohl vor allem deshalb angewandt, weil es so einfach ist: man muss nur alle Datenwerte aufschreiben, abzählen und dann das nach 1/4 (unteres Quartil) 1/2 (Median) und 3/4 (oberes Quartil) der Datenreihe nehmen

(bzw. gegebenenfalls den Mittelwert zweier benachbarter Datenwerte).

Nun sind aber Computer ganz schön doof und brauchen idiotensichere Anweisungen, für etwas, das uns Menschen sehr einfach fällt.

Herzuleiten ist also

(hier nur für den Median - und nicht unbedingt mit den spezifischen Computerbegriffen)

so etwas wie

Da sei gleich ergänzt, dass ich nie richtig programmieren gelernt habe

(viele Details des sonstigen Programmcodes [beispielsweise fürs Zeichnen des Graphen] habe ich aus dem Internet zusammengeklaut und dann "nur" modifiziert)

und deshalb mein Programmcode vermutlich arg umständlich ist

(aber er funktioniert!).

Man hätte den obigen Programmcode vermutlich erheblich abkürzen können, indem man zusätzliche Variable eingeführt hätte. Aber das hätte ihn erheblich abstrakter und damit für SchülerInnen vermutlich (noch) weniger verständlich gemacht.

Natürlich soll der Matheunterricht nicht den Informatikunterricht ersetzen, und es wäre wünschenswert, wenn zumindest einige SchülerInnen schon (im Informatikunterricht?) programmieren gelernt hätten und statt meiner das Programm schreiben (und dann auch erklären) könnten.

Aber viele SchülerInnen eines Mathekurses haben halt nie Informatik gehabt und sollten deshalb immerhin doch einen ersten Einblick ins Programmieren bekommen, und sei´s einfach, um zu merken, dass Programme nicht fertig vom Himmel fallen, und zu staunen, welch ein Aufwand für die Programmierung getrieben werden muss.

Denkbar wäre es auch, den SchülerInneN den fertigen Programmcode zu geben und sie diesen dann durch eine Analyse verstehen zu lassen

(hier nur ansatzweise vorgeführt):

Wichtig daran ist vor allem, dass die SchülerInnen die verschachtelten Fallunterscheidungen verstehen.


3. wie ein Programm zu benutzen ist

Ein Nachteil des Einsatzes von Computerprogrammen im Unterricht ist es oftmals, dass völlig unklar ist, wie mit ihnen umzugehen ist, woraus dann folgt, dass SchülerInnen oftmals nur sinn- und zwecklos mit ihnen rumspielen, statt systematisch Erkenntnisse "herauszukitzeln".

Nun gibt es zwei Möglichkeiten, die SchülerInnen zu systematischem Vorgehen zu bewegen:

  1. durch zusätzliche, im Programm noch nicht enthaltene Aufgaben.

Ein Beispiel zu meinem Programm:

"Untersuche den Klassenarbeitsausfall    !"

Das anschauliche Ergebnis ist da

Natürlich ist diese Aufgabe mit einigem Hintersinn gegeben worden:

  1. liegt der Median beim Boxplot bei 6 und ein oberes Quartil taucht gar nicht auf bzw. es ist ebenfalls 6. Der Boxplot erscheint also - im Gegensatz zum Standardabweichungsbereich - arg rechtslastig.

Hier wäre natürlich zu fragen, weshalb der Boxplot so rechtslastig ausfällt

(Boxplots sind zwar sehr einfach zu erstellen, haben aber auch massive Nachteile; vgl. Bild ).

  1. geht der Standardabweichungsbereich rechts sogar über die 6 hinaus, nimmt also nicht existierende Werte (z.B. die Schulnote 6,5) an

(auch hier wäre zu klären, warum das passieren kann).

Wohlgemerkt: solche Erkenntnisse werden (vielleicht arg suggestiv) durch die Aufgabenstellung systematisch herausgekitzelt und doch nicht platt verraten.

Vielleicht reicht es aber, einige wenige Aufgaben vorzugeben - und dann wissen die SchülerInnen vielleicht selbst, wonach sie am besten suchen.

(Hier nur kleingedruckt, weil es nichts mit dem Programm zu tun hat, ansonsten aber am wichtigsten: insbesondere liegt es natürlich nahe, vom Anwendungsproblem auszugehen und interessante/ungewöhnliche Klassenarbeitsausfälle zu untersuchen, also z.B.

.

Und überhaupt sollte natürlich jeder Klassenarbeitsausfall interpretiert werden. Hier also: was ist in einer Klasse los, wenn es nur zwölf Einsen und zwölf Sechsen gibt, und welche pädagogischen Maßnahmen könnten da angebracht sein?

Interessant im Hinblick auf das Programm ist dabei allerdings nur, ob bzw. inwieweit Boxplot und Standardabweichung bei der Interpretation eines Klassenarbeitsausfalls helfen können.)

Nebenbei: die Möglichkeit, einige erhellende Aufgaben vorzugeben, hat auch der Programmierer des oben erwähnten fertigen Programms genutzt:

  1. wäre aber bei Computerprogrammen viel häufiger zu fragen, wie sie angelegt sein müssen, um pädagogisch sinnvoll zu sein, d.h. spezifische Erkenntnisse "hervorzukitzeln", ohne sie allerdings plump zu verraten.

Hier sei nochmals an die Grundeinstellung

des fertigen Computerprogramms aus dem Internet erinnert.

Da wird man doch fragen dürfen, warum der Programmierer

vorgegeben hat, was zu folgendem, arg langweiligem Ergebnis führt:

Und es gibt erstmal keine im Programm angelegte Motivation, zu weniger, überschaubaren Werten überzugehen oder bestimmten Sonderfällen nachzuspüren.

Bei meinem Programm ist das auch nicht besser, es sei denn, man geht von der Anwendung, also besonders interessanten Klassenarbeitsausfällen aus.

Wenn man aber davon ausgeht, ergeben sich aber durchaus interessante Fragen:

  1. wann sind Boxplot / Standardabweichung eher kontraproduktiv, d.h. grob irreführend?Ein schönes Beispiel ist ein Extremausfall wie folgender:

    Da suggeriert der nur noch aus einem Strich bestehende Boxplot, dass es überhaupt nur Sechsen gegeben hätte.

    Oder nehmen wir den anderen Extremfall

    Da unterscheidet sich der Boxplot in nichts von dem beim (bei gleicher Schülerzahl!)dramatisch anders gelagerten Fall

    Halten wir also fest: insbesondere der Boxplot hat (bei Extremfällen) extreme Nachteile: er ist allzu einfach gestrickt (ignoriert zu viele Details einer Verteilung), um sinnvolle Aussagen machen zu können.

    Interessant(er) ist aber allemal die verschiedene Breite der lila Bereiche in den beiden letztgenannten Beispielen: wenn dieser Bereich sehr breit ist oder gar die ganze Breite einnimmt, liegen sehr viele Datenwerte weit außen, und das ist eine durchaus sinnvolle Aussage zum vorletzten Beispiel.

  2. welche Unterschiede zwischen den Boxplots einerseits und der Standardabweichung andererseits gibt es?

Es wurde schon klar, dass beide manchmal dasselbe Ergebnis anzeigen.

Ein bereits oben bemerkter Unterschied ist, dass das Boxplot immer komplett im Datenbereich (von 1 bis 6) liegt, während der Standardabweichungsbereich unrealistisch über ihn hinaus gehen kann.

Ein weiterer Unterschied ist, dass der Boxplot dazu neigt, Ausreißer zu ignorieren (was manchmal durchaus sinnvoll ist), während der Standardabweichungsbereich sie nicht nur einbezieht, sondern sogar

(wegen der quadratischen Abstandsmessung vom Mittelwert) 

    besonders betont (was in anderen Fällen sinnvoll ist).

  1. welches der beiden Verfahren ist sinnvoller / aussagekräftiger?

Es hat sich bereits gezeigt, dass die Standardabweichung meistens erheblich aussagekräftiger als der simple Boxplot ist. 

  1. wo sind Boxplot / Standardabweichung über die rein numerische Liste und die Stabdiagramme / Funktionsgraphen hinaus aussagekräftig?

    (Hat es sich also - zumindest im Hinblick auf den Klassenarbeitsausfall - überhaupt gelohnt, sie einzuführen?)

Ich befürchte, die Antwort ist negativ: Boxplot und Standardabweichung liefern im vorliegenden Fall des Klassenarbeitsausfalls keine zusätzlichen Information, ja, sie entstellen die ursprüngliche Datenreihe sogar manchmal.

Mein mühevoller Programmierversuch ist also eher dem Umstand geschuldet,

Aber Vorsicht: meine negative Antwort gilt, wenn überhaupt, vorerst nur für den Fall, dass nur wenige Werte (1 bis 6) angenommen werden, also sowohl die numerische Liste als auch das Stabdiagramme / der Funktionsgraph leicht zu überschauen ist.

Vor allem aber sind die numerische sowie die Stabdiagramm-/Funktionsgraphendarstellung auch dem Laien verständlich, während er in der Regel keine Boxplots / Standardabweichungsbereiche interpretieren kann

(geschweige denn ihre mathematische Erstellung versteht).

Deshalb ist es einfach Blödsinn, wenn beispielsweise die Ergebnisse von Lernstandserhebungen mit Boxplots dargestellt werden: das verstehen weder die Nichtmathematiker unter den LehrerInnen noch gar Eltern und SchülerInnen. Aber es wirkt

(wie es sich für eine "Qualitätsagentur" gehört)

 ungemein wissenschaftlich und damit objektiv!