Statistik / Wahrscheinlichkeitsrechnung

 

"[...] »probability« [...] that strange and deeply modern word [...]"
(zitiert nach )


"In probability theory the variables and the initial state are know, and the goal is to predict the most likely end result. In statistics the outcome is know, but the past cases are uncertain."
(zitiert nach ; anders gesagt: für die Wahrscheinlichkeitstheorie ist die Zukunft, für die Statistik die Vergangenheit ungewiss.)


"We all use probabilities and statistics in almost every decision we make, sometimes subconsciously. For instance, you probably don't know that the number of fatalities from automobile accidents in the U.S. was 42,636 in 2004. However, had that number been, say, 3 million, I'm sure you would have known about it. Furthermore, this knowledge would have probably caused you to think twice before getting into the car in the morning. Why do these precise data on road fatalities give us some confidence in our decision to drive? As we shall see shortly, a key ingredient to their reliability is the fact that they are based on very large numbers. The number of fatalities in Frio Town, Texas, with a population of forty-nine in 1969 would hardly have been equally convincing."
(ebenfalls zitiert nach )

Um gleich zu Anfang die Verwirrung vollständig zu machen:

Demnach

Demnach

Nach dieser Definition

Um solcher Begriffsverwirrung zu entgehen, spreche ich im Folgenden nicht mehr von "Stochastik", sondern nur noch von "Statistik" und "Wahrscheinlichkeitsrechnung" - und definiere sie in Anlehnung an die beiden letzten Zitate:

(und dann oftmals von einer repräsentativen Auswahl aus ihnen)

Oder kurz gesagt:

  • die Statistik beschäftigt sich mit der faktischen Vergangenheit oder Gegenwart,
  • die Wahrscheinlichkeitsrechnung beschäftigt sich mit der noch offenen Zukunft.
"Nehmt Abschied, Brüder,
Ungewiss ist alle Wiederkehr.
Die Zukunft liegt in Finsternis
Und macht das Herz so schwer."

Bemerkenswert, ja fast schon paradox ist, dass die Wahrscheinlichkeitsrechnung überhaupt Aussagen über die Zukunft machen kann, wenn auch immer nur mit einer gewissen Wahrscheinlichkeit:

"Und erstens kommt es anders
und zweitens als man denkt."
 

Daraus folgt dann beispielweise, dass

(der Mitte aus bereits Sicherem),

(der wahrscheinlichen Mitte aus Erwartetem). 

Und bei allem,

Ein Beispiel:

(solange ist die Lottoziehung ein Fall für die Wahrscheinlichkeitsrechnung),

(ab dann taugt die Lottoziehung nur noch für die Statistik).

Man könnte auch sagen: von den vielen Möglichkeiten, die es vorher gab, verschwinden bis auf eine einzige urplötzlich alle, und die letzte Möglichkeit gefriert zu einer Tatsache.

Man spricht auch von einem "Wahrscheinlichkeitskollaps":

Allemal interessant finde ich auch noch folgende Definition:

"In probability theory the variables and the initial state are known, and the goal is to predict the most likely end result. In statistics the outcome is known, but the past causes are uncertain."
(zitiert nach )

Ich würde allerdings ergänzen:

(z.B. die Wahrscheinlichkeit jedes zukünftigen Ereignisses),

(ausschnittshafte)

Endergebnis

(da es ja in der Vergangenheit liegt bzw. in der Gegenwart feststeht),

aber man kann nur Vermutungen darüber erarbeiten, wie es zustande gekommen ist

(was der Ausschnitt über das Ganze sagt bzw. nach welcher Logik das Ganze organisiert ist)


Ein Nachteil insbesondere der Statistik ist, dass sie erst bei sehr großen Datenmengen wirklich interessant wird: bei kleinen Datenmengen sieht man "alles" ja auf Anhieb, also ohne großartige Statistik.

Daraus folgt aber auch umgekehrt, dass man bei großen Datenmengen interessante Dinge eben nicht sofort sieht, d.h.