Σ ξ ζ       statistik hilfe & info

statistik hilfe: Interpretation

Funktionen

Regressionen

Zwischen quantitativen Größen lassen sich funktionale Zusammenhänge finden. In den meisten Fällen, in denen ein derartiger Zusammenhang zu ermitteln versucht wird, gibt es einen solchen Zusammenhang auch. Aber es lässt sich gelegentlich auch ein Zusammenhang darstellen, der gar nicht existiert.

Die Ermittlung einer Funktionsgleichung wird als Regression bezeichnet. Für die Beurteilung der Qualität des Vorgehens wird zumeist der Korrelationskoeffizient r verwendet – dieser ist allerdings nur für Geraden definiert.

Die grafische Darstellung einer Funktion

In der grafischen Darstellung eines funktionalen Zusammenhanges werden die gemessenen Datenpunkte Pi=(x,y) in ein Standardkoordinatensystem eingetragen. Zusätzlich wird der Graf der ermittelten Funktionsgleichung eingetragen (hier eine blaue Gerade).

Gemessene Punkte werden oftmals in Form kleiner Kreise dargestellt, dies verdeutlicht die Ungenauigkeit einer jeden Messung

Die Genauigkeit einer Regression lässt sich gut über einen Streubereich der Daten darstellen. Hier wird etwa die Standardabweichung der Daten verwendet.

Zu beachten ist auch hier: Etwa 68% aller Daten liegen innerhalb des Bereiches der einfachen Standardabweichung. Für 95% der Daten ist der Bereich der zweifachen Standardabweichung zu verwenden.

Die mathematische Darstellung einer Funktion

Eine Funktion wird zunächst mittels einer Funktionsgleichung
f: y=f(x)
angegeben (im Beispiel
f: y=3.6 x +3.5).

Darüber hinaus wird für eine Gerade der Korrelationskoeffizient r angegeben.

Ein Korrelationskoeffizient sollte vom Absolutbetrag größer als 0.707 sein, also
0.707 < |r|
andernfalls ist es wahrscheinlicher, dass ein derart ermittelter Funktionszusammenhang nicht existiert. Dieses ist also eine Mindestanforderung und kein Kriterium für 'gut'.

Ein 'guter' Korrelationskoeffizient liegt in der Größenordnung 0.9 < |r|.

Die Abweichung der Daten von der Regressionsfunktion lässt sich besonders gut in normierter Form angeben. Dazu wird die Datenabweichung jeweils durch den theoretisch zu erwartenden Funktionswert dividiert. Diese relative Abweichung, die auch als Residuum bezeichnet wird, ist ein gutes Genauigkeitsmaß. Eine Aussage über die Sicherheit bezüglich des gefundenen Zusammenhanges ist sie aber nicht!

Im Beispiel ist die relative Datenabweichung 0.15, also 15%


Eine ausführliche Besprechung der Verfahren findet sich in meinem Lehrbuch Statistik und Wahrscheinlichkeit – leicht gemacht