[Weiter] [Zurück] [Zurück (Ende)] [Ende] [Hoch]
Nun schauen wir uns den Einfluss eines einzelnen Punktes und die Quadrate nochmal genauer an. Wir nehmen hierzu wieder ein zufällig ausgewähltes lineares Modell und führen die Schätzung durch (schwarze Linie). Danach fügen wir einen zusätzlichen Punkt ein A (blaues Kreuz) und schätzen erneut (blaue Linie). A liegt zunächst auf der Schätzgeraden (bei x=-1). Deshalb ändert er das Schätzergebnis nicht. Sie können den Punkt aber bewegen und sehen, welchen Einfluss ein einzelner Punkt auf das Schätzergebnis hat.
Wenn Sie den Punkt A an den Rand bewegen, fällt auf, dass bereits ein einzelner Punkt das Schätzergebnis total verändern und sogar in Gegenteil drehen kann! Ein weit außen liegender Punkt erhält aufgrund des Quadrate Kriteriums überproportional viel Gewicht. Man nennt einen solchen Punkt Ausreißer. Schätzer, die nicht so sensibel auf einzelne Punkte reagieren heißen robust, Beispiel Median.
Die unten stehende Tabelle zeigt Ihnen den wahren Wert der Parameter, die über die Kleinste-Quadrate-Regression geschätzen Werte und die KQ-Schätzung mit den zusätzlichen Punkt A an.
wahr | geschätzt | geschätzt mit A | |
---|---|---|---|
α | |||
β |
Wenn Sie A bewegen, ändern sich die geschätzten Parameter und die Schätzgerade (blau). Wenn Sie A möglichst weit von der ursprünglichen Schätzung (schwarz) wegziehen, kann die Kurve sogar kippen, d.h. aus einer positiven Steigung kann eine negative werden. Ein einzelner Punkt, wenn er weit außen liegt, kann also aus einem positiv geschätzten Zusammenhang einen negativen machen. Deshalb ist es wichtig, solche "Ausreißer" in den Daten zu identifizieren und gesondert zu überprüfen, ob es sich und valide Werte oder Fehler (Meßfehler, Gerätedefekte, Übertragungsfehler, Schreibfehler, usw.) handelt.
Unten angegeben sind noch die Wert zu den Residuen. Interessant ist sicherlich auch noch der folgende Vergleich der Residuenquadratsumme mit dem Residuum von A bezogen auf die alte Schätzung ohne A, d.h. wir veranschaulichen, welches Gewicht der Punkt A auf die Schätzung hätte. Es fällt auf, dass der Einfluss des einzelnen Punktes A, wenn er weit außen liegt, beim quadratishen Kriterium immer viel höher ist, als bei den Absolutbeträgen. Deshalb reagiert die Kleinste-Quadrate Schätzung auch stärker auf Ausreißer. Ausreißer kann man in der Regel gut im Residuenplot erkennen, da sie herausragen.
Summe ohne A | A bezüglich der alten Schätzung | Verhältnis in Prozent | |
---|---|---|---|
absolute Residuen | |||
Residuenquadrate |
wahr | geschätzt | neues Modell mit A | |
---|---|---|---|
Durchschnitt der Residuen | |||
Durchschnitt der Absolutbeträge der Residuen | |||
Durchschnitt der Quadrate der Residuen |
[Weiter] [Zurück] [Zurück (Ende)] [Anfang] [Hoch]