Help Online - Origin Help (2024)

Das Residuum ist definiert als:

Help Online - Origin Help (1)

Residuendiagramme können zum Beurteilen der Qualität einer Regression verwendet werden. Zurzeit werden fünf verschiedene Arten von Residuendiagrammen in dem Dialog der linearen Anpassung unterstützt

  • Residuum vs. Unabhängig
  • Residuum vs. Vorhergesagte Werte
  • Residuum vs. Reihenfolge der Daten
  • Histogramm des Residuums
  • Diagramm Differenz Residuen
  • Wahrscheinlichkeitsnetz der Residuen (Normal)

Diese Residuendiagramme können zum Beurteilen der Qualität der Regression verwendet werden. Sie können die zugrunde liegenden statistischen Annahmen über Residuen wie konstante Varianz, Unabhängigkeit der Variablen und die Normalverteilung überprüfen. Damit diese Annahmen für ein bestimmtes Regressionsmodell wahr bleiben, sollten die Residuen zufällig um Null verteilt sein.

Es können verschiedene Arten von Residuendiagrammen verwendet werden, um die Gültigkeit dieser Annahmen zu prüfen und Informationen zu liefern, wie das Modell verbessert werden kann. Das Streudiagramm der Residuen wird beispielsweise ungeordnet sein, wenn die Regression gut ist. Die Residuen sollten keine Trends aufweisen. Ein Trend würde anzeigen, dass die Residuen nicht unabhängig sind. Andererseits sollte das Histogramm der Residuen eine symmetrische glockenförmige Verteilung aufweisen, was anzeigt, dass die Annahme der Normalverteilung richtig ist.

Inhalt

  • 1 Fehlervarianz prüfen
  • 2 Nullpunktfehler des Prozesses prüfen
  • 3 Unabhängigkeit des Fehlerterms prüfen
  • 4 Normalverteilung der Varianzen prüfen
  • 5 Regressionsmodell mit Hilfe des Residuendiagramms verbessern
  • 6 Ausreißer mit Hilfe von Residuentransformation erkennen
  • 7 Konturdiagramme mit Residuen für die Oberflächenanpassung

Fehlervarianz prüfen

Ein Residuendiagramm, das einen ansteigenden Trend besitzt, lässt folgern, dass die Fehlervarianz mit der unabhängigen Variable ansteigt, während ein abfallender Trend anzeigt, dass die Fehlervarianz mit der unabhängigen Variable abfällt. Keine dieser Verteilungen besitzt ein konstantes Varianzmuster. Daher weisen sie darauf hin, dass die Annahme einer konstanten Varianz nicht zutrifft und die Regression nicht gut ist. Ein horizontales Muster hingegen deutet auf eine konstante Varianz der Residuen hin.

Help Online - Origin Help (2)

Nullpunktfehler des Prozesses prüfen

Das Diagramm Residuen vs. Ordnung der Daten kann zum Prüfen des Nullpunktfehlers der Varianz während des experimentellen Prozesses verwendet werden, wenn die Daten zeitlich geordnet sind. Sind die Residuen zufällig um Null verteilt, bedeutet dies, dass in dem Prozess kein Nullpunktfehler vorliegt.

Help Online - Origin Help (3)

Unabhängigkeit des Fehlerterms prüfen

Das verzögerte Residuendiagramm, erstellt durch Zeichnen des Residuums (i) gegen Residuum (i-1), ist nützlich für die Überprüfung der Abhängigkeit von Fehlertermen. Jedes nicht zufällige Muster in einem verzögertem Diagramm deutet darauf hin, dass die Varianz nicht zufällig ist.

Help Online - Origin Help (4)


Handelt es sich bei den analysierten Daten um Daten einer Zeitreihe (sequenziell aufgezeichnete Daten), zeigt das Diagramm Residuen vs. Ordnung der Daten die Korrelation zwischen Fehlerterm und Zeit an. Schwankende Muster um Null zeigen an, dass der Fehlerterm abhängig ist.

Help Online - Origin Help (5)

Das verzögerte Residuendiagramm zeigt, dass der Fehlerterm unabhängig ist.

Help Online - Origin Help (6)

Residuendiagramme für Zeitreihendaten

Help Online - Origin Help (7)

Normalverteilung der Varianzen prüfen

Das Histogramm der Residuen kann verwendet werden, um zu prüfen, ob die Varianz normalverteilt ist. Ein symmetrisches glockenförmiges Histogramm, das gleichmäßig um Null verteilt ist, zeigt an, dass die Annahme der Normalverteilung wahr ist. Zeigt das Histogramm, dass ein Zufallsfehler nicht normalverteilt ist, lässt dies vermuten, dass die dem Modell zugrunde liegenden Annahmen verletzt wurden.

Das Histogramm der Residuen zeigt, dass die Abweichung normalverteilt ist.

Help Online - Origin Help (8)

Das Wahrscheinlichkeitsnetz der Residuen (Normal) kann verwendet werden, um zu prüfen, ob die Varianz ebenfalls normalverteilt ist. Wenn das sich ergebende Diagramm linear ist, nehmen wir weiterhin an, dass die Fehlerterme normal verteilt sind. Das Diagramm basiert auf Perzentilen versus geordnete Residuen. Die Perzentile werden geschätzt von

Help Online - Origin Help (9)

wobei n die Gesamtanzahl der Datensätze und i die i-ten Daten sind. Das Wahrscheinlichkeitsnetz der Residuen (Normal) sieht folgendermaßen aus:

Wahrscheinlichkeitsnetz der Residuen (Normal)

Help Online - Origin Help (10)

Regressionsmodell mit Hilfe des Residuendiagramms verbessern

Die Strukturen der Residuendiagramme helfen nicht nur beim Prüfen der Güte eines Regressionsmodells, sie können auch helfen, es zu verbessern. Ein gekrümmtes Muster im Diagramm Residuen vs. Unabhängige deutet zum Beispiel darauf hin, dass ein Term höherer Ordnung zu dem Anpassungsmodell hinzugefügt werden sollte.

Help Online - Origin Help (11)

Dies ist nur ein Beispiel und sicherlich gibt es viele weitere, die aus dem Muster der Residuendiagramme entnommen werden können. Wir empfehlen, dass Sie für weitere Informationen die statistischen Referenzen am Ende dieses Kapitels/ Abschnitts lesen.

Ausreißer mit Hilfe von Residuentransformation erkennen

Wenn Sie nach Ausreißern in Ihren Daten suchen, kann es sinnvoll sein, die Residuen zu transformieren, um standardisierte, studentisierte oder studentisiert gelöschte Residuen zu erhalten. Diese transformierten Residuen werden wie folgt berechnet:

Standardisiert

Help Online - Origin Help (12)

Studentisiert

Sind auch bekannt als intern studentisierte Residuen.

Help Online - Origin Help (13)

Studentisiert gelöscht

Sind auch bekannt als extern studentisierte Residuen.

Help Online - Origin Help (14)


In den Gleichungen der studentisierten und studentisiert gelöschten Residuen ist Help Online - Origin Help (15) das i-te diagonale Element der Matrix P:

Help Online - Origin Help (16)

wobei F die Matrix der partiellen Ableitungen für ein nichtlineares Regressionsmodell ist.

In der linearen Regression ist die unabhängige Matrix X einfach gleich F.

Help Online - Origin Help (17)

Als Beispiel der Verwendung von transformierten Residuen skalieren die standardisierten Residuen die Residuenwerte mit Hilfe des Standardfehlers der Regression neu, so dass bei Geltung der Regressionsannahmen -- dies bedeutet, dass die Daten normalverteilt sind -- über 95% der Datenpunkte innerhalb von 2σ um die angepasste Kurve liegen sollten. Dementsprechend sollten 95% der standardisierten Residuen im Bereich -2 bis +2 im Residuendiagramm liegen.

Diese Variationen der Residuendiagramme sind sehr nützlich beim Entdecken von Ausreißern. Beispielsweise werden in dem Diagramm Standardisiertes Residuum vs. Unabhängig die Residuen mit Hilfe des Standardfehlers der Regression neu skaliert. Wenn die Regressionsannahmen gelten, d.h., die Daten sind normalverteilt, sollten ungefähr 95% der Datenpunkte innerhalb von 2σ um die angepasste Kurve verteilt sein, so dass folglich 95% der standardisierten Residuen zwischen -2 und +2 fallen, wie in der Abbildung unten zu sehen.

Help Online - Origin Help (18)

Daher sollten Residuen, die sich außerhalb dieses Bereichs befinden, genauer untersucht werden, da es sich bei diesen Punkten um Ausreißer handeln könnte.

Konturdiagramme mit Residuen für die Oberflächenanpassung

Wenn Sie mit Hilfe einer OriginPro-Standardfunktion eine Oberfläche anpassen, wird ein Konturdiagramm der Residuen in der XY-Ebene erstellt. Die Konturintervalle sind durch den Sigmawert (den Modellfehler) festgelegt. Wie im Fall einer 2D-Anpassung sollte eine gute Anpassung der Regressionsoberfläche kein erkennbares Muster im Konturdiagramm der Residuen erzeugen.

Certainly! The provided text delves into residual analysis and its significance in evaluating regression models. Residuals, defined as the differences between observed and predicted values in a regression model, are crucial in assessing the model's quality. The article covers various residual plots used to evaluate assumptions regarding residuals in regression analysis:

  1. Error Variance Check: Residual plots indicating increasing or decreasing trends imply changing error variance concerning independent variables, violating the assumption of constant variance. Horizontal patterns suggest constant variance in residuals, crucial for a well-fitted regression model.

  2. Process Zero Error Check: Residuals plotted against the order of data help assess the process zero error. If residuals are randomly distributed around zero, it implies no process zero error.

  3. Independence of Error Terms Check: Delayed residual plots (residuals vs. lagged residuals) reveal patterns indicating dependency among error terms. Non-random patterns in these plots suggest non-random variance. For time series data, patterns in the "residuals vs. order of data" plot reveal correlation between error term and time.

  4. Normality of Variances Check: Histograms and probability plots of residuals help assess the normality assumption. Symmetrical bell-shaped histograms centered around zero indicate normal distribution, validating the assumption.

  5. Improving Regression Models Using Residual Analysis: Identifying patterns in residual plots helps not only in evaluating but also in improving regression models. For instance, curved patterns in "residuals vs. independent variables" plots suggest adding higher-order terms to the model.

  6. Detecting Outliers through Residual Transformation: Transforming residuals to standardized, studentized, or deleted residuals helps identify outliers. These transformations involve scaling residual values using regression standard errors, aiding in outlier detection.

  7. Contour Plots with Residuals for Surface Fitting: When fitting surfaces using software like OriginPro, contour plots of residuals in the XY plane help visualize the regression surface's goodness of fit. A well-fitted surface should not exhibit recognizable patterns in its residual contour plot.

Each aspect mentioned in the text contributes to understanding and validating the assumptions underlying regression analysis through residual analysis. From checking error variance to detecting outliers and assessing normality, these methods aid in both evaluating and refining regression models.

Help Online - Origin Help (2024)
Top Articles
Latest Posts
Article information

Author: Tish Haag

Last Updated:

Views: 6264

Rating: 4.7 / 5 (47 voted)

Reviews: 94% of readers found this page helpful

Author information

Name: Tish Haag

Birthday: 1999-11-18

Address: 30256 Tara Expressway, Kutchburgh, VT 92892-0078

Phone: +4215847628708

Job: Internal Consulting Engineer

Hobby: Roller skating, Roller skating, Kayaking, Flying, Graffiti, Ghost hunting, scrapbook

Introduction: My name is Tish Haag, I am a excited, delightful, curious, beautiful, agreeable, enchanting, fancy person who loves writing and wants to share my knowledge and understanding with you.