- Arten von Freiheitsgraden
- In einem mechanischen Fall
- In einer Reihe von Zufallswerten
- Beispiele
- Varianz und Freiheitsgrade
- In der Chi-Quadrat-Verteilung
- Im Hypothesentest (mit gelöstem Beispiel)
- Verweise
Die Freiheitsgrade in der Statistik sind die Anzahl unabhängiger Komponenten eines Zufallsvektors. Wenn der Vektor n Komponenten hat und es p lineare Gleichungen gibt, die seine Komponenten in Beziehung setzen, ist der Freiheitsgrad np.
Das Konzept der Freiheitsgrade erscheint auch in der theoretischen Mechanik, wo sie in etwa der Raumdimension entsprechen, in der sich das Teilchen bewegt, abzüglich der Anzahl der Bindungen.
Abbildung 1. Ein Pendel bewegt sich in zwei Dimensionen, hat jedoch nur einen Freiheitsgrad, da es gezwungen ist, sich in einem Bogen mit dem Radius L zu bewegen. Quelle: F. Zapata.
In diesem Artikel wird das Konzept der Freiheitsgrade für Statistiken erörtert. Ein mechanisches Beispiel ist jedoch in geometrischer Form leichter zu visualisieren.
Arten von Freiheitsgraden
Abhängig vom Kontext, in dem es angewendet wird, kann die Art und Weise der Berechnung der Anzahl der Freiheitsgrade variieren, aber die zugrunde liegende Idee ist immer dieselbe: Gesamtdimensionen abzüglich Anzahl der Einschränkungen.
In einem mechanischen Fall
Betrachten wir ein oszillierendes Teilchen, das an eine Schnur (ein Pendel) gebunden ist, die sich in der vertikalen xy-Ebene (2 Dimensionen) bewegt. Das Teilchen ist jedoch gezwungen, sich auf dem Umfang des Radius zu bewegen, der der Länge der Sehne entspricht.
Da sich das Teilchen nur auf dieser Kurve bewegen kann, beträgt die Anzahl der Freiheitsgrade 1. Dies ist in Abbildung 1 zu sehen.
Die Anzahl der Freiheitsgrade wird berechnet, indem die Differenz aus der Anzahl der Dimensionen abzüglich der Anzahl der Einschränkungen berechnet wird:
Freiheitsgrade: = 2 (Dimensionen) - 1 (Ligatur) = 1
Eine weitere Erklärung, die es uns ermöglicht, zum Ergebnis zu gelangen, ist die folgende:
-Wir wissen, dass die Position in zwei Dimensionen durch einen Koordinatenpunkt (x, y) dargestellt wird.
-Aber da der Punkt für einen gegebenen Wert der Variablen x der Gleichung des Umfangs (x 2 + y 2 = L 2 ) entsprechen muss, wird die Variable y durch die Gleichung oder Einschränkung bestimmt.
Auf diese Weise ist nur eine der Variablen unabhängig und das System hat einen (1) Freiheitsgrad.
In einer Reihe von Zufallswerten
Um zu veranschaulichen, was das Konzept bedeutet, nehmen wir den Vektor an
x = (x 1 , x 2 ,…, x n )
Darstellung der Stichprobe von n normalverteilten Zufallswerten. In diesem Fall hat der Zufallsvektor x n unabhängige Komponenten und daher soll x n Freiheitsgrade haben.
Konstruieren wir nun den Vektor r der Residuen
r = (x 1 -
Wo
Also die Summe
(x 1 -
Es ist eine Gleichung, die eine Restriktion (oder Bindung) in den Elementen des Vektors r der Reste darstellt, da, wenn n-1 Komponenten des Vektors r bekannt sind , die Restriktionsgleichung die unbekannte Komponente bestimmt.
Daher der Vektor r der Dimension n mit der Einschränkung:
∑ (x i -
Es hat (n - 1) Freiheitsgrade.
Wiederum wird angewendet, dass die Berechnung der Anzahl der Freiheitsgrade ist:
Freiheitsgrade: = n (Dimensionen) - 1 (Einschränkungen) = n-1
Beispiele
Varianz und Freiheitsgrade
Die Varianz s 2 ist definiert als der Mittelwert des Quadrats der Abweichungen (oder Residuen) der Stichprobe von n Daten:
s 2 = ( r · r ) / (n - 1)
wobei r der Vektor der Residuen ist r = (x1 -
s 2 = ∑ (x i -
In jedem Fall sollte beachtet werden, dass bei der Berechnung des Durchschnitts des Quadrats der Residuen dieser durch (n-1) und nicht durch n geteilt wird, da, wie im vorherigen Abschnitt erläutert, die Anzahl der Freiheitsgrade des Vektors r ( n-1).
Wenn für die Berechnung der Varianz durch n anstelle von (n-1) geteilt würde, hätte das Ergebnis eine Verzerrung, die für Werte von n kleiner als 50 sehr signifikant ist.
In der Literatur erscheint die Varianzformel auch mit dem Divisor n anstelle von (n-1), wenn es um die Varianz einer Population geht.
Die Menge der Zufallsvariablen der Residuen, dargestellt durch den Vektor r , hat, obwohl sie die Dimension n hat, nur (n-1) Freiheitsgrade. Wenn die Anzahl der Daten jedoch groß genug ist (n> 500), konvergieren beide Formeln zum gleichen Ergebnis.
Taschenrechner und Tabellenkalkulationen liefern sowohl Versionen der Varianz als auch die Standardabweichung (die Quadratwurzel der Varianz).
In Anbetracht der hier vorgestellten Analyse empfehlen wir, immer die Version mit (n-1) zu wählen, wenn die Varianz oder Standardabweichung berechnet werden muss, um verzerrte Ergebnisse zu vermeiden.
In der Chi-Quadrat-Verteilung
Einige Wahrscheinlichkeitsverteilungen in kontinuierlichen Zufallsvariablen hängen von einem Parameter ab, der als Freiheitsgrad bezeichnet wird. Dies ist der Fall bei der Chi-Quadrat-Verteilung (χ 2 ).
Der Name dieses Parameters ergibt sich genau aus den Freiheitsgraden des zugrunde liegenden Zufallsvektors, für den diese Verteilung gilt.
Angenommen, wir haben g Populationen, aus denen Proben der Größe n entnommen werden:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 , … xg n )
Eine Bevölkerung j, die gemein hat
Die standardisierte oder normalisierte Variable zj i ist definiert als:
zj i = (xj i -
Und der Vektor Zj ist wie folgt definiert:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) und folgt der standardisierten Normalverteilung N (0,1).
Also die Variable:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 + … + Zg 1 ^ 2), …, (Z1 n ^ 2 + z2 n ^ 2 + … + Zg n ^ 2))
folgt der χ 2 (g) -Verteilung, die als Chi-Quadrat-Verteilung mit Freiheitsgrad g bezeichnet wird.
Im Hypothesentest (mit gelöstem Beispiel)
Wenn Sie Hypothesen basierend auf einem bestimmten Satz zufälliger Daten testen möchten, müssen Sie die Anzahl der Freiheitsgrade g kennen, um den Chi-Quadrat-Test anwenden zu können.
Abbildung 2. Gibt es einen Zusammenhang zwischen der Präferenz von Eiscreme FLAVOUR und dem GENDER des Kunden? Quelle: F. Zapata.
Als Beispiel werden die Daten analysiert, die über die Präferenzen von Schokolade oder Erdbeereis bei Männern und Frauen in einer bestimmten Eisdiele gesammelt wurden. Die Häufigkeit, mit der Männer und Frauen Erdbeere oder Schokolade wählen, ist in Abbildung 2 zusammengefasst.
Zunächst wird die Tabelle der erwarteten Häufigkeiten berechnet, die durch Multiplizieren der Gesamtzahl der Zeilen mit der Gesamtzahl der Spalten geteilt durch die Gesamtdaten erstellt wird. Das Ergebnis ist in der folgenden Abbildung dargestellt:
Abbildung 3. Berechnung der erwarteten Frequenzen basierend auf den beobachteten Frequenzen (Werte in blau in Abbildung 2). Quelle: F. Zapata.
Dann wird das Chi-Quadrat (aus den Daten) unter Verwendung der folgenden Formel berechnet:
χ 2 = ∑ (F o - F e ) 2 / F e
Wobei F o die beobachteten Frequenzen sind (Abbildung 2) und F e die erwarteten Frequenzen sind (Abbildung 3). Die Summierung geht über alle Zeilen und Spalten, die in unserem Beispiel vier Begriffe ergeben.
Nach den Operationen erhalten Sie:
χ 2 = 0,2043.
Nun ist es notwendig, mit dem theoretischen Chi-Quadrat zu vergleichen, das von der Anzahl der Freiheitsgrade g abhängt.
In unserem Fall wird diese Anzahl wie folgt bestimmt:
g = (# Zeilen - 1) (# Spalten - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Es stellt sich heraus, dass die Anzahl der Freiheitsgrade g in diesem Beispiel 1 ist.
Wenn Sie die Nullhypothese (H0: es gibt keine Korrelation zwischen GESCHMACK und GESCHLECHT) mit einem Signifikanzniveau von 1% überprüfen oder ablehnen möchten, wird der theoretische Chi-Quadrat-Wert mit dem Freiheitsgrad g = 1 berechnet.
Es wird der Wert gesucht, der die akkumulierte Frequenz (1 - 0,01) = 0,99, dh 99% macht. Dieser Wert (der aus den Tabellen entnommen werden kann) beträgt 6.636.
Wenn das theoretische Chi das berechnete überschreitet, wird die Nullhypothese verifiziert.
Mit anderen Worten, mit den gesammelten Daten wird keine Beziehung zwischen den Variablen GESCHMACK und GESCHLECHT beobachtet.
Verweise
- Minitab. Was sind die Freiheitsgrade? Wiederhergestellt von: support.minitab.com.
- Moore, David. (2009) Grundlegende angewandte Statistik. Antoni Bosch Herausgeber.
- Leigh, Jennifer. Berechnung von Freiheitsgraden in statistischen Modellen. Wiederhergestellt von: geniolandia.com
- Wikipedia. Freiheitsgrad (Statistik). Wiederhergestellt von: es.wikipedia.com
- Wikipedia. Freiheitsgrad (physisch). Wiederhergestellt von: es.wikipedia.com