Der Tukey-Test ist eine Methode, mit der einzelne Mittelwerte aus einer Varianzanalyse mehrerer Proben verglichen werden sollen, die unterschiedlichen Behandlungen unterzogen wurden.
Der 1949 von John.W. Mit Tukey können wir erkennen, ob die erzielten Ergebnisse signifikant unterschiedlich sind oder nicht. Es ist auch bekannt als Tukeys ehrlich signifikanter Unterschiedstest (Tukeys HSD-Test).
Abbildung 1. Mit dem Tukey-Test können wir feststellen, ob die Unterschiede in den Ergebnissen zwischen drei oder mehr verschiedenen Behandlungen, die auf drei oder mehr Gruppen mit denselben Merkmalen angewendet werden, signifikant und ehrlich unterschiedliche Mittelwerte aufweisen.
In Experimenten, bei denen drei oder mehr verschiedene Behandlungen, die auf die gleiche Anzahl von Proben angewendet wurden, verglichen werden, muss festgestellt werden, ob die Ergebnisse signifikant unterschiedlich sind oder nicht.
Ein Experiment gilt als ausgewogen, wenn die Größe aller statistischen Proben für jede Behandlung gleich ist. Wenn die Größe der Proben für jede Behandlung unterschiedlich ist, wird ein unausgeglichenes Experiment durchgeführt.
Manchmal reicht es bei einer Varianzanalyse (ANOVA) nicht aus zu wissen, ob sie beim Vergleich verschiedener Behandlungen (oder Experimente), die auf mehrere Proben angewendet wurden, die Nullhypothese erfüllen (Ho: „Alle Behandlungen sind gleich“) oder im Gegenteil erfüllt die alternative Hypothese (Ha: "Mindestens eine der Behandlungen ist anders").
Tukeys Test ist nicht eindeutig, es gibt viel mehr Tests zum Vergleichen von Stichprobenmitteln, aber dies ist einer der bekanntesten und angewandten.
Tukey Komparator und Tabelle
Bei der Anwendung dieses Tests wird ein Wert w berechnet, der als Tukey-Komparator bezeichnet wird und dessen Definition wie folgt lautet:
w = q √ (MSE / r)
Wobei der Faktor q aus einer Tabelle (Tukey's Table) erhalten wird, die aus Reihen von q-Werten für unterschiedliche Anzahlen von Behandlungen oder Experimenten besteht. Die Spalten geben den Wert des Faktors q für verschiedene Freiheitsgrade an. Normalerweise haben die verfügbaren Tabellen eine relative Signifikanz von 0,05 und 0,01.
In dieser Formel erscheint innerhalb der Quadratwurzel der MSE-Faktor (Mean Square of Error) geteilt durch r, der die Anzahl der Wiederholungen angibt. Die MSE ist eine Zahl, die normalerweise aus einer Varianzanalyse (ANOVA) erhalten wird.
Wenn die Differenz zwischen zwei Mittelwerten den Wert w (Tukey-Komparator) überschreitet, wird der Schluss gezogen, dass es sich um unterschiedliche Durchschnittswerte handelt. Wenn die Differenz jedoch geringer als die Tukey-Zahl ist, handelt es sich um zwei Stichproben mit statistisch identischem Mittelwert .
Die Nummer w ist auch als HSD-Nummer (Honestly Significant Difference) bekannt.
Diese einzelne Vergleichszahl kann angewendet werden, wenn die Anzahl der für den Test jeder Behandlung verwendeten Proben in jeder von ihnen gleich ist.
Unausgeglichene Experimente
Wenn aus irgendeinem Grund die Größe der Proben bei jeder zu vergleichenden Behandlung unterschiedlich ist, unterscheidet sich das oben beschriebene Verfahren geringfügig und wird als Tukey-Kramer-Test bezeichnet.
Nun wird für jedes Behandlungspaar i, j eine Vergleichszahl w erhalten:
w (i, j) = q √ (½ MSE / (ri + rj))
In dieser Formel wird der Faktor q aus Tukeys Tabelle erhalten. Dieser Faktor q hängt von der Anzahl der Behandlungen und den Freiheitsgraden des Fehlers ab. r i ist die Anzahl der Wiederholungen in der Behandlung i, während r j die Anzahl der Wiederholungen in der Behandlung j ist.
Beispielfall
Ein Kaninchenzüchter möchte eine zuverlässige statistische Studie durchführen, aus der hervorgeht, welche der vier Marken von Kaninchenmastfutter am effektivsten ist. Für die Studie bildete er vier Gruppen mit sechs anderthalb Monate alten Kaninchen, die bis dahin die gleichen Fütterungsbedingungen hatten.
Die Gründe waren, dass in den Gruppen A1 und A4 Todesfälle aufgrund von Ursachen auftraten, die nicht auf Nahrung zurückzuführen waren, da eines der Kaninchen von einem Insekt gebissen wurde und im anderen Fall der Tod sicherlich die Ursache eines angeborenen Defekts war. Die Gruppen sind also unausgeglichen und es ist notwendig, den Tukey-Kramer-Test anzuwenden.
Übung gelöst
Um die Berechnungen nicht zu lange zu verlängern, wird ein ausgewogener Versuchsfall als gelöste Übung betrachtet. Folgendes wird als Daten verwendet:
In diesem Fall gibt es vier Gruppen, die vier verschiedenen Behandlungen entsprechen. Wir stellen jedoch fest, dass alle Gruppen die gleiche Anzahl von Daten haben, so dass es sich dann um einen ausgewogenen Fall handelt.
Zur Durchführung der ANOVA-Analyse wurde das in der Libreoffice-Tabelle enthaltene Tool verwendet. In anderen Tabellenkalkulationen wie Excel ist dieses Tool für die Datenanalyse integriert. Nachfolgend finden Sie eine Übersichtstabelle, die nach Durchführung der Varianzanalyse (ANOVA) erstellt wurde:
Aus der Varianzanalyse ergibt sich auch der P-Wert, der für das Beispiel 2,24E-6 beträgt und deutlich unter dem Signifikanzniveau von 0,05 liegt, was direkt zur Ablehnung der Nullhypothese führt: Alle Behandlungen sind gleich.
Das heißt, unter den Behandlungen haben einige unterschiedliche Mittelwerte, aber es ist notwendig zu wissen, welche sich aus statistischer Sicht unter Verwendung des Tukey-Tests signifikant und ehrlich unterscheiden (HSD).
Um die Zahl wo zu finden, da die HSD-Nummer auch bekannt ist, müssen wir das mittlere Quadrat der Fehler-MSE finden. Aus der ANOVA-Analyse wird erhalten, dass die Summe der Quadrate innerhalb der Gruppen SS = 0,2 ist; und die Anzahl der Freiheitsgrade innerhalb der Gruppen ist df = 16 mit diesen Daten können wir MSE finden:
MSE = SS / df = 0,2 / 16 = 0,0125
Es ist auch erforderlich, den Tukey-Faktor q anhand der Tabelle zu ermitteln. Spalte 4, die den 4 zu vergleichenden Gruppen oder Behandlungen entspricht, und Zeile 16 werden durchsucht, da die ANOVA-Analyse 16 Freiheitsgrade innerhalb der Gruppen ergab. Dies führt uns zu einem Wert von q, der gleich ist: q = 4,33, was 0,05 Signifikanz oder 95% Zuverlässigkeit entspricht. Schließlich wird der Wert für den "ehrlich signifikanten Unterschied" gefunden:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Um zu wissen, welche Gruppen oder Behandlungen ehrlich gesagt unterschiedlich sind, müssen Sie die Durchschnittswerte jeder Behandlung kennen:
Es ist auch notwendig, die Unterschiede zwischen den Mittelwerten von Behandlungspaaren zu kennen, die in der folgenden Tabelle gezeigt sind:
Es wird der Schluss gezogen, dass die besten Behandlungen zur Maximierung des Ergebnisses T1 oder T3 sind, die aus statistischer Sicht gleichgültig sind. Um zwischen T1 und T3 zu wählen, müsste man nach anderen Faktoren außerhalb der hier vorgestellten Analyse suchen. Zum Beispiel Preis, Verfügbarkeit usw.
Verweise
- Cochran William und Cox Gertrude. 1974. Versuchspläne. Dreschen. Mexiko. Dritter Nachdruck. 661p.
- Snedecor, GW und Cochran, WG 1980. Statistische Methoden. Siebte Ausgabe Iowa, The Iowa State University Press. 507p.
- Steel, RGD und Torrie, JH 1980. Prinzipien und Verfahren der Statistik: Ein biometrischer Ansatz (2. Aufl.). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Vergleich einzelner Mittelwerte bei der Varianzanalyse. Biometrics, 5: 99 & ndash; 114.
- Wikipedia. Tukeys Test. Wiederhergestellt von: en.wikipedia.com