- Erklärung des Problems im Mann-Whitney-U-Test
- Qualitative Variablen versus quantitative Variablen
- Normalfall
- Fall mit nicht normalem Trend
- Gepaarte oder ungepaarte Proben
- Eigenschaften des Mann Whitney U-Tests
- Mann-Whitney-Formel
- Schritte zum Anwenden des Tests
- Praktisches Anwendungsbeispiel
- - Schritt 1
- - Schritt 2
- Region A.
- Region B.
- Schritt 3
- Schritt 4
- Vergleichskriterien
- Online-Rechner für den Mann-Whitney-U-Test
- Verweise
Der Mann-Whitney-U-Test wird zum Vergleich zweier unabhängiger Proben angewendet, wenn diese nur wenige Daten haben oder keiner Normalverteilung folgen. Auf diese Weise wird es im Gegensatz zu seinem Gegenstück, dem Student-t-Test, als nicht parametrischer Test betrachtet, der verwendet wird, wenn die Stichprobe groß genug ist und der Normalverteilung folgt.
Frank Wilcoxon schlug es 1945 zum ersten Mal für Proben identischer Größe vor, aber zwei Jahre später wurde es von Henry Mann und DR Whitney für Proben unterschiedlicher Größe erweitert.
Abbildung 1. Der Mann-Whitney-U-Test wird zum Vergleich unabhängiger Proben angewendet. Quelle: Pixabay.
Der Test wird häufig angewendet, um zu überprüfen, ob ein Zusammenhang zwischen einer qualitativen und einer quantitativen Variablen besteht.
Ein anschauliches Beispiel besteht darin, eine Gruppe von Bluthochdruckpatienten zu nehmen und zwei Gruppen zu extrahieren, aus denen die täglichen Blutdruckdaten für einen Monat aufgezeichnet werden.
Behandlung A wird auf eine Gruppe und Behandlung B auf eine andere angewendet. Hier ist der Blutdruck die quantitative Variable und die Art der Behandlung die qualitative.
Wir möchten wissen, ob der Median und nicht der Mittelwert der gemessenen Werte statistisch gleich oder unterschiedlich ist, um festzustellen, ob zwischen beiden Behandlungen ein Unterschied besteht. Um die Antwort zu erhalten, wird die Wilcoxon-Statistik oder der Mann-Whitney-U-Test angewendet.
Erklärung des Problems im Mann-Whitney-U-Test
Ein weiteres Beispiel, in dem der Test angewendet werden kann, ist das folgende:
Angenommen, Sie möchten wissen, ob sich der Konsum von Erfrischungsgetränken in zwei Regionen des Landes erheblich unterscheidet.
Eine davon heißt Region A und die andere Region B. Über den wöchentlich verbrauchten Liter werden in zwei Proben Aufzeichnungen geführt: eine von 10 Personen für Region A und eine weitere von 5 Personen für Region B.
Die Daten sind wie folgt:
-Region A : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Region B : 12,14, 11, 30, 10
Die folgende Frage stellt sich:
Qualitative Variablen versus quantitative Variablen
-Qualitative Variable X : Region
-Quantitative Variable Y : Konsum von Erfrischungsgetränken
Wenn die Menge der verbrauchten Liter in beiden Regionen gleich ist, wird die Schlussfolgerung gezogen, dass zwischen den beiden Variablen keine Abhängigkeit besteht. Der Weg, dies herauszufinden, besteht darin, den mittleren oder mittleren Trend für die beiden Regionen zu vergleichen.
Normalfall
Wenn die Daten einer Normalverteilung folgen, werden zwei Hypothesen vorgeschlagen: die Null H0 und die Alternative H1 durch den Vergleich zwischen den Mitteln:
- H0 : Es gibt keinen Unterschied zwischen dem Mittelwert der beiden Regionen.
- H1 : Die Mittelwerte beider Regionen sind unterschiedlich.
Fall mit nicht normalem Trend
Im Gegenteil, wenn die Daten keiner Normalverteilung folgen oder die Stichprobe einfach zu klein ist, um sie zu kennen, wird der Median der beiden Regionen verglichen, anstatt den Mittelwert zu vergleichen.
- H0 : Es gibt keinen Unterschied zwischen dem Median der beiden Regionen.
- H1 : Die Mediane beider Regionen sind unterschiedlich.
Wenn die Mediane übereinstimmen, ist die Nullhypothese erfüllt: Es gibt keinen Zusammenhang zwischen dem Konsum von Erfrischungsgetränken und der Region.
Und wenn das Gegenteil passiert, ist die alternative Hypothese wahr: Es gibt eine Beziehung zwischen Konsum und Region.
In diesen Fällen ist der Mann-Whitney-U-Test angezeigt.
Gepaarte oder ungepaarte Proben
Die nächste wichtige Frage bei der Entscheidung, ob der Mann Whitney U-Test angewendet werden soll, ist, ob die Anzahl der Daten in beiden Stichproben identisch ist, dh, dass sie gleich sind.
Wenn die beiden Beispiele gepaart werden, gilt die ursprüngliche Wilcoxon-Version. Wenn nicht, wie im Beispiel, wird der modifizierte Wilcoxon-Test angewendet, der genau der Mann Whitney U-Test ist.
Eigenschaften des Mann Whitney U-Tests
Der Mann-Whitney-U-Test ist ein nicht parametrischer Test, der auf Proben angewendet werden kann, die nicht der Normalverteilung folgen oder nur wenige Daten enthalten. Es hat die folgenden Eigenschaften:
1.- Vergleichen Sie die Mediane
2.- Es funktioniert auf bestellten Bereichen
3.- Es ist weniger mächtig, was bedeutet, dass Macht die Wahrscheinlichkeit ist, die Nullhypothese abzulehnen, wenn sie tatsächlich falsch ist.
Unter Berücksichtigung dieser Eigenschaften wird der Mann-Whitney-U-Test angewendet, wenn:
-Die Daten sind unabhängig
- Sie folgen nicht der Normalverteilung
-Die Nullhypothese H0 wird akzeptiert, wenn die Mediane der beiden Stichproben übereinstimmen: Ma = Mb
-Die alternative Hypothese H1 wird akzeptiert, wenn sich die Mediane der beiden Stichproben unterscheiden: Ma ≠ Mb
Mann-Whitney-Formel
Die Variable U ist die im Mann-Whitney-Test verwendete Kontraststatistik und wird wie folgt definiert:
Dies bedeutet, dass U der kleinste der Werte zwischen Ua und Ub ist, der auf jede Gruppe angewendet wird. In unserem Beispiel wäre es für jede Region: A oder B.
Die Variablen Ua und Ub werden nach folgender Formel definiert und berechnet:
Ua = Na Nb + Na (Na + 1) / 2 - Ra
Ub = Na Nb + Nb (Nb + 1) / 2 - Rb
Hier sind die Na- und Nb-Werte die Größen der Proben, die den Regionen A bzw. B entsprechen, und Ra und Rb sind ihrerseits die Rang-Summen, die wir unten definieren werden.
Schritte zum Anwenden des Tests
1.- Bestellen Sie die Werte der beiden Proben.
2.- Weisen Sie jedem Wert einen Ordnungsrang zu.
3.- Korrigieren Sie die vorhandenen Bindungen in den Daten (wiederholte Werte).
4.- Berechnen Sie Ra = Summe der Ränge von Probe A.
5.- Finden Sie Rb = Summe der Ränge von Probe B.
6.- Bestimmen Sie den Wert Ua und Ub gemäß den im vorherigen Abschnitt angegebenen Formeln.
7.- Vergleichen Sie Ua und Ub, und die kleinere der beiden wird der experimentellen U-Statistik (dh der Daten) zugeordnet, die mit der theoretischen oder normalen U-Statistik verglichen wird.
Praktisches Anwendungsbeispiel
Nun wenden wir das oben Genannte auf das Problem der zuvor angesprochenen Erfrischungsgetränke an:
Region A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Region B: 12,14, 11, 30, 10
Abhängig davon, ob die Mittelwerte beider Proben statistisch gleich oder unterschiedlich sind, wird die Nullhypothese akzeptiert oder verworfen: Es gibt keine Beziehung zwischen den Variablen Y und X, dh der Konsum von Erfrischungsgetränken hängt nicht von der Region ab:
H0: Ma = Mb
H1: Ma ≠ Mb
Abbildung 2. Daten zum Konsum von Erfrischungsgetränken in den Regionen A und B. Quelle: F. Zapata.
- Schritt 1
Wir ordnen die Daten gemeinsam für die beiden Stichproben und ordnen die Werte vom niedrigsten zum höchsten:
Beachten Sie, dass der Wert 11 zweimal vorkommt (einmal in jeder Probe). Ursprünglich hat es Positionen oder Bereiche 3 und 4, aber um den einen oder anderen nicht zu überschätzen oder zu unterschätzen, wird der Durchschnittswert als Bereich gewählt, dh 3,5.
In ähnlicher Weise fahren wir mit dem Wert 12 fort, der dreimal mit den Bereichen 5, 6 und 7 wiederholt wird.
Nun, dem Wert 12 wird der durchschnittliche Bereich von 6 = (5 + 6 + 7) / 3 zugewiesen. Und dasselbe gilt für den Wert 14, der an den Positionen 8 und 9 eine Ligatur aufweist (erscheint in beiden Proben), und ihm wird der Durchschnittsbereich 8,5 = (8 + 9) / 2 zugewiesen.
- Schritt 2
Als nächstes werden die Daten für Region A und B erneut getrennt, aber jetzt werden ihre entsprechenden Bereiche in einer anderen Zeile zugewiesen:
Region A.
Region B.
Die Bereiche Ra und Rb werden aus den Summen der Elemente der zweiten Reihe für jeden Fall oder jede Region erhalten.
Schritt 3
Die jeweiligen Ua- und Ub-Werte werden berechnet:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Experimenteller Wert U = min (19, 31) = 19
Schritt 4
Es wird angenommen, dass das theoretische U einer Normalverteilung N mit Parametern folgt, die ausschließlich durch die Größe der Proben gegeben sind:
N ((na⋅nb) / 2, √)
Um die experimentell erhaltene Variable U mit dem theoretischen U zu vergleichen, muss die Variable geändert werden. Wir gehen von der experimentellen Variablen U zu ihrem standardisierten Wert über, der Z genannt wird, um den Vergleich mit dem einer standardisierten Normalverteilung durchführen zu können.
Die Änderung der Variablen ist wie folgt:
Z = (U - na.nb / 2) / √
Es ist zu beachten, dass für die Änderung der Variablen die Parameter der theoretischen Verteilung für U verwendet wurden. Dann wird die neue Variable Z, die ein Hybrid zwischen dem theoretischen U und dem experimentellen U ist, einer standardisierten Normalverteilung N (0,1) gegenübergestellt ).
Vergleichskriterien
Wenn Z ≤ Zα ⇒ ist, wird die Nullhypothese H0 akzeptiert
Wenn Z> Zα ⇒, lehne die Nullhypothese H0 ab
Die standardisierten kritischen Zα-Werte hängen vom erforderlichen Konfidenzniveau ab, beispielsweise wird für ein Konfidenzniveau α = 0,95 = 95%, das am üblichsten ist, der kritische Wert Zα = 1,96 erhalten.
Für die hier gezeigten Daten:
Z = (U - na nb / 2) / √ = -0,73
Welches ist unter dem kritischen Wert 1,96.
Die endgültige Schlussfolgerung lautet also, dass die Nullhypothese H0 akzeptiert wird:
Online-Rechner für den Mann-Whitney-U-Test
Es gibt spezielle Programme für statistische Berechnungen, einschließlich SPSS und MINITAB, aber diese Programme werden bezahlt und ihre Verwendung ist nicht immer einfach. Dies liegt an der Tatsache, dass sie so viele Optionen bieten, dass ihre Verwendung praktisch Experten für Statistik vorbehalten ist.
Glücklicherweise gibt es eine Reihe sehr genauer, kostenloser und benutzerfreundlicher Online-Programme, mit denen Sie unter anderem den Mann-Whitney-U-Test durchführen können.
Diese Programme sind:
-Sozialwissenschaftliche Statistik (socscistatistics.com), die sowohl den Mann-Whitney-U-Test als auch den Wilcoxon-Test für ausgeglichene oder gepaarte Stichproben enthält.
-AI-Therapiestatistik (ai-therapy.com), die mehrere der üblichen Tests der deskriptiven Statistik enthält.
-Statistic to Use (physics.csbsju.edu/stats), eine der ältesten, so dass die Benutzeroberfläche möglicherweise veraltet aussieht, obwohl es sich dennoch um ein sehr effizientes kostenloses Programm handelt.
Verweise
- Dietrichson. Quantitative Methoden: Rangprüfung. Wiederhergestellt von: bookdown.org
- Marín J P. SPSS-Leitfaden: Analyse und Verfahren in nichtparametrischen Tests. Wiederhergestellt von: halweb.uc3m.es
- USAL MOOC. Nichtparametrische Tests: Mann-Whitney U. Wiederhergestellt von: youtube.com
- Wikipedia. Mann-Whitney-U-Test. Wiederhergestellt von: es.wikipedia.com
- XLSTAT. Hilfezentrum. Mann-Whitney-Test-Tutorial in Excel. Wiederhergestellt von: help.xlsat.com