- Formeln und Gleichungen
- So berechnen Sie den Stichprobenfehler
- Für ein gewisses Maß an Vertrauen
- Beispiele
- - Beispiel 1
- Lösung
- - Beispiel 2
- Lösung
- - Beispiel 3
- Lösung
- - Beispiel 4
- Lösung
- - Übung 5
- Lösung
- Verweise
Der Stichprobenfehler oder Stichprobenfehler in der Statistik ist die Differenz zwischen dem Mittelwert einer Stichprobe und dem Mittelwert der Gesamtbevölkerung. Stellen wir uns zur Veranschaulichung der Idee vor, dass die Gesamtbevölkerung einer Stadt eine Million Menschen beträgt, von denen Sie die durchschnittliche Schuhgröße möchten, für die eine Zufallsstichprobe von tausend Menschen gezogen wird.
Die durchschnittliche Größe, die sich aus der Stichprobe ergibt, stimmt nicht unbedingt mit der der Gesamtbevölkerung überein. Wenn die Stichprobe jedoch nicht voreingenommen ist, muss der Wert nahe beieinander liegen. Diese Differenz zwischen dem Mittelwert der Stichprobe und dem der Gesamtpopulation ist der Stichprobenfehler.
Abbildung 1. Da die Stichprobe eine Teilmenge der Gesamtpopulation ist, weist der Stichprobenmittelwert eine Fehlerquote auf. Quelle: F. Zapata.
Der Mittelwert der Gesamtpopulation ist im Allgemeinen unbekannt, es gibt jedoch Techniken zur Reduzierung dieses Fehlers und Formeln zur Schätzung der Stichprobenfehlerspanne, die in diesem Artikel erörtert werden.
Formeln und Gleichungen
Nehmen wir an, wir möchten den Mittelwert eines bestimmten messbaren Merkmals x in einer Population der Größe N kennen, aber da N eine große Zahl ist, ist es nicht möglich, die Studie über die Gesamtpopulation durchzuführen, und wir nehmen eine Zufallsstichprobe von Größe n <
Der Mittelwert der Probe wird mit bezeichnet
Angenommen, m Proben werden aus der Gesamtpopulation N entnommen, alle gleich groß n mit Mittelwerten
Diese Mittelwerte sind nicht identisch und liegen alle um den Populationsmittelwert μ herum. Die Abtastfehlergrenze E gibt die erwartete Trennung der Mittelwerte an
Die Standardfehlerspanne ε der Stichprobe der Größe n beträgt:
ε = σ / √n
Dabei ist σ die Standardabweichung (Quadratwurzel der Varianz), die nach folgender Formel berechnet wird:
σ = √
Die Bedeutung der Standardfehlerspanne ε ist wie folgt:
Mittelwert
So berechnen Sie den Stichprobenfehler
Im vorherigen Abschnitt wurde die Formel zum Ermitteln der Standardfehlergrenze einer Stichprobe der Größe n angegeben, wobei das Wort Standard angibt, dass es sich um eine Fehlergrenze mit 68% iger Sicherheit handelt.
Dies zeigt an, dass 68% von ihnen Mittelwerte ergeben, wenn viele Proben der gleichen Größe n entnommen wurden
Es gibt eine einfache Regel, die als 68-95-99.7-Regel bezeichnet wird und es uns ermöglicht, die Stichprobenfehlergrenze E für Konfidenzniveaus von 68%, 95% und 99,7% leicht zu finden, da diese Grenze 1⋅ ε, 2 beträgt ⋅ ε bzw. 3⋅ ε.
Für ein gewisses Maß an Vertrauen
Wenn das Konfidenzniveau γ nicht eines der oben genannten ist, ist der Abtastfehler die Standardabweichung σ multipliziert mit dem Faktor Zγ, der durch das folgende Verfahren erhalten wird:
1.- Zunächst wird das Signifikanzniveau α bestimmt, das aus dem Konfidenzniveau γ durch folgende Beziehung berechnet wird: α = 1 - γ
2.- Dann müssen wir den Wert 1 - α / 2 = (1 + γ) / 2, der der akkumulierten Normalfrequenz zwischen -∞ und Zγ entspricht, in einer Normal- oder Gaußschen Verteilung berechnen, die für F (z) typisch ist und deren Definition ist in Abbildung 2 zu sehen.
3.- Die Gleichung F (Zγ) = 1 - α / 2 wird mittels der Tabellen der Normalverteilung (kumulativ) F oder mittels einer Computeranwendung gelöst, die die inverse Gaußsche Funktion F -1 hat .
Im letzteren Fall haben wir:
Zγ = G -1 (1 - α / 2).
4.- Schließlich wird diese Formel für den Stichprobenfehler mit einem Zuverlässigkeitsgrad γ angewendet:
E = Zγ ⋅ (σ / √n)
Abbildung 2. Tabelle der Normalverteilung. Quelle: Wikimedia Commons.
Beispiele
- Beispiel 1
Berechnen Sie die Standardfehlerspanne im Durchschnittsgewicht einer Stichprobe von 100 Neugeborenen. Die Berechnung des Durchschnittsgewichts war
Lösung
Die Standardfehlergrenze beträgt ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. Dies bedeutet, dass aus diesen Daten geschlossen werden kann, dass das Gewicht von 68% der Neugeborenen zwischen 2.950 kg und 3,25 kg liegt.
- Beispiel 2
Bestimmen Sie die Spanne des Stichprobenfehlers E und den Gewichtsbereich von 100 Neugeborenen mit einem Konfidenzniveau von 95%, wenn das mittlere Gewicht 3.100 kg mit der Standardabweichung σ = 1.500 kg beträgt.
Lösung
Wenn Regel 68 gilt; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε haben wir:
E = 2 · e = 2 · 0,15 kg = 0,30 kg
Mit anderen Worten, 95% der Neugeborenen haben ein Gewicht zwischen 2.800 kg und 3.400 kg.
- Beispiel 3
Bestimmen Sie den Gewichtsbereich der Neugeborenen in Beispiel 1 mit einer Konfidenzspanne von 99,7%.
Lösung
Der Stichprobenfehler mit einer Sicherheit von 99,7% beträgt 3 σ / √n, was für unser Beispiel E = 3 * 0,15 kg = 0,45 kg ist. Daraus folgt, dass 99,7% der Neugeborenen ein Gewicht zwischen 2.650 kg und 3.550 kg haben werden.
- Beispiel 4
Bestimmen Sie den Faktor Zγ für ein Konfidenzniveau von 75%. Bestimmen Sie die Fehlerquote bei der Stichprobe mit dieser Zuverlässigkeit für den in Beispiel 1 dargestellten Fall.
Lösung
Das Konfidenzniveau ist γ = 75% = 0,75, was mit dem Signifikanzniveau α durch die Beziehung γ = (1 - α) zusammenhängt, so dass das Signifikanzniveau α = 1 - 0,75 = 0 ist 25.
Dies bedeutet, dass die kumulative Normalwahrscheinlichkeit zwischen -∞ und Zγ beträgt:
P (Z ≤ Z & ggr;) = 1 - 0,125 = 0,875
Dies entspricht einem Zγ-Wert von 1.1503, wie in Abbildung 3 dargestellt.
Figure 3. Bestimmung des Zγ-Faktors entsprechend einem Konfidenzniveau von 75%. Quelle: F. Zapata durch Geogebra.
Mit anderen Worten ist der Abtastfehler E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Bei Anwendung auf die Daten aus Beispiel 1 ergibt sich ein Fehler von:
E = 1,15 · 0,15 kg = 0,17 kg
Mit einem Konfidenzniveau von 75%.
- Übung 5
Was ist das Konfidenzniveau, wenn Z α / 2 = 2,4 ist?
Lösung
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Das Signifikanzniveau ist:
α = 0,0164 = 1,64%
Und schließlich bleibt das Vertrauensniveau:
1- & agr; = 1 - 0,0164 = 100% - 1,64% = 98,36%
Verweise
- Canavos, G. 1988. Wahrscheinlichkeit und Statistik: Anwendungen und Methoden. McGraw Hill.
- Devore, J. 2012. Wahrscheinlichkeit und Statistik für Ingenieurwesen und Wissenschaft. 8 .. Auflage. Engagieren.
- Levin, R. 1988. Statistik für Administratoren. 2 .. Auflage. Prentice Hall.
- Sudman, S. 1982. Fragen stellen: Ein praktischer Leitfaden zur Fragebogendesign. San Francisco. Jossey Bass.
- Walpole, R. 2007. Wahrscheinlichkeit und Statistik für Ingenieurwissenschaften und Naturwissenschaften. Pearson.
- Wonnacott, TH und RJ Wonnacott. 1990. Einführungsstatistik. 5. Aufl. Wiley
- Wikipedia. Stichprobenfehler. Wiederhergestellt von: en.wikipedia.com
- Wikipedia. Fehlermarge. Wiederhergestellt von: en.wikipedia.com