- Formeln und Gleichungen
- Wichtige statistische Variablen
- Modell und Eigenschaften
- Haupteigenschaften der hypergeometrischen Verteilung
- Approximation unter Verwendung der Binomialverteilung
- Beispiel 2
- Gelöste Übungen
- Übung 1
- Lösung
- Übung 2
- Lösung
- Übung 3
- Lösung für
- Lösung c
- Verweise
Die hypergeometrische Verteilung ist eine diskrete statistische Funktion, die zur Berechnung der Wahrscheinlichkeit in randomisierten Experimenten mit zwei möglichen Ergebnissen geeignet ist. Voraussetzung für die Anwendung ist, dass es sich um kleine Populationen handelt, bei denen die Entnahmen nicht ersetzt werden und die Wahrscheinlichkeiten nicht konstant sind.
Wenn daher ein Element der Population ausgewählt wird, um das Ergebnis (wahr oder falsch) eines bestimmten Merkmals zu kennen, kann dasselbe Element nicht erneut ausgewählt werden.
Abbildung 1. In einer solchen Bolzenpopulation gibt es sicherlich fehlerhafte Proben. Quelle: Pixabay.
Sicherlich ist es wahrscheinlicher, dass das nächste ausgewählte Element ein echtes Ergebnis erzielt, wenn das vorherige Element ein negatives Ergebnis hatte. Dies bedeutet, dass die Wahrscheinlichkeit variiert, wenn Elemente aus der Stichprobe extrahiert werden.
Die Hauptanwendungen der hypergeometrischen Verteilung sind: Qualitätskontrolle in Prozessen mit geringer Population und Berechnung von Wahrscheinlichkeiten in Glücksspielen.
Die mathematische Funktion, die die hypergeometrische Verteilung definiert, besteht aus drei Parametern:
- Anzahl der Bevölkerungselemente (N)
- Probengröße (m)
- Anzahl der Ereignisse in der gesamten Bevölkerung mit einem günstigen (oder ungünstigen) Ergebnis des untersuchten Merkmals (n).
Formeln und Gleichungen
Die Formel für die hypergeometrische Verteilung gibt die Wahrscheinlichkeit P an, dass x günstige Fälle eines bestimmten Merkmals auftreten. Die Art und Weise, es mathematisch zu schreiben, basierend auf den kombinatorischen Zahlen, ist:
Im vorherigen Ausdruck sind N, n und m Parameter und x ist die Variable selbst.
- Gesamtbevölkerung ist N.
- Die Anzahl der positiven Ergebnisse eines bestimmten binären Merkmals in Bezug auf die Gesamtbevölkerung beträgt n.
- Die Menge der Elemente in der Stichprobe beträgt m.
In diesem Fall ist X eine Zufallsvariable, die den Wert x annimmt, und P (x) gibt die Wahrscheinlichkeit des Auftretens von x günstigen Fällen des untersuchten Merkmals an.
Wichtige statistische Variablen
Andere statistische Variablen für die hypergeometrische Verteilung sind:
- Mittelwert μ = m * n / N.
- Varianz σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Standardabweichung σ, die die Quadratwurzel der Varianz ist.
Modell und Eigenschaften
Um zum Modell der hypergeometrischen Verteilung zu gelangen, gehen wir von der Wahrscheinlichkeit aus, x günstige Fälle in einer Stichprobe der Größe m zu erhalten. Dieses Beispiel enthält Elemente, die der untersuchten Eigenschaft entsprechen, und Elemente, die dies nicht tun.
Denken Sie daran, dass n die Anzahl der günstigen Fälle in der Gesamtpopulation von N Elementen darstellt. Dann würde die Wahrscheinlichkeit folgendermaßen berechnet:
Wenn man das Obige in Form von kombinatorischen Zahlen ausdrückt, wird das folgende Wahrscheinlichkeitsverteilungsmodell erreicht:
Haupteigenschaften der hypergeometrischen Verteilung
Sie sind wie folgt:
- Die Stichprobe muss immer klein sein, auch wenn die Population groß ist.
- Die Elemente der Stichprobe werden einzeln extrahiert, ohne sie wieder in die Population aufzunehmen.
- Die zu untersuchende Eigenschaft ist binär, dh sie kann nur zwei Werte annehmen: 1 oder 0 oder wahr oder falsch.
In jedem Element-Extraktionsschritt ändert sich die Wahrscheinlichkeit in Abhängigkeit von den vorherigen Ergebnissen.
Approximation unter Verwendung der Binomialverteilung
Eine weitere Eigenschaft der hypergeometrischen Verteilung besteht darin, dass sie durch die mit Bi bezeichnete Binomialverteilung angenähert werden kann, solange die Population N groß und mindestens zehnmal größer als die Probe m ist. In diesem Fall würde es so aussehen:
Die Wahrscheinlichkeit, dass x = 3 Schrauben in der Probe defekt sind, beträgt: P (500, 5, 60, 3) = 0,0129.
Die Wahrscheinlichkeit, dass x = 4 Schrauben aus den sechzig der Probe defekt sind, beträgt: P (500, 5, 60; 4) = 0,0008.
Schließlich ist die Wahrscheinlichkeit, dass x = 5 Schrauben in dieser Probe defekt sind, wie folgt: P (500, 5, 60; 5) = 0.
Wenn Sie jedoch die Wahrscheinlichkeit wissen möchten, dass in dieser Stichprobe mehr als 3 defekte Schrauben vorhanden sind, müssen Sie die kumulative Wahrscheinlichkeit ermitteln und Folgendes hinzufügen:
Dieses Beispiel ist in Abbildung 2 dargestellt, die mit GeoGebra erstellt wurde, einer freien Software, die in Schulen, Instituten und Universitäten weit verbreitet ist.
Abbildung 2. Beispiel für eine hypergeometrische Verteilung. Vorbereitet von F. Zapata mit GeoGebra.
Beispiel 2
Ein spanisches Deck hat 40 Karten, von denen 10 Gold haben und die restlichen 30 nicht. Angenommen, aus diesem Deck werden zufällig 7 Karten gezogen, die nicht wieder in das Deck aufgenommen werden.
Wenn X die Anzahl der Goldstücke ist, die in den 7 gezogenen Karten vorhanden sind, ist die Wahrscheinlichkeit, x Gold in einem 7-Karten-Zug zu haben, durch die hypergeometrische Verteilung P (40,10,7; x) gegeben.
Lassen Sie uns das so sehen: Um die Wahrscheinlichkeit zu berechnen, 4 Gold in einem 7-Karten-Draw zu haben, verwenden wir die Formel der hypergeometrischen Verteilung mit den folgenden Werten:
Und das Ergebnis ist: 4,57% Wahrscheinlichkeit.
Wenn Sie jedoch die Wahrscheinlichkeit kennen möchten, mehr als 4 Karten zu erhalten, müssen Sie Folgendes hinzufügen:
Gelöste Übungen
Die folgenden Übungen sollen die in diesem Artikel vorgestellten Konzepte veranschaulichen und verarbeiten. Es ist wichtig, dass der Leser versucht, sie selbst zu lösen, bevor er sich die Lösung ansieht.
Übung 1
Eine Kondomfabrik hat festgestellt, dass von 1000 Kondomen, die von einer bestimmten Maschine hergestellt werden, 5 defekt sind. Zur Qualitätskontrolle werden 100 Kondome nach dem Zufallsprinzip entnommen und das Los wird abgelehnt, wenn mindestens eines oder mehrere defekt sind. Antworten:
a) Wie groß ist die Möglichkeit, dass viele 100 weggeworfen werden?
b) Ist dieses Qualitätskontrollkriterium effizient?
Lösung
In diesem Fall erscheinen sehr große kombinatorische Zahlen. Die Berechnung ist schwierig, es sei denn, Sie haben ein geeignetes Softwarepaket.
Da es sich jedoch um eine große Population handelt und die Stichprobe zehnmal kleiner als die Gesamtpopulation ist, kann die Näherung der hypergeometrischen Verteilung durch die Binomialverteilung verwendet werden:
In dem obigen Ausdruck ist C (100, x) eine kombinatorische Zahl. Dann wird die Wahrscheinlichkeit, mehr als einen Defekt zu haben, wie folgt berechnet:
Es ist eine ausgezeichnete Annäherung im Vergleich zu dem Wert, der durch Anwenden der hypergeometrischen Verteilung erhalten wird: 0,4102
Es kann gesagt werden, dass mit einer Wahrscheinlichkeit von 40% eine Charge von 100 Prophylaktika verworfen werden sollte, was nicht sehr effizient ist.
Da der Qualitätskontrollprozess jedoch etwas weniger anspruchsvoll ist und die Partie 100 nur dann verworfen wird, wenn zwei oder mehr Fehler vorliegen, sinkt die Wahrscheinlichkeit, die Partie zu verwerfen, auf nur 8%.
Übung 2
Eine Kunststoffblockmaschine arbeitet so, dass von 10 Stück eines deformiert herauskommt. Wie wahrscheinlich ist es bei einer Stichprobe von 5 Stück, dass nur ein Stück defekt ist?
Lösung
Bevölkerung: N = 10
Anzahl n der Defekte für jedes N: n = 1
Probengröße: m = 5
Daher besteht eine 50% ige Wahrscheinlichkeit, dass in einer Stichprobe von 5 ein Block deformiert wird.
Übung 3
Bei einem Treffen junger Abiturienten gibt es 7 Damen und 6 Herren. Unter den Mädchen studieren 4 Geisteswissenschaften und 3 Naturwissenschaften. In der Jungengruppe studiert 1 Geisteswissenschaften und 5 Naturwissenschaften. Berechnen Sie Folgendes:
a) Drei Mädchen nach dem Zufallsprinzip auswählen: Wie wahrscheinlich ist es, dass sie alle Geisteswissenschaften studieren?
b) Wenn drei Teilnehmer des Freundeskreises nach dem Zufallsprinzip ausgewählt werden: Wie groß ist die Möglichkeit, dass drei von ihnen, unabhängig vom Geschlecht, alle drei Naturwissenschaften studieren oder alle drei Geisteswissenschaften?
c) Wählen Sie nun zufällig zwei Freunde aus und nennen Sie x die Zufallsvariable "Anzahl derjenigen, die Geisteswissenschaften studieren". Bestimmen Sie zwischen den beiden ausgewählten den Mittelwert oder den erwarteten Wert von x und die Varianz σ ^ 2.
Lösung für
Die jetzt zu verwendenden Werte sind:
-Population: N = 14
-Quantität, die Buchstaben studiert, ist: n = 6 und die
-Größe der Probe: m = 3.
-Anzahl der Freunde, die Geisteswissenschaften studieren: x
Demnach bedeutet x = 3, dass alle drei Geisteswissenschaften studieren, aber x = 0 bedeutet, dass keiner Geisteswissenschaften studiert. Die Wahrscheinlichkeit, dass alle drei gleich studieren, ergibt sich aus der Summe:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Dann haben wir eine Wahrscheinlichkeit von 21%, dass drei zufällig ausgewählte Besprechungsteilnehmer dasselbe lernen.
Lösung c
Hier haben wir folgende Werte:
N = 14 Gesamtbevölkerung von Freunden, n = 6 Gesamtzahl in der geisteswissenschaftlichen Bevölkerung, die Stichprobengröße beträgt m = 2.
Hoffnung ist:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
Und die Varianz:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Verweise
- Diskrete Wahrscheinlichkeitsverteilungen. Wiederhergestellt von: biplot.usal.es
- Statistik und Wahrscheinlichkeit. Hypergeometrische Verteilung. Wiederhergestellt von: projectdescartes.org
- CDPYE-UGR. Hypergeometrische Verteilung. Wiederhergestellt von: ugr.es.
- Geogebra. Klassische Geogebra, Wahrscheinlichkeitsrechnung. Von geogebra.org wiederhergestellt
- Versuchen Sie es einfach. Gelöste Probleme der hypergeometrischen Verteilung. Wiederhergestellt von: probafacil.com
- Minitab. Hypergeometrische Verteilung. Wiederhergestellt von: support.minitab.com
- Universität von Vigo. Diskrete Hauptverteilungen. Wiederhergestellt von: anapg.webs.uvigo.es
- Vitutor. Statistik und Kombinatorik. Wiederhergestellt von: vitutor.net
- Weisstein, Eric W. Hypergeometrische Verteilung. Wiederhergestellt von: mathworld.wolfram.com
- Wikipedia. Hypergeometrische Verteilung. Wiederhergestellt von: es.wikipedia.com