- Formel und Gleichungen
- Unterschiede zur Binomialverteilung
- Beispiele
- Praktische Anwendungen
- Annäherung der Binomialverteilung an die Poisson-Verteilung
- Gelöste Übungen
- Übung 1
- Lösung c)
- Übung 2
- Lösung für)
- Verweise
Die Poisson-Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung, anhand derer die Wahrscheinlichkeit ermittelt werden kann, dass innerhalb einer großen Stichprobengröße und während eines bestimmten Intervalls ein Ereignis mit geringer Wahrscheinlichkeit auftritt.
Oft kann die Poisson-Verteilung anstelle der Binomialverteilung verwendet werden, solange die folgenden Bedingungen erfüllt sind: große Stichprobe und kleine Wahrscheinlichkeit.
Abbildung 1. Diagramm der Poisson-Verteilung für verschiedene Parameter. Quelle: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) schuf diese Distribution, die seinen Namen trägt und sehr nützlich ist, wenn es um unvorhersehbare Ereignisse geht. Poisson veröffentlichte seine Ergebnisse 1837, eine Untersuchung zur Wahrscheinlichkeit des Auftretens fehlerhafter strafrechtlicher Verurteilungen.
Später passten andere Forscher die Verteilung in anderen Gebieten an, zum Beispiel die Anzahl der Sterne, die in einem bestimmten Raumvolumen gefunden werden konnten, oder die Wahrscheinlichkeit, dass ein Soldat durch den Tritt eines Pferdes sterben würde.
Formel und Gleichungen
Die mathematische Form der Poisson-Verteilung lautet wie folgt:
- μ (manchmal auch als λ bezeichnet) ist der Mittelwert oder Parameter der Verteilung
- Eulernummer: e = 2,71828
- Die Wahrscheinlichkeit, y = k zu erhalten, ist P.
- k ist die Anzahl der Erfolge 0, 1,2,3 …
- n ist die Anzahl der Tests oder Ereignisse (die Stichprobengröße)
Diskrete Zufallsvariablen hängen, wie der Name schon sagt, vom Zufall ab und nehmen nur diskrete Werte an: 0, 1, 2, 3, 4…, k.
Der Mittelwert der Verteilung ergibt sich aus:
Die Varianz σ, die die Streuung der Daten misst, ist ein weiterer wichtiger Parameter. Für die Poisson-Distribution gilt:
σ = μ
Poisson stellte fest, dass bei n → ∞ und p → 0 der Mittelwert μ - auch als Erwartungswert bezeichnet - zu einer Konstanten tendiert:
-Die Ereignisse oder Ereignisse sind unabhängig voneinander und treten zufällig auf.
-Die Wahrscheinlichkeit P, dass ein bestimmtes Ereignis während eines bestimmten Zeitraums auftritt, ist sehr gering: P → 0.
-Die Wahrscheinlichkeit, dass mehr als ein Ereignis im Zeitintervall auftritt, beträgt 0.
-Der Durchschnittswert nähert sich einer Konstanten an, die gegeben ist durch: μ = np (n ist die Stichprobengröße)
- Da die Dispersion σ gleich μ ist, da sie größere Werte annimmt, wird auch die Variabilität größer.
-Ereignisse müssen im verwendeten Zeitintervall gleichmäßig verteilt sein.
-Die Menge möglicher Werte des Ereignisses y ist: 0,1,2,3,4….
-Die Summe der i-Variablen, die einer Poisson-Verteilung folgen, ist auch eine andere Poisson-Variable. Sein Durchschnittswert ist die Summe der Durchschnittswerte dieser Variablen.
Unterschiede zur Binomialverteilung
Die Poisson-Verteilung unterscheidet sich von der Binomialverteilung in folgenden wichtigen Punkten:
-Die Binomialverteilung wird sowohl von der Stichprobengröße n als auch von der Wahrscheinlichkeit P beeinflusst, die Poisson-Verteilung wird jedoch nur vom Mittelwert μ beeinflusst.
-In einer Binomialverteilung sind die möglichen Werte der Zufallsvariablen y 0,1,2,…, N, während es in der Poisson-Verteilung keine Obergrenze für diese Werte gibt.
Beispiele
Poisson wandte seine berühmte Distribution zunächst auf Rechtsfälle an, aber auf industrieller Ebene war eine seiner frühesten Anwendungen das Brauen von Bier. Bei diesem Verfahren werden Hefekulturen zur Fermentation verwendet.
Hefe besteht aus lebenden Zellen, deren Population über die Zeit variabel ist. Bei der Herstellung von Bier ist es notwendig, die notwendige Menge hinzuzufügen, daher ist es notwendig, die Menge an Zellen zu kennen, die pro Volumeneinheit vorhanden sind.
Während des Zweiten Weltkriegs wurde die Poisson-Verteilung verwendet, um herauszufinden, ob die Deutschen tatsächlich von Calais aus auf London zielten oder nur zufällig feuerten. Für die Alliierten war es wichtig festzustellen, wie gut die Technologie für die Nazis war.
Praktische Anwendungen
Die Anwendungen der Poisson-Verteilung beziehen sich immer auf Zeitzählungen oder Raumzählungen. Und da die Eintrittswahrscheinlichkeit gering ist, wird sie auch als "Gesetz der seltenen Ereignisse" bezeichnet.
Hier ist eine Liste von Ereignissen, die in eine dieser Kategorien fallen:
-Registrierung der Partikel in einem radioaktiven Zerfall, der wie das Wachstum von Hefezellen eine exponentielle Funktion ist.
-Anzahl der Besuche auf einer bestimmten Website.
- Ankunft von Personen an einer Leitung, um zu bezahlen oder besucht zu werden (Warteschlangentheorie).
- Anzahl der Autos, die in einem bestimmten Zeitintervall einen bestimmten Punkt auf einer Straße passieren.
Abbildung 2. Die Anzahl der Autos, die einen Punkt passieren, folgt ungefähr einer Poisson-Verteilung. Quelle: Pixabay.
-Mutationen litten in einer bestimmten DNA-Kette nach Bestrahlung.
- Anzahl der Meteoriten mit einem Durchmesser von mehr als 1 m pro Jahr gefallen.
-Defekte pro Quadratmeter eines Stoffes.
-Menge der Blutzellen in 1 Kubikzentimeter.
- Anrufe pro Minute zu einer Telefonzentrale.
-Schokoladenstückchen in 1 kg Kuchenteig.
-Anzahl der von einem bestimmten Parasiten infizierten Bäume in 1 Hektar Wald.
Beachten Sie, dass diese Zufallsvariablen die Häufigkeit darstellen, mit der ein Ereignis während eines festgelegten Zeitraums (Anrufe pro Minute an die Telefonzentrale) oder in einem bestimmten Raumbereich (Stoffdefekte pro Quadratmeter) auftritt.
Diese Ereignisse sind, wie bereits festgestellt, unabhängig von der Zeit, die seit dem letzten Auftreten vergangen ist.
Annäherung der Binomialverteilung an die Poisson-Verteilung
Die Poisson-Verteilung ist eine gute Annäherung an die Binomialverteilung, solange:
-Die Größe der Stichprobe ist groß: n ≥ 100
-Die Wahrscheinlichkeit p ist klein: p ≤ 0,1
- μ liegt in der Größenordnung von: np ≤ 10
In solchen Fällen ist die Poisson-Verteilung ein hervorragendes Werkzeug, da die Binomialverteilung in diesen Fällen schwierig anzuwenden sein kann.
Gelöste Übungen
Übung 1
Eine seismologische Studie ergab, dass es in den letzten 100 Jahren weltweit 93 große Erdbeben gab, von denen mindestens 6,0 auf der Richterskala (logarithmisch) lagen. Angenommen, die Poisson-Verteilung ist in diesem Fall ein geeignetes Modell. Finden:
a) Das durchschnittliche Auftreten großer Erdbeben pro Jahr.
b) Wenn P (y) die Wahrscheinlichkeit ist, dass Erdbeben in einem zufällig ausgewählten Jahr auftreten, ermitteln Sie die folgenden Wahrscheinlichkeiten:
Es ist ziemlich viel weniger als P (2).
Die Ergebnisse sind unten aufgeführt:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P. (7) = 0,0000471.
Zum Beispiel könnten wir sagen, dass es eine Wahrscheinlichkeit von 39,5% gibt, dass in einem bestimmten Jahr kein schweres Erdbeben auftritt. Oder dass in diesem Jahr 5,29% von 3 großen Erdbeben auftreten.
Lösung c)
c) Die Häufigkeiten werden analysiert, multipliziert mit n = 100 Jahren:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 und 0,00471.
Beispielsweise:
- Eine Häufigkeit von 39,5 zeigt an, dass in 39,5 von 100 Jahren 0 große Erdbeben auftreten. Man könnte sagen, dass dies dem tatsächlichen Ergebnis von 47 Jahren ohne größere Erdbeben ziemlich nahe kommt.
Vergleichen wir ein anderes Poisson-Ergebnis mit den tatsächlichen Ergebnissen:
- Der erhaltene Wert von 36,7 bedeutet, dass es in einem Zeitraum von 37 Jahren 1 großes Erdbeben gibt. Das tatsächliche Ergebnis ist, dass es in 31 Jahren 1 schweres Erdbeben gab, eine gute Übereinstimmung mit dem Modell.
- 17,1 Jahre werden mit 2 großen Erdbeben erwartet, und es ist bekannt, dass es in 13 Jahren, was ein enger Wert ist, tatsächlich 2 große Erdbeben gab.
Daher ist das Poisson-Modell für diesen Fall akzeptabel.
Übung 2
Ein Unternehmen schätzt, dass die Anzahl der Komponenten, die vor Erreichen von 100 Betriebsstunden ausfallen, einer Poisson-Verteilung folgt. Wenn die durchschnittliche Anzahl von Fehlern in dieser Zeit 8 beträgt, ermitteln Sie die folgenden Wahrscheinlichkeiten:
a) Dass eine Komponente in 25 Stunden ausfällt.
b) Ausfall von weniger als zwei Komponenten in 50 Stunden.
c) Mindestens drei Komponenten fallen innerhalb von 125 Stunden aus.
Lösung für)
a) Es ist bekannt, dass der Durchschnitt der Ausfälle in 100 Stunden 8 beträgt, daher wird in 25 Stunden ein Viertel der Ausfälle erwartet, dh 2 Ausfälle. Dies ist der μ-Parameter.
Die Wahrscheinlichkeit, dass 1 Komponente ausfällt, wird angefordert, die Zufallsvariable lautet "Komponenten, die vor 25 Stunden ausfallen" und ihr Wert ist y = 1. Durch Einsetzen der Wahrscheinlichkeitsfunktion:
Die Frage ist jedoch die Wahrscheinlichkeit, dass weniger als zwei Komponenten in 50 Stunden ausfallen, nicht dass genau zwei Komponenten in 50 Stunden ausfallen. Daher müssen wir die Wahrscheinlichkeiten hinzufügen, die:
-Keine scheitern
- Nur Fehler 1
Der Parameter μ der Verteilung ist in diesem Fall:
μ = 8 + 2 = 10 Fehler in 125 Stunden.
P (3 oder mehr Komponenten fallen aus) = 1 - P (0) - P (1) - P (2) =
Verweise
- MathWorks. Poisson-Verteilung. Wiederhergestellt von: es.mathworks.com
- Mendenhall, W. 1981. Statistik für Management und Wirtschaft. 3 .. Auflage. Grupo Editorial Iberoamérica.
- Stat Trek. Bringen Sie sich Statistik bei. Poisson-Verteilung. Wiederhergestellt von: stattrek.com,
- Triola, M. 2012. Elementare Statistik. 11 .. Ed. Pearson Education.
- Wikipedia. Poisson-Verteilung. Wiederhergestellt von: en.wikipedia.org