- Vorteile und Nachteile
- Nachteile der Reichweite als Maß für die Dispersion
- Interquartilbereich, Quartile und Arbeitsbeispiel
- - Berechnung von Quartilen
- Erstes Quartil
- Zweites Quartil oder Median
- Drittes Quartil
- Gearbeitetes Beispiel
- Lösung für
- Lösung b
- Lösung c
- Verweise
Der Bereich , die Reichweite oder die Amplitude in der Statistik ist die Differenz (Subtraktion) zwischen dem Maximalwert und dem Minimalwert eines Datensatzes aus einer Stichprobe oder einer Population. Wenn der Bereich durch den Buchstaben R dargestellt wird und die Daten durch x dargestellt werden, lautet die Formel für den Bereich einfach:
R = x max - x min
Dabei ist x max der Maximalwert der Daten und x min der Minimalwert.
Abbildung 1. Datenumfang, der der Bevölkerung von Cádiz in den letzten zwei Jahrhunderten entspricht. Quelle: Wikimedia Commons.
Das Konzept ist als einfaches Maß für die Streuung sehr nützlich, um die Variabilität der Daten schnell zu erkennen, da es die Ausdehnung oder Länge des Intervalls angibt, in dem die Daten gefunden werden.
Angenommen, die Größe einer Gruppe von 25 männlichen Ingenieurstudenten im ersten Studienjahr an einer Universität wird gemessen. Der größte Schüler in der Gruppe ist 1,93 m und der kürzeste 1,67 m. Dies sind die Extremwerte der Probendaten, daher lautet ihr Pfad:
R = 1,93 - 1,67 m = 0,26 m oder 26 cm.
Die Größe der Schüler in dieser Gruppe verteilt sich auf diesen Bereich.
Vorteile und Nachteile
Die Reichweite ist, wie bereits erwähnt, ein Maß für die Verteilung der Daten. Ein kleiner Bereich zeigt an, dass die Daten mehr oder weniger nahe beieinander liegen und die Streuung gering ist. Andererseits zeigt ein größerer Bereich an, dass die Daten stärker verteilt sind.
Die Vorteile der Berechnung des Bereichs liegen auf der Hand: Es ist sehr einfach und schnell zu finden, da es sich um einen einfachen Unterschied handelt.
Es hat auch die gleichen Einheiten wie die Daten, mit denen es arbeitet, und das Konzept ist für jeden Beobachter sehr einfach zu interpretieren.
Im Beispiel der Größe von Ingenieurstudenten würden wir bei einer Reichweite von 5 cm sagen, dass die Studenten alle ungefähr gleich groß sind. Bei einer Reichweite von 26 cm gehen wir jedoch sofort davon aus, dass sich Schüler aller mittleren Höhen in der Stichprobe befinden. Ist diese Annahme immer richtig?
Nachteile der Reichweite als Maß für die Dispersion
Wenn wir genau hinschauen, kann es sein, dass in unserer Stichprobe von 25 Ingenieurstudenten nur einer von ihnen 1,93 misst und die restlichen 24 Höhen nahe 1,67 m haben.
Und doch bleibt die Reichweite gleich, obwohl das Gegenteil durchaus möglich ist: Die Höhe der Mehrheit liegt bei 1,90 m und nur eine bei 1,67 m.
In beiden Fällen ist die Verteilung der Daten sehr unterschiedlich.
Die Nachteile des Bereichs als Maß für die Dispersion liegen darin, dass nur Extremwerte verwendet werden und alle anderen ignoriert werden. Da die meisten Informationen verloren gehen, wissen Sie nicht, wie die Beispieldaten verteilt werden.
Ein weiteres wichtiges Merkmal ist, dass der Bereich der Probe niemals abnimmt. Wenn wir mehr Informationen hinzufügen, dh mehr Daten berücksichtigen, erhöht sich der Bereich oder bleibt gleich.
In jedem Fall ist es nur nützlich, wenn mit kleinen Proben gearbeitet wird. Die alleinige Verwendung als Maß für die Dispersion in großen Proben wird nicht empfohlen.
Was getan werden muss, ist, es durch die Berechnung anderer Dispersionsmaße zu ergänzen, die die Informationen berücksichtigen, die durch die Gesamtdaten bereitgestellt werden: Interquartilbereich, Varianz, Standardabweichung und Variationskoeffizient.
Interquartilbereich, Quartile und Arbeitsbeispiel
Wir haben erkannt, dass die Schwäche des Bereichs als Maß für die Streuung darin besteht, dass nur die Extremwerte der Datenverteilung verwendet werden und die anderen weggelassen werden.
Um diese Unannehmlichkeiten zu vermeiden, werden Quartile verwendet: drei Werte, die als Positionsmaße bezeichnet werden.
Sie verteilen die nicht gruppierten Daten in vier Teile (andere weit verbreitete Positionsmaße sind Dezile und Perzentile). Dies sind seine Eigenschaften:
-Das erste Quartil Q 1 ist der Wert der Daten, sodass 25% von allen kleiner als Q 1 sind .
-Das zweite Quartil Q 2 ist der Median der Verteilung, was bedeutet, dass die Hälfte (50%) der Daten unter diesem Wert liegt.
- Schließlich zeigt das dritte Quartil Q 3 an, dass 75% der Daten kleiner als Q 3 sind .
Dann wird der Interquartilbereich oder Interquartilbereich als die Differenz zwischen dem dritten Quartil Q 3 und dem ersten Quartil Q 1 der Daten definiert:
Interquartilbereich = R Q = Q 3 - Q 1
Auf diese Weise wird der Wert des Bereichs R Q durch Extremwerte nicht so beeinflusst. Aus diesem Grund ist es ratsam, es zu verwenden, wenn es sich um verzerrte Verteilungen handelt, wie z. B. die oben beschriebenen sehr großen oder sehr kleinen Schüler.
- Berechnung von Quartilen
Es gibt verschiedene Möglichkeiten, sie zu berechnen. Hier schlagen wir eine vor. In jedem Fall ist es jedoch erforderlich, die Bestellnummer "N o " zu kennen, die der Platz ist, den das jeweilige Quartil in der Verteilung einnimmt.
Das heißt, wenn zum Beispiel der Term, der Q 1 entspricht, der zweite, der dritte oder der vierte usw. der Verteilung ist.
Erstes Quartil
N oder (Q 1 ) = (N + 1) / 4
Zweites Quartil oder Median
N oder (Q 2 ) = (N + 1) / 2
Drittes Quartil
N oder (Q 3 ) = 3 (N + 1) / 4
Wobei N die Anzahl der Daten ist.
Der Median ist der Wert, der genau in der Mitte der Verteilung liegt. Wenn die Anzahl der Daten ungerade ist, ist es kein Problem, sie zu finden. Wenn sie jedoch gerade sind, werden die beiden zentralen Werte gemittelt, um eins zu werden.
Sobald die Bestellnummer berechnet wurde, wird eine dieser drei Regeln befolgt:
-Wenn keine Dezimalstellen vorhanden sind, werden die in der Verteilung angegebenen Daten durchsucht und dies ist das gesuchte Quartil.
-Wenn die Bestellnummer auf halbem Weg zwischen zwei liegt, werden die durch den ganzzahligen Teil angegebenen Daten mit den folgenden Daten gemittelt, und das Ergebnis ist das entsprechende Quartil.
-In jedem anderen Fall wird es auf die nächste ganze Zahl gerundet und das ist die Position des Quartils.
Gearbeitetes Beispiel
Auf einer Skala von 0 bis 20 erhielt eine Gruppe von 16 Mathematik-I-Schülern bei einer Zwischenprüfung die folgenden Punkte (Punkte):
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Finden:
a) Der Bereich oder die Reichweite der Daten.
b) Die Werte der Quartile Q 1 und Q 3
c) Der Interquartilbereich.
Abbildung 2. Haben die Ergebnisse dieses Mathe-Tests so viel Variabilität? Quelle: Pixabay.
Lösung für
Um die Route zu finden, müssen Sie zunächst die Daten in aufsteigender oder absteigender Reihenfolge sortieren. Zum Beispiel in aufsteigender Reihenfolge haben Sie:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Verwenden Sie die am Anfang angegebene Formel: R = x max - x min
R = 20 - 1 Punkte = 19 Punkte.
Entsprechend dem Ergebnis weisen diese Bewertungen eine große Streuung auf.
Lösung b
N = 16
N oder (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Es ist eine Zahl mit Dezimalstellen, deren ganzzahliger Teil 4 ist. Dann gehen wir zur Verteilung, suchen nach den Daten, die den vierten Platz einnehmen, und ihr Wert wird mit dem der fünften Position gemittelt. Da beide 9 sind, beträgt der Durchschnitt auch 9 und so:
Q 1 = 9
Nun wiederholen wir den Vorgang, um Q 3 zu finden :
N oder (Q 3 ) = 3 (N + 1) / 4 = 3 (16 + 1) / 4 = 12,75
Wieder ist es eine Dezimalstelle, aber da es nicht die Hälfte ist, wird es auf 13 gerundet. Das gesuchte Quartil nimmt die dreizehnte Position ein und ist:
Q 3 = 16
Lösung c
R Q = Q 3 - Q 1 = 16 - 9 = 7 Punkte.
Was, wie wir sehen können, viel kleiner ist als der in Abschnitt a) berechnete Datenbereich, da die Mindestpunktzahl 1 Punkt betrug, ein Wert, der viel weiter vom Rest entfernt ist.
Verweise
- Berenson, M. 1985. Statistik für Management und Wirtschaft. Interamericana SA
- Canavos, G. 1988. Wahrscheinlichkeit und Statistik: Anwendungen und Methoden. McGraw Hill.
- Devore, J. 2012. Wahrscheinlichkeit und Statistik für Ingenieurwesen und Wissenschaft. 8 .. Auflage. Engagieren.
- Beispiele für Quartile. Wiederhergestellt von: matematicas10.net.
- Levin, R. 1988. Statistik für Administratoren. 2 .. Auflage. Prentice Hall.
- Walpole, R. 2007. Wahrscheinlichkeit und Statistik für Ingenieurwissenschaften und Naturwissenschaften. Pearson.