3. Begriffsklärung 1 Deskriptive Statistik: Ausgangspunkt sind Daten, die in ihrer Rohform oft als Urlisten vorliegen. Meistens sind diese Daten sehr umfangreich und im Einzelnen gar nicht mehr überblickbar. Um die Daten systematisch zu ordnen, zu charakterisieren und übersichtlich darzustellen wendet man die Methoden der beschreibenden Statistik an.
4. Begriffsklärung 2 Häufig wird in statistischen Erhebungen eine bestimmte Grundgesamtheit (eine z.B. Anzahl von Personen mittels Fragebogen) hinsichtlich bestimmter Variablen (Merkmale) befragt. Beispiele dazu sind:
9. Anwendungsbeispiele a) Geschlecht Seminargruppe: => Absolute, relative und prozentuelle Häufigkeit => Säulen- und Kreisdiagramm b) Zweitfachverteilung Seminargruppe: => Absolute, relative und prozentuelle Häufigkeit => Säulen- und Kreisdiagramm
10. Spannweite, Minimum und Maximum Geordnete Datenreihe: 28, 29, 30, 31, 33, 33, 35, 38 Spannweite: R = xMax - xMin R = xMin xMax
14. Median (Zentralwert) Ungerade Anzahl von Datenelementen: 28, 29, 30, 31, 33, 33, 35, 38, 40 Bei einer ungeraden Anzahl von Elementen in einer geordneten Datenreihe, ergibt sich der Median genau aus dem mittleren Element. xMed=33
15. Robustheit von Zentralmaßen Gehaltsstruktur in einer Firma: 1000, 1000, 1200, 1200, 1200, 1200, 1500, 4000 „Ausreißer“ bereinigen: 1000, 1000, 1200, 1200, 1200, 1200, 1500, 4000 x = z = m = x = z = m =
16. Quartile Mit den Quartilen q0, q1, q2, q3, q4 wird eine geordnete Datenreihe „geviertelt“. xMin xMax geordnete Datenreihe q0 q1 q2 q3 q4
17. Quartile Es gilt definitionsgemäß: q2 = z q3 und q1 sind die Mediane der oberen und unteren Hälfte. q3=zo q4=xMax q0=xMin q1=zu q2=z
20. Grafische Darstellung von Quartilen Die grafische Darstellung von Quartilen erfolgt in so genannten Kastenschau-bildern (Boxplots) Analog kann man geordnete Listen auch z.B. in 10 Teile (Dezile) oder 100 Teile (Centile) teilen. Gewicht / kg 40 Klasse 1a Klasse 1b 36,5 33 29,5 Schulklasse 28
23. Varianz Die Standardabweichung s ergibt sich aus der Quadratwurzel der Varianz, daher gilt für die Varianz: Häufig ist in der Literatur auch folgende Formel zu finden: Stichproben-umfang „Ausreißer bereinigt“