Éteres. Química Orgánica. Propiedades y reacciones
Estadistica descriptiva
1. ESTADISTICA DESCRIPTIVA
Objetivo: Resumir un grupo de datos mediante
el uso de la moda, la media aritmética, la
mediana, los cuartiles, el máximo y el mínimo,
e interpretar la información que proporcionan
dichas medidas.
2. ESTADISTICA
• La estadística es una rama de la matemática
que recoge, organiza, presenta analiza e
interpreta datos con el fin de propiciar la toma
de decisiones más eficaz.
Douglas A. Lind
3. EJEMPLOS USO DE ESTADISTICA
• En la Biblia se registra con el censo que exigía
a los pobladores volver a su lugar de origen,
por esto fue que Jesús nació en Belén y se
cumplió una profecía.
• Se llevó registro de los muertos por la Peste
Negra en la Edad Media, esto es estadística.
• Las encuestas son ejemplos del uso de la
estadística.
4. Descriptiva e Inferencial
• Estadística descriptiva se basa en medidas de
posición para describir situaciones o
características de los datos.
• Estadística inferencial se basa en el uso de
muestreo para determinar características
aplicables a toda la población.
5. Estadística Descriptiva
Método para organizar, resumir y presentar datos de
manera informativa.
• Objetivos
A. Organizar los datos cualitativos en una tabla
de frecuencias.
B. Organizar la tabla de frecuencias en barras,
pastel o histogramas.
C. Organizar datos cuantitativos en una
distribución de frecuencias .
D. Representar en histogramas o polígonos.
6. Construcción de Tabla de Frecuencias
• Concepto de tabla de frecuencias:
• Agrupa datos cualitativos en clases
mutuamente excluyentes.
• Frecuencias relativas:
• Muestra el porcentaje de participación de
un dato dado con relación al total de datos. A
estos datos se les conoce también con el
nombre de observaciones.
7. Vehículos vendidos Cantidad Frecuencia
Tipo Numero Relativa
Vehículos locales 50 0.625
Vehiculos
importados
30 0.375
total 80 1
8. Utilidad de una distribución de
frecuencias
• Una distribución de frecuencias busca
acomodar los datos en una tabla que muestra
las clases y el número de observaciones que
hay en cada clase.
• El objetivo de este procedimiento es revelar
rápidamente la concentración y distribución
de datos para un mejor análisis de la
información.
9. Formas numéricas de describir datos
cuantitativos.
I. Medidas de ubicación
Se les llama también promedios .
a. Su propósito es señalar el centro de un
conjunto de valores.
b. Ejemplos de medidas de ubicación:
“La casa promedio en Costa Rica cambia
de dueño cada 22.4 años”.
“El salario inicial promedio para un
graduado de la carrera de administración
en el año 2015 era de 558.000 colones al
mes”
“En undécimo año del 2015 el promedio
de notas en matemática fue de 83.23”
“En Chicago, la temperatura media más
alta es de 29 C grados en julio y de 1 C en
enero”.
Medidas de tendencia central
a. Media aritmética
b. Moda
c. Mediana
d. Cuartiles
e. Máximos y
mínimos
10. La media aritmética
• Es la suma de los valores de la muestra
divididos entre el numero total de valores de
la muestra.
• = Ex
• n
• En mode stat: shift 1 2
11. Propiedades de la media aritmética
1. Todo conjunto de datos posee una media
2. Todos los valores se encuentras incluidos en el
cálculo de la media
3. La media es única
4. La media es un punto de equilibrio en un
conjunto de datos
Desventaja:
La media se ve afectada en exceso por valores
grandes o pequeños poco comunes.
12. La Mediana
• Punto medio de los valores una vez que se han
ordenado de mayor a menor o viceversa.
Precios de vehículos en miles de dólares
6000
6500
7000 Esta es la mediana
8000
12000
13. La Mediana
• Propiedades:
a. La mediana se determina para cualquier nivel de datos excepto para
datos nominales.
b. Se requiere por lo menos la escala ordinal de medición
c. Tiene la ventaja que no influyen en ella valores extremadamente
grandes o pequeños.
d. Cincuenta por ciento de las observaciones son más grandes que la
mediana, cincuenta por ciento de las observaciones son más
pequeñas que la mediana.
e. Esta medida es única para un conjunto de datos.
f. Permite ver un valor intermedio entre el grupo de datos.
14. La Moda
• Es el valor de la observación que aparece con
más frecuencia.
• Propiedades
a. Es posible determinar la moda para todos los
niveles de datos (nominales y ordinales).
Desventaja: Puede que no haya moda en un
grupo de datos si no se repiten datos.
15. La media geométrica
• Se utiliza para determinar la razón de cambio
de un periodo a otro.
• Es la raíz enésima del producto de n valores
positivos
• Propiedades:
1. Es siempre igual o menor que la media
aritmética
2. Se usa cuando se necesita comparar
16. Valores máximos y mínimos
• El rango es la diferencia entre el valor máximo
y el mínimo en un conjunto de datos.
• Shift 1 6 da: 1. min X 2 max X
Propiedades
1. Solo dos valores se emplean y es fácil.
2. Recibe la influencia de los valores extremos
17. Los Cuartiles
• Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes porcentualmente iguales
• Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los
datos.
• Q2 coincide con la mediana pues se encuentra a la mitad del conjunto de datos
• Identificar los cuartiles:
• Primer cuartil (Q1) como la mediana de la primera mitad de valores.
• Segundo cuartil (Q2) como la propia mediana de la serie.
• Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
• La diferencia entre el tercer cuartil y el primero se conoce como rango
intercuartílico. Se representa gráficamente como la anchura de las cajas en los
llamados diagramas de cajas.
18. Identificar los cuartiles
• Sean n datos ordenados, entonces
• Para el primer cuartil: (n + 1)/4
• Para el segundo cuartil: es la mediana de los
datos.
• Para el tercer cuartil: 3(n + 1)/4
19. Ejemplo de cuartiles
Calcular los cuartiles las series estadísticas: 3, 5, 2, 7, 6, 4, 9.
1. Acomodar en orden de menor a mayor: 2, 3, 4, 5, 6, 7, 9
2. Vemos que n = 7 entonces aplicamos la formula para el primer cuartil:
(n + 1)/4 = 2 . Esto significa que el número 3 es donde esta el Q1.
3. El segundo cuartil es lo mismo que la mediana que es el punto medio de los
valores. Como se trata de 7 elementos el punto medio es fácil de identificar y es el
número 5.
4. El tercer cuartil, aplicamos la formula 3(n + 1)/4 y nos da la posición 6, que es el
número 7.
20. Distribución simétrica
• Tiene forma de campana y posee la misma
forma a cualquier lado del centro. Tiene
simetría y por lo tanto un eje de simetría.
• En la distribución simétrica, la moda, la
mediana y la media siempre son iguales.
22. Distribución con sesgo Positivo
• En una distribución con sesgo o asimétrica la
relación en tres las tres medidas cambia y los
valores tienen a concentrarse a la derecha
A. La media aritmética es la mayor medida pues es
influenciada por valores extremadamente altos
B. La moda será la menor de las medidas
C. Si la distribución tiene un sesgo muy
pronunciado, la media no sería una medida
adecuada. La mediana y la moda serían más
representativas.
24. Distribución con Sesgo Negativo
• La distribución está sesgada a la izquierda.
A. La media es la menor de la medida de las tres
medidas de tendencia central.
B. La mediana es mayor que la media aritmética
y la moda es la más grande de las tres
medidas.
C. Si el sesgo es muy pronunciado, la media no
debe usarse para representar datos
26. Medidas de dispersión
1. El rango es la medida más simple. Representa
la diferencia entre los valores máximo y
mínimo de un conjunto de datos.
2. Mientras menor sea el rango entre dos
valores significa que los valores se
encuentran más cercanos a la media.
3. Mientras mayor sea el rango entre dos
valores significa que los valores se alejan más
de la media.
27. Desviación Media
• La desventaja del rango estriba en que parte
de dos valores: mínimo y máximo.
• La desviación media mide la cantidad media
respecto de la cual los valores de una
población o muestra varían.
• Desviación Media: Es la media aritmética de
los valores absolutos de las desviaciones con
respecto a la media aritmética.
28. Ventajas de la Desviación media
1. Incluye todos los valores de los cálculos, no
solo valores máximos o mínimos como el
rango.
2. Brinda la cantidad promedio que los valores
se desvían de la media.
Desventaja: Como se trabaja con valores
absolutos no se emplea con tanta frecuencia.
29. Varianza y Desviación Estándar
• Son medidas de dispersión que se
fundamentan en las desviaciones de la media.
• Varianza
• Es la media aritmética de las desviaciones de
las medias elevada al cuadrado.
• Shift 1 4 3 enter (eleva 2) enter
30. La Varianza
• Así como el rango y la desviación media, la
Varianza se emplea para comparar la dispersión
en dos o más conjuntos de observaciones
• No se puede usar solo en un conjunto. Cuando
se comparan las varianzas de dos o más
conjuntos de datos sucede:
• A. Mientras mayor sea la varianza más se alejarán
los datos de la media . Mientras menor sea la
varianza, estarán más cerca de la media.
• La varianza ayuda a determinar cuán confiable
puede ser la media en un conjunto de datos.
31. La Desviación Estándar de la Población
• Cuando la varianza con raíz cuadrada se
convierte en la Desviación Estándar.
• Shift 1 4 3
• Ya este dato nos da la Desviacion estándar.
• Nos indica el número de unidades de
medición empleadas en el conjunto de datos.
32. Ejemplo de Varianza y Desviación
Estándar
• El número diario de consumidores de café
negro en dos cafeterías
Cafés El Cafetal Cafés en El Dorado
45 38
23 26
17 13
56 41
35 22
33. Varianza y Desviación Estándar
En Café Cafetal
• Sumatoria: Se vendieron 176 cafés
• Media poblacional en este caso es igual a la
media muestral:
• Varianza de la población = 201.76
• Desviación estándar de la población = 14.2
34. Varianza y Desviación Estándar
• Sumatoria: Se vendieron 140 cafés
• Media poblacional en este caso es igual a la
media muestral:
• Varianza de la población = 106.8
• Desviación estándar de la población =10.33