1. Medidas de Tendencia central
Se les llama medidas de tendencia central porque general
mente la acumulación más alta de datos se encuentra en los
valores intermedios.
Las medidas de tendencia central comúnmente empleadas
son :
Media aritmética
Mediana
Moda
Media geométrica
Media armónica
Los cuantilos
2. Moda
La moda es el valor que aparece con mayor frecuencia en la
serie de datos. Así por ejemplo, de la serie {14, 15, 17, 17, 21,
21, 21, 33, 36, 40}, la moda es 21.
La moda es una medida muy natural para describir un
conjunto de datos; su concepto se adquiere fácilmente : es la
altura más corriente, es la velocidad más común, etc. Además
tiene la ventaja de que no se ve afectada por la presencia de
valores altos o bajos.
La principal limitación esta en el hecho de que requiere un
número suficiente de observaciones para que se manifieste o
se defina claramente.
Otros inconvenientes son que puede darse el caso de que una
determinada serie no tenga moda o que tenga varias modas.
3. Mediana
La mediana toma en cuenta la posición de los datos y
se define como el valor central de una serie de datos
o, más específicamente, como un valor tal que no más
de la mitad de las observaciones son menores que el y
no más de la mitad mayores.
El primer paso es ordenar los datos de acuerdo a su
magnitud, luego se determina el valor central de la
serie y esa es la mediana. Si el número de datos es
par, existirán dos valores centrales y entonces la
mediana se obtiene sacando el promedio de ellos.
4. Los Cuantilos
En algunas ocasiones es importante obtener
valores que dividan el conjunto de datos en
fracciones especificas. Así como la
mediana divide el conjunto de datos en dos
partes iguales, es decir, la mitad de los
valores son inferiores a la mediana y la otra
mitad son superiores. Si cada una de estas
mitades se volviera a dividir por la mitad,
el conjunto quedaría dividido en cuatro
partes y cada parte se llamara cuartilo.
Pero el conjunto puede dividirse también
por 10 (deciles) o por 100 (percentiles) y
todos se llaman cuantilos.
Tanto la mediana, como los cuartilos y los
deciles pueden expresarse como
percentiles.
5.
Así que conociendo los percentiles se puede
averiguar cualquier cuantilo.
Para el calculo de los percentiles, el conjunto de datos
debe estar ordenado, luego se aplica la siguiente
formula :
Pm = m (n+1) termino
100
Donde : Pm = Percentil m. Valor tal que un m/100 de
las observaciones son menores que el y un 1 - m/100
son mayores.
m = Número que indica el percentil que se quiere. Por
ejemplo, si m = 43, esto quiere decir que se quiere el
percentil 43 (P43).
n = Número total de observaciones.
6. Media Aritmética
La media aritmética es el promedio más comúnmente usado,
este puede ser simple o ponderado.
La media aritmética simple esta dada por la formula SX/n y
que significa: la suma de todos los valores dividida por el
número de datos.
Media Aritmética Ponderada
Si los valores que toma x en una serie de datos, no todos
tienen la misma importancia, es valido asignar "pesos" o
"ponderaciones" de acuerdo a la importancia de cada dato.
En la serie del ejemplo anterior aparecen los números; pero
cada uno con diferente frecuencia. Si cada uno de estos datos
se multiplica por su respectiva frecuencia o ponderación y se
suman estos productos, se obtendrá la misma suma que si se
hubieran sumado uno por uno.
7.
Media Geométrica
La media geométrica es la
raíz enésima del producto de
todos los valores de la serie.
Media Armónica
La media armónica se define
como el recíproco de la
media aritmética de los
recíprocos de los valores.
y reacomodando la fórmula
se tiene:
8. Tablas estadísticas
Consideremos una
población estadística de n
individuos, descrita según
un carácter o variable C
cuyas modalidades han
sido agrupadas en un
número k de clases, que
denotamos mediante .
Para cada una de las clases
ci,
, introducimos las
siguientes magnitudes:
9.
Frecuencia absoluta
de la clase ci es el número ni, de observaciones
que presentan una modalidad perteneciente a esa
clase.
Frecuencia relativa
de la clase ci es el cociente fi, entre las
frecuencias absolutas de dicha clase y el número
total de observaciones, es decir
Obsérvese que fi es el tanto por uno de
observaciones que están en la clase ci.
Multiplicado por representa el porcentaje de la
población que comprende esa clase.
Frecuencia absoluta acumulada
Ni, se calcula sobre variables cuantitativas o
cuasicuantitativas, y es el número de elementos
de la población cuya modalidad es inferior o
equivalente a la modalidad ci:
10.
Frecuencia relativa acumulada
, Fi, se calcula sobre variables
cuantitativas o cuasicuantitativas,
siendo el tanto por uno de los
elementos de la población que están en
alguna de las clases y que presentan
una modalidad inferior o igual a la ci,
es decir,
Como todas las modalidades son
exhaustivas e incompatibles ha de
ocurrir que
o lo que es lo mismo,
Frecuencia absoluta (ni): Número de
elementos que presentan la clase xi.
12.
Llamaremos distribución de frecuencias al
conjunto de clases junto a las frecuencias
correspondientes a cada una de ellas. Una
tabla estadística sirve para presentar de forma
ordenada las distribuciones de frecuencias. Su
forma general es la siguiente:
13. Modali.
Frec. Abs.
Frec. Rel.
Frec. Abs. Acumu.
Frec. Rel. Acumu.
C
ni
fi
Ni
Fi
c1
n1
...
...
cj
nj
...
...
ck
nk
n
N 1 = n1
...
...
...
...
...
...
Nk = n
Fk = 1
1
14. Medidas de posición
Son indicadores usados para señalar que porcentaje de datos
dentro de una distribución de frecuencias superan estas
expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribución de frecuencia, por
lo que también se les llama " Medidas de Tendencia Central
".
Pero estas medidas de posición de una distribución de
frecuencias han de cumplir determinadas condiciones para
que lean verdaderamente representativas de la variable a la
que resumen. Toda síntesis de una distribución se
considerara como operativa si intervienen en su
determinación todos y cada uno de los valores de la
distribución, siendo única para cada distribución de
frecuencias y siendo siempre calculable y de fácil obtención.
A continuación se describen las medidas de posición más
comunes utilizadas en estadística, como lo
son:deciles,percentiles,cuartiles.
15. MEDIDAS DE DISPERSIÓN:
Rango:
Es la primera medida que vamos a estudiar, se
define como la diferencia existente entre el
valor mayor y el menor de la distribución,. Lo
notaremos como R. Realmente no es una
medida muy significativa e la mayoría de los
casos, pero indudablemente es muy fácil de
calcular.
16.
Desviación: Es la diferencia que se observa
entre el valor de la variable y la media
aritmética. La denotaremos por di .
Desviaciòn media.
Es la media de los valores absolutos de las
desviaciones, y la denotaremos por dm.
17. Varianza:
Es la media de los cuadrados de las
desviaciones, y la denotaremos por
o
también por
Aunque también es posible calcularlo como:
r
21. Coeficiente de Variación:
Es un estadístico de dispersión que tiene la
ventaja de que no lleva asociada ninguna
unidad, por lo que nos permitirá decir entre
dos muestras, cual es la que presenta mayor
dispersión. La denotaremos por C.V.
22. Datos agrupados
Son datos que están organizados (formando
grupos). Podemos formar más o menos grupos,
dependiendo de que tan exacto queramos
trabajar, a cada grupo le llamamos clase. Rara
vez se emplean menos de seis clases o màs de
quince.
23. Ventajas
Facilidad y rapidez al manejo de datos.
Se notan rápidamente el valor mayor y el valor
menor de los datos
Se puede dividir fácilmente los datos en
secciones.
Se puede observar si algún valor aparece mas
de una vez en el ordenamiento.
Se observa la distancia entre los valores
sucesivos de los datos.
24. Datos no agrupados
Son datos no agrupados cuando se consideran y
analizan todos los valores observados tal como se
obtuvieron. Es conveniente y mas sencillo trabajar a
estos datos como no agrupados cuando la muestra no
es muy grande. De preferencia que sea una cantidad
menor de 30 datos.
También resulta conveniente trabajarlos así cuando se
quiere que el peso de cada observación se
vea reflejado en el resumen de los datos.
25. ventajas
Resulta más fácil y rápido trabajar con los datos no
agrupados.
DESVENTAJAS
Solo se puede aplicar en pequeñas cantidades de
datos, ya que en grandes cantidades resultaría un
tanto tedioso y por lo mismo existiría más probabilidad
de equivocarse.