2. Tablas de Frecuencias Las formas más simples de organizar y presentar los datos presentes en una muestra son las tablas de frecuencias y los gráficos . Estos permiten observar características especiales en los datos y obtener información preliminar que necesitan quienes administran y toman decisiones. PRESENTACION DE DATOS
3. Distribución en la Tabla Suponga que los datos X1 , X 2, ...., X n son clasificados en k clases o categorías C1 , C2 ,...., C k . Una tabla de frecuencias tiene la siguiente forma 100 1 n Total Fk% Fk Nk fk% fk nk Ck : . : . : . : . : . : . : : F2% F2 N2 f2% f2 n2 C2 F1% F1 N1 f1% f1 n1 C1 Fi% Fi Ni fi% fi ni Clase
4. Frecuencia absoluta n i . Corresponde al número de individuos en la muestra que pertenecen a la clase Ci . Tienen la propiedad de que n 1 + n 2 + ... + nk = n Frecuencia relativa f i . Corresponde a la proporción de datos que pertenecn a la clase Ci con respecto al total n . Es decir, fi = ni / n , i = 1,2,..., k . Las frecuencias relativas cumplen la propiedad de que f 1 + f 2 + ... + fk = 1. Frecuencia relativa porcentual fi %. fi %= fi ×100%
5. Frecuencia absoluta acumulada N i. Corresponde al número de datos que pertenecen a las clases C 1, C 2,...., Ci . Es decir, Ni = n 1 + n 2 + ... + ni . Esta frecuencia cumple: 1.- N 1 = n 1 N 2 = n 1 + n 2= N 1 + n 2. N 3 = n 1 + n 2 + n 3= N 2 + n 3 : N i = n 1 + n 2 + n 3 +...+ n i = N i-1 + n i i =1,2,3,..., k 2.- Debe verificarse que N k = n (número total de datos) Frecuencia relativa acumulada Fi Corresponde a la proporción de datos que pertenecen a las clases C 1, C 2 ,...., Ci con respecto al total de datos n . Es decir, Fi = Ni / n , i = 1,2,..., k 1.- F 1 = f 1 =N 1/ n F 2 = f 1 + f 2= F 1 + f 2 = N 2/ n F 3 = f 1 + f 2 + f 3= F 2 + f 3 = N 3/ n : F i = f 1 + f 2 + f 3 +....+ f i = F i-1 + f i = N i/ n 2.- Debe verificarse que Fk = 1.
6. Agrupación de datos por Intervalos Número de intervalos k . Usualmente el número de intervalos k es un número entre 5 y 20 que depende del tamaño de la muestra n . Algunos criterios empíricos para determinar k son: a) k = 1 + 3,3× log n (Regla de Sturgess) k b) 2 ≥ n 14 ó 15 14 14,2 10000 11 ó 12 10 10,9 1000 9 ó 10 9 9,9 500 7 u 8 7 7,6 100 6 ó 7 6 6,6 50 5 5 5,3 20 -------------- 4 4,3 10 -------------- 1 1 1 K a usar k 2 n K = 1 + 3,3 x log n n
7. Rango o recorrido de la muestra Rm . Corresponde a la diferencia entre el dato mayor y el menor. Se designa por Rm y está dado por Rm = max{ Xi } − min{ Xi } Amplitud del intervalo . El criterio es que Rm ai ≥ -------- , i = 1, 2, 3,….,k k Rango de tabla Rt . Es el rango que cubrirá la tabla. Si todas las amplitudes son iguales a a , entonces Rt = ak
8. Determinación de los límites de los intervalos La idea es que Rt ≥ Rm para que todos los datos de la muestra queden agrupadosen la tabla. Sin embargo, no deben quedar intervalos al principio o al final de la tablacon frecuencia cero. Sea Δ = Rt − Rm la diferencia entre el rango de la tabla y el de la muestra. Una posibilidad para escoger los límites es: L 0 = min{ Xi }− Δ / 2 . L 1 = L 0 + a L 2 = L 1 + a : Lk = Lk −1 + a El rango de la tabla Rt cubre el intervalo [ L 0; Lk ].
9. Marca de clase Xi Corresponde al punto medio de cada intervalo, Li + Li-1 Xi = ------------ , i =1,2,3,..., k 2 Estas marcas serán los representantes de los datos al interior de cada intervalo. De este modo se trabajará con k “datos” en vez de n . Lk-1; Lk : . L1; L2 L0; L1 Intervalo a : . a a Amplitud 100 1 n Total Fk% Fk Nk fk% fk nk Ck : . : . : . : . : . : . : : F2% F2 N2 f2% f2 n2 C2 F1% F1 N1 f1% f1 n1 C1 Fi% Fi Ni fi% fi ni Clase
10. La siguiente tabla presenta algunas sugerencias para el número de clases.
11. Etapas en la construcción de una tabla de frecuencias: Paso 1 . Escoger el número de categorías o intervalos para hacer la clasificación Paso 2 . Determinar el tamaño o longitud de cada intervalo. Una regla general es dividir la diferencia entre el dato mayor y e menor por la cantidad de clases que se empleará. Paso 3 . Determinar los límites inferior y superior de cada intervalo. Paso 4 . Contar cuántos datos hay en cada categoría. Si un dato coincide con algún límite superior, se lo contabilizará en el intervalo siguiente. Paso 5 . Construir la tabla de frecuencias .
12. Cheques sin fondos Supongamos que se han obtenido los siguientes datos sobre el número de cheques impagos durante un mes en las 50 sucursales de un Banco. ----------------------------------------------------------------------------------------------------- 74 87 99 88 90 101 91 83 97 94 105 110 99 94 104 97 90 88 89 90 79 105 96 93 93 90 91 102 94 106 101 96 97 103 108 90 102 91 76 109 110 94 101 97 106 86 88 97 107 107 ----------------------------------------------------------------------------------------------------- Ejercicio
13. El primer paso es determinar el número de categorías en que serán agrupados los datos. Para 50 datos, se recomienda usar 6 ó 7 intervalos. El segundo paso es determinar la longitud de cada intervalo. Aquí, el dato mayor es 110 y el menor 74. Por tanto, el rango es 110-74 = 36 y, si se construye una tabla de frecuencias con 6 intervalos, la amplitud de cada intervalo será 36/6 = 6. El tercer paso es determinar los límites inferior y superior de cada intervalo. El primer límite es 74 porque es el dato más pequeño. Los siguientes límites son 74+6=80, seguido por 80+6=86, 86+6=92, 92+6=98, 98+6=104 y 104+6=110 que resulta ser el mayor de los datos. Los últimos pasos son contar cuántos datos hay en cada intervalo y construir la tabla de frecuencia. El resultado final se presenta en la Tabla 1