2. 2
Estadística
Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los últimos años.
¿En qué áreas se aplica la estadística?
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas,
entre otras.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto
antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.
3. 3
Estadística
Introducción
Ejemplos de su aplicación son:
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una
votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado
de salud de la población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
4. 4
Estadística
Introducción
Etapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado
método científico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y
precisar el universo o población.
2) Recogida de la información: consiste en recolectar los datos necesarios
relacionados al problema de investigación.
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la
información relevante en el estudio.
4) Inferencia estadística: consiste en suponer un modelo para toda la población
partiendo de los datos analizados para obtener conclusiones generales.
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la población
5. 5
Estadística
Introducción
Esquema de las etapas de un estudio estadístico
AREA DE INTERES DATOSDATOS
Tema de InvestigaciónTema de Investigación
-Antecedentes PreviosAntecedentes Previos
-ObjetivosObjetivos
-Preguntas de InvestigaciónPreguntas de Investigación
-Posibles HipótesisPosibles Hipótesis
-Unidad de AnálisisUnidad de Análisis
-PoblaciónPoblación
-VariablesVariables
ORGANIZAR YORGANIZAR Y
RESUMIRRESUMIR
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
(Tablas,
Gráficos, Medidas
Descriptivas, etc.)
INTERPRETACIÓN
INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICA
¿Población o Muestra?¿Población o Muestra?
CONCLUSIONES
PoblaciónPoblación
MuestraMuestra
ProbabilidadProbabilidad
INFORMACIÓN
6. 6
Estadística
Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de
la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones
económicas y sociales en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a
vestuario, alimentación, ocio y vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de
distintas empresas del país.
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una
Universidad, y si éste tiene alguna relación con su edad u otras características.
7. 7
• VARIABLE:VARIABLE: es lo que se va a medir y representa una característica de laes lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISISUNIDAD DE ANÁLISIS..
• ¿QUIÉNES VAN A SER MEDIDOS?:¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de unaLos sujetos u objetos o Unidades de Análisis de una
Población o una MuestraPoblación o una Muestra
• POBLACIÓN :POBLACIÓN : Es el total de unidades de análisis que son tema de estudio.Es el total de unidades de análisis que son tema de estudio.
Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajador de empresa de comunicación
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.
Población:Población:
““Las personas queLas personas que
trabajantrabajan en empresas deen empresas de
comunicacióncomunicación””
Estadística
• MUESTRA:MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.Es un conjunto de unidades de análisis provenientes de una población.
MuestraMuestra
Resumen de algunos conceptos planteados en la Introducción
8. 8
TIPOS DE VARIABLESTIPOS DE VARIABLES
Variables CuantitativasVariables Cuantitativas
VariableVariable:: corresponde a la característica de la Unidad de Análisiscorresponde a la característica de la Unidad de Análisis
IntervaloIntervalo
DISCRETADISCRETA
Variables CualitativasVariables Cualitativas
CONTINUACONTINUA
Toma valores enterosToma valores enteros
EjemplosEjemplos:: Número de HijosNúmero de Hijos,, Número deNúmero de
empleados de una empresaempleados de una empresa,, Número deNúmero de
asignaturas aprobadas en un semestreasignaturas aprobadas en un semestre, etc., etc.
Toma cualquier valor dentro de un intervaloToma cualquier valor dentro de un intervalo
EjemplosEjemplos:: Peso; Estatura; Temperatura, etc.Peso; Estatura; Temperatura, etc.
Unidad de MedidaUnidad de Medida:: GramosGramos oo KilosKilos para la variable Peso; Gradospara la variable Peso; Grados CC oo FF para Temperaturapara Temperatura
ORDINALORDINALNOMINALNOMINAL
Característica o cualidadCaracterística o cualidad
cuyas categorías no tienencuyas categorías no tienen
un orden preestablecido.un orden preestablecido.
EjemplosEjemplos:: Sexo, DeporteSexo, Deporte
FavoritoFavorito, etc., etc.
Característica o cualidad cuyasCaracterística o cualidad cuyas
categorías tienen un ordencategorías tienen un orden
preestablecido.preestablecido.
EjemplosEjemplos: Calificación (S, N, A);: Calificación (S, N, A);
Grado de Interés por un tema, etc.Grado de Interés por un tema, etc.
Estadística
9. 9
FrecuenciaFrecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.presenta una característica.
DISCRETADISCRETA
CONTINUACONTINUA
ORDINALORDINAL
NOMINALNOMINAL
TIPO FRECUENCIATIPO FRECUENCIA
Frecuencia AbsolutaFrecuencia Absoluta (F)(F) Frecuencia RelativaFrecuencia Relativa (f)(f)
Frecuencia AbsolutaFrecuencia Absoluta
Acumulada (FAA)Acumulada (FAA)
Frecuencia RelativaFrecuencia Relativa
Acumulada (fra)Acumulada (fra)
DISCRETADISCRETA
CONTINUACONTINUANOMINALNOMINAL
ORDINALORDINAL
VariableVariable
CuantitativaCuantitativa
VariableVariable
CualitativaCualitativa
VariableVariable
CuantitativaCuantitativa
VariableVariable
CualitativaCualitativa
Estadística
10. 10
VariablesVariables
- Tipo de Industria- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (: se clasifica en industria tipo A, B, C o D. (cualitativa nominalcualitativa nominal))
-- Nº de EmpleadosNº de Empleados: se refiere al número de empleados en las líneas de producción. (: se refiere al número de empleados en las líneas de producción. (cuantitativacuantitativa
discretadiscreta))
-- SuperficieSuperficie: se refiere a los: se refiere a los metros cuadradosmetros cuadrados ((unidad de medidaunidad de medida) disponibles para las áreas de) disponibles para las áreas de
producción. (producción. (cuantitativa continuacuantitativa continua))
-- CalificaciónCalificación: calificación realizada por una institución pública sobre cumplimiento de ciertos: calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinalcualitativa ordinal))
Industria nº Tipo Nº Empleados Superficie Calificación
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias: Se quiere establecer el perfil de las industrias
de conserva en función de algunas características.de conserva en función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
DatosDatos
EJEMPLOEJEMPLO
Estadística
11. 11
EJEMPLOEJEMPLO
TABLAS DETABLAS DE
FRECUENCIAFRECUENCIA
Tipo de
Industria
Frecuencia
Absoluta (Fj)
Frecuencia
Relativa (fj)
Porcentaje
(%)
A
B
C
D
Total 300 1 100
Calificación
Frec.
Absoluta (Fj)
Frec.Relativa
(fj) o %
Frec. Absol.
Acum. (FAAj)
Frec. Relat.
Acum. (fraj) o %
Muy Bien
Bien
Regular
Mal 300 1 (o 100)
Total 300 1 (o 100)
Numero de
Empleados
Frec.
Absoluta (Fj)
Frec.Relativa
(fj) o %
Frec. Absol.
Acum. (FAAj)
Frec. Relat.
Acum. (fraj) o %
<100
[100-150[
.
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie
(mt2
)
Frec.
Absoluta (Fj)
Frec.Relativa
(fj) o %
Frec. Absol.
Acum. (FAAj)
Frec. Relat.
Acum. (fraj) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
(1)(1)
(2)(2)
(3)(3)
(4)(4)
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva en: Se quiere establecer el perfil de las industrias de conserva en
función de algunas características.función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
Estadística
12. 12
Elementos de una tabla de frecuencia cuando la variable es continua (x)Elementos de una tabla de frecuencia cuando la variable es continua (x)
Intervalo
Centro
de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2
.
.
Ik ck ak n 1
Total n 1
[LI1 ; LS1 [
[LI2 ; LS2 [
[LIk ; LSk]
aj = (LSj – LIj))cj = (LIj) + LSj )/2
Estadística
13. 13
Ejercicio: confección de una tabla de frecuencia para una variable continuaEjercicio: confección de una tabla de frecuencia para una variable continua
10,5 10,7 9,5 10,5 11,8 11,2
12,0 10,3 13,5 12,3 10,6 9,8
10,7 11,5 11,1 10,6 9,3 12,9
10,4 7,5 10,2 8,7 10,9 9,9
11,7 10,3 10,6 10,5 11,9 11,0
13,9 10,6 10,0 10,8 10,6 -
7,3 8,0 8,5 12,5 9,7 -
Los datos corresponden a la edad de losLos datos corresponden a la edad de los
hijos de los trabajadores de una empresahijos de los trabajadores de una empresa
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 -
9,5 10,3 10,6 11,0 12,0 -
Datos ordenados de menor a mayorDatos ordenados de menor a mayor
1)1) Construya un Diagrama de Tallo y HojaConstruya un Diagrama de Tallo y Hoja
2)2) ¿Cuál es la variable?; ¿Cuál es la Unidad de¿Cuál es la variable?; ¿Cuál es la Unidad de
análisis?; ¿Cuánto vale n?; ¿Cuál es el rangoanálisis?; ¿Cuánto vale n?; ¿Cuál es el rango
de la variable?.de la variable?.
3)3) Sobre una Tabla de frecuenciaSobre una Tabla de frecuencia: ¿Cuántos: ¿Cuántos
intervalos podría construir?; ¿Cuál es laintervalos podría construir?; ¿Cuál es la
amplitud de cada intervalo?; ¿Cuántasamplitud de cada intervalo?; ¿Cuántas
medidas de frecuencia puede obtener paramedidas de frecuencia puede obtener para
cada intervalo?.cada intervalo?.
4)4) Construir tabla de frecuenciaConstruir tabla de frecuencia para lapara la
variablevariable: Intervalos, centro de clase,: Intervalos, centro de clase,
amplitud, frecuencias.amplitud, frecuencias.
Realice la siguiente actividadRealice la siguiente actividad
Diagrama de Tallo y Hoja: permite organizar los
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automáticas para ordenar
los datos.
Estadística
14. 14
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de1. Gráfico de Sectores Circulares (de Torta)Torta)
Distribución de las unidades de análisis de
acuerdo a variable 1
A
20%
D
10%
C
40%
B
30%
Distribución de las unidades de
análisis de acuerdo a variable 1
B
30%
C
40%
D
10% A
20%
Distribución de las unidades de
análisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
Estadística
15. 15
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS 2. Gráfico de Barras2. Gráfico de Barras
Numero de unidades de análisis
de acuerdo a variable 1
0
100
200
300
400
500
A B C D
variable 1
Nº
Porcentaje de unidad de análisis de acuerdo a
variable 1
0 20 40 60 80 100
A
B
C
D
variable1
% unidad de análisis
-Este tipo de gráfico se utiliza generalmente paraEste tipo de gráfico se utiliza generalmente para
representar la frecuenciarepresentar la frecuencia de las categorías de unade las categorías de una
variable cualitativavariable cualitativa..
-Cuando una variable es cuantitativa se puede utilizarCuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se haeste tipo de gráfico sólo si la variable se ha
transformada en categorías.transformada en categorías.
-Hay distintas versiones de estos gráficos (por ejemploHay distintas versiones de estos gráficos (por ejemplo
en Excel), y en algunos casos son muy útiles paraen Excel), y en algunos casos son muy útiles para
describir el comportamiento de una variable en distintosdescribir el comportamiento de una variable en distintos
grupos.grupos.
Proporción de unidad de análisis de acuerdo a
variable 1
0 0,2 0,4 0,6 0,8 1
A
B
C
D
variable1
Proporción de unidad de análisis
Estadística
16. 16
HistogramaHistograma
- Permite la representación de- Permite la representación de
lala frecuenciafrecuencia de unade una variablevariable
CuantitativaCuantitativa..
- ElEl ejeeje xx se refiere a lase refiere a la
variable.variable.
- ElEl ejeeje yy se refiere a lase refiere a la
frecuencia (Nº , %).frecuencia (Nº , %).
- CadaCada barrabarra representa larepresenta la
frecuencia de la variable en lafrecuencia de la variable en la
población en estudio (o lapoblación en estudio (o la
muestra).muestra).
-El histograma se puedeEl histograma se puede
construir desde los datos de laconstruir desde los datos de la
tabla de frecuencia de latabla de frecuencia de la
variable en estudio.variable en estudio.
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS 3. Histograma3. Histograma
1413121110987
15
10
5
0
edad
FrecuenciaNºNº
edadedad
HistogramaHistograma
Distribución de los hijos de trabajadoresDistribución de los hijos de trabajadores
de la empresa de acuerdo a edadde la empresa de acuerdo a edad
EjemploEjemplo
En el gráfico se puede observar elEn el gráfico se puede observar el número denúmero de
hijoshijos , de menor edad (7-8 años), las de mayor, de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría deedad (13-14 años); y además que la mayoría de
hijos de los trabajadores están entre los 10 y 12hijos de los trabajadores están entre los 10 y 12
años.años.
Estadística
17. 17
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS 5. Polígono de Frecuencia5. Polígono de Frecuencia
edadedad
1413121110987
15
10
5
0
edad
FrecuenciaNºNº
Distribución de los hijos de trabajadoresDistribución de los hijos de trabajadores
de la empresade la empresa de acuerdo a edadde acuerdo a edad
-Esta representación se basa enEsta representación se basa en
el Histograma.el Histograma.
-Sólo es útil para variablesSólo es útil para variables
cuantitativascuantitativas..
-ElEl eje xeje x se refiere a lase refiere a la
variable.variable.
- ElEl ejeeje yy se refiere a lase refiere a la
frecuencia (Nº , %).frecuencia (Nº , %).
-Los puntos que permiten laLos puntos que permiten la
unión de las líneas representaunión de las líneas representa
elel centro de clasecentro de clase (o marca de(o marca de
clase)clase)..
Estadística
18. 18
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS 5. Diagrama de Caja5. Diagrama de Caja
- Permite identificar gráficamente laPermite identificar gráficamente la
mediana, los cuartiles 1 y 3mediana, los cuartiles 1 y 3
(percentiles 25 y 75), mínimo y(percentiles 25 y 75), mínimo y
máximo de una variable.máximo de una variable.
- Sólo es útil para variablesSólo es útil para variables
cuantitativascuantitativas..
-ElEl eje xeje x permite identificar lapermite identificar la
poblacion en estudio.poblacion en estudio.
- ElEl ejeeje yy representa los valores de larepresenta los valores de la
variable en estudio.variable en estudio.
Estadística
1473584N =
HombresMujeres
Edad
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaronEdad de las personas que se realizaron
angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000
19. 19
TIPOS DE GRÁFICOSTIPOS DE GRÁFICOS 6. Otros6. Otros
Número de alumnos matriculados en la
Carrera A según año de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nºdealumnos
Número de alumnos matriculados en la
Carrera B según año de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nºdealumnos
Número de alumnos matriculados en las Carreras
según año de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
año ingreso
Nºdealumnos
Carrera B
Carrera A
año de ingreso Carrera A Carrera B
1998 60 80
1999 55 70
2000 80 50
2001 40 60
2002 68 50
2003 70 75
Nº de alumnos
Estadística
20. 20
OBSERVACIONESOBSERVACIONES
* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un Título General y la identificación de cada eje* El Gráfico debe contener un Título General y la identificación de cada eje
(variable en estudio y frecuencia).(variable en estudio y frecuencia).
* En ocasiones resulta más ilustrativo un gráfico que una tabla de* En ocasiones resulta más ilustrativo un gráfico que una tabla de
frecuencia.frecuencia.
* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.
Variables Cuantitativas
variable=x iindividuoelenvariableladevalor=ix
ni ,...,1=
ncccc
n
i
=++=∑
=
1
∑∑
==
=++=
n
i
in
n
i
i xccxcxcx
1
1
1
bxabaxbaxbax
n
i
in
n
i
i +=++++=+ ∑∑
== 1
1
1
)()()(
22
1
1
2
n
n
i
i xxx ++=∑
=
2
1
2
1
)()( n
n
i
i xxx ++=∑
=
)()()( 11
1
nn
n
i
ii yxyxyx ++++=+∑
=
)()()( 11
1
nn
n
i
ii yxyxyx ++=∑
=
variable=y iindividuoelenvariableladevalor=iy
NOTACIONNOTACION
constantes:,, cba
Estadística
21. 21
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL
-Media Aritmética (Promedio)Media Aritmética (Promedio)
-MedianaMediana
-ModaModa
n
x
x
n
i
i∑
=
= 1
Media Aritmética o PromedioMedia Aritmética o Promedio
MedianaMediana
)(EM kx=
2
M
)1()(
E
++
=
kk xx
x
1x
2x
nx
Datos CuantitativosDatos Cuantitativos
x
)1(x
)2(x
)(nx
Datos Cuantitativos ordenados de menor a mayorDatos Cuantitativos ordenados de menor a mayor
SiSi nn es pares par
SiSi nn es impares impar
centrodeldato)( =kx
repite"semásquedatoel"Mo =
ModaModaDatosDatos
Cualitativos y CuantitativosCualitativos y Cuantitativos
Estadística
22. 22
Percentiles, Deciles o CuartilesPercentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10El Decil va de 1 a 10
El Decil 4 (4/10)El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos: es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losPercentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los
nn datos están ordenados dedatos están ordenados de MenorMenor aa MayorMayor
Estadística
El Percentil va de 1 a 100El Percentil va de 1 a 100
El percentil 25 (25/100)El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos: es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Cuartil va de 1 a 4El Cuartil va de 1 a 4
El Cuartil 3 (3/4)El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos: es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
23. 23
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
-RangoRango
-VarianzaVarianza
-Desviación EstándarDesviación Estándar
RangoRango
VarianzaVarianza
x
1x
2x
nx
Datos CuantitativosDatos Cuantitativos
Coeficiente de VariaciónCoeficiente de Variación
Comparación entre VariablesComparación entre Variables
Se refiere al comportamiento de las variables cuantitativas enSe refiere al comportamiento de las variables cuantitativas en
un grupo.un grupo. Por ejemplo: Si se tiene un conjunto de personas a lasPor ejemplo: Si se tiene un conjunto de personas a las
que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuálque se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál
presenta mayor variación?presenta mayor variación?
)min()max( ii xxR −=
Desviación Típica o EstándarDesviación Típica o Estándar
2
1
21 1
22
1
2
2 1
)(
1
)(
xx
nn
x
n
x
n
xx
s
n
i
i
n
i
n
i
ii
n
i
i
−=
−
=
−
= ∑
∑ ∑∑
=
= ==
2
ss =
x
s
cv =
Estadística
24. 24
Estadística
Otras medidas o CoeficientesOtras medidas o Coeficientes
-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.
Coeficiente de Asimetría 3
1
3
)(
sn
xx
CA
n
i
i
⋅
−
=
∑=
Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Si CA>0 si la distribución es asimétrica a la derecha
Coeficiente de Apuntamiento 4
1
4
)(
sn
xx
CAp
n
i
i
⋅
−
=
∑=
- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
nombre de mesocúrtica.
- Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.
25. 25
Estadística
Otras medidas o CoeficientesOtras medidas o Coeficientes
-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetría y apuntamiento
V2
7,06,05,04,03,02,01,0
14
12
10
8
6
4
2
0
Desv. típ. = 1,67
Media = 3,9
N = 30,00
V4
2,01,00,0-1,0
30
20
10
0
Desv. típ. = ,64
Media = 0,0
N = 30,00
V5
9,08,07,06,05,04,03,02,01,0
6
5
4
3
2
1
0
Desv. típ. = 2,42
Media = 5,2
N = 28,00
26. 26
Estadística
Otras medidas o CoeficientesOtras medidas o Coeficientes
-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Ejemplos
Media 3,9
Mediana 4
Moda 4
Desviación estándar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetría -0,02
Rango 6
Mínimo 1
Máximo 7
Cuenta 30
V1
9,08,07,06,05,04,03,02,01,0
16
14
12
10
8
6
4
2
0
Desv. típ. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos Histograma Medidas descriptivas
27. 27
Estadística
Media, Desviación típica, Coeficientes de Asimetría y ApuntamientoMedia, Desviación típica, Coeficientes de Asimetría y Apuntamiento
para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)
Intervalo
Centro
de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2
.
.
Ik ck ak n 1
Total n 1
f1
f2
fk
n1
n2
nk
Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)
1) La Media para datos agrupados es igual a
la suma de los productos de las marcas de
clase por sus frecuencias relativas, de la forma:
∑=
==
k
j
jjcc fcxMedia
1
Sea cj la marca de clase (o centro de clase) y fj la
frecuencia relativa de la clase j, donde j=1, 2,…, k.
2) LaLa Desviación típicaDesviación típica para datospara datos
agrupados esta dada por:agrupados esta dada por:
∑=
−=
k
j
jcjc fxcs
1
2
)(
3) ElEl Coeficiente de AsimetríaCoeficiente de Asimetría parapara
datos agrupados esta dado por:datos agrupados esta dado por:
3
1
3
)(
c
k
j
jcj
c
s
fxc
CA
∑=
−
=
4) ElEl Coeficiente de apuntamientoCoeficiente de apuntamiento parapara
datos agrupados esta dada por:datos agrupados esta dada por:
4
1
4
)(
c
k
j
jcj
c
s
fxc
CAp
∑=
−
=
28. 28
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte Nº %
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad Nº %
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
Problema
Interesa estudiar cual es el
principal medio de transporte
preferido por un grupo de
personas a la hora de dirigirse
al centro comercial.
Para esto se consultó a cadaPara esto se consultó a cada
persona sobre la actividad apersona sobre la actividad a
la que se dedicaba y el mediola que se dedicaba y el medio
de transporte preferido.de transporte preferido.
29. 29
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personasNº de personas
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
30. 30
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personas y % respecto de tipo de TransporteNº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100
31. 31
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personas y % respecto de tipo de ActividadNº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100
32. 32
MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL
- CovarianzaCovarianza
- CorrelaciónCorrelación
x
1x
2x
nx
DatosDatos
CuantitativosCuantitativos
Covarianza:Covarianza:
Recordemos que:Recordemos que: Hasta ahora hemos estudiado lasHasta ahora hemos estudiado las medidas tendenciamedidas tendencia
centralcentral (Media, Mediana, Moda)(Media, Mediana, Moda) y dispersióny dispersión
(Varianza y Desviación Estándar) para(Varianza y Desviación Estándar) para unauna
Variable CuantitativaVariable Cuantitativa (x).(x).
Es una medida de Variabilidad Conjunta entreEs una medida de Variabilidad Conjunta entre dosdos variables (variables (xx11 ,, xx22) o bien () o bien (xx ,, yy))
x y
)1(x )(y 1
)2(x )(y 2
)(nx )n(y
Si Cov(x,y) es positivaSi Cov(x,y) es positiva:: la asociación entre la asociación entre xx e e yy es directamente proporcional, es directamente proporcional,
es decir que cuando es decir que cuando xx aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa.
Si Cov(x,y) es negativaSi Cov(x,y) es negativa:: la asociación entre la asociación entre xx e e yy es inversamente es inversamente
proporcional, es decir que cuando proporcional, es decir que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa.
Si Cov(x,y) es ceroSi Cov(x,y) es cero:: no existe asociación entreno existe asociación entre xx e e yy..
∑
=
−−=
n
i
ii )yy)(xx(
n
)y,xcov(
1
1
Estadística
33. 33
MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL
- CovarianzaCovarianza
- CorrelaciónCorrelación
DatosDatos
CuantitativosCuantitativos
Coeficiente de Correlación de Pearson (Coeficiente de Correlación de Pearson (rr):): Mide el grado de Asociación LinealMide el grado de Asociación Lineal
entre dos variables Cuantitativasentre dos variables Cuantitativas
Se refiere al grado de asociación entreSe refiere al grado de asociación entre dosdos variables (variables (xx11 ,, xx22) o bien () o bien (xx ,, yy))
x y
)1(x )(y 1
)2(x )(y 2
)(nx )n(y
SiSi rr es positivoes positivo:: la asociación entrela asociación entre xx ee yy es directamente proporcional, es decir quees directamente proporcional, es decir que
cuandocuando xx aumentaaumenta yy también aumenta; y viceversa.también aumenta; y viceversa. SiSi rr=1=1:: la asociación lineal esla asociación lineal es
perfecta.perfecta.
SiSi rr es negativoes negativo:: la asociación entrela asociación entre xx ee yy es inversamente proporcional, es decires inversamente proporcional, es decir
que cuandoque cuando xx aumentaaumenta yy disminuye; y viceversa.disminuye; y viceversa. SiSi rr=-1=-1:: la asociación lineal esla asociación lineal es
perfecta.perfecta.
SiSi rr es ceroes cero:: no existe asociación entreno existe asociación entre xx ee yy..
CorrelaciónCorrelación::
11 ≤≤− r
yxss
)y,xcov(
r =
yx
n
i
ii
ss)n(
yxnyx
r
1
1
−
−
=
∑
=
Estadística
34. 34
r=1 r=-1
EJEMPLO : Representación gráfica de las variables x e yEJEMPLO : Representación gráfica de las variables x e y
Estadística
35. 35
Objetivo 2
Estudiar si los valores de una
variable pueden ser utilizados para
predecir el valor de la otra
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
Datos CuantitativosDatos Cuantitativos
Determinar si existe relación
entre las variables x e y:
Coeficiente de Correlación
Objetivo 1
Determinar si dos variables estánDeterminar si dos variables están
asociadas y en qué sentido se daasociadas y en qué sentido se da
la asociaciónla asociación..
Estudiar la dependencia de una
variable respecto de la otra:
Modelo de RegresiónModelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
x y
)1(x )(y 1
)2(x )(y 2
)(nx )n(y
Estadística
36. 36
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
Datos CuantitativosDatos Cuantitativos
Notación
Variable Respuesta: y
Variable Explicativa: x
Modelo de Regresión Lineal Simple: yi=α+βxi+ei
Intercepto: α
Pendiente: β
Error: e
x y
)1(x )(y 1
)2(x )(y 2
)(nx )n(y
Modelo Estimado
(recta de regresión)
bxay +=ˆ
xbya −=
2
11
2
111
−
−
=
∑∑
∑∑∑
==
===
n
i
i
n
i
n
i
i
n
i
i
n
i
xxn
yxxyn
b
Método de Estimación: Mínimos CuadradosMínimos Cuadrados
iii yye ˆ−=
Residuos o Errores
Estadística
37. 37
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
DATOSDATOS
MODELO DE REGRESIÓN LINEAL SIMPLE
yi=α+βxi+ei
x y
)1(x )(y 1
)2(x )(y 2
)(nx )n(y
MODELO ESTIMADO
bxay +=ˆ
xbya −=
2
11
2
111
−
−
=
∑∑
∑∑∑
==
===
n
i
i
n
i
n
i
i
n
i
i
n
i
xxn
yxxyn
b
ESTIMADORES
iii yye ˆ−=
ERRORES
Estadística
38. 38
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm)
i xi yi
1 3 55
2 6 68
3 5 64
4 5 66
5 3 62
6 4 65
7 9 74
8 8 75
9 9 73
10 7 69
11 6 73
12 5 68
13 8 73
14 6 71
y=talla / x=edad / n=14
956
14
1
=∑
=i
iy 3,68=y 6,5=ys
84
14
1
=∑
=i
ix 6=x 2=xs
07,9),cov( =yx 88,0=xyr
5863
14
1
=∑
=i
ii yx 556
14
1
2
=∑
=i
ix
Estadística
39. 39
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
Modelo Estimado
bxay +=ˆ
44,2=b 64,53=a
xy 44,264,53ˆ +=
Interpretación de los resultados
- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
Estadística
40. 40
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
De acuerdo al coeficiente de
determinación, el modelo ajustado
a los datos es adecuado (R2
cercano a 1)
Bondad de Ajuste del Modelo
R2
= 0,77
niño edad (meses) talla (cm) Talla estimada error
i xi yi iyˆ ie
1 3 55 61,0 -6,0
2 6 68 68,3 -0,3
3 5 64 65,8 -1,8
4 5 66 65,8 0,2
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6
8 8 75 73,2 1,8
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7
11 6 73 68,3 4,7
12 5 68 65,8 2,2
13 8 73 73,2 -0,2
14 6 71 68,3 2,7
86,402)(
14
1
2
=−∑
=i
ii yy
7,92)ˆ(
14
1
2
14
1
2
∑∑
==
==−
i
i
i
ii eyy
Estadística
Editor's Notes
Traducción al Español. Dr en C Nicolás Padilla Raygoza, Facultad de Enfermería y Obstetricia de Celaya, Universidad de Guanajuato, México. padilla@celaya.podernet.com.mx o padillawarm@gmail.com