2. Enunciado :
Tenemos recogidos en
una base los datos de 30
individuos sobre 31
variables distintas, entre
ellas: el peso, las horas de
dedicación al deporte,
número de cigarrillos
fumados al día, la nota de
acceso, o la altura.
Utilizaremos el programa
“IBM SPSS Statistics 20”
para resolver el ejercicio.
3. Primero comprobamos
gráficamente si hay
agrupación. Para ello
seguimos los siguientes
pasos: seleccionamos
“Gráficos”, “Cuadros de
diálogo antiguos“,
“Dispersión/Puntos”, y
“Dispersión simple”.
Introducimos la variable
“peso” en el eje X, y la
variable “horas de
dedicación al deporte” en el
eje Y, y aceptamos:
Ejercicio 1.1 : Comprobar la correlación entre la variable “peso” y la
variable “horas de dedicación al deporte”.
4. En el gráfico observamos una correlación débil, ya que la recta
de regresión no está demasiado próxima a los puntos de la
nube.
La recta es creciente, por lo que se trata de una correlación
positiva: al aumentar una variable, la otra tiene también
tendencia a aumentar.
Aunque se observa la existencia de una cierta tendencia lineal
en la relación, hay que recurrir a una prueba de hipótesis para
valorar si existe o no correlación lineal entre estas dos variables
cuantitativas. Esa prueba de contraste de hipótesis se realiza
calculando el denominado coeficiente de correlación lineal de
Pearson (que permite estudiar la fuerza de la correlación o
asociación lineal entre dos variables cuantitativas).
Ejercicio 1.1 : Comprobar la correlación entre la variable “peso” y la
variable “horas de dedicación al deporte”.
5. Como las dos variables son cuantitativas, para
calcular el coeficiente de correlación lineal de
Pearson, deben seguir una distribución normal.
Por tanto, antes de calcularlo habrá que
comprobar que se cumplan las condiciones de
normalidad de las dos variables.
Como se trata de una muestra de 30 individuos
podemos considerar que sigue una distribución
normal.
Ejercicio 1.1 : Comprobar la correlación entre la variable “peso” y la
variable “horas de dedicación al deporte”.
6. Una vez comprobada la normalidad bivariante, realizamos el
cálculo del coeficiente de Pearson mediante SPSS (“Analizar”,
“Correlaciones”, “Bivariadas”, pasamos a la derecha las
variables a comprobar y aceptamos):
Hemos obtenido un valor del coeficiente de Pearson distinto
de 0, por lo que podemos afirmar que existe correlación
entre las variables “horas de dedicación al deporte” y
“peso”, siendo la correlación positiva y débil.
Ejercicio 1.1 : Comprobar la correlación entre la variable “peso” y la
variable “horas de dedicación al deporte”.
7. Hecho esto, sabemos que es lo que ocurre en la
muestra, pero queremos conocer la situación en la
población. Para ello realizamos un contraste de
hipótesis, donde:
H0: r = 0 (El coeficiente de correlación obtenido
procede de una población cuya correlación es
cero, NO hay correlación).
H1: r ≠ 0 (El coeficiente de correlación obtenido
procede de una población cuyo coeficiente de
correlación es distinto de cero, SÍ hay
correlación).
Ejercicio 1.1 : Comprobar la correlación entre la variable “peso” y la
variable “horas de dedicación al deporte”.
8. Ahora nos fijamos en la Sig. de la correlación
de Pearson (0,091), que evalúa la probabilidad
de que en la población ambas variables no
estén correlacionadas linealmente y que el
coeficiente de correlación sea cero.
Como es mayor que el nivel de significación
=0’05, se acepta la H0, por lo que
efectivamente, en la población la correlación es
cero, y NO existe asociación lineal entre las
variables “horas de dedicación al deporte” y
“peso”.
Ejercicio 1.1 : Comprobar la correlación entre la variable “peso” y la
variable “horas de dedicación al deporte”.
9. Comenzamos por comprobar gráficamente si hay agrupación, como
en el ejercicio anterior con un diagrama de dispersión:
Ejercicio 1.2 : Calcula el Coeficiente de Correlación de Pearson para
las variables “nº de cigarrillos fumados al día” y “nota de acceso”.
Observamos una correlación
fuerte, aunque hay pocos datos.
La recta es decreciente, por lo
que se trata de una correlación
negativa: al aumentar una
variable, la otra tiene tendencia a
disminuir.
Aunque se observa la existencia
de una cierta tendencia lineal en
la relación, recurrimos a la
prueba del coeficiente de
correlación lineal de Pearson
(ya que las variables son
cuantitativas).
10. Como se trata de una muestra de 30 individuos podemos
considerar que sigue una distribución normal, y realizamos el
cálculo del coeficiente de Pearson mediante SPSS:
Ejercicio 1.2 : Calcula el Coeficiente de Correlación de Pearson para
las variables “nº de cigarrillos fumados al día” y “nota de acceso”.
Hemos obtenido un valor del coeficiente de Pearson distinto
de 0 (r = -0,976), por lo que podemos afirmar que existe
correlación entre las variables “nº de cigarrillos fumados al
día” y “nota de acceso”, siendo la correlación negativa y muy
fuerte.
11. Ejercicio 1.2 : Calcula el Coeficiente de Correlación de Pearson para
las variables “nº de cigarrillos fumados al día” y “nota de acceso”.
Hecho esto, sabemos que es lo que ocurre en la
muestra, pero queremos conocer la situación en la
población. Para ello realizamos un contraste de
hipótesis, donde:
H0: r = 0 (El coeficiente de correlación obtenido
procede de una población cuya correlación es
cero, NO hay correlación, y se debe al azar).
H1: r ≠ 0 (El coeficiente de correlación obtenido
procede de una población cuyo coeficiente de
correlación es distinto de cero, SÍ hay
correlación).
12. Ejercicio 1.2 : Calcula el Coeficiente de Correlación de Pearson para
las variables “nº de cigarrillos fumados al día” y “nota de acceso”.
Ahora nos fijamos en la Sig. de la correlación
de Pearson (0,001), que evalúa la probabilidad
de que en la población ambas variables no
estén correlacionadas linealmente y que el
coeficiente de correlación sea cero.
Como es menor que el nivel de significación
=0’05 e incluso que =0’01, se rechaza la H0,
por lo tanto, en la población la correlación es
distinta de cero, y SÍ existe asociación lineal
entre las variables “nº de cigarrillos fumados al
día” y “nota de acceso”.
13. Ejercicio 1.3 : Calcula el Coeficiente de Correlación de Pearson para
las variables “peso” y “altura” (limitando la muestra a 10 casos).
Comenzamos por comprobar gráficamente si hay agrupación, como
en los dos ejercicios anteriores con un diagrama de dispersión, pero
en este caso seleccionando los 10 primeros individuos por ejemplo:
Observamos una correlación algo
fuerte.
La recta es creciente, por lo que se
trata de una correlación positiva: al
aumentar una variable, la otra
también tiene tendencia a aumentar.
Aunque se observa la existencia de
una cierta tendencia lineal en la
relación, recurrimos a la prueba del
coeficiente de correlación lineal
de Pearson (ya que las variables
son cuantitativas).
14. Como se trata de una muestra inferior a 30 individuos no podemos considerar
que sigue una distribución normal, por lo que realizamos el Test de Kolmogorov-
Smirnov con SPSS (“Analizar”, “Estadísticos descriptivos”, “Explorar”, “Gráficos”,
“Pruebas de normalidad”, y aceptamos):
En la hoja de resultados de SPSS observamos la Sig. de “Pruebas de
normalidad” del Test de Kolmogorov- Smirnov:
• Si es menor que 0’05 se rechaza la Ho: el conjunto de datos no sigue
una distribución normal.
• Si es mayor que 0’05 se acepta la Ho : el conjunto de datos sigue una
distribución normal. En este caso vemos que es mayor (0’2>0’05), por lo tanto se
acepta la Ho, los datos siguen una distribución normal, así que procedemos a
realizar la prueba del coeficiente de correlación lineal de Pearson.
Ejercicio 1.3 : Calcula el Coeficiente de Correlación de Pearson para
las variables “peso” y “altura” (limitando la muestra a 10 casos).
15. Realizamos el cálculo del coeficiente de Pearson mediante
SPSS:
Ejercicio 1.3 : Calcula el Coeficiente de Correlación de Pearson para
las variables “peso” y “altura” (limitando la muestra a 10 casos).
Hemos obtenido un valor del coeficiente de Pearson distinto
de 0 (r = 0,757), por lo que podemos afirmar que existe
correlación entre las variables “nº de cigarrillos fumados al
día” y “nota de acceso”, siendo la correlación positiva y fuerte.
16. Hecho esto, sabemos que es lo que ocurre en la
muestra de 10 individuos, pero queremos conocer
la situación en la población. Para ello realizamos
un contraste de hipótesis, donde:
H0: r = 0 (El coeficiente de correlación obtenido
procede de una población cuya correlación es
cero, NO hay correlación, y se debe al azar).
H1: r ≠ 0 (El coeficiente de correlación obtenido
procede de una población cuyo coeficiente de
correlación es distinto de cero, SÍ hay
correlación).
Ejercicio 1.3 : Calcula el Coeficiente de Correlación de Pearson para
las variables “peso” y “altura” (limitando la muestra a 10 casos).
17. Ejercicio 1.3 : Calcula el Coeficiente de Correlación de Pearson para
las variables “peso” y “altura” (limitando la muestra a 10 casos).
Ahora nos fijamos en la Sig. de la correlación
de Pearson (0,011), que evalúa la probabilidad
de que en la población ambas variables no
estén correlacionadas linealmente y que el
coeficiente de correlación sea cero.
Como es menor que el nivel de significación
=0’05, se rechaza la H0, por lo tanto, en la
población la correlación es distinta de cero, y SÍ
existe asociación lineal entre las variables
“peso” y “altura”.