seminario 10 de estadistica y tics

Preview:

Citation preview

Seminario

10: Correlaciones

Laura Arriaza Granado.

Grupo 1. Facultad de

Valme.

1º enfermería

Estadística y Tics

En un municipio español se ha realizado una pequeña encuesta en la que se ha preguntado por el nº de personas que habitan en el hogar y el nº de habitaciones del mismo.

Si ambas variables se distribuyen normalmente:

-Averiguar si existe correlación entre ambas variables en la población de donde derivan los datos.

-Calcular el coeficiente de correlación de Pearson.

-Averiguar si el coeficiente de correlación es significativo. Realizar las hipótesis.

-Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de Pearson y evaluar los resultados.

Lo primero que tenemos que hacer es averiguar si existe normalidad en la muestra. Esto lo sabremos mediante las pruebas de normalidad en SPSS. Para ello, miraremos el test de Kolmogorov-Smirnov si el tamaño de la muestra es mayor a 50, y el Test de Shapiro Wills si el tamaño de la muestra es menor a 50.Después, usaremos R de Pearson si se distribuye normalmente y Rho de Spearman si no se distribuye normalmente.

Vamos a ver si las variables se distribuyen normalmente en SPSS

Para ello, pinchamos en:

“Analizar----estadísticos

descriptivos----Explorar”.

Elegimos las variables y pinchamos en

“gráficos”.

Pinchamos en “niveles de los factores juntos”---- “De tallo y hojas”---- “Gráficos con prueba de normalidad”

Ahora nos va a salir una tabla y nos tendremos que fijar en la parte de “Sig.” (nivel de significación).Si el resultado del nivel de significación es mayor de 0,05 el conjunto de datos sigue una distribución normal, es decir, se acepta la Ho, y usaremos R de PearsonSi el resultado del nivel de significación es menor de 0,05, el conjunto de datos no sigue una distribución normal, es decir, se rechaza la Ho y usaremos Rho de Spearman

La sig. es mayor que 0,05 por lo que sigue una distribución normal. Así que, aceptamos la hipótesis nula y utilizaremos la R de Pearson

En la tabla nos aparece Kolmogorov-Smirnov y Shapiro Will. Como la muestra es menor de 50 nos fijamos en Shapiro-Wills.

Vamos a utilizar la FÓRMULA DE R DE PEARSON, porque se distribuye normalmente:

R= coeficiente de correlación de pearson∑xy= sumatorio de los productos de ambas variables∑x=sumatoria de los valores de la variable independiente∑y= sumatoria de los valores de la variable dependiente∑x^2= sumatoria de los valores al cuadrado de la variable independiente∑y^2= sumatoria de los valores al cuadrado de la variable dependienteN= tamaño de la muestra en función de parejas.

x y X2 Y2 xy

3 2 9 4 6

5 3 25 9 15

4 4 16 16 16

6 4 36 16 24

5 3 25 9 15

4 3 16 9 12

Σx=27 Σy=19 Σx2 =127 Σy2=63 Σxy=88

(88x6) – (19x27)

r = = 0,63

√ {(6x127)-(729) } {(6x63)-(361)

Si Pearson nos da cero pues entonces en esa población no hay correlación.Si es diferente de cero, como en nuestro caso (Pearson = 0,63==0), el resultado obtenido hay que estudiarlo y para eso haremos la T de Student, con N-2 grados de libertad (N= nº de muestra).

La T de Student informa de si la relación se ha producido al azar o no.

T(n-2) = r xy

= 1,63

(n-2)

1-rxy^2 T (n-2) = 0,63

( 6-2

1-(0,63)^2

.

Ya sabemos el valor de la T de Student (1,63). Ahora tenemos que compararlo con el valor de la tabla de distribución de la T de Student. Si el valor de la fórmula es mayor que el valor de las tablas rechazamos la hipótesis nula, y diremos que las variables están relacionadas. Si T de student de la fórmula < T de las tablas, aceptamos la hipótesis nula, y las variables no están relacionadas.

Todo esto teniendo en cuenta que:

• H0: No hay relación entre el número de personas que viven en una casa y el número de habitaciones de ella.

• H1: Hay relación significativa entre el número de personas que viven en una casa y el número de habitaciones de la misma

Para buscar en la tabla tenemos que tener en cuenta el grado de libertad (n-2= 6-2= 4), y el nivel de confianza, que vamos a suponer que es del 95%.

Vemos que la T de Student de la fórmula es menor que la T de las tablas (1,63<2,132) por lo que aceptamos la hipótesis nula. Por tanto, las variables no están relacionadas, es decir, no existe relación significativa entre las personas que habitan una casa y el número de habitaciones que tiene.

Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de Pearson y evaluar los resultados.

Incluimos los datos en SPSS

Para realizar el gráfico de dispersión simple tenemos que seguir los siguientes pasos:

---”Gráficos”--- “cuadros de diálogo antiguos”--- “Dispersión/puntos”

Nos sale la siguiente tabla: Pinchamos en “dispersión simple” y en “definir”

Señalamos las dos variables: Personas y Habitaciones

Este sería el gráfico de dispersión simple que nos sale.

Para hacer la correlación de Pearson: “Analizar”--- “Correlaciones” --- “Bivariadas”

Vemos que la significación es 0,177 > 0,05 por lo que aceptamos la hipótesis nula y, por tanto, no existe relación entre las variables, así que la relación entre ambas variables se ha producido al azar.