Seminario 8

Preview:

Citation preview

Análisis bivariado con variables cuantitativas.

Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman.

Ana Bautista GarroteGrupo A, subgrupo 1

ENFERMERIA (Macarena)

EJERCICIO

Determina si existe relación entre las variables altura y peso del fichero de datos

“activos en salud” y si existe determina cómo de fuerte

es.

-En primer lugar, debemos cargar el conjunto de datos de “Activos en salud” en R Commander.

-En segundo lugar comprobamos si las dos variables cuantitativas siguen o no una distribución normal:

Pearson: si sigue una distribución normal. Rho de Spearman: si no sigue una distribución normal.

A continuación observamos con un Diagrama de dispersión si existe algún tipo de relación entre las variables (peso y altura).

Descubrimos que no se puede apreciar con precisión ningún tipo de relación entre ambas por lo que vamos a proceder a realizar los coeficiente de correlación.

Primero vamos a estudiar si existe distribución normal en las variables (peso y altura)

Para ello, vamos a utilizar el Test de Shapiro Wilk, y pasamos a formular las dos hipótesis correspondientes: Hipótesis nula: la variable (peso o altura) sí sigue una distribución normal. Hipótesis alternativa: la variable (peso o altura) no sigue una distribución normal

Al realizar el Test de Shapiro Wilk obtenemos estos resultados:

VARIABLE PESO

Observamos que el p-valor es menor que 0,05, y sabiendo que el error que podíamos cometer es menor del que en un principio estábamos dispuestos a asumir….

…aceptamos la hipótesis alternativa: la variable no sigue una distribución normal

VARIABLE ALTURA

También nos disponemos de tres gráficos que nos ayudan a estudiar la normalidad.

1.-GRÁFICO Q-Q

VARIABLE PESOVARIABLE ALTURA

Se puede ver como no siguen una distribución normal

2.- BOX-PLOT

VARIABLE PESOVARIABLE ALTURA

No siguen distribución normal, puesto que no coinciden media, mediana y moda.

3.- HISTOGRAMA

VARIABLE PESOVARIABLE ALTURA

No siguen distribución normal porque las barras no son simétricas.

Para finalizar, al no seguir una distribución normal las variables, debemos utilizar el coeficiente de Test de Spearman.

Para ello, antes establecemos las dos hipótesis correspondientes: Hipótesis nula: Existe correlación entre peso y altura (Rho entre -1 y 1) Hipótesis alternativa: No existe correlación entre peso y altura (Rho=0)

RESULTADO:Vemos que Rho es distinto de 0. por lo que podemos decir según las hipótesis formuladas anteriormente, que aceptamos la hipótesis nula (existe correlación entre peso y altura).Se trata de una correlación positiva puesto que 0,622 está alejado del 0 y más cerca del 1.