30
SEMINARIO 10 Correlación en variables cuantitativas y categóricas

Seminario 10

Embed Size (px)

Citation preview

SEMINARIO 10

Correlación en variables cuantitativas y categóricas

CORRELACIÓN EN VARIABLES CUANTITATIVAS

En variables cuantitativas podemos aplicar el estadístico R de Pearson, pero para ello se tienen que cumplir dos asunciones:

asume que la distribución es lineal.

asume que la distribución sea normal.

Nuestro ejemplo de variable cuantitativa es el siguiente:

medir la relación que existe entre el peso y la talla

Por tanto, nuestras hipótesis son las siguientes:

H1: existe relación entre peso y talla en nuestra muestra de adolescente.Ho: no existe relación entre peso y talla en nuestra muestra .

A continuación, vamos a comprobar si se cumplen las dos asunciones :

ESTUDIO DE LA LINEALIDAD

Para estudiar la linealidad, observamos la nube de puntos mediante el diagrama de dispersión.

Como podemos comprobar en la imagen, este gráfico si sigue una tendencia lineal, por tanto, si se cumple nuestra primera asunción.

ESTUDIO DE LA NORMALIDAD

Podemos explorar la normalidad a modo de:

Gráfico: entre los que distinguimos:• gráfico Q-Q

• histogramas.

• cajas y bigotes.

Pruebas • Komogorov Smirnov.

• Shapiro-WilK.

Tenemos que tener en cuenta que en muestras grandes, las pruebas son significativas y pueden dar datos erróneos.

En este caso tenemos dos variables cuantitativas que son la talla y el peso, por tanto, tenemos que explorar la normalidad de las dos variables.

ESTUDIO DE LA NORMALIDAD MEDIANTE PRUEBAS

Vamos a recordar cuáles son nuestras hipótesis de partida:

H1: existe relación entre peso y talla.

Ho: no existe relación entre peso y talla.

Cabe destacar que para que se cumpla la H1 es necesario que p<0,05 y en este caso el grado de significación es 0,00 por tanto aceptamos la H1 y decimos que nuestra distribución es distinta a la distribución normal.

En conclusión decimos que se cumple la asunción de la linealidad pero que no se cumple la asunción de normalidad mediante pruebas estadísticas, con lo cual, no podríamos aceptar el estadístico r de Pearson.

ESTUDIO DE LA NORMALIDAD MEDIANTE

GRÁFICOS: VARIABLE PESO

1. HISTOGRAMA:

Podemos ver que hay una leve asimetría hacia la izquierda

2. GRÁFICO Q-Q:

Podemos observar que por debajo hay ciertas puntuaciones que se alejan de la línea.

3. DIAGRAMA DE CAJAS Y BIGOTES

Podemos observar como el individuo 24 se sale de la muestra

Por tanto, con estos gráficos llegamos a la conclusión de que el peso tiene un leve incumplimiento de la normalidad

ESTUDIO DE LA NORMALIDAD MEDIANTE GRÁFICOS:

VARIABLE TALLA

1. HISTOGRAMA

Podemos observar que se parece más a la normal

2. GRÁFICO Q-Q

Está más cerca de la distribución normal.

3. DIAGRAMA DE CAJAS Y BIGOTES

Podemos observar que es bastante más simétrico

Al menos la talla si se parece a la distribución normal a pesar de que las pruebas nos dicen lo contrario

Se cumple que en muestras grandes las pruebas son significativas , por lo que no nos sirven.

CONCLUSIÓN

Aunque hemos hecho las pruebas de normalidad en esta prueba no eran necesarias debido a que la muestra es grande (N=500) y directamente tiende a la normal.

Como se cumple n las dos asunciones (linealidad y normalidad) podemos aplicar el estadístico r de Pearson.

Si no se cumpliese ninguna de las dos asunciones, tendríamos que realizar la Rho de Spearman.

¿CÓMO SE INTERPRETAN LAS CORRELACIONES?

1. CORRELACIONES

La correlación de peso/correlación de peso es igual a la unidad, ya que cuando se correlaciona la variable consigo misma, es una correlación perfecta.

La correlación peso/correlación talla = 0,65 por tanto, hay una alta correlación.

La significación o error tipo 1 es igual a 0,00 y como p<0,05 se acepta la H1 con lo cual, existe relación entre el peso y la talla

2. CORRELACIONES NO PARAMÉTRICAS

En este caso, las correlaciones no paramétricas no son necesarias porque se cumplen las asunciones de linealidad y normalidad. Destacamos las siguientes:

Tau de Kendal: es más conservadora porque dice que hay correlación pero que es menor.

Rho de Spearman: el resultado es más parecido a la r de Pearson

CORRELACIÓN EN VARIABLES CATEGÓRICAS

Para el estudio de la correlación en variables categóricas vamos a ver:

Correlación biscerial puntual.

Coeficiente de Phi.

Coeficiente de contingencia y V de Cramer.

CORRELACIÓN BISCERIAL PUNTUAL

La correlación biscerial puntual es un tipo de coeficiente de correlación de Pearson.

Se aplica con una variable binaria (sexo) y otra cuantitativa u ordinal (ejercicio físico)

Nuestra H1 es la siguiente: existe relación entre sexo y ejercicio físico

Asumimos que como nuestra muestra es grande, se cumple la asunción de la normalidad.

En cuanto a la interpretación de la correlación:

El efecto es medio ya que la correlación entre sexo/frecuencia de ejercicio es 0,3.

Además, cabe destacar que el signo es negativo y por tanto podemos concluir que cuando se pasa de chico a chica, la frecuencia de ejercicio se reduce.

COEFICIENTE DE PHI

El coeficiente de Phi se utiliza para ver la relación entre dos variables categóricas dicotómicas.

Una característica de las variables categóricas a excepción de la correlación biscerial es que se usan tablas de contingencias o tablas cruzadas.

Las variables que vamos a usar de ejemplo van a ser el sexo y el consumo de tabaco.

Nuestra H1 es la siguiente: existe relación entre sexo y consumo de tabaco.

El valor de coeficiente de phi es 0,019 y como es menor 0,01 significa que la correlación es de muy baja magnitud.

La significación o error tipo 1es 0,648 y al ser p>0,05 se rechaza la H1 y con esto concluimos que no existe relación entre sexo y consumo de tabaco.

En relación con las frecuencias observadas y esperadas cabe destacar que las frecuencias observadas son prácticamente lo esperado ya que no hay diferencia

COEFICIENTE DE CONTINGENCIA Y V DE

CRAMER

Se usan para ver la relación entre dos variables categóricas nominales o no dicotómicas.

Nuestra H1 va a ser: existe relación entre el grado adgar y la frecuencia de consumo de tabaco.

El efecto es bajo porque la correlación es menor a 0,03 no obstante, es significativo.

Además es una correlación positiva: a más….más

Cabe destacar que la disfuncional grave esperaba que fumaran menos todos los días de lo recontado.

Realizado por:

Marta Gómez Conejero

Subgrupo 6

Primero de Enfermería

H.U. Virgen de Rocío.