Upload
martagc20
View
38
Download
0
Embed Size (px)
Citation preview
CORRELACIÓN EN VARIABLES CUANTITATIVAS
En variables cuantitativas podemos aplicar el estadístico R de Pearson, pero para ello se tienen que cumplir dos asunciones:
asume que la distribución es lineal.
asume que la distribución sea normal.
Nuestro ejemplo de variable cuantitativa es el siguiente:
medir la relación que existe entre el peso y la talla
Por tanto, nuestras hipótesis son las siguientes:
H1: existe relación entre peso y talla en nuestra muestra de adolescente.Ho: no existe relación entre peso y talla en nuestra muestra .
ESTUDIO DE LA LINEALIDAD
Para estudiar la linealidad, observamos la nube de puntos mediante el diagrama de dispersión.
Como podemos comprobar en la imagen, este gráfico si sigue una tendencia lineal, por tanto, si se cumple nuestra primera asunción.
ESTUDIO DE LA NORMALIDAD
Podemos explorar la normalidad a modo de:
Gráfico: entre los que distinguimos:• gráfico Q-Q
• histogramas.
• cajas y bigotes.
Pruebas • Komogorov Smirnov.
• Shapiro-WilK.
Tenemos que tener en cuenta que en muestras grandes, las pruebas son significativas y pueden dar datos erróneos.
En este caso tenemos dos variables cuantitativas que son la talla y el peso, por tanto, tenemos que explorar la normalidad de las dos variables.
ESTUDIO DE LA NORMALIDAD MEDIANTE PRUEBAS
Vamos a recordar cuáles son nuestras hipótesis de partida:
H1: existe relación entre peso y talla.
Ho: no existe relación entre peso y talla.
Cabe destacar que para que se cumpla la H1 es necesario que p<0,05 y en este caso el grado de significación es 0,00 por tanto aceptamos la H1 y decimos que nuestra distribución es distinta a la distribución normal.
En conclusión decimos que se cumple la asunción de la linealidad pero que no se cumple la asunción de normalidad mediante pruebas estadísticas, con lo cual, no podríamos aceptar el estadístico r de Pearson.
ESTUDIO DE LA NORMALIDAD MEDIANTE
GRÁFICOS: VARIABLE PESO
1. HISTOGRAMA:
Podemos ver que hay una leve asimetría hacia la izquierda
Por tanto, con estos gráficos llegamos a la conclusión de que el peso tiene un leve incumplimiento de la normalidad
ESTUDIO DE LA NORMALIDAD MEDIANTE GRÁFICOS:
VARIABLE TALLA
1. HISTOGRAMA
Podemos observar que se parece más a la normal
Al menos la talla si se parece a la distribución normal a pesar de que las pruebas nos dicen lo contrario
Se cumple que en muestras grandes las pruebas son significativas , por lo que no nos sirven.
CONCLUSIÓN
Aunque hemos hecho las pruebas de normalidad en esta prueba no eran necesarias debido a que la muestra es grande (N=500) y directamente tiende a la normal.
Como se cumple n las dos asunciones (linealidad y normalidad) podemos aplicar el estadístico r de Pearson.
Si no se cumpliese ninguna de las dos asunciones, tendríamos que realizar la Rho de Spearman.
¿CÓMO SE INTERPRETAN LAS CORRELACIONES?
1. CORRELACIONES
La correlación de peso/correlación de peso es igual a la unidad, ya que cuando se correlaciona la variable consigo misma, es una correlación perfecta.
La correlación peso/correlación talla = 0,65 por tanto, hay una alta correlación.
La significación o error tipo 1 es igual a 0,00 y como p<0,05 se acepta la H1 con lo cual, existe relación entre el peso y la talla
2. CORRELACIONES NO PARAMÉTRICAS
En este caso, las correlaciones no paramétricas no son necesarias porque se cumplen las asunciones de linealidad y normalidad. Destacamos las siguientes:
Tau de Kendal: es más conservadora porque dice que hay correlación pero que es menor.
Rho de Spearman: el resultado es más parecido a la r de Pearson
CORRELACIÓN EN VARIABLES CATEGÓRICAS
Para el estudio de la correlación en variables categóricas vamos a ver:
Correlación biscerial puntual.
Coeficiente de Phi.
Coeficiente de contingencia y V de Cramer.
CORRELACIÓN BISCERIAL PUNTUAL
La correlación biscerial puntual es un tipo de coeficiente de correlación de Pearson.
Se aplica con una variable binaria (sexo) y otra cuantitativa u ordinal (ejercicio físico)
Nuestra H1 es la siguiente: existe relación entre sexo y ejercicio físico
Asumimos que como nuestra muestra es grande, se cumple la asunción de la normalidad.
En cuanto a la interpretación de la correlación:
El efecto es medio ya que la correlación entre sexo/frecuencia de ejercicio es 0,3.
Además, cabe destacar que el signo es negativo y por tanto podemos concluir que cuando se pasa de chico a chica, la frecuencia de ejercicio se reduce.
COEFICIENTE DE PHI
El coeficiente de Phi se utiliza para ver la relación entre dos variables categóricas dicotómicas.
Una característica de las variables categóricas a excepción de la correlación biscerial es que se usan tablas de contingencias o tablas cruzadas.
Las variables que vamos a usar de ejemplo van a ser el sexo y el consumo de tabaco.
Nuestra H1 es la siguiente: existe relación entre sexo y consumo de tabaco.
El valor de coeficiente de phi es 0,019 y como es menor 0,01 significa que la correlación es de muy baja magnitud.
La significación o error tipo 1es 0,648 y al ser p>0,05 se rechaza la H1 y con esto concluimos que no existe relación entre sexo y consumo de tabaco.
En relación con las frecuencias observadas y esperadas cabe destacar que las frecuencias observadas son prácticamente lo esperado ya que no hay diferencia
COEFICIENTE DE CONTINGENCIA Y V DE
CRAMER
Se usan para ver la relación entre dos variables categóricas nominales o no dicotómicas.
Nuestra H1 va a ser: existe relación entre el grado adgar y la frecuencia de consumo de tabaco.
El efecto es bajo porque la correlación es menor a 0,03 no obstante, es significativo.
Además es una correlación positiva: a más….más