Apuntes estadística

Preview:

DESCRIPTION

Correlación lineal simple

Citation preview

PRÁCTICAS

ESTADÍSTICA

Curso de formación adicional 2012

Prof. María José Ponce Darós.

Recordatorio ANÁLISIS INFERENCIAL:

2 variables categóricas (ordinales o nominales):

Prueba de Chi-cuadrado (tabla de contingencia 2x2 o IxJ).

1 variable categórica + 1 variable cuantitativa:

Prueba t (variable categórica con dos categorías o modalidades). Análisis de varianza (variable categórica con 3 o más categorías).

2 variables cuantitativas:

Pruebas: Correlación y regresión.

Correlación lineal simple:

Menú ANALIZAR → correlaciones → bivariadas.

Las correlaciones bivariadas que permite calcular el SPSS son el coeficiente de correlación producto-momento (Pearson), la rho de Spearman y la tau de Kendall.

Los resultados se presentan en forma de matriz de correlaciones en todos los casos, y se ofrece, además, la correspondiente prueba de significación sobre la correlación.

Ejemplo:

En la siguiente figura se muestra el menú de correlaciones.

De las variables que queramos las correlaciones se sitúan en la ventana de variables, en nuestro caso el número de horas de estudio y el rendimiento en matemáticas.

Si se quiere calcular simultáneamente más de una correlación, por ejemplo las correlaciones de horas de estudio con rendimiento en matemáticas, pero también la de horas de estudio con rendimiento en lenguaje, se hace igual pero poniendo simultáneamente las tres variables implicadas en la ventana.

Correlaciones

1 ,708**

,000

188 184

,708** 1

,000

184 184

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Horas de estudios

rendimiento matemáticas

Horas de

estudios

rendimiento

matemáticas

La correlación es significativa al nivel 0,01 (bilateral).**.

Correlación entre horas de estudio y rendimiento

en matemáticas

¿Qué información nos ofrece esta tabla?

Correlación de Pearson 0,708 → Sig (bilateral) < 0,05 → relación

estadísticamente significativa entre las horas de estudio y el rendimiento en

matemáticas.

Índice de correlación de Pearson oscila de -1 a +1.→0,708 → Relación positiva

y elevada.

Rechazamos H0

Conclusión: rechazamos H0.

Hay relación estadísticamente significativa

entre las horas de estudio y el rendimiento

en matemáticas.

Cuantas más horas estudian los alumnos,

mayor es su rendimiento.

Correlaciones

1 ,606** ,662** ,421**

,000 ,000 ,000

183 181 179 181

,606** 1 ,708** ,442**

,000 ,000 ,000

181 188 184 184

,662** ,708** 1 ,441**

,000 ,000 ,000

179 184 184 183

,421** ,442** ,441** 1

,000 ,000 ,000

181 184 183 189

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Inteligencia promedio de

los padres

Horas de estudios

rendimiento matemáticas

rendimiento lenguaje

Inteligencia

promedio de

los padres

Horas de

estudios

rendimiento

matemáticas

rendimiento

lenguaje

La correlación es significativa al nivel 0,01 (bilateral).**.

Correlación entre inteligencia promedio de los padres,

horas de estudio, rendimiento en matemáticas y

rendimiento en lenguaje:

Existe relación estadísticamente significativa entre:

La inteligencia promedio de los padres y las horas de estudio.

La inteligencia promedio de los padres y el rendimiento en matemáticas.

La inteligencia promedio de los padres y el rendimiento en lenguaje.

Horas de estudio y rendimiento en matemáticas.

Horas de estudio y rendimiento en lenguaje.

Rendimiento en matemáticas y rendimiento en lenguaje.

Todas estas relaciones son positivas, es decir, cuando una aumenta, la otra también.

¿Qué relación es la más elevada?

Las horas de estudio y el rendimiento en matemáticas.

¿Y la relación más baja?

La inteligencia promedio de los padres y el rendimiento en lenguaje.

Diagrama de dispersión:

Pedir un diagrama de dispersión para evaluar si la tendencia de relación entre las variables es lineal.

Menú GRÁFICOS → dispersión → simple.

Solamente hay que definir:

- Las horas de estudio como eje de las X (abcisas).

- Rendimiento en matemáticas en el eje de las Y (ordenadas).

Diagrama de dispersión de horas de estudio y

rendimiento en matemáticas.

5,004,504,003,503,002,502,001,501,00

Horas de estudios

5,00

4,50

4,00

3,50

3,00

2,50

2,00

1,50

1,00

ren

dim

ien

to m

ate

máti

cas

Relación lineal positiva.

ACTIVIDADES: Base de datos exploratorio.sav

Actividad 1:

¿Existe correlación entre el peso y la altura de

los estudiantes?

Si existe, ¿cómo es?

Justifica tu respuesta explicando cada paso y

diseña el gráfico de dispersión.

Como Sig (bilateral) es mayor que 0´05, indica que no existe

correlación entre el peso y la altura de los estudiantes.

No hay ninguna relación por ser más o menos alto y pesar más o

menos.

Aceptamos H0.

No existe correlación lineal.

Si eliminamos el caso extremos nº26, que pesa 171kg:

Actividad 2:

¿Existe correlación entre la edad y la altura?

Si existe, ¿cómo es?

Justifica tu respuesta explicando cada paso y

diseña el gráfico de dispersión.

No existe correlación.

Aceptamos H0.

Actividad 3:

¿Existe correlación entre el test de flexibilidad

inicial y la intensidad del dolor inicial?

Si existe, ¿cómo es?

Justifica tu respuesta explicando cada paso y

diseña el gráfico de dispersión.

Aceptamos H0.

No existe correlación lineal entre las variables.

Actividad 4:

¿Existe correlación entre la intensidad del dolor

inicial, el dolor posterior a la intervención, y el

dolor a los 30 días?

Si existe, ¿cómo es?

Justifica tu respuesta explicando cada paso y

diseña el gráfico de dispersión.

Sí existe correlación entre estas tres variables.

Existe una mayor correlación entre el dolor posterior a la intervención, y el dolor

a los 30 días (0´800).

Correlación lineal positiva.

Rechazamos la H0.

Actividad 5:

¿Existe correlación entre la edad y intensidad

del dolor inicial?

Si existe, ¿cómo es?

Justifica tu respuesta explicando cada paso y

diseña el gráfico de dispersión.

Sí existe correlación lineal entre la edad y el dolor inicial.

Conclusión: A mayor edad, más dolor. (Correlación lineal positiva)

Correlación moderada (0´420).

Rechazamos la H0.

Base de datos Datos-def.sav:

Actividad 6:

¿Existe correlación entre la edad y el resultado

de la escala de Tinetti?

Si existe, ¿cómo es?

Justifica tu respuesta explicando cada paso y

diseña el gráfico de dispersión.

Sí existe correlación lineal entre las variables.

Se observa una relación lineal negativa o inversa: a más edad, menos

puntuación en la escala de Tinetti (es decir, mayor riesgo de padecer caídas).

La relación es moderada (-0´518).

Rechazamos la H0.

Actividad 7:

Analiza si existe correlación lineal entre

las variables que elijas, que cumplan los

requisitos para poder realizar este tipo de

análisis.

Ejemplo:

Edad + Barthel

Edad + EVA

Tinetti + Barthel

Tinetti + EVA

Barthel + EVA

Barthel+ EVA+ Tinetti + escala depresión.

Etc.

Recommended