REGRESIÓN Y CORRELACIÓN
Objetivo TerminalObjetivo Terminal
Al finalizar la unidad el estudiante será capaz de analizar el coeficiente de correlaciòn de Pearson y la ecuaciòn de regresión
Objetivo de la Unidad Definir medidas de correlación y su aplicación en el
estudio entre variables Calcular e interpretar las medidas de correlación en
ejemplos que se presenten Definir coeficiente de regresión interpretando el
significado de su valor en datos que se presenten Predecir un valor mediante la aplicación de la ecuación de
regresión en datos que se le presenten Valorar la importancia de los parametros biologicos
utilizando medidas de asociación y predicción.
Cuando se plantean estudios correlaciónales es indispensables contar con pruebas estadísticas apropiadas para conocer si existe relación o independencia entre dos variables que podrían estar asociadas.
Cuando se plantean estudios correlaciónales es indispensables contar con pruebas estadísticas apropiadas para conocer si existe relación o independencia entre dos variables que podrían estar asociadas.
Características
• Solo mide relaciones lineales. Si la relación entre las variables es lineal y al menos una de ella se distribuye normalmente
•Cuando se busca analizar la relación entre dos variables medidas en escala numérica.
•Es una prueba estadística para analizar la relación entre dos variables mutuamente dependientes.
•Su principal objetivo es determinar que intensa es la relación entre dos variables
•Se altera de manera importante ante la presencia de valores extremos
•No implica causalidad
COEFICIENTE DE CORRELACION DE PEARSON (ϒ)
COEFICIENTE DE CORRELACION DE PEARSON (ϒ)
Característ icas
• Sus valores oscilan entre – 1 y + 1 ambos extremos representan relaciones perfectas entre las variables.
• El cero (0) representa la ausencia de relación. • El signo posit ivo o negativo indican la dirección es
decir:• Un valor posit ivo (+) indica que las dos variables
aumentan o disminuyen al mismo tiempo. • Un valor negativo (-) indica que cuando una de las
variable aumenta la otra disminuye o viceversa.• El valor numérico indica la magnitud de la correlación
0
No hay correlación
-0,25 +0,25
Escasa
-0,5 +0,5
Cierta C.Cierta C.
+0,75-0,95-1 -0,75 +0,95 +1
Moderada. Moderada.Muy B. Muy B.Excel.. Excel..
PerfectaPerfecta
Escasa
VALOR TIPO DE RELACIÓN
< 0,50 ESCASA O NULA
ENTRE 0,51 y 0,80 MODERADA A BUENA
ENTRE 0,81 y 0,95 MUY BUENA
> 0,95 EXCELENTE
1. Elaborar el diagrama de dispersión
2.Obtener el promedio para cada una de las variables
3.Estimar en cuánto difiere cada observación
( x ó y) de su promedio
PASOS PARA CALCULAR EL COEFICIENTE DE CORRELACIÓN DE PEARSON
4. Elevar al cuadrado las diferencias o desviaciones y realizar la sumatoria.
5. Calcular el producto de las desviaciones obtenidas, respetando los signos y realizar la sumatoria de esos productos
6. Calcular el coeficiente de correlación (asociación entre variables)
PASOS PARA CALCULAR EL COEFICIENTE DE CORRELACIÓN DE PEARSON
Peso del niño al nacer (Kgs)
Y
Tensión Arterial de la madre (mmhg)
X
2,4002,5002,6002,7002,8002,9003,0003,1003,2003,300
180170160150140130120110100 90
Tensión arterial de la madre y el peso del niño al nacer en la Maternidad del Hospital AMP del Estado Lara.
Paso1: Representar los datos en un diagrama de dispersión
TA
20018016014012010080
PE
SO
3,4
3,2
3,0
2,8
2,6
2,4
2,2
Peso del niño al nacer según tensión arterial de la madrePeso del niño al nacer según tensión arterial de la madre
Y X (y- y) (x-x) (y-y)2 (x- x)2 ∑ (y-y)(x-x)
∑Media
2,4002,5002,6002,7002,8002,9003,0003,1003,2003,300
28.52,85
18017016015014013012011010090
1350135
-0.45-0.35-0.25-0.15-0.050.050.150.250.350.45
453525155-5
-15-25-35-45
. 202.122.062.022.002.002.022.062.122.202
.821
202512256252252525
225625
12252025
8250
-20,25-12,25-6,25-2,25-0.25-0.25-2.25-6.25
-12.25-20.25
-82.5
γ = - 1 ; Este resultado indica una relación negativa y excelente entre las variables
∑∑
∑∑∑
−=
−−
−−=
821.08250
00.82
)()(
))((22
γ
γYYXX
YYXX
A partir de los datos anteriores, se sustituyen en la fórmula y obtendremos los siguientes resultados:
Pasos: 6
Se simboliza: r2
Es el porcentaje de variación de una variable debido a la variación de otra donde “Y” es la variable dependiente y “X” la Independiente
EJ: El valor obtenido (- 1) se eleva al cuadrado y se multiplica por 100Es decir: (- 1)2 x 100 = 100
¿Qué significa? 100% de las variaciones del peso del niño al nacer son explicadas por la tensión arterial de la madre
Coeficiente de Regresión
1. Estima el efecto de una variable sobre otra. Una llamada variable dependiente (Y), y otra denominada independiente, explicativa o predictora (X).
2. Predice la relación entre variables.
3. Expresa que los valores de la variable dependiente cambian “b” unidades por cada unidad de cambio de la variable independiente.
1. El coeficiente de regresión puede tener cualquier valor.
2. Si es positivo indica que ambas variables aumentan a la vez.
3. Si es negativo indica que si una variable aumenta la otra disminuye o viceversa.
4. Si fuera cero (0) para cualquier valor de X habría siempre el mismo valor en la variable Y o para cada valor X se pudieran observar cualquier valor en la variable Y
CALCULO COEFICIENTE DE REGRESIÓN
Fórmula:
b= ∑(X-X)* (Y-Y) ; b= -82.50
(X-X)2 8250
b= - 0.01
Este coeficiente de regresión significa:
Por cada unidad (mmhg) que aumenta la tensión arterial de la madre, el peso del niño al nacer disminuye en 0.01 Kgs.
y
x
b
a
Permite predecir los valores de la variable dependiente conociendo los valores de la variable independiente:
Formula:Y = a + b x, donde a= (y – b.x)
X = variable independiente predictora o explicativa
Y = variable dependiente o respuesta.
a = punto donde la recta corta el eje de las ordenadas, es decir el valor que toma la variable Y cuando la variable X vale cero (0)
b = Pendiente de la recta: indica la cantidad en que varia la variable Y por cada unidad de variación de la variable X
Ecuación de Regresión Lineal Simple
Ejemplo, si quisiéramos predecir el peso de un niño al nacer hijo de madre con una de tensión arterial de 85 mmhg:
Al sustituir los valores en la fórmula obtendremos lo siguiente:
Y = [2.850 – (135 * -0.01)] + (-0,01) * 85
entonces:
Y = 4,2 - (-0.01 x 85) ; 3,350 Kgs
Significa: El peso de un niño al nacer cuya madre presente una tensión arterial de 85 mmhg puede estimarse en 3,350 Kgs.
Los siguientes datos corresponden a mujeres embarazadas que asisten a la consulta prenatal del Ambulatorio La Carucieña, realiza los cálculos e interpreta los resultados de los siguientes estadísticos:
a) Coeficiente de Regresión
b) Coeficiente de Correlación
c) Coeficiente de Determinación
e) Estima la presión sanguínea una embarazada de 38 años.
Presión Sistolica (Y)
Edad (X)
139171137111133128183130133144
41414647484949505151
Ejercicio de Aplicación: