Upload
sebagar
View
553
Download
0
Embed Size (px)
Citation preview
LA REGRESION Y CORRELACION
Consiste en establecer una relación cuantitativa entre dos o más variables.
Peso=f(talla), Consumo=f(Ingreso) Demanda=f(Precio) n: observaciones (x1,y1),..............(xn,
yn) Yi: variable dependiente Xi: variable
independiente.
FORMAS DE RELACION DIAGRAMA DE DISPERSION
Relacion Lineal Yi= a + bXi Relac.no Lineal Yi= a+bXi+cX2
Parabólico Yi= aXb ,Potencial Yi= a.bx ,
Exponencial Yi= a / Xi Hiperbola Equilatera
Diagramas de dispersión o nubes de puntos
TALLA (cm) 160 165 168 170 171 175 175 180 180 182
PESO (kg) 55 58 58 61 67 62 66 74 79 83
Modelo de Regresión lineal Simple
Proceso de estimación en la regresión lineal simple
Modelo de Regresión Lineal Simple
y = βo + β 1 x + εEcuación de Regresión Lineal Simple
E(y) = βo + β 1 x Parametros desconocidos
βo, β 1
Datos de la muestra
x y--------------X1 y1
X2 y2 . . . .
Xn yn
Ecuación estimada de RegresiónLineal Simple
^ y = bo + b 1 x
Estadísticos de la muestra
bo, b 1
bo, b 1Proporcionan estimados de
βo, β 1
MINIMOS CUADRADOS MODELO LINEAL Para el cálculo de los parámetros a y b Estimar Y* = a + bXi Suma Cuadrados de Errores Mínimo e = ∑( Yi - Y*)2
MEDIANTE DERIVADAS PARCIALES Se encuetran las Ecuaciones Normales
ECUACIONES NORMALES ∑Yi = na + b ∑Xi ∑XiYi= a ∑Xi + b ∑Xi2
CALCULO DE LOS PARAMETROS a y b a = ∑Yi ∑Xi2 - ∑Xi ∑XiYi/n ∑Xi2- (∑Xi)2
b = n ∑XiYi - ∑Xi ∑Yi / n ∑Xi2- (∑Xi)2
SUMATORIAS PARA EL CALCULO DE LOS ESTIMADORES DE βo ; β1
Talla (cm)xi
Peso (kg.)yi
XiYi X2i Y2
i
160 55 8.800 25.600 3.025
165 58 9.570 27.225 3.364
168 58 9.744 28.224 3.364
170 61 10.370 28.900 3.721
171 67 11.457 29.241 4.489
175 62 10.850 30.625 3.844
175 66 11.550 30.625 4.356
180 74 13.320 32.400 5.476
180 79 14.220 32.400 6.241
182 83 15.106 33.124 6.889
1.726 663 114.987 298.364 44.769Σ
Cálculo del estimador de βo
a = (∑Yi* ∑Xi2 - ∑Xi* ∑XiYi) / (n ∑ Xi
2 - (∑Xi)2)
a= (663*298364-1726*114987)/(10*298363-(1726)2)
a= -142,907537
Cálculo del estimador de β1
b = (n* ∑XiYi - ∑Xi*∑Yi) /( n ∑Xi2 - (∑Xi)2)
b=(10*114987-1726*663)/(10*298364-(1726)2)
b= 1,21209465 significa que por cada incremento de la talla en un centímetro el peso se incrementa en 1,21 kilogramos.
La recta de la Regresión Lineal es: Y’ = -142,9075 + 1,212Xi
Y'=-142,907+1,212X
Talla (cm)xi
Peso (kg.)yi
Y' Y-Y' (Y-Y')2 (Y-Ymedia)2 (Y'-Ymedia)2
160 55 51,0 4,0 15,8 127,7 233,2
165 58 57,1 0,9 0,8 68,9 84,9
168 58 60,7 -2,7 7,4 68,9 31,1
170 61 63,1 -2,1 4,6 28,1 9,9
171 67 64,4 2,6 7,0 0,5 3,8
175 62 69,2 -7,2 52,0 18,5 8,5
175 66 69,2 -3,2 10,3 0,1 8,5
180 74 75,3 -1,3 1,6 59,3 80,5
180 79 75,3 3,7 13,9 161,3 80,5
182 83 77,7 5,3 28,2 278,9 129,8
1.726 663 663 0 141,6 812,1 670,5
SUMA CUADRADO DE ERRORES DE (SCT;SCR; SCE)
EL ERROR ESTANDAR DE ESTIMACION O DESVIACION ESTANDAR DE LA REGRESION
VARIANZA DE LA REGRESION:
S2yx =Σ(Y-Y’)2/n-k; S2
yx= (ΣY2-aΣY-bΣXY)/n-k
Donde: n= tamaño de muestra y k nº de parámetros estimados
ERROR ESTANDAR DE ESTIMACION
Syx= √Σ(Y-Y’)2/n-k; Syx=√(ΣY2 -aΣY-bΣXY)/n-k
Syx= √(141,6)/8
Syx = √(44769-(-142,9075*663-1,2120945*114987)/8
Syx = 4,2071
DIAGRAMA DE DISPERSION y = 0,0451x - 15,902
1 7
22
27
32
37
750 850 950 1 050 1 1 50 1 250 1 350
Hor as -Hombr es
ERROR EXPLICADO POR LA REGRESION.
ERROR NO EXPLICADO POR LA REGRESION
TOTAL ERROR
Conceptos básicos Análisis de Regresión: Es un procedimiento estadístico que estudia la
relación funcional entre variables.Con el objeto de predecir una en función de la/s otra/s.
Análisis de Correlación: Un grupo de técnicas estadísticas usadas para medir la intensidad de la relación entre dos variables
Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés.
Variable dependiente (respuesta, predicha, endógena): es la variable que se desea predecir o estimar
Variables independientes (predictoras, explicativas exógenas). Son las variables que proveen las bases para estimar.
Regresión simple: interviene una sola variable independiente Regresión múltiple: intervienen dos o más variables independientes. Regresión lineal: la función es una combinación lineal de los parámetros. Regresión no lineal: la función que relaciona los parámetros no es una
combinación lineal
CORRELACION Es el análisis del grado de asociación
entre las variables expresados a través de la función o modelo de Regresión.
R= Cov(Xi,Yi)/Sx.Sy
- 1< = R < = 1 R = 1 Correlac. Perfect. lineal directa R = -1 Correlac. Perfecta Lineal Inversa