Upload
ruperto-limones
View
4
Download
2
Embed Size (px)
Citation preview
1
Bondad de Ajuste, MRLC Y MCO
BANCO CENTRAL DE RESERVA DEL PERÚBANCO CENTRAL DE RESERVA DEL PERÚCURSO DE ACTUALIZACIÓN PARA PROFESORESCURSO DE ACTUALIZACIÓN PARA PROFESORES
ECONOMETRÍAECONOMETRÍA
Profesora: Donita Rodríguez.
Agosto 2011
2
1. El MRLCK en Desviaciones Muestrales
2. Descomposición de la Suma de Cuadrados
3. El Coeficiente de Determinación o R2
4. Algunas observaciones sobre el R2
5. Otros criterios de Bondad de Ajuste
6. Aplicaciones
ESQUEMA
3
• El MRLK en desviaciones, para la “t-ésima” observación, está
dado por la siguiente expresión (minúsculas son desvíos):
• Dado que desaparece el término constante, este se obtiene
de:
• Para expresar matricialmente el modelo en desviaciones,
utilizamos la matriz de desvíos A:
iktkttt exxxy ˆˆˆ3322
kk XXXY ˆˆˆˆ33221
ii'IAnn
1
1. EL MRLCK EN DESVIACIONES MUESTRALES
4
• La matriz A es simétrica (A’=A), idempotente (AA=A), Ae=e y
Ai=0. Con A se obtiene el MRLK en desviaciones:
• Para obtener las ecuaciones normales en términos de
desviaciones, multiplicamos el modelo por X*’ y obtenemos:
eβXy
eβXy
AeβAXAy
ˆ
ˆ
ˆ
D
D
yXβXX '2
'**
ˆ)(
1. EL MRLCK EN DESVIACIONES MUESTRALES
eβXy
eβ
AX0y
Aeβ
XiAAy
2*
2
2
2
2
ˆ
ˆ
ˆ][
ˆ
ˆ][
1
1
5
Para el caso del modelo de 2 variables:
SCT = SCE + SCR.
donde:
SCT = Suma total de los cuadrados de las desviaciones de la variable Y.
SCE = Suma explicada de los cuadrados a partir de la regresión de Y
sobre X.
SCR = Suma residual o no explicada de los cuadrados a partir de la
regresión de Y sobre X.
n
ii
n
ii
n
ii eeYYYY
1
2
1
2
1
2 )()ˆˆ()(
2. DESCOMPOSICIÓN DE SUMA DE CUADRADOS.
n
ii
n
ii
n
ii eyy
1
2
1
2
1
2 ˆ
6
• Las expresiones alternativas –en términos de desviaciones- para
la descomposición son:
n
ii
n
ii
n
ii exy
1
2
1
22
1
2 ˆ
n
ii
n
iii
n
ii eyxy
1
2
11
2 ˆ
n
ii
n
ii
n
ii eyry
1
2
1
22
1
2
2. DESCOMPOSICIÓN DE SUMA DE CUADRADOS.
7
• Para el MRLCK, es posible debido a que X’e=0.
• Se parte de , y se obtiene:
• En términos de desviaciones:
SCRSCESCT
YnYn
ee'βXX''βyy' )ˆˆ( 22
eyy ˆ
SCRSCESCT ee'βXXβy'y ' )ˆˆ( 2
'*2
2. DESCOMPOSICIÓN DE SUMA DE CUADRADOS.
8
3. EL COEFICIENTE DE DETERMINACIÓN O R2
• El R2 centrado (alrededor de la media) se define como:
• En términos vectoriales:
– Se demuestra que:
– En el MRLC2:
2
1
1
2
1
2
1
2
2
)(11
)(
)ˆˆ(
n
iii
n
ii
n
iii
n
iii
YY
e
SCTSCR
YY
YY
SCTSCE
R
22 rR
2ˆ,
2
YYrR
Ayy'ee'
Ayy'βXXβ
Ayy'βAXX'β 2
'*
'2 1
ˆˆ)ˆ'ˆ(2
SCTSCE
R
9
• El R2 también se denomina coeficiente de determinación o
bondad de ajuste.
• Mide el porcentaje de la variación total observada de la
variable endógena explicada linealmente por la variación de
las variables independientes del modelo estimado.
• Esta interpretación es válida bajo las siguientes condiciones:
– El estimador analizado debe ser MCO.
– La relación tiene que ser lineal.
– La relación lineal estimada debe incluir intercepto.
3. EL COEFICIENTE DE DETERMINACIÓN O R2
10
Observaciones Importantes sobre el R2.
(1) Lo único que se puede afirmar a partir del valor del R2 es si el
grado de ajuste de los datos muestrales al modelo estimado
es bueno o malo.
(2) Solamente bajo el supuesto de que la muestra es
representativa de los valores poblacionales (verdaderos), un
buen (mal) ajuste de los datos al modelo será equivalente a
que la relación estimada entre las variables involucradas es
relevante (irrelevante).
4. ALGUNAS OBSERVACIONES SOBRE EL R2
11
(3) Si el modelo poblacional tiene intercepto y se estima sin
intercepto, SCE y SCR pueden crecer mucho:
El R2 puede tomar valores mayores que 1: R2 =
SCE/SCT.
El R2 puede tomar valores negativos:
R2=1-(SCR/SCT).
4. ALGUNAS OBSERVACIONES SOBRE EL R2
12
X
Y
ii XY ˆˆˆ
ii XY ˆˆ
4. ALGUNAS OBSERVACIONES SOBRE EL R2
13
(4) El R2 es sensible al rango de variación de las variables
independientes:
– Un mayor rango de variación generará mayor rango de
variación para la dependiente, afectando el R2.
– No tiene sentido comparar el R2 de dos muestras
diferentes: dos períodos diferentes o dos países.
– Tiene más sentido comparar estimados de varianza de la
perturbación de diferentes muestras.
4. ALGUNAS OBSERVACIONES SOBRE EL R2
14
(5) Los econometristas buscan obtener buenos estimados, lo cual
no depende del R2, sino de la metodología y los supuestos
del modelo probabilístico.
(6) Otras advertencias:
• No deben compararse los R2 de dos modelos con
diferentes variables dependientes.
• Las variables dummy pueden “inflar” el R2.
4. ALGUNAS OBSERVACIONES SOBRE EL R2
15
• El R2 no es adecuado para comparar la bondad de ajuste de
dos modelos (anidados) con distinto número de regresores.
• Sólo para comparar modelos (con la misma dependiente)
con igual número de regresores.
– Cuando se añade al modelo un regresor, la SCR o la
parte no explicada por el modelo nunca aumenta: se
mantiene igual o disminuye.
• Se necesitan criterios alternativos: R2 ajustado, AIC, SC
6. OTROS CRITERIOS DE BONDAD DE AJUSTE
16
El R2 Ajustado
• Se define como:
• Puede expresarse alternativamente como:
• Penaliza la inclusión de regresores adicionales.
• La bondad de ajuste de un modelo será mejor mientras
más alto sea el valor del R2 ajustado.
)1/(
)/(12
nSCT
knSCRR
)1()(
)1(1 22 R
kn
nR
)()(
)1(
)(
)1( 22 Rkn
n
kn
kR
6. OTROS CRITERIOS DE BONDAD DE AJUSTE
17
El Criterio de Schwarz (Swarchz Criterion o SC)
• El SC también penaliza el hecho de incluir regresores
adicionales, contrarrestándolo con el nivel de información que
esta variable incluye al modelo.
• Se define como:
• La bondad de ajuste de un modelo será mejor mientras más
bajo sea el valor del SC.
)ln('
ln nn
k
n
eeSC
6. OTROS CRITERIOS DE BONDAD DE AJUSTE
18
El Criterio de Información de Akaike (Akaike Information
Criterion o AIC).
• Es similar al SC. La única diferencia es en la manera de
penalizar la inclusión de regresores adicionales al modelo.
• Se define como:
• La bondad de ajuste de un modelo será mejor mientras más
bajo sea el valor del SC.
n
k
n
eeAIC
2'ln
6. OTROS CRITERIOS DE BONDAD DE AJUSTE
19
7. APLICACIONES
Dependent Variable: EARNINGSMethod: Least SquaresDate: 07/31/11 Time: 23:27Sample: 1 540Included observations: 540
Variable Coefficient Std. Error t-Statistic Prob.
C -19.79196 3.585928 -5.519341 0.0000S 2.870943 0.255034 11.25710 0.0000
R-squared 0.190639 Mean dependent var 19.93339
Adjusted R-squared 0.189135 S.D. dependent var 16.43569
S.E. of regression 14.80002 Akaike info criterion 8.230831
Sum squared resid 117843.8 Schwarz criterion 8.246725Log likelihood -2220.324 F-statistic 126.7222
Durbin-Watson stat 1.885753 Prob(F-statistic) 0.000000
20
7. APLICACIONES
Dependent Variable: EARNINGS
Method: Least Squares
Date: 07/31/11 Time: 23:27
Sample: 1 540
Included observations: 540
Variable Coefficient Std. Error t-Statistic Prob.
C -12.57680 12.03502 -1.045017 0.2965
S 2.878874 0.255490 11.26805 0.0000
AGE -0.179826 0.286313 -0.628074 0.5302
R-squared 0.191233 Mean dependent var 19.93339
Adjusted R-squared 0.188221 S.D. dependent var 16.43569
S.E. of regression 14.80835 Akaike info criterion 8.233800
Sum squared resid 117757.3 Schwarz criterion 8.257642
Log likelihood -2220.126 F-statistic 63.48704
Durbin-Watson stat 1.883935 Prob(F-statistic) 0.000000
Age: edad
21
7. APLICACIONES
Dependent Variable: EARNINGS
Method: Least Squares
Date: 07/31/11 Time: 23:27
Sample: 1 540
Included observations: 540
Variable Coefficient Std. Error t-Statistic Prob.
C -17.43225 4.024129 -4.331931 0.0000
S 2.788855 0.262711 10.61567 0.0000
SIBLINGS -0.391983 0.304064 -1.289144 0.1979
R-squared 0.193136 Mean dependent var 19.93339
Adjusted R-squared 0.190131 S.D. dependent var 16.43569
S.E. of regression 14.79092 Akaike info criterion 8.231444
Sum squared resid 117480.2 Schwarz criterion 8.255287
Log likelihood -2219.490 F-statistic 64.27001
Durbin-Watson stat 1.869203 Prob(F-statistic) 0.000000
Siblings: número de hermanos
22
• ¿Cuál de los dos modelos elegiría? ¿Por qué?
7. APLICACIONES
Modelo 1 Modelo 2 Modelo 3
R2 0.190639 0.191233 0.1931
R2 Ajustado 0.189135 0.188221 0.1901AIC 8.230831 8.2338 8.2314SC 8.246725 8.257642 8.2553
23
1. El MRLCK en Desviaciones Muestrales
2. Descomposición de la Suma de Cuadrados
3. El Coeficiente de Determinación o R2
4. Algunas observaciones sobre el R2
5. Otros criterios de Bondad de Ajuste
6. Aplicaciones
ESQUEMA