Material Docente de
Econometría Curso 2012-2013. Primera parte
Problemas y cuestiones
Cuarto curso de Economía Cuarto curso de Administración y Dirección de Empre sas Cuarto curso de Derecho y Administración y Direcció n de
Empresas
Profesores: Isabel Gómez Valle
Yolanda González González Carmen Lorenzo Lago
Mª Dolores de Prada Moraga Mercedes Prieto Alaiz
Econometría Curso 2012-13
1
PROBLEMAS: Temas 1 a 6
PRÁCTICA 1: Dados los siguientes datos correspondientes a las variables Y (beneficio empresarial en millones de euros) y X (gasto en publicidad, en miles de euros):
X 1 2 3 4 5
Y 2 2 5 6 8
Se pide:
a) Trazar un diagrama de dispersión para los datos de la tabla y determinar a la vista del mismo si existe una relación lineal aproximada.
b) Expresar la relación que intente explicar el beneficio empresarial en función del gasto en publicidad mediante una forma lineal exacta y forma estocástica.
c) Enumerar las hipótesis del modelo de regresión lineal clásico de dos variables y dar una explicación intuitiva de su significado.
d) Comentar:
• la diferencia entre parámetros y estimadores. • la diferencia entre perturbación y residuo.
e) Obtener los estimadores por MCO de los parámetros en notación matricial y escalar, así como la de los estimadores de sus varianzas. Analizar su precisión e interpretar su
significado.
f) Analizar la bondad del ajuste. Calcular la suma de los residuos y ver si la suma de las observaciones de la variable endógena es igual a la suma de las observaciones de la
variable endógena estimada.
Econometría Curso 2012-13
2
PRÁCTICA 2: Dado el siguiente modelo de regresión lineal clásico:
tttt XXY εβββ +++= 22110
y disponiendo de las siguientes observaciones:
Yt X1t X2t
40
45
50
65
70
100
200
300
400
500
10
25
30
35
50
donde:
Yt= consumo “per cápita” en el año t.
X1t= renta disponible “per cápita” en el año t.
X2t= precios en el año t.
a) Realiza la estimación del modelo por MCO. Calcula la matriz de varianzas y covarianzas de los estimadores, el coeficiente de determinación, los valores de la variable endógena
ajustada y los residuos.
b) Comprueba qué sucede con los estimadores si al realizar el apartado anterior se supone que el modelo no tiene término independiente.
ΣYt=270 ΣX1t2=550,000 ΣX1tYt=89,000
ΣX1t=1,500 ΣX2t2=5,350 ΣX2tYt=8,800
ΣX2t=150 ΣX1t X2t=54,000 ΣYt2=15,250
Descriptivos Y X1 X2
Mean 54,00000 300,0000 30,00000
Median 50,00000 300,0000 30,00000
Maximum 70,00000 500,0000 50,00000
Minimum 40,00000 100,0000 10,00000
Std. Dev. 12,94218 158,1139 14,57738
Skewness 0,243688 1,41E-16 0,000000
Kurtosis 1,396859 1,700000 2,223183
Jarque-Bera 0,584916 0,352083 0,125718
Probability 0,746427 0,838583 0,939076
Sum 270,0000 1500,000 150,0000
Sum Sq. Dev. 670,0000 100000,0 850,0000
Observations 5 5 5
Econometría Curso 2012-13
3
Matriz de covarianzas Y X1 X2
Y 134,0000 1600,000 140,0000
X1 1600,000 20000,00 1800,000
X2 140,0000 1800,000 170,0000
Matriz de correlaciones Y X1 X2
Y 1,000000 0,977356 0,927580
X1 0,977356 1,000000 0,976187
X2 0,927580 0,976187 1,000000
Estimación con término constante
Dependent Variable: Y
Method: Least Squares
Date: 10/09/09 Time: 12:34
Sample: 1 5
Included observations: 5
Variable Coefficient Std. Error t-Statistic Prob.
C 31.50000 3.640055 8.653716 0.0131
X1 0.125000 0.046098 2.711631 0.1133
X2 -0.500000 0.500000 -1.000000 0.4226
R-squared 0.970149 Mean dependent var 54.00000
Adjusted R-squared 0.940299 S.D. dependent var 12.94218
S.E. of regression 3.162278 Akaike info criterion 5.424171
Sum squared resid 20.00000 Schwarz criterion 5.189834
Log likelihood -10.56043 F-statistic 32.50000
Durbin-Watson stat 2.500000 Prob(F-statistic) 0.029851
Estimación sin término constante
Dependent Variable: Y
Method: Least Squares
Date: 10/09/09 Time: 12:37
Sample: 1 5
Included observations: 5
Variable Coefficient Std. Error t-Statistic Prob.
X1 0.035849 0.227467 0.157601 0.8848
X2 1.283019 2.306342 0.556300 0.6168
R-squared -0.147564 Mean dependent var 54.00000
Adjusted R-squared -0.530085 S.D. dependent var 12.94218
S.E. of regression 16.00904 Akaike info criterion 8.673358
Sum squared resid 768.8679 Schwarz criterion 8.517134
Log likelihood -19.68340 Durbin-Watson stat 0.892001
Econometría Curso 2012-13
4
PRÁCTICA 3: Dado el siguiente modelo de regresión lineal clásico:
tttt XXY εβββ +++= 22110
y disponiendo de las siguientes observaciones:
Yt X1t X2t
3
2
4
5
5
7
6
8
8
12
1
2
2
3
4
5
5
9
9
15
8
14
10
9
7
6
8
4
3
1
1) Realiza la estimación del modelo por MCO. Calcula la matriz de varianzas y covarianzas de los estimadores, los coeficientes de variación, el coeficiente de
determinación, los valores de la variable endógena ajustada y los residuos.
2) Comprueba qué sucede con los estimadores si al realizar el apartado anterior se supone que el modelo no tiene término independiente.
Solución apartado 1):
ttt XXY 21 26723,044706,041176,5ˆ −+=
)1203,0()104,0()3843,1( R2=0,9576
Econometría Curso 2012-13
5
PRACTICA 4: El fichero datos4.wf1 recoge datos sobre el coste de mantenimiento en euros (Y) de 20 empresas correspondientes al mismo sector, así como del número de máquinas
disponibles por cada empresa (X1), de la media de los años de especialización del equipo
de mantenimiento de cada empresa (X2) y de la media del número de años de antigüedad
de las máquinas (X3).
obs Y X1 X2 X3
1 1.923,239 50 7,4 7,4
2 2.704,554 53 5,1 5,406
3 2.223,745 60 4,2 5,04
4 2.824,757 63 3,9 4,914
5 2.524,251 69 1,4 1,932
6 3.005,061 82 2,2 3,608
7 3.425,769 100 7 14
8 3.846,477 104 5,7 11,856
9 4.026,781 113 13,1 29,606
10 4.687,894 130 16,4 42,64
11 4.146,984 150 5,1 15,3
12 4.207,085 181 2,9 10,498
13 5.469,210 202 4,5 18,18
14 5.589,413 217 6,2 26,908
15 5.649,514 229 3,2 14,656
16 6.430,830 240 2,4 11,52
17 6.971,740 243 4,9 23,814
18 7.272,246 247 8,8 43,472
19 8.714,676 249 10,1 50,298
20 7.332,348 254 6,7 34,036
1 En el modelo que explica el gasto en mantenimiento en función del resto de las
variables, calcula los coeficientes primero con los datos originales y después con los
datos tipificados. A la vista de los resultados ¿cuál dirías que es la variable que más
influye en el gasto en mantenimiento, manteniendo todo lo demás constante?
2 Con la estimación obtenida con datos originales, realiza los siguientes apartados:
a) Analiza dicha estimación (estimadores, bondad, significación individual y conjunta).
b) Contrasta la significación conjunta de X2 y X3. c) Contrasta el conjunto de restricciones: 12 31 == ββ y .
d) ¿Se puede aceptar que si el número de máquinas aumentara en 2 unidades, el coste de mantenimiento se incrementaría en 200 euros?
e) ¿Se puede aceptar que el efecto que tiene sobre la variable endógena el número medio de años de especialización del equipo de mantenimiento es el mismo, pero de
signo contrario que el que tiene la media de los años de antigüedad de las
máquinas?
f) ¿Se puede aceptar que si el número de máquinas aumenta en 10 unidades el coste aumenta en 500 euros y que a la vez la media de los años de especialización del
equipo de mantenimiento no es significativa?
g) ¿Se puede aceptar que si el número de máquinas aumenta en 10 unidades el coste aumenta en 500 euros y si conjuntamente aumentan en 2 la media de los años de
especialización del equipo de mantenimiento y disminuyen en 1 la media de los
años de antigüedad de las máquinas el coste disminuye en 100 euros?
(Nivel de significación: 5%)
Econometría Curso 2012-13
6
Estimaciones apartado (1) Para generar las variables tipificadas, restamos la media y dividimos por la desviación
típica. Por ejemplo, para generar x1 tipificada:
genr tipx1=(x1-@mean(x1))/@sqr(@var(x1))
Dependent Variable: TIPY
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 3.57E-16 0.047819 7.46E-15 1.0000
TIPX1 0.555081 0.113668 4.883357 0.0002
TIPX2 -0.288625 0.132216 -2.182971 0.0443
TIPX3 0.642494 0.172457 3.725526 0.0018
R-squared 0.963414 Mean dependent var 1.67E-16
Adjusted R-squared 0.956554 S.D. dependent var 1.025978
S.E. of regression 0.213853 Akaike info criterion -
0.070203
Sum squared resid 0.731727 Schwarz criterion 0.128943
Log likelihood 4.702033 F-statistic 140.4406
Durbin-Watson stat 2.049221 Prob(F-statistic) 0.000000
Dependent Variable: Y
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 1824.096 430.0058 4.242026 0.0006
X1 13.99922 2.866721 4.883357 0.0002
X2 -150.6805 69.02544 -2.182971 0.0443
X3 85.99539 23.08275 3.725526 0.0018
R-squared 0.963414 Mean dependent var 4648.829
Adjusted R-squared 0.956554 S.D. dependent var 1951.429
S.E. of regression 406.7515 Akaike info criterion 15.03114
Sum squared resid 2647148. Schwarz criterion 15.23028
Log likelihood -146.3114 F-statistic 140.4406
Durbin-Watson stat 2.049221 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
7
Apartado (2b) Dependent Variable: Y
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 1011.344 314.2324 3.218457 0.0048
X1 23.96235 1.853857 12.92567 0.0000
R-squared 0.902741 Mean dependent var 4648.829
Adjusted R-squared 0.897338 S.D. dependent var 1951.429
S.E. of regression 625.2564 Akaike info criterion 15.80884
Sum squared resid 7037020. Schwarz criterion 15.90841
Log likelihood -156.0884 F-statistic 167.0730
Durbin-Watson stat 1.211301 Prob(F-statistic) 0.000000
Wald Test:
Equation: EQ02
Null
Hypothesis:
C(3)=0
C(4)=0
F-statistic 13.26672 Probability 0.000401
Chi-square 26.53344 Probability 0.000002
Apartado (2c) YT=Y-2X1-X3 Dependent Variable: YT
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 3628.754 776.3163 4.674325 0.0002
X2 115.1353 109.7910 1.048677 0.3082
R-squared 0.057578 Mean dependent var 4326.474
Adjusted R-squared 0.005221 S.D. dependent var 1793.534
S.E. of regression 1788.846 Akaike info criterion 17.91117
Sum squared resid 57599430 Schwarz criterion 18.01074
Log likelihood -177.1117 F-statistic 1.099724
Durbin-Watson stat 0.138035 Prob(F-statistic) 0.308204
Econometría Curso 2012-13
8
La regresión anterior se puede hacer sin generar previamente la variable YT: Dependent Variable: Y-2*X1-X3
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 3628.754 776.3163 4.674325 0.0002
X2 115.1353 109.7910 1.048677 0.3082
R-squared 0.057578 Mean dependent var 4326.474
Adjusted R-squared 0.005221 S.D. dependent var 1793.534
S.E. of regression 1788.846 Akaike info criterion 17.91117
Sum squared resid 57599430 Schwarz criterion 18.01074
Log likelihood -177.1117 F-statistic 1.099724
Durbin-Watson stat 0.138035 Prob(F-statistic) 0.308204
Wald Test:
Equation: EQ02
Null
Hypothesis:
C(2)=2
C(4)=1
F-statistic 166.0724 Probability 0.000000
Chi-square 332.1448 Probability 0.000000
Apartado (2d) Wald Test:
Equation: EQ02
Null
Hypothesis:
C(2)=100
F-statistic 899.9822 Probability 0.000000
Chi-square 899.9822 Probability 0.000000
Apartado (2e) Wald Test:
Equation: EQ02
Null
Hypothesis:
C(3)+C(4)=0
F-statistic 1.797795 Probability 0.198706
Chi-square 1.797795 Probability 0.179979
Econometría Curso 2012-13
9
Apartado (2f) Wald Test:
Equation: EQ02
Null
Hypothesis:
C(2)=50
C(3)=0
F-statistic 192.9379 Probability 0.000000
Chi-square 385.8757 Probability 0.000000
Apartado (2g) Dependent Variable: Y-50*X1-100*X3
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficien
t
Std. Error t-Statistic Prob.
C -1682.250 792.5486 -2.122583 0.0479
X2+2*X3 -71.94070 14.78054 -4.867259 0.0001
R-squared 0.568244 Mean dependent var -
4816.591
Adjusted R-squared 0.544258 S.D. dependent var 3060.529
S.E. of regression 2066.123 Akaike info criterion 18.19938
Sum squared resid 76839576 Schwarz criterion 18.29895
Log likelihood -179.9938 F-statistic 23.69021
Durbin-Watson stat 0.446080 Prob(F-statistic) 0.000124
Wald Test:
Equation: EQ02
Null
Hypothesis:
C(2)=50
2*C(3)+100=C(4)
F-statistic 224.2184 Probability 0.000000
Chi-square 448.4369 Probability 0.000000
Econometría Curso 2012-13
10
PRÁCTICA 5: Se desea estimar una función de demanda de manzanas para la economía española para el periodo 1970-1990 según se recoge en el cuadro siguiente. Las series de
datos se recogen el fichero datos5.wf1 y corresponden al consumo de manzanas expresado
en decenas de miles de toneladas (Y), precio de las manzanas en euros por kilogramo (X1),
precio de las peras en euros por kilogramo (X2) y renta nacional neta en miles de millones
de euros (X3).
obs X1 X2 X3 Y
1970 0.66177 0.67734 12.98007 40.96910
1971 0.65727 0.66256 14.76985 35.58961
1972 0.65721 0.65901 17.42818 36.46826
1973 0.66610 0.67289 21.02961 35.82432
1974 0.65204 0.65901 26.04892 36.93440
1975 0.67422 0.69399 30.55850 40.01959
1976 0.64843 0.64176 36.67395 35.81354
1977 0.73924 0.80223 46.51522 46.88589
1978 0.69495 0.79261 57.56297 50.07885
1979 0.66676 0.73822 66.87424 45.81358
1980 0.71563 0.76094 76.74535 44.72002
1981 0.70457 0.72500 83.61080 42.53917
1982 0.73173 0.81347 96.13585 51.56290
1983 0.75583 0.74556 107.66687 40.04668
1984 0.74748 0.80139 120.90579 48.07645
1985 0.77386 0.75319 140.04375 39.47407
1986 0.85710 0.92670 152.36875 51.45681
1987 0.81245 0.88054 171.50968 50.90479
1988 0.82032 0.95447 191.87522 64.21715
1989 0.81858 0.88565 215.38314 56.94415
1990 0.92790 1.01709 225.11683 58.06092
El modelo que se propone para dicha estimación es el que recoge una relación lineal entre
las variables disponibles según la siguiente especificación:
ttttot XXXY εββββ ++++= 321 321
a) Estimar el modelo y comentar los resultados. b) Para analizar la capacidad predictiva del modelo se ha reestimado el modelo para el
periodo 1970-1986. Calcular dicha capacidad para los años 1987-1990.
c) En vista de los resultados del apartado anterior. Predecir el consumo de manzanas para los años 1991 y 1992 teniendo en cuenta los valores que tomarán las variables
explicativas en esos años.
obs X1 X2 X3
1991 0.93157 1.03374 228.6846
1992 1.20202 1.15394 258.4352
d) Analizar la precisión de la predicción de la variable endógena para el año 1991. ¿Se puede aceptar que el consumo de manzanas en ese año será igual a 65 decenas de miles
de toneladas?.
(Fuente: Pena et al. Cien ejercicios de Econometría. Ed. Pirámide. 1999)
Econometría Curso 2012-13
11
Estimación del modelo para la muestra 1970-1990 Dependent Variable: Y
Method: Least Squares
Sample: 1970 1990
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
X1 -129.1445 14.86578 -8.687366 0.0000
X2 130.5201 8.884055 14.69151 0.0000
X3 0.051235 0.012713 4.030174 0.0009
C 34.20980 7.065776 4.841620 0.0002
R-squared 0.976125 Mean dependent var 45.35239
Adjusted R-squared 0.971912 S.D. dependent var 8.174013
S.E. of regression 1.369931 Akaike info criterion 3.637041
Sum squared resid 31.90410 Schwarz criterion 3.835998
Log likelihood -34.18893 F-statistic 231.6793
Durbin-Watson stat 1.770086 Prob(F-statistic) 0.000000
Estimación del modelo para la muestra 1970-1986 Dependent Variable: Y
Method: Least Squares
Sample: 1970 1986
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
X1 -107.3637 15.84571 -6.775572 0.0000
X2 124.4200 8.544156 14.56200 0.0000
X3 0.030486 0.014653 2.080489 0.0578
C 24.63787 7.586632 3.247537 0.0064
R-squared 0.964907 Mean dependent var 42.48666
Adjusted R-squared 0.956808 S.D. dependent var 5.668416
S.E. of regression 1.178044 Akaike info criterion 3.367913
Sum squared resid 18.04125 Schwarz criterion 3.563963
Log likelihood -24.62726 F-statistic 119.1473
Durbin-Watson stat 1.597403 Prob(F-statistic) 0.000000
Análisis de la capacidad predictiva para 1987-1990
48
52
56
60
64
68
1987 1988 1989 1990
YF ± 2 S.E.
Forecast: YFActual: YForecast sample: 1987 1990Included observations: 4
Root Mean Squared Error 2.391354Mean Absolute Error 2.033892Mean Abs. Percent Error 3.484383Theil Inequality Coefficient 0.020946 Bias Proportion 0.254550 Variance Proportion 0.207255 Covariance Proportion 0.538195
Predicción para 1991 y 1992
Obs YF SF
1991 60.52805 1.639171
1992 42.82869 3.937987
Econometría Curso 2012-13
12
PRACTICA 6: Se desea elaborar un modelo para explicar el precio del cobre en Estados Unidos. Para ello, el fichero datos6.wf1 contiene datos anuales para el periodo 1971-1996
relativos al precio del cobre en Estados Unidos (COSTE), al Producto Nacional Bruto del
país (G), al precio del cobre en la bolsa de Londres (L), al número de casas construidas en
el año (H) y al precio del aluminio(A). Todas las variables están medidas en dólares,
excepto el Producto Nacional Bruto que está medido en cientos de miles de millones de
dólares y el número de casas que está medido en cientos de miles de unidades.
1) Especifica y estima un modelo lineal en el que el precio del cobre se explique en función del resto de variables disponibles. Analiza los resultados.
2) ¿Podría aceptarse que un incremento de un dólar en el precio del cobre en la bolsa de Londres tiene el mismo efecto sobre el precio del cobre en Estados unidos que un
incremento de 200 mil millones de dólares en el Producto Nacional Bruto?
3) Contrasta si un incremento en el precio del aluminio de 2 dólares y una disminución de 4 dólares en el precio del cobre en Londres disminuiría en 1,5 dólares el precio
del cobre en Estados Unidos y que a la vez el número de casas construidas es una
variable no significativa.
4) Analiza la capacidad predictiva del modelo para el periodo 1991-1996. 5) Realiza una predicción del precio del cobre en Estados Unidos para 1997, sabiendo
que el precio del cobre en la bolsa de Londres esperado para ese año era de 6.8
dólares, el precio del aluminio es de 4.4 dólares, el número de casa construidas son
800 mil y el valor previsto para el Producto Nacional Bruto para ese año de 7.900
mil millones de dólares. ¿Podría aceptarse un precio del cobre en Estados Unidos
para 1997 de 8 dólares?
Apartado 1) Dependent Variable: COSTE
Method: Least Squares
Sample: 1971 1996
Included observations: 26
Variable
Coefficien
t Std. Error t-Statistic Prob.
G 0.552399 0.085269 6.478331 0.0000
L -0.017005 0.019340 -0.879251 0.3892
H 0.012599 0.166916 0.075481 0.9405
A 0.354951 0.225145 1.576546 0.1298
C -1.152568 1.662749 -0.693170 0.4958
R-squared 0.921208 Mean dependent var 3.612807
Adjusted R-squared 0.906200 S.D. dependent var 0.373064
S.E. of regression 0.114258 Akaike info criterion -1.329682
Sum squared resid 0.274150 Schwarz criterion -1.087741
Log likelihood 22.28587 F-statistic 61.38109
Durbin-Watson stat 1.332990 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
13
Apartado 2)
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 46.29912 (1, 21) 0.0000
Chi-square 46.29912 1 0.0000
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
-2*C(1) + C(2) -1.121803 0.164866
Restrictions are linear in coefficients.
Apartado 3)
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 17.72813 (2, 21) 0.0000
Chi-square 35.45626 2 0.0000
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
1.5 - 4*C(2) + 2*C(4) 2.277923 0.426865
C(3) 0.012599 0.166916
Restrictions are linear in coefficients.
Econometría Curso 2012-13
14
Apartado 4)
Dependent Variable: COSTE
Method: Least Squares
Sample: 1971 1990
Included observations: 20
Variable
Coefficie
nt Std. Error t-Statistic Prob.
G 0.532507 0.088014 6.050266 0.0000
L
-
0.025655 0.023421 -1.095391 0.2906
H 0.168222 0.220590 0.762600 0.4575
A 0.751710 0.275370 2.729816 0.0155
C
-
3.371989 2.002256 -1.684095 0.1129
R-squared 0.872252 Mean dependent var 3.460378
Adjusted R-squared 0.838186 S.D. dependent var 0.264922
S.E. of regression 0.106568 Akaike info criterion
-
1.427753
Sum squared resid 0.170350 Schwarz criterion
-
1.178820
Log likelihood 19.27753 F-statistic 25.60468
Durbin-Watson stat 1.235286 Prob(F-statistic) 0.000001
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
5.2
1991 1992 1993 1994 1995 1996
COSTEF
Forecast: COSTEFActual: COSTEForecast sample: 1991 1996Included observations: 6
Root Mean Squared Error 0.233378Mean Absolute Error 0.191621Mean Abs. Percent Error 4.657398Theil Inequality Coefficient 0.027673 Bias Proportion 0.624020 Variance Proportion 0.041075 Covariance Proportion 0.334905
Apartado 5)
costef s.e.
4.758328 0.343616
I.C:= [4.758328±2.08*0.343616]=[4.0436;5.473]
Econometría Curso 2012-13
15
PRÁCTICA 7: Se desea analizar la influencia de las campañas publicitarias en televisión sobre las ventas de las empresas. Para ello se recoge información de un conjunto de
empresas encuadradas en distintos sectores (agricultura, industria y servicios), estimándose
el siguiente modelo.
i2ii1ii2i1ii SP20SP10S20S30P60150V −++−+=
campaña realizado ha no si 0
campaña realizado ha si 1iP
sector otro de empresa 0
industrial empresa 11iS
sector otro de empresa 0
servicios de empresa 12iS
Cuantifica el efecto diferencial por haber realizado o no, campaña publicitaria entre
las empresas del sector servicios, por un lado, y del sector industrial, por otro.
(Exámen de Econometría de 6/6/99)
PRÁCTICA 8: Se quiere estudiar la dependencia de los años de educación de un joven respecto de la renta familiar y procedencia socio-demográfica del mismo, para lo que se
dispone de la siguiente muestra (datos8.wf1):
Zona (ZONA) Años de educación (AE) Renta (RENTA)
Urbana
16
18
14
18
8
13
9
12
Rural
12
10
11
14
7
3
6
10
a) Basándote en la información disponible, especifica varios modelos que expliquen la duración de la educación de los jóvenes. Para ello considera que la variable ZONA
toma el valor 1 si es urbana y cero si es rural. Interpreta el significado de los
coeficientes de dichos modelos.
b) Estima los modelos anteriores analizando todos los resultados y elige el que consideres más adecuado.
c) Basándote en los resultados obtenidos, ¿se podría afirmar que la renta familiar es una variable significativa para explicar el comportamiento de los años de educación de los
jóvenes? ¿Y la procedencia socio-demográfica?
d) Realiza la predicción puntual y por intervalos de la duración de la educación de un joven urbano cuya familia tiene una renta de 10.5.
(Nivel de significación: 0.05)
Econometría Curso 2012-13
16
Estimación de los modelos
Dependent Variable: AE
Method: Least Squares
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 7.980000 1.431028 5.576411 0.0051
RENTA 0.580000 0.205484 2.822609 0.0477
ZONA 1.725882 3.026142 0.570324 0.5990
RENTA*ZONA 0.067059 0.322981 0.207624 0.8457
R-squared 0.934916 Mean dependent var 14.12500
Adjusted R-squared 0.886102 S.D. dependent var 3.044316
S.E. of regression 1.027418 Akaike info criterion 3.198828
Sum squared resid 4.222353 Schwarz criterion 3.238549
Log likelihood -8.795312 F-statistic 19.15287
Durbin-Watson stat 2.177557 Prob(F-statistic) 0.007768
Dependent Variable: AE
Method: Least Squares
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 7.803571 1.035396 7.536798 0.0007
RENTA 0.607143 0.142559 4.258882 0.0080
ZONA 2.321429 0.867154 2.677067 0.0440
R-squared 0.934214 Mean dependent var 14.12500
Adjusted R-squared 0.907900 S.D. dependent var 3.044316
S.E. of regression 0.923889 Akaike info criterion 2.959547
Sum squared resid 4.267857 Schwarz criterion 2.989338
Log likelihood -8.838189 F-statistic 35.50209
Durbin-Watson stat 2.316497 Prob(F-statistic) 0.001110
Dependent Variable: AE
Method: Least Squares
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 8.365948 1.172751 7.133608 0.0008
RENTA 0.528275 0.171494 3.080427 0.0275
RENTA*ZONA 0.241660 0.095727 2.524477 0.0529
R-squared 0.929623 Mean dependent var 14.12500
Adjusted R-squared 0.901472 S.D. dependent var 3.044316
S.E. of regression 0.955584 Akaike info criterion 3.027008
Sum squared resid 4.565704 Schwarz criterion 3.056799
Log likelihood -9.108033 F-statistic 33.02300
Durbin-Watson stat 1.856614 Prob(F-statistic) 0.001314
Apartado d)
Predicción: 16.5
Intervalo de confianza para la predicción: (13.844, 19.156)
Econometría Curso 2012-13
17
PRÁCTICA 9: En un estudio sobre el comportamiento de los salarios (W) se supuso que estos dependían de dos variables: la experiencia laboral (EL), medida en años de trabajo y
de los años de estudio (AE). Se recogieron datos correspondientes a 30 individuos, 15
varones y 15 mujeres que aparecen en la tabla siguiente y en el fichero datos9.wf1.
VARONES MUJERES W EL AE W EL AE 100 4 12 90 4 10
105 5 12 95 5 9
115 6 15 97 4 12
120 8 17 100 6 12
115 9 20 110 7 15
85 2 15 96 6 9
110 7 18 107 6 15
119 10 23 111 10 11
134 9 10 91 5 8
97 3 11 118 7 20
114 8 19 116 8 17
94 5 20 112 8 15
106 6 17 111 7 16
139 11 15 95 5 10
126 8 12 112 6 18
Se pide:
a) Especifica y estima un modelo que explique el comportamiento de los salarios en función de la experiencia laboral, de los años de estudio y del género (llamando DV a la
variable que toma el valor 1 si la observación es hombre y 0 si es mujer).
b) Teniendo en cuenta los resultados de la estimación del modelo anterior, contrastar la significación del factor género para explicar el comportamiento de los salarios. ¿Cúal
sería el modelo especificado si el factor género no fuera explicativo de la variable
endógena?
c) Especifica y estima un modelo que explique los salarios en función de la experiencia laboral y los años de estudios para los hombres. Haz lo mismo, sólo con las mujeres.
Compara los valores estimados resultantes en cada una de las submuestras con los
obtenidos en el modelo del apartado (a). ¿Qué similitudes encuentras?
d) Finalmente, plantea un modelo donde además de los años de estudio y la experiencia laboral se tenga en cuenta un posible salario autónomo diferente entre hombres y
mujeres. ¿Se podría aceptar que existen diferencias entre el salario autónomo de los
hombres y el de las mujeres?
(Fuente: Pena et al. Cien ejercicios de Econometría. Ed. Pirámide. 1999)
Econometría Curso 2012-13
18
Estimación del modelo Wt= ββββ0 +ββββ1DV + ββββ2ELt +ββββ3ELtDVt + ββββ4AEt + ββββ5AEtDVt + εεεεt Dependent Variable: W
Method: Least Squares
Sample: 1 30
Included observations: 30
W=C(1)+C(2)*DV+C(3)*EL+C(4)*EL*DV+C(5)*AE+C(6)*AE*DV
Coefficient Std. Error t-Statistic Prob.
C(1) 63.02514 2.232099 28.23581 0.0000
C(2) 34.50636 3.113243 11.08374 0.0000
C(3) 2.843575 0.336223 8.457414 0.0000
C(4) 3.129287 0.392726 7.968119 0.0000
C(5) 1.768156 0.147566 11.98210 0.0000
C(6) -3.408969 0.201671 -16.90359 0.0000
R-squared 0.982782 Mean dependent var 108.0000
Adjusted R-squared 0.979195 S.D. dependent var 12.84657
S.E. of regression 1.852973 Akaike info criterion 4.248316
Sum squared resid 82.40423 Schwarz criterion 4.528556
Log likelihood -57.72475 F-statistic 273.9818
Durbin-Watson stat 2.185000 Prob(F-statistic) 0.000000
Apartado b)
Contraste
Wald Test:
Equation: Untitled
Null Hypothesis: C(2)=0
C(4)=0
C(6)=0
F-statistic 117.2127 Probability 0.000000
Chi-square 351.6382 Probability 0.000000
Estimación del modelo restringido
Dependent Variable: W
Method: Least Squares
Sample: 1 30
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C 73.03486 5.372068 13.59530 0.0000
EL 4.983923 0.647192 7.700839 0.0000
AE 0.178036 0.352755 0.504700 0.6179
R-squared 0.730515 Mean dependent var 108.0000
Adjusted R-squared 0.710553 S.D. dependent var 12.84657
S.E. of regression 6.911497 Akaike info criterion 6.798889
Sum squared resid 1289.757 Schwarz criterion 6.939009
Log likelihood -98.98333 F-statistic 36.59547
Durbin-Watson stat 1.742176 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
19
Apartado c) Estimación del modelo Wt= αααα0 + αααα1ELt + αααα2AEt + εεεεt para la muestra de varones
Dependent Variable: W
Method: Least Squares
Sample: 1 15
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 97.53150 2.832551 34.43239 0.0000
EL 5.972862 0.264881 22.54920 0.0000
AE -1.640812 0.179410 -9.145625 0.0000
R-squared 0.977025 Mean dependent var 111.9333
Adjusted R-squared 0.973196 S.D. dependent var 14.77192
S.E. of regression 2.418442 Akaike info criterion 4.780981
Sum squared resid 70.18635 Schwarz criterion 4.922591
Log likelihood -32.85736 F-statistic 255.1562
Durbin-Watson stat 2.086625 Prob(F-statistic) 0.000000
Estimación del modelo Wt= γγγγ0 + γγγγ1ELt + γγγγ2AEt + εεεεt para la muestra de mujeres Dependent Variable: W
Method: Least Squares
Sample: 16 30
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 63.02514 1.215491 51.85160 0.0000
EL 2.843575 0.183090 15.53100 0.0000
AE 1.768156 0.080357 22.00366 0.0000
R-squared 0.990356 Mean dependent var 104.0667
Adjusted R-squared 0.988749 S.D. dependent var 9.512899
S.E. of regression 1.009037 Akaike info criterion 3.032727
Sum squared resid 12.21788 Schwarz criterion 3.174337
Log likelihood -19.74545 F-statistic 616.1703
Durbin-Watson stat 2.256287 Prob(F-statistic) 0.000000
Apartado d)
Dependent Variable: W
Method: Least Squares
Sample: 1 30
Included observations: 30
W=C(1)+C(2)*DV+C(3)*EL+C(5)*AE
Coefficient Std. Error t-Statistic Prob.
C(1) 73.66035 4.997578 14.73921 0.0000
C(2) 5.726070 2.489431 2.300152 0.0297
C(3) 5.011908 0.601307 8.335020 0.0000
C(5) -0.076267 0.345827 -0.220534 0.8272
R-squared 0.776080 Mean dependent var 108.0000
Adjusted R-squared 0.750243 S.D. dependent var 12.84657
S.E. of regression 6.420168 Akaike info criterion 6.680331
Sum squared resid 1071.682 Schwarz criterion 6.867158
Log likelihood -96.20497 F-statistic 30.03759
Durbin-Watson stat 2.009021 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
20
PRÁCTICA 10: Se quiere estudiar el comportamiento del gasto en vivienda de las familias (GTO) en función del número de miembros que componen la unidad familiar (TAM), el
lugar de residencia (URBANO), de los ingresos familiares (Y) y del nivel de estudios del
cabeza de familia (ESTU). Para ello, se dispone en el fichero datos10.wf1 de 500
observaciones tomadas de la Encuesta de Presupuestos Familiares 1990-91
correspondientes a la provincia de Sevilla. Las variables URBANO y ESTU son variables
cualitativas que toman los siguientes valores:
1
0
si familia habita en zona urbanaURBANO
si familia reside en zona rural
=
ESTU=1 si el individuo es analfabeto o sin estudios,
ESTU=2 si el individuo tiene estudios primarios, EGB o FP-1,
ESTU=3 si el individuo tiene BUP, COU o FP-2,
ESTU=4 si el individuo es titulado universitario o equivalente.
a) Estima un modelo que explique los gastos en vivienda en función de los ingresos familiares, del tamaño de la familia y en el que el lugar de residencia
afecte al gasto autónomo.
b) Estima un modelo en el que los gastos en vivienda estén en función de los ingresos familiares y del tamaño de la familia y en el que ahora el efecto de los
ingresos sobre los gastos sea diferente según el lugar de lugar de residencia.
c) Estima un modelo en el que los gastos en vivienda estén en función de los ingresos familiares y del tamaño de la familia y en el que la zona de residencia
influya en el comportamiento del efecto de las dos variables anteriores sobre los
gastos en vivienda y en el gasto autónomo. ¿Puede aceptarse que el lugar de
residencia y el número de miembros de unidad familiar no son significativas
conjuntamente?
d) Estima un modelo en el que además de los ingresos y el tamaño de la familia, se tenga en cuenta un posible gasto autónomo diferente según el lugar de residencia
y el nivel de estudios, así como efectos de interacción entre estas dos variables
cualitativas. Considera como categoría base la categoría superior del nivel de
estudios.
(Fuente: Carrascal et al. Análisis econométrico con Eviews. Ed RA-MA. 2000.)
Apartado a) Dependent Variable: GTO
Method: Least Squares
Sample: 1 500
Included observations: 500
Variable Coefficient Std. Error t-Statistic Prob.
URBANO 14655.83 6789.100 2.158730 0.0314
Y 0.050108 0.003048 16.43694 0.0000
TAM -8692.680 2268.410 -3.832058 0.0001
C 17955.59 9397.991 1.910578 0.0566
R-squared 0.399630 Mean dependent var 94443.14
Adjusted R-squared 0.395999 S.D. dependent var 93315.68
S.E. of regression 72522.62 Akaike info criterion 25.22915
Sum squared resid 2.61E+12 Schwarz criterion 25.26287
Log likelihood -6303.288 F-statistic 110.0525
Durbin-Watson stat 2.141804 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
21
Apartado b) Dependent Variable: GTO
Method: Least Squares
Sample: 1 500
Included observations: 500
Variable Coefficien
t
Std. Error t-Statistic Prob.
URBANO*Y 0.007341 0.002969 2.472969 0.0137
Y 0.045605 0.003896 11.70601 0.0000
TAM -8551.064 2266.429 -3.772924 0.0002
C 25377.41 8803.855 2.882534 0.0041
R-squared 0.401370 Mean dependent var 94443.14
Adjusted R-squared 0.397750 S.D. dependent var 93315.68
S.E. of regression 72417.43 Akaike info criterion 25.22625
Sum squared resid 2.60E+12 Schwarz criterion 25.25997
Log likelihood -6302.562 F-statistic 110.8531
Durbin-Watson stat 2.146351 Prob(F-statistic) 0.000000
Apartado c) Dependent Variable: GTO
Method: Least Squares
Sample: 1 500
Included observations: 500
Variable Coefficien
t
Std. Error t-Statistic Prob.
URBANO 28538.99 17577.08 1.623648 0.1051
Y 0.042428 0.004875 8.703985 0.0000
URBANO*Y 0.012816 0.006231 2.056926 0.0402
TAM -3228.286 3250.375 -0.993204 0.3211
URBANO*TAM -10295.71 4525.067 -2.275262 0.0233
C 10027.93 12652.51 0.792564 0.4284
R-squared 0.407592 Mean dependent var 94443.14
Adjusted R-squared 0.401596 S.D. dependent var 93315.68
S.E. of regression 72185.82 Akaike info criterion 25.22380
Sum squared resid 2.57E+12 Schwarz criterion 25.27438
Log likelihood -6299.951 F-statistic 67.97697
Durbin-Watson stat 2.147965 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
22
Wald Test: Equation: Untitled
Test Statistic Value df Probability F-statistic 6.504849 (3, 494) 0.0003
Chi-square 19.51455 3 0.0002 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(1) 28538.99 17577.08
C(4) -3228.286 3250.375 C(5) -10295.71 4525.067
Restrictions are linear in coefficients. Apartado d) Genr E1=ESTU=1
Genr E2=ESTU=2
Genr E3=ESTU=3
Dependent Variable: GTO
Method: Least Squares
Sample: 1 500
Included observations: 500
Variable Coefficien
t
Std. Error t-Statistic Prob.
URBANO 84647.74 22930.20 3.691540 0.0002
E1 47210.83 22294.86 2.117566 0.0347
E2 37114.29 22433.74 1.654396 0.0987
E3 45957.56 32146.73 1.429619 0.1535
URBANO*E1 -83271.54 25582.60 -3.255007 0.0012
URBANO*E2 -69396.61 24900.04 -2.787008 0.0055
URBANO*E3 -78177.64 35833.41 -2.181697 0.0296
Y 0.048117 0.003655 13.16630 0.0000
TAM -8006.707 2306.600 -3.471216 0.0006
C -22082.73 23959.42 -0.921672 0.3572
R-squared 0.414746 Mean dependent var 94443.14
Adjusted R-squared 0.403996 S.D. dependent var 93315.68
S.E. of regression 72040.91 Akaike info criterion 25.22765
Sum squared resid 2.54E+12 Schwarz criterion 25.31195
Log likelihood -6296.913 F-statistic 38.58254
Durbin-Watson stat 2.097383 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
23
PRÁCTICA 11: El fichero datos11.wf1 contiene datos para la economía española desde 1964 a 1998 de las variables consumo privado nacional (CPN80), renta neta disponible
familiar (RDNFAM80), tipo de interés real a corto plazo (RCP80) e impuesto inflacionario
(IT). Todas las variables se expresan en euros constantes de 1980. La ecuación que vamos a
especificar es una función de consumo en la que trataremos de estudiar además la
existencia de un cambio estructural en 1986, como consecuencia de la entrada de España en
la Comunidad Económica Europea. La especificación es:
tttt ITRCPRDNFAMCPN εββββ ++++= 3210 808080
a) Estima el modelo propuesto y analiza los resultados. b) Analiza la posible existencia de un cambio estructural en 1986 como consecuencia
de la entrada de España en la Comunidad Económica Europea (aplica el contraste de
Chow y la estimación recursiva).
c) Estudia si se ha cometido un error de especificación en la forma funcional. d) Comprueba que las perturbaciones son normales. e) Especifica y estima el modelo más adecuado para corregir los problemas que has
detectado.
Apartado a) Dependent Variable: CPN80
Method: Least Squares
Sample: 1964 1998
Included observations: 35
Variable
Coefficie
nt Std. Error t-Statistic Prob.
RNDFAM80 0.928086 0.013485 68.82582 0.0000
RCP80 3830150. 1011197. 3.787740 0.0007
IT 142.9114 78.29980 1.825182 0.0776
C
-
1482.117 754.8709 -1.963405 0.0586
R-squared 0.997055 Mean dependent var 60729.26
Adjusted R-squared 0.996770 S.D. dependent var 17349.55
S.E. of regression 986.0705 Akaike info criterion 16.73254
Sum squared resid 30142386 Schwarz criterion 16.91030
Log likelihood
-
288.8195 F-statistic 3498.141
Durbin-Watson stat 1.320095 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
24
Apartado b) Contraste cambio estructural Chow Breakpoint Test: 1986
F-statistic 6.224527 Prob. F(4,27) 0.001103
Log likelihood ratio 22.87059 Prob. Chi-Square(4) 0.000134
Dependent Variable: CPN80
Method: Least Squares
Sample: 1964 1985
Included observations: 22
Variable
Coefficie
nt Std. Error t-Statistic Prob.
RNDFAM80 0.780261 0.032168 24.25605 0.0000
RCP80 6045410. 847251.7 7.135318 0.0000
IT 620.5179 112.5335 5.514073 0.0000
C 3837.281 1229.764 3.120340 0.0059
R-squared 0.998455 Mean dependent var 49982.28
Adjusted R-squared 0.998198 S.D. dependent var 11312.44
S.E. of regression 480.2309 Akaike info criterion 15.34938
Sum squared resid 4151191. Schwarz criterion 15.54775
Log likelihood
-
164.8431 F-statistic 3878.277
Durbin-Watson stat 1.631866 Prob(F-statistic) 0.000000
Dependent Variable: CPN80
Method: Least Squares
Sample: 1986 1998
Included observations: 13
Variable
Coefficie
nt Std. Error t-Statistic Prob.
RNDFAM80 0.831769 0.043313 19.20371 0.0000
RCP80 6185627. 5158137. 1.199198 0.2611
IT
-
307.5653 237.0227 -1.297620 0.2267
C 9210.890 4611.942 1.997182 0.0769
R-squared 0.983664 Mean dependent var 78916.45
Adjusted R-squared 0.978219 S.D. dependent var 7669.374
S.E. of regression 1131.881 Akaike info criterion 17.14881
Sum squared resid 11530391 Schwarz criterion 17.32264
Log likelihood
-
107.4673 F-statistic 180.6447
Durbin-Watson stat 2.094167 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
25
Estimación recursiva Coeficientes recursivos
0.6
0.7
0.8
0.9
1.0
1.1
72 74 76 78 80 82 84 86 88 90 92 94 96 98
Recursive C(1) Estimates ± 2 S.E.
0.00E+00
2.00E+06
4.00E+06
6.00E+06
8.00E+06
1.00E+07
1.20E+07
72 74 76 78 80 82 84 86 88 90 92 94 96 98
Recursive C(2) Estimates ± 2 S.E.
-400
-200
0
200
400
600
800
1000
1200
72 74 76 78 80 82 84 86 88 90 92 94 96 98
Recursive C(3) Estimates ± 2 S.E.
-6000
-4000
-2000
0
2000
4000
6000
8000
10000
72 74 76 78 80 82 84 86 88 90 92 94 96 98
Recursive C(4) Estimates ± 2 S.E.
Residuos recursivos
-3000
-2000
-1000
0
1000
2000
3000
1970 1975 1980 1985 1990 1995
Recursive Residuals ± 2 S.E.
Econometría Curso 2012-13
26
Apartado c) Contraste de linealidad (RESET) introduciendo 2Y
Ramsey RESET Test:
F-statistic 0.211775 Prob. F(1,30) 0.648698
Log likelihood ratio 0.246203 Prob. Chi-Square(1) 0.619761
Test Equation:
Dependent Variable: CPN80
Method: Least Squares
Sample: 1964 1998
Included observations: 35
Variable
Coefficie
nt Std. Error t-Statistic Prob.
RNDFAM80 0.872095 0.122434 7.122972 0.0000
RCP80 3895417. 1034075. 3.767056 0.0007
IT 183.1513 118.0546 1.551412 0.1313
C 130.5479 3586.797 0.036397 0.9712
FITTED^2 4.67E-07 1.02E-06 0.460190 0.6487
R-squared 0.997075 Mean dependent var 60729.26
Adjusted R-squared 0.996685 S.D. dependent var 17349.55
S.E. of regression 998.8510 Akaike info criterion 16.78265
Sum squared resid 29931097 Schwarz criterion 17.00484
Log likelihood
-
288.6964 F-statistic 2556.949
Durbin-Watson stat 1.330325 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
27
Apartado d) Normalidad
0
2
4
6
8
-2000 -1000 0 1000 2000
Series: ResidualsSample 1964 1998Observations 35
Mean -1.70E-12Median -85.76667Maximum 2116.565Minimum -1979.022Std. Dev. 941.5629Skewness 0.233994Kurtosis 2.716536
Jarque-Bera 0.436573Probability 0.803895
Apartado e) Reespecificación del modelo: Variables omitidas:
≥<
=19861
198601
t
tD D1=@year>1985
Omitted Variables: D1 D1*RNDFAM80 D1*RCP80 D1*IT
F-statistic 6.224527 Prob. F(4,27) 0.001103
Log likelihood ratio 22.87059 Prob. Chi-Square(4) 0.000134
Test Equation:
Dependent Variable: CPN80
Method: Least Squares
Sample: 1964 1998
Included observations: 35
Variable
Coefficien
t Std. Error t-Statistic Prob.
RNDFAM80 0.780261 0.051048 15.28471 0.0000
RCP80 6045410. 1344545. 4.496249 0.0001
IT 620.5179 178.5849 3.474638 0.0017
C 3837.281 1951.573 1.966251 0.0596
D1 5373.609 3667.587 1.465162 0.1544
D1*RNDFAM80 0.051508 0.058791 0.876119 0.3887
D1*RCP80 140216.9 3724185. 0.037650 0.9702
D1*IT -928.0833 239.5019 -3.875057 0.0006
R-squared 0.998468 Mean dependent var 60729.26
Adjusted R-squared 0.998070 S.D. dependent var 17349.55
S.E. of regression 762.1019 Akaike info criterion 16.30767
Sum squared resid 15681581 Schwarz criterion 16.66318
Log likelihood -277.3842 F-statistic 2513.422
Durbin-Watson stat 2.019517 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
28
Variables redundantes Redundant Variables: D1*RCP80
F-statistic 0.001418 Prob. F(1,27) 0.970243
Log likelihood ratio 0.001838 Prob. Chi-Square(1) 0.965808
Test Equation:
Dependent Variable: CPN80
Method: Least Squares
Sample: 1964 1998
Included observations: 35
Variable Coefficient Std. Error t-Statistic Prob.
RNDFAM80 0.779710 0.048029 16.23409 0.0000
RCP80 6063686. 1231299. 4.924625 0.0000
IT 622.6684 166.1602 3.747397 0.0008
C 3857.861 1839.751 2.096948 0.0452
D1 5374.526 3601.514 1.492296 0.1468
D1*RNDFAM80 0.051987 0.056366 0.922311 0.3642
D1*IT -930.7208 224.9068 -4.138250 0.0003
R-squared 0.998468 Mean dependent var 60729.26
Adjusted R-squared 0.998139 S.D. dependent var 17349.55
S.E. of regression 748.3889 Akaike info criterion 16.25058
Sum squared resid 15682405 Schwarz criterion 16.56165
Log likelihood -277.3851 F-statistic 3040.770
Durbin-Watson stat 2.018851 Prob(F-statistic) 0.000000
Dependent Variable: CPN80
Method: Least Squares
Sample: 1964 1998
Included observations: 35
Variable Coefficient Std. Error t-Statistic Prob.
RNDFAM80 0.817895 0.024283 33.68200 0.0000
RCP80 5301792. 910719.8 5.821540 0.0000
IT 496.5897 94.21646 5.270731 0.0000
D1 8299.528 1702.419 4.875138 0.0000
D1*IT -845.2721 204.4101 -4.135179 0.0003
C 2415.862 967.1740 2.497857 0.0184
R-squared 0.998421 Mean dependent var 60729.26
Adjusted R-squared 0.998149 S.D. dependent var 17349.55
S.E. of regression 746.4594 Akaike info criterion 16.22336
Sum squared resid 16158846 Schwarz criterion 16.49000
Log likelihood -277.9089 F-statistic 3667.642
Durbin-Watson stat 1.942190 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
29
PRÁCTICA 12: Un investigador desea realizar un estudio sobre el consumo interno de un país. Dispone, en el fichero datos12.wf1, de observaciones de 20 años de las variables:
consumo interno (CONS), rentas salariales agrarias (WA), rentas no salariales no agrarias
(RNA) y rentas agrarias (RA), todas las variables medidas en millones de euros.
CONS RA RNA WA
331.2000 26.34000 106.3800 235.2600
373.2000 27.60000 121.7400 253.8600
351.6000 19.50000 112.9800 242.2200
339.6000 15.66000 104.6400 234.9000
306.6000 10.02000 88.56000 204.0000
306.6000 14.64000 80.34000 201.5400
324.0000 14.34000 83.58000 221.2800
343.2000 30.48000 88.02000 235.6200
376.8000 23.58000 103.2000 273.0600
390.0000 32.88000 95.52000 276.3600
383.4000 26.22000 105.4200 264.9600
405.0000 27.06000 110.9400 286.0800
427.8000 29.40000 110.9400 304.7400
459.6000 38.22000 115.0800 346.6800
517.8000 50.52000 114.7200 473.8200
574.2000 55.62000 118.5600 441.2400
589.8000 53.22000 105.3000 431.5200
601.8000 55.80000 115.0200 444.0600
619.2000 41.70000 121.2000 453.0600
653.4000 42.90000 132.7200 485.8200
1) Construye un modelo en el que el consumo interno sea explicado linealmente por el resto de variables de las que se posee información y estima por MCO. Analiza dicho
modelo y en función de sus conclusiones propón el modelo que consideres más
oportuno justificando adecuadamente tu decisión.
2) ¿Es razonable suponer que la relación entre las variables es lineal? Utiliza los criterios que consideres oportunos para tal decisión.
3) ¿Se puede aceptar que los estimadores MCO se distribuyen como una normal?
4) La representación gráfica de los residuos del modelo seleccionado muestra un error desproporcionado que se sale de las bandas en una observación. Con objeto de recoger
este dato atípico, se introduce en el modelo una variable ficticia aditiva que toma el
valor 1 para esa observación y 0 para el resto .Estima y analiza el modelo resultante
¿Crees que es importante recoger el efecto anómalo de dicha observación? Justifica tu
respuesta a la vista de los resultados de la estimación.
5) ¿Cuál sería finalmente el modelo que seleccionarías para explicar el comportamiento del consumo interno? Aporta los motivos de tu decisión brevemente.
Econometría Curso 2012-13
30
Modelo I Dependent Variable: CONS
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
RA 0.031507 1.093757 0.028806 0.9774
RNA 0.408724 0.649673 0.629122 0.5381
WA 1.085019 0.175523 6.181621 0.0000
C 46.78228 53.39389 0.876173 0.3939
R-squared 0.952673 Mean dependent var 433.7400
Adjusted R-squared 0.943799 S.D. dependent var 115.5349
S.E. of regression 27.38945 Akaike info criterion 9.635050
Sum squared resid 12002.91 Schwarz criterion 9.834196
Log likelihood -92.35050 F-statistic 107.3583
Durbin-Watson stat 1.381411 Prob(F-statistic) 0.000000
Matriz de correlaciones: CONS RA WA RNA
CONS 1.000000 0.890236 0.975445 0.710734
RA 0.890236 1.000000 0.913933 0.604030
WA 0.975445 0.913933 1.000000 0.703625
RNA 0.710734 0.604030 0.703625 1.000000
Modelo II Dependent Variable: CONS
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
WA 1.089384 0.085923 12.67855 0.0000
RNA 0.406191 0.624492 0.650434 0.5241
C 46.67685 51.67918 0.903204 0.3790
R-squared 0.952671 Mean dependent var 433.7400
Adjusted R-squared 0.947103 S.D. dependent var 115.5349
S.E. of regression 26.57236 Akaike info criterion 9.535101
Sum squared resid 12003.54 Schwarz criterion 9.684461
Log likelihood -92.35101 F-statistic 171.0930
Durbin-Watson stat 1.388986 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
31
Modelo III Dependent Variable: CONS
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
WA 1.128708 0.060068 18.79042 0.0000
C 77.62802 19.83288 3.914107 0.0010
R-squared 0.951493 Mean dependent var 433.7400
Adjusted R-squared 0.948798 S.D. dependent var 115.5349
S.E. of regression 26.14305 Akaike info criterion 9.459683
Sum squared resid 12302.26 Schwarz criterion 9.559256
Log likelihood -92.59683 F-statistic 353.0798
Durbin-Watson stat 1.443093 Prob(F-statistic) 0.000000
Contraste RESET introduciendo 2Y Ramsey RESET Test:
F-statistic 0.337320 Probability 0.569001
Log likelihood ratio 0.392961 Probability 0.530747
Histograma de los residuos del modelo III
0
2
4
6
8
10
* * -75 -50 -25 0 25 50
Series: ResidualsSample 1 20Observations 20
Mean -3.20E-15Median 0.509203Maximum 30.19937Minimum -94.63257Std. Dev. 25.44577Skewness -2.534564Kurtosis 10.87790
Jarque-Bera 73.13114Probabil ity 0.000000
Representación gráfica residuos modelo III
-100
-80
-60
-40
-20
0
20
40
2 4 6 8 10 12 14 16 18 20
CONS Residuals
Econometría Curso 2012-13
32
Modelo IV Dependent Variable: CONS
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
WA 1.225438 0.022071 55.52229 0.0000
F15 -115.7331 9.855374 -11.74315 0.0000
C 52.89602 7.081185 7.469939 0.0000
R-squared 0.994676 Mean dependent var 433.7400
Adjusted R-squared 0.994050 S.D. dependent var 115.5349
S.E. of regression 8.911783 Akaike info criterion 7.350107
Sum squared resid 1350.138 Schwarz criterion 7.499467
Log likelihood -70.50107 F-statistic 1588.189
Durbin-Watson stat 2.039962 Prob(F-statistic) 0.000000
Histograma residuos Modelo IV
0
2
4
6
8
-20 -15 -10 -5 0 5 10 15
Series: ResidualsSample 1 20Observations 20
Mean 3.09E-14Median 1.548442Maximum 11.10694Minimum -19.40837Std. Dev. 8.429703Skewness -1.082320Kurtosis 3.340569
Jarque-Bera 4.001377Probability 0.135242
Econometría Curso 2012-13
33
PRÁCTICA 13: El fichero datos13.wf1 contiene información relativa a las variables cantidad demandada de un producto (Y), precio de dicho producto (X1), ingreso de los consumidores
(X2), y precio de un artículo sustitutivo (X3) y se quiere estudiar el comportamiento de la
cantidad demandada.
1.-Estima el modelo que intenta explicar la cantidad demandada en función del resto
de variables. Analiza los resultados.
2.- Estudia la presencia de multicolinealidad en el modelo estimado a partir de todos
los indicios que detectan su existencia: significación individual y conjunta, coeficientes de
correlación simple, coeficientes de correlación múltiple y factor de inflación de la varianza.
3.-Valora conjuntamente las siguientes afirmaciones: “Al aumentar en una unidad el
precio del artículo sustitutivo (X3), la cantidad demandada del propio artículo (Y) aumenta
en 0,17 unidades”; “no es cierto, sino que en ese caso la cantidad aumenta en 0,7 unidades”;
“no, realmente el aumento es de 0,95 unidades”; “el aumento es de 3,6 unidades”; “la
verdad es que la variable X3 no es significativa, en ningún caso, para explicar el
comportamiento de Y”.
3.-Selecciona el modelo que consideres más adecuado.
Apartado 1 Dependent Variable: Y
Sample: 1980 1994
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
X1 -4.928058 1.611083 -3.058847 0.0109
X2 0.015900 0.007411 2.145577 0.0551
X3 0.174798 0.636716 0.274530 0.7888
C 79.10634 19.78228 3.998849 0.0021
R-squared 0.950980 Mean dependent var 70.00000
Adjusted R-squared 0.937611 S.D. dependent var 18.12654
S.E. of regression 4.527610 Akaike info criterion 6.081444
Sum squared resid 225.4918 Schwarz criterion 6.270257
Log likelihood -41.6103 F-statistic 71.13280
Durbin-Watson stat 1.818105 Prob(F-statistic) 0.000000
Apartado 2
a) Matriz de Correlación entre las variables Y X1 X2 X3
Y 1.000000 -0.961251 0.947219 0.889946
X1 -0.961251 1.000000 -0.918105 -0.887244
X2 0.947219 -0.918105 1.000000 0.885714
X3 0.889946 -0.887244 0.885714 1.000000
Econometría Curso 2012-13
34
b) Coeficientes de correlación múltiple Dependent Variable: X1
Method: Least Squares
Sample: 1980 1994
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
X2 -0.00284 0.001044 -2.720256 0.0186
X3 -0.15909 0.104435 -1.523344 0.1536
C 11.82955 0.950107 12.45074 0.0000
R-squared 0.868371 Mean dependent var 6.000000
Adjusted R-squared 0.846433 S.D. dependent var 2.070197
S.E. of regression 0.811261 Akaike info criterion 2.596402
Sum squared resid 7.897727 Schwarz criterion 2.738012
Log likelihood -16.4730 F-statistic 39.58273
Durbin-Watson stat 1.885775 Prob(F-statistic) 0.000005
Dependent Variable: X2
Method: Least Squares
Sample: 1980 1994
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
X1 -134.2657 49.35775 -2.720256 0.0186
X3 33.42657 22.84820 1.462985 0.1692
C 1337.343 666.9061 2.005294 0.0680
R-squared 0.866693 Mean dependent var 1100.000
Adjusted R-squared 0.844476 S.D. dependent var 447.2136
S.E. of regression 176.3658 Akaike info criterion 13.35985
Sum squared resid 373258.7 Schwarz criterion 13.50146
Log likelihood -97.1989 F-statistic 39.00899
Durbin-Watson stat 2.505756 Prob(F-statistic) 0.000006
Dependent Variable: X3
Method: Least Squares
Simple: 1980 1994
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
X1 -1.018568 0.668639 -1.523344 0.1536
X2 0.004528 0.003095 1.462985 0.1692
C 18.13035 7.283473 2.489245 0.0285
R-squared 0.819412 Mean dependent var 17.00000
Econometría Curso 2012-13
35
Adjusted R-squared 0.789314 S.D. dependent var 4.472136
S.E. of regression 2.052734 Akaike info criterion 4.453079
Sum squared resid 50.56461 Schwarz criterion 4.594689
Log likelihood -30.39809 F-statistic 27.22482
Durbin-Watson stat 1.876771 Prob(F-statistic) 0.000035
c) 53.58194.01
1;5.7
86669.01
1;59.7
86837.01
1
321ˆˆˆ =
−==
−==
−= βββ FIVFIVFIV
4) Modelo seleccionado:
Dependent Variable: Y Method: Least Squares Sample: 1980 1994 Included observations: 15
Coefficient Std. Error t-Statistic Prob.
X1 -5.106101 1.416827 -3.603899 0.0036 X2 0.016692 0.006559 2.545031 0.0257 C 82.27548 15.43346 5.330981 0.0002
R-squared 0.950644 Mean dependent var 70.00000 Adjusted R-squared 0.942418 S.D. dependent var 18.12654 S.E. of regression 4.349682 Akaike info criterion 5.954939 Sum squared resid 227.0368 Schwarz criterion 6.096549 Log likelihood -41.66204 Hannan-Quinn criter. 5.953430 F-statistic 115.5662 Durbin-Watson stat 1.878170 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
36
PRÁCTICA 14: Los datos contenidos en el fichero datos14.wf1 corresponden a distintos ratios elaborados con diferentes partidas del balance de 56 empresas. El objetivo del
ejercicio es explicar la variable Y, ratio de dividendos (Dividendos/Beneficios después de
intereses e impuestos) en función de la rentabilidad y eficiencia de las empresas, de su
grado de expansión, su estructura financiera y su grado de liquidez. Para ello, se
seleccionan los regresores que aparecen a continuación:
R5 Ventas/Activo total
R7 Tasa de variación del activo total
R9 Tasa de variación de los fondos propios
R11 Deudas totales/Recursos propios
R13 Beneficio antes de intereses e impuestos/Gastos
financieros
R16 Activo circulante/Deudas a corto plazo
R17 (Activo circulante-existencias)/Deudas a corto plazo
1. Estima el modelo que relaciona el ratio de dividendos y las variables explicativas anteriores. Estudia los resultados de la estimación anterior.
2. Contrasta la hipótesis de que las variables R5 y R7 no son conjuntamente significativas. Analiza la especificación del modelo resultante al incorporar las
restricciones anteriores.
3. Utilizando el modelo del apartado anterior, contrasta la hipótesis de que la variable R16 es una variable no significativa. Analiza la especificación del modelo
restringido.
4. El gráfico de los valores de la variable endógena muestra la existencia de tres empresas con un ratio de dividendos muy superior a los valores que presentan el
resto de empresas. Construye una variable ficticia (F) que recoja esta diferencia y
que tome el valor 1 para las tres empresas con mayor valor y 0 para las restantes.
5. Estima el modelo resultante del apartado 3, incluyendo entre las variables explicativas la ficticia creada en el apartado 4, de forma que sólo afecte al término
constante. Estudia los resultados de la estimación del modelo obtenido.
6. Estima un nuevo modelo en el que, además de las variables explicativas del apartado 5, se incluya la variable ficticia multliplicando al ratio R17. Analiza el
modelo resultante.
7. En el modelo anterior, realiza cada uno de los contrastes siguientes: a) La variable R17 no es significativa. Compara el modelo restringido con el
del apartado 6
b) La variable R9 no es significativa. Compara el modelo restringido con el del apartado 6
c) Las variables R9 y R17 no son significativas conjuntamente. Compara el modelo restringido con el del apartado 6
8. Selecciona el modelo que te parece más adecuado, a la vista de todos los resultados obtenidos.
Econometría Curso 2012-13
37
Modelo 1 Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficient Std. Error t-Statistic Prob.
C 0.218699 0.139425 1.568585 0.1233
R5 -0.003937 0.005156 -0.763612 0.4488
R7 -0.000725 0.001125 -0.644172 0.5225
R9 -0.000114 6.71E-05 -1.702249 0.0952
R11 -0.075077 0.042572 -1.763543 0.0842
R13 0.006203 0.003123 1.986281 0.0527
R16 0.083587 0.095852 0.872042 0.3875
R17 0.173304 0.100451 1.725250 0.0909
R-squared 0.604781 Mean dependent var 0.461076
Adjusted R-squared 0.547145 S.D. dependent var 0.661660
S.E. of regression 0.445261 Akaike info criterion 1.351249
Sum squared resid 9.516335 Schwarz criterion 1.640585
Log likelihood -29.83498 F-statistic 10.49311
Durbin-Watson stat 2.138301 Prob(F-statistic) 0.000000
Matriz de correlaciones lineales
Y R5 R7 R9 R11
Y 1.000000 -0.101913 -0.137071 -0.100339 -0.298458
R5 -0.101913 1.000000 -0.014353 -0.032257 -0.024933
R7 -0.137071 -0.014353 1.000000 0.035649 -0.042810
R9 -0.100339 -0.032257 0.035649 1.000000 -0.115644
R11 -0.298458 -0.024933 -0.042810 -0.115644 1.000000
R13 0.184800 -0.048518 -0.041259 -0.062431 -0.187386
R16 0.406844 -0.058902 -0.054972 0.726469 -0.196551
R17 0.682107 -0.047170 -0.093156 0.173067 -0.177072
R13 R16 R17
0.184800 0.406844 0.682107
-0.048518 -0.058902 -0.047170
-0.041259 -0.054972 -0.093156
-0.062431 0.726469 0.173067
-0.187386 -0.196551 -0.177072
1.000000 -0.092246 -0.072459
-0.092246 1.000000 0.762864
-0.072459 0.762864 1.000000
Econometría Curso 2012-13
38
R múltiple FIV
R5 0.010224 1.0103
R7 0.023851 1.0244
R9 0.876213 8.0784
R11 0.090210 1.0991
R13 0.060330 1.0642
R16 0.946772 18.787
R17 0.889719 9.0677
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 0.486398 (2, 48) 0.6178
Chi-square 0.972797 2 0.6148
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.003937 0.005156
C(3) -0.000725 0.001125
Restrictions are linear in coefficients.
Modelo 2 Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficient Std. Error t-Statistic Prob.
C 0.173651 0.129652 1.339360 0.1865
R9 -0.000119 6.61E-05 -1.800490 0.0778
R11 -0.071501 0.041969 -1.703654 0.0947
R13 0.006479 0.003078 2.104891 0.0403
R16 0.090932 0.094532 0.961923 0.3407
R17 0.170020 0.099354 1.711248 0.0932
R-squared 0.596772 Mean dependent var 0.461076
Adjusted R-squared 0.556449 S.D. dependent var 0.661660
S.E. of regression 0.440663 Akaike info criterion 1.299885
Sum squared resid 9.709199 Schwarz criterion 1.516887
Log likelihood -30.39677 F-statistic 14.79984
Durbin-Watson stat 2.121051 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
39
Modelo 3 Test Equation:
Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficient Std. Error t-Statistic Prob.
C 0.237943 0.111015 2.143345 0.0369
R9 -5.97E-05 2.38E-05 -2.505077 0.0155
R11 -0.073445 0.041890 -1.753298 0.0856
R13 0.006369 0.003074 2.072059 0.0433
R17 0.259778 0.034098 7.618663 0.0000
R-squared 0.589310 Mean dependent var 0.461076
Adjusted R-squared 0.557099 S.D. dependent var 0.661660
S.E. of regression 0.440340 Akaike info criterion 1.282507
Sum squared resid 9.888876 Schwarz criterion 1.463342
Log likelihood -30.91020 F-statistic 18.29528
Durbin-Watson stat 2.113836 Prob(F-statistic) 0.000000
0
1
2
3
4
5 10 15 20 25 30 35 40 45 50 55
Y
Econometría Curso 2012-13
40
Modelo 4 (F=1 si la empresa es la 5, 25 o 31) Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficient Std. Error t-Statistic Prob.
C 0.273649 0.061898 4.420929 0.0001
R9 -3.47E-05 1.35E-05 -2.573272 0.0131
R11 -0.056200 0.023378 -2.403959 0.0200
R13 0.005312 0.001714 3.099015 0.0032
R17 0.111188 0.023520 4.727426 0.0000
F 1.956073 0.182781 10.70172 0.0000
R-squared 0.875190 Mean dependent var 0.461076
Adjusted R-squared 0.862709 S.D. dependent var 0.661660
S.E. of regression 0.245163 Akaike info criterion 0.127171
Sum squared resid 3.005247 Schwarz criterion 0.344173
Log likelihood 2.439220 F-statistic 70.12208
Durbin-Watson stat 2.104801 Prob(F-statistic) 0.000000
Modelo 5 Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficient Std. Error t-Statistic Prob.
C 0.350759 0.063039 5.564168 0.0000
R9 -2.36E-05 1.31E-05 -1.804490 0.0773
R11 -0.061206 0.021785 -2.809524 0.0071
R13 0.005191 0.001593 3.257948 0.0020
R17 0.027244 0.035600 0.765291 0.4478
F 1.609910 0.205600 7.830317 0.0000
F*R17 0.133800 0.044796 2.986893 0.0044
R-squared 0.894415 Mean dependent var 0.461076
Adjusted R-squared 0.881486 S.D. dependent var 0.661660
S.E. of regression 0.227782 Akaike info criterion -0.004384
Sum squared resid 2.542355 Schwarz criterion 0.248785
Log likelihood 7.122748 F-statistic 69.17989
Durbin-Watson stat 2.044168 Prob(F-statistic) 0.000000
Redundant Variables: R17
F-statistic 0.585671 Probability 0.447769
Log likelihood ratio 0.665369 Probability 0.414671
Econometría Curso 2012-13
41
Test Equation:
Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 0.377240 0.052474 7.189078 0.0000
R9 -2.00E-05 1.22E-05 -1.646540 0.1059
R11 -0.063255 0.021530 -2.937932 0.0050
R13 0.005082 0.001580 3.215793 0.0023
F 1.586988 0.202562 7.834594 0.0000
F*R17 0.160863 0.027383 5.874614 0.0000
R-squared 0.893153 Mean dependent var 0.461076
Adjusted R-squared 0.882468 S.D. dependent var 0.661660
S.E. of regression 0.226837 Akaike info criterion -
0.028216
Sum squared resid 2.572742 Schwarz criterion 0.188785
Log likelihood 6.790061 F-statistic 83.59142
Durbin-Watson stat 2.021590 Prob(F-statistic) 0.000000
Redundant Variables: R9
F-statistic 3.256186 Probability 0.077302
Log likelihood ratio 3.602927 Probability 0.057678
Test Equation:
Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficien
t
Std. Error t-Statistic Prob.
C 0.354120 0.064417 5.497288 0.0000
R11 -0.057916 0.022193 -2.609630 0.0119
R13 0.005333 0.001627 3.278188 0.0019
R17 0.004480 0.034033 0.131649 0.8958
F 1.601359 0.210131 7.620755 0.0000
F*R17 0.156816 0.043899 3.572164 0.0008
R-squared 0.887398 Mean dependent var 0.461076
Adjusted R-squared 0.876138 S.D. dependent var 0.661660
S.E. of regression 0.232865 Akaike info criterion 0.024240
Sum squared resid 2.711302 Schwarz criterion 0.241242
Log likelihood 5.321283 F-statistic 78.80849
Durbin-Watson stat 1.931474 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
42
Wald Test:
Equation: Untitled
Null Hypothesis: C(2)=0
C(5)=0
F-statistic 1.637150 Probability 0.204995
Chi-square 3.274299 Probability 0.194534
Dependent Variable: Y
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable Coefficient Std. Error t-Statistic Prob.
C 0.359005 0.052145 6.884691 0.0000
R11 -0.058394 0.021682 -2.693231 0.0096
R13 0.005308 0.001600 3.316776 0.0017
F 1.597290 0.205833 7.760112 0.0000
F*R17 0.161255 0.027837 5.792787 0.0000
R-squared 0.887359 Mean dependent var 0.461076
Adjusted R-squared 0.878525 S.D. dependent var 0.661660
S.E. of regression 0.230611 Akaike info criterion -0.011128
Sum squared resid 2.712241 Schwarz criterion 0.169707
Log likelihood 5.311581 F-statistic 100.4416
Durbin-Watson stat 1.931503 Prob(F-statistic) 0.000000
Econometría Curso 2012-13
43
EXAMEN PARCIAL DE ECONOMETRÍA (ADE). 27 de enero de 2012. (5 puntos) Duración: 1 hora y 45 minutos. NOMBRE Y APELLIDOS: GRUPO:
Nota 1: Recuerda que es necesario alcanzar el 30% de la puntuación tanto en teoría como en práctica para sumar las puntuaciones de estas dos partes. El nivel de significación de los contrastes es el 5%.
1) (1 punto) Comenta las distintas hipótesis sobre las perturbaciones aleatorias que se exigen en un Modelo econométrico Clásico. Obtén a partir de dichas hipótesis, la distribución de los residuos
mínimo cuadráticos, la de la variable endógena observada y la de la variable endógena ajustada.
2) (1 punto) Demuestra que el estimador β de mínimos cuadrados ordinarios es consistente. 3) (1 punto) Se tiene el siguiente modelo estimado: 1 2
(0.2) (0.5) (0.07)
ˆ 10 0.81 0.32t t tY X X= + +
Donde Y son las importaciones de un bien, X1 es el PIB, X2 los precios de un bien sustitutivo y
se conoce también que N=50, SCT=120 y SCR=100 y los siguientes valores críticos
47(0.05) 1.96t =
, 3 2
47 47(0.05) 2.84 , (0.05) 3.23F F= = (entre paréntesis los estadísticos t).
a. Interpreta el significado económico de los estimadores. b. Analiza la significación individual de las variables explicativas. c. Analiza la significación global del modelo. d. Calcula la expresión matricial R rβ = y el modelo restringido resultante de analizar la
hipótesis nula: 1 22* 3β β+ =
4) (1 punto) Comenta si son ciertas o falsas las afirmaciones siguientes, justificando adecuadamente tu respuesta:
a. Si las perturbaciones no tienen distribución Normal, pero se cumplen el resto de hipótesis
clásicas, los estimadores β de mínimos cuadrados siguen siendo insesgados. b. Existe multicolinealidad perfecta en un modelo donde se cumple que: 1 2 3β β= +
c. El que no se rechace la hipótesis nula de que un parámetro es igual a 0, no significa siempre que la variable explicativa a la que acompaña el parámetro sea irrelevante.
d. Las propiedades de los estimadores del modelo no se ven modificadas si el efecto de las variables explicativas sobre la variable endógena no se mantiene dentro del periodo
muestral.
e. El hecho de que una de las variables explicativas de un modelo econométrico correctamente especificado sea una variable ficticia en lugar de una variable cuantitativa no modifica las
propiedades de los estimadores de dicho modelo.
5) (1 punto) Se quiere analizar si la nota que han obtenido 100 alumnos en una prueba de primer curso de grado (N) viene determinada por la nota media de bachillerato (B) y el género de la
persona (donde se define G=1 si el alumno es hombre y G=0 si es mujer).
a. Especifica un modelo que permita analizar las diferencias en la nota de la prueba atribuibles únicamente a si la persona es hombre o mujer ¿Cómo contrastarías si dichas diferencias no
son significativas?
b. Se piensa que la nota media de bachillerato (B) debería ser también una variable incluida en el modelo anterior. Especifica un modelo que permita contrastar si el efecto de la nota de
bachiller (B) sobre la nota de la prueba (N) es diferente para un hombre que para una mujer
y escribe dicho contraste.
c. Tras diversas pruebas el modelo finalmente estimado es el siguiente (entre paréntesis los estadísticos t):
{ { {(3.55)(4.5) (8.9)
ˆ 25 0.75 20.5i i iN B G= + +
Indique si los resultados de la prueba son diferentes entre hombres y mujeres y si es así, cuantifique
esa diferencia (Nota: con un nivel de significación de 0.05, los valores críticos de una t de Student
son: t100=1.96; t97=1.98, t3=3.18).
Econometría Curso 2012-13
44
EXAMEN PARCIAL DE ECONOMETRÍA (ADE). 27 de enero de 2012. PARTE PRÁCTICA (5 puntos)
NOMBRE Y APELLIDOS: Nota 1: Recuerda que es necesario alcanzar el 30% de la puntuación tanto en teoría como en práctica para sumar las puntuaciones de estas dos partes. Nota 2: Rellena solamente los espacios en blanco en las tablas y, si lo necesitas, utiliza la parte de atrás de las hojas para responder. Utiliza 4 decimales. El nivel de significación de los contrastes es 5%. Nota 3: En todos los apartados es necesario que expliques en qué se basan tus respuestas. Por ejemplo, si se fundan en el resultado de un contraste, has de indicar claramente, al menos, las hipótesis, el estadístico que utilizas y la conclusión a la que llegas. Si necesitas especificar cuadros, gráficos, estimaciones, etc. para los cuales no tienes asignado explícitamente el recuadro, deberás hacerlo claramente como lo consideres oportuno. Duración: 1 hora y 30 minutos Se desea estimar un modelo que explique la mortalidad infantil de 64 países en desarrollo. Se dispone de los datos del fichero mortalidad.wf1 que contiene información de las siguientes variables: MI= Mortalidad infantil (número de defunciones de niños menores de 5 años por cada 1000 nacidos vivos). PIBPC= Producto interior bruto per cápita (en miles de euros). TFT= Tasa de fecundidad total (promedio de hijos por mujer) TAF= Tasa de alfabetismo femenina (en porcentaje)
1) Plantea y estima un modelo que explique la mortalidad infantil en función del PIB per cápita. MODELO 1.
Dependent Variable: MI
Method: Least Squares
Date: 12/01/11 Time: 15:46
Sample: 1 64
Included observations: 64 Coefficient Std. Error t-Statistic Prob.
PIBPC -0.011364 0.003233 -3.515661 0.0008
C 157.4244 9.845583 15.98935 0.0000
R-squared 0.166217 Mean dependent var 141.5000
Adjusted R-squared 0.152769 S.D. dependent var 75.97807
S.E. of regression 69.93413 Akaike info criterion 11.36374
Sum squared resid 303228.5 Schwarz criterion 11.43120
Log likelihood -361.6396 Hannan-Quinn criter. 11.39031
F-statistic 12.35987 Durbin-Watson stat 1.931458
Prob(F-statistic) 0.000826
2) ¿Qué porcentaje de la variabilidad de la mortalidad infantil es explicada por el modelo? ¿El
modelo propuesto explica adecuadamente la mortalidad infantil?
Econometría Curso 2012-13
45
3) Contrasta, en el modelo anterior, si la forma funcional lineal del modelo es la adecuada.
Ramsey RESET Test:
F-statistic 16.33611 Prob. F(1,61) 0.0002
Log likelihood ratio 15.18638 Prob. Chi-Square(1) 0.0001
Test Equation:
Dependent Variable: MI
Method: Least Squares
Date: 01/17/12 Time: 16:58
Sample: 1 64
Included observations: 64 Coefficient Std. Error t-Statistic Prob.
PIBPC 0.007913 0.005579 1.418363 0.1612
C -164.4369 80.11971 -2.052390 0.0444
FITTED^2 0.014063 0.003479 4.041796 0.0002
R-squared 0.342341 Mean dependent var 141.5000
Adjusted R-squared 0.320779 S.D. dependent var 75.97807
S.E. of regression 62.61723 Akaike info criterion 11.15770
Sum squared resid 239176.0 Schwarz criterion 11.25890
Log likelihood -354.0464 Hannan-Quinn criter. 11.19757
F-statistic 15.87664 Durbin-Watson stat 1.864825
Prob(F-statistic) 0.000003
4) A la vista de los resultados se proponen dos estimaciones alternativas al modelo anterior:
Incluir en el MODELO 1 las variables Tasa de alfabetismo femenino y Tasa de fecundidad (MODELO 2). Estima dicha alternativa.
MODELO 2
Dependent Variable: MI
Method: Least Squares
Date: 11/28/11 Time: 13:04
Sample: 1 64
Included observations: 64 Coefficient Std. Error t-Statistic Prob.
PIBPC -0.005647 0.002003 -2.818703 0.0065
TAF -2.231586 0.209947 -10.62927 0.0000
C 263.6416 11.59318 22.74109 0.0000
R-squared 0.707665 Mean dependent var 141.5000
Econometría Curso 2012-13
46
Adjusted R-squared 0.698081 S.D. dependent var 75.97807
S.E. of regression 41.74780 Akaike info criterion 10.34691
Sum squared resid 106315.6 Schwarz criterion 10.44811
Log likelihood -328.1012 Hannan-Quinn criter. 10.38678
F-statistic 73.83254 Durbin-Watson stat 2.186159
Prob(F-statistic) 0.000000
5) En base únicamente a los resultados de las dos estimaciones, selecciona entre los dos
modelos estimados el que mejor explica la mortalidad infantil justificando adecuadamente tu selección. Señala las propiedades de los estimadores de los modelos no elegidos.
6) Contrasta si la forma funcional lineal del modelo seleccionado es la adecuada. ¿A qué crees
que es debido este resultado?
Ramsey RESET Test:
F-statistic 3.124542 Prob. F(1,59) 0.0823
Log likelihood ratio 3.302635 Prob. Chi-Square(1) 0.0692
Test Equation:
Dependent Variable: MI
Method: Least Squares
Date: 01/17/12 Time: 17:08
Sample: 1 64
Included observations: 64 Coefficient Std. Error t-Statistic Prob.
PIBPC -0.002972 0.002339 -1.270820 0.2088
TAF -0.295054 0.868217 -0.339840 0.7352
TFT 6.408240 5.506154 1.163832 0.2492
C 58.57352 69.99047 0.836878 0.4060
FITTED^2 0.002745 0.001553 1.767638 0.0823
R-squared 0.760078 Mean dependent var 141.5000
Adjusted R-squared 0.743812 S.D. dependent var 75.97807
S.E. of regression 38.45634 Akaike info criterion 10.21183
Sum squared resid 87254.53 Schwarz criterion 10.38049
Log likelihood -321.7785 Hannan-Quinn criter. 10.27827
F-statistic 46.72819 Durbin-Watson stat 2.032580
Prob(F-statistic) 0.000000
Econometría Curso 2012-13
47
7) Contrasta si las perturbaciones cumplen la hipótesis de normalidad.
0
2
4
6
8
10
12
14
-80 -40 0 40 80
Series: ResidualsSample 1 64Observations 64
Mean 2.36e-14Median 3.320166Maximum 98.71893Minimum -98.16451Std. Dev. 38.18821Skewness 0.145068Kurtosis 3.326877
Jarque-Bera 0.509408Probability 0.775146
8) ¿Puede admitirse que si se aumenta en un punto la tasa de alfabetización en las mujeres y
se disminuye en 1000 euros el PIB per cápita la mortalidad infantil no se modifica?
Wald Test:
Equation: EQ02
Test Statistic Value df Probability
F-statistic 50.34709 (1, 60) 0.0000
Chi-square 50.34709 1 0.0000
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
-C(1) + C(2) -1.762518 0.248397
Restrictions are linear in coefficients. 9) Calcula las correlaciones lineales simples entre las variables explicativas del modelo.
Escríbelas y razona si hay multicolinealidad en el modelo y, en caso afirmativo, comenta si observas alguna consecuencia en los resultados de la misma.
PIBPC TAF TFT
PIBPC 1.000000 0.268530 -0.185718
TAF 0.268530 1.000000 -0.625954
ºTFT -0.185718 -0.625954 1.000000
Econometría Curso 2012-13
48
10) Calcula la capacidad predictiva del modelo para las 4 últimas observaciones. Analiza los
resultados.
-40
0
40
80
120
160
200
240
280
61 62 63 64
MIFCAP
Forecast: MIFCAPActual: MIForecast sample: 61 64Included observations: 4
Root Mean Squared Error 8.743292Mean Absolute Error 7.720772Mean Abs. Percent Error 5.863251Theil Inequality Coefficient 0.030143 Bias Proportion 0.447873 Variance Proportion 0.503522 Covariance Proportion 0.048605
11) Calcula la predicción para dos países adicionales y analiza su precisión si se dispone de la
información contenida en la tabla siguiente:
País TAF PIBPC TFT 65 25 1150 5,2 66 30 870 5,6
País MIF se CVpredicción
65 184.6850 40.12650 0.217270 66 182.5354 39.75416 0.217789
Econometría Curso 2012-13
49
EXAMEN PARCIAL DE ECONOMETRÍA (ADE). 17 de Enero de 2011 PARTE PRÁCTICA (5 puntos)
NOMBRE Y APELLIDOS:
Nota 1: Recuerda que es necesario alcanzar el 30% de la puntuación tanto en teoría como en práctica para sumar las puntuaciones de estas dos partes. Nota 2: Rellena solamente los espacios en blanco en las tablas y, si lo necesitas, utiliza la parte de atrás de las hojas para responder. Utiliza 4 decimales. El nivel de significación de los contrastes es 5%. Nota 3: En todos los apartados es necesario que expliques en qué se basan tus respuestas. Por ejemplo, si se fundan en el resultado de un contraste, has de indicar claramente, al menos, las hipótesis, el estadístico que utilizas y la conclusión a la que llegas. Si necesitas especificar cuadros, gráficos, estimaciones, etc. para los cuales no tienes asignado explícitamente el recuadro, deberás hacerlo claramente como lo consideres oportuno.
Duración: 1 hora y 45 minutos Se desea estimar un modelo que explique la calidad del aire a partir de los datos del fichero calidad.wf1 que contiene información de las siguientes variables para 15 ciudades: AIRQ: Indicador de la calidad del aire (cuanto mayor es, peor calidad) VALA= Valor añadido de las empresas asentadas en la ciudad (en miles de euros) RAIN= Nivel de lluvia (en litros/año) MEDI= Renta media per cápita (en euros) DENS: Densidad de población (en hab./km2) COAS: Ficticia que toma el valor 1 si la ciudad es costera, 0 en caso contrario
1) Plantea y estima tres modelos que expliquen la calidad del aire en función de: a) la variable cuantitativa más relacionada. (Modelo 1) b) todas las variables cuantitativas (Modelo 2). c) todas las variables cuantitativas y la cualitativa incluida de forma aditiva (Modelo 3).
Completa la siguiente tabla con los resultados de las estimaciones. Entre paréntesis los estadísticos t.
MODELO 1 MODELO 2 MODELO 3
VALA iβ
(t)
RAIN iβ
(t)
MEDI iβ
(t)
DENS iβ
(t)
COAS iβ
(t)
Constante iβ
(t)
R2
2R
F
P-valor
Econometría Curso 2012-13
50
2) En base únicamente a los resultados de la tabla anterior, selecciona entre los tres modelos estimados el que mejor explica la calidad del aire justificando adecuadamente tu selección y explicitando claramente los problemas de cada uno de ellos.
3) A partir del modelo elegido en el apartado anterior, realiza una selección de regresores
eliminando en cada paso la variable que consideres más oportuna. Completa el cuadro con la ecuación finalmente seleccionada (Modelo 4) y explica claramente los pasos realizados para llegar a dicha selección.
Dependent Variable: Method: Least Squares Sample: Included observations:
Variable Coefficient Std. Error t-Statistic Prob.
R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)
4) A partir del modelo seleccionado en el apartado anterior, responde a las siguientes cuestiones:
4.1. ¿Crees que las ciudades costeras tienen mejor o peor calidad del aire que las ciudades del interior?
4.2. ¿Crees que la lluvia mejora la calidad del aire en las ciudades?
Econometría Curso 2012-13
51
5) En el modelo seleccionado, contrasta si la forma funcional lineal del modelo es la adecuada. 6) Contrasta asimismo si las perturbaciones del modelo seleccionado se distribuyen como una
normal. 7) El gráfico siguiente se corresponde a la secuencia del coeficiente recursivo de la variable
RAIN. ¿Cuál es el valor del coeficiente recursivo obtenido utilizando las 12 primeras observaciones? Expresa el resultado con cuatro decimales.
-1.2
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
8 9 10 11 12 13 14 15
Recursiv C(3) Estimates_RAIN ± 2 S.E.
8) A la vista de los resultados obtenidos, contrasta si la calidad del aire se mantendría si la renta
media aumentara en 500 euros y el nivel de lluvia disminuyera en 10 litros. 9) Analiza la capacidad predictiva del modelo seleccionado en el apartado 3 para las 5 últimas
observaciones.
10) Para un nivel de significación del 5%, calcula un intervalo de confianza para la predicción de la calidad del aire para una nueva ciudad costera cuyo valor añadido se eleva 2 millones de euros, con una renta media per capita de 3500 euros y una densidad de población de 650 hab. sabiendo además que el nivel de lluvia es de 40 litros.
¿ ?
Econometría Curso 2012-13
52
CUESTIONES: Temas 1 a 6
Pregunta 1. Se estima por mínimos cuadrados ordinarios el siguiente modelo de regresión
0 1i i iY Xβ β ε= + + obteniéndose una estimación de 1β igual a 1.2. Di si son ciertas o falsas
las siguientes afirmaciones, razonando tus respuestas:
a) Si tomamos distintas muestras de la variable Y podemos obtener otras estimaciones de
1β .
b) La distribución del estimador MCO de 1β está centrada en el valor 1.2.
Pregunta 2. Responde brevemente a la siguiente cuestión:
¿ Qué relación existe entre las siguientes expresiones?
)ˆ()'ˆ( ββββ −−E y )'ˆ)(ˆ( ββββ −−E
siendo β el estimador por MCO en un modelo de regresión lineal clásico
Pregunta 3. Responde o comenta brevemente los siguientes apartados:
a) ¿Cuál de los dos modelos estimados presenta mayor R2?
i) ii)
b) El siguiente gráfico muestra las distribuciones normales de dos estimadores lineales e insesgados de la pendiente en un modelo de regresión lineal simple ¿Cuál de ellas no es la del estimador por mínimos cuadrados ordinarios?.
X
Y1
0 1 2 3 4 5
3,5
5,5
7,5
9,5
11,5
X
Y2
0 1 2 3 4 5
3
5
7
9
11
-15 -5 5 15 25
0
0,1
0,2
0,3
0,4
Econometría Curso 2012-13
53
Pregunta 4. Indica en cada uno de los siguientes casos si la afirmación es verdadera o falsa. Razona tu respuesta.
a. La matriz de varianzas y covarianzas estimada de los estimadores de MCO ( ββββΣ ˆˆˆˆ Sˆ
′′ = ) es la misma para cualquier muestra que se tome.
b. Si al estimar un modelo econométrico, el R2 toma un valor cercano a cero, puede ser indicativo de que la relación entre las variables no es lineal.
c. La aplicación de los métodos de estimación de Mínimos Cuadrados Ordinarios y Máxima Verosimilitud a un modelo econométrico genera los mismos estimadores
de todos los parámetros del modelo.
d. Si al estimar el modelo: iiiii XXXY εββββ ++++= 3322110 , la variable X2 es no
significativa individualmente, eso significa también que el valor obtenido para 2β
es cero.
e. Los residuos mínimo cuadráticos de un modelo de regresión lineal clásico son variables aleatorias con esperanza cero, pero cuyos valores muestrales no siempre
tienen media muestral nula.
Pregunta 5. Dadas las siguientes expresiones
a)N' εε; b)
Nee'; c) E(e’e) d) E(ee’)
donde ),,,(' N21 εεεε L= y )e,,e,e('e N21 L= . Indíquese el significado de cada una de
ellas y establezca su relación con 2σ .
Pregunta 6. Responde razonadamente a las siguientes preguntas:
a) En el modelo de regresión lineal clásico las variables del segundo miembro suelen llamarse “variables independientes”, las columnas de X se suponen “linealmente
independientes” y las perturbaciones ε se suponen variables aleatorias “distribuidas independientemente”. El vocablo “independiente” es utilizado de tres maneras
distintas en la frase anterior. Explica los tres significados de la palabra. ¿Qué papel
desempeñan estos tres conceptos diferentes en la teoría de la estimación del modelo
lineal?
b) Estimado el modelo: iii uXY += β se calcula el coeficiente de determinación R2
para medir la bondad del ajuste y se obtiene un valor igual a –1,74. ¿A qué obedece
este resultado?
c) Si al ir añadiendo regresores nuevos en un modelo va aumentando el coeficiente de determinación, R
2, ¿deberíamos incluir en el modelo el mayor número posible de
regresores?
Pregunta 7. Supongamos que se estima con 100 datos un modelo de 4 regresores, incluido
el término independiente, y se obtiene un 2R corregido (ajustado) igual a 0,7. Determina
que porcentaje de variación de la variable endógena queda explicado por la regresión.
Econometría Curso 2012-13
54
Pregunta 8. En un modelo con 4 variables explicativas (además del término constante) se desea contrastar que el efecto de la primera variable sobre la variable dependiente es el
doble que el efecto de la segunda y, a la vez, las otras dos variables tienen el mismo efecto
sobre la variable dependiente.
a) Plantea el modelo inicial, la hipótesis nula y el modelo restringido.
b) Si escribimos la hipótesis nula como rR =β , construye las matrices R y r.
Pregunta 9. Considera el modelo de regresión lineal clásico
iiii XXY εβββ +++= 22110
Se ha estimado por MCO ordinarios con 20 observaciones, obteniéndose los siguientes
resultados.
( )
−−−−
==
= −
04.003.005.0
03.005.002.0
05.002.022.0
X'XSS
78.1
70.0
97.0
ˆ 12ˆˆβββ S
2 =2.52 y R
2=0.95.
a) Calcula la suma de los cuadrados totales, la suma de los cuadrados de la regresión y la suma de los cuadrados de los errores o de los residuos.
b) Contrasta la hipótesis de que 0 1: 1H β = frente a la alternativa de que
1 1: 1H β ≠ .
c) Contrasta la significación de la regresión.
Pregunta 10. Se ha estimado por MCO el modelo siguiente
)72,3()18,2()88,4(321 867,150141,1824ˆiiii XXXY +−+=
− 963,02 =R N=20 (Modelo
1)
Con los mismos datos se estimaron dos modelos restringidos
)34,3()64,10(321 17,33)(82,197,897ˆiiii XXXY +++= 9494,02 =R (Modelo
2)
( ))18,5()35,5(
321 234,95134,2044ˆiiii XXXY +−++= 962,02 =R (Modelo
3)
a) ¿Bajo qué restricción se ha estimado el modelo 2? ¿y el modelo 3? b) ¿Es razonable suponer que la restricción del modelo 2 es cierta? ¿y la del modelo 3?
Pregunta 11. Sea el siguiente modelo econométrico estimado por MCO con 100 observaciones
( ) ( ) ( )iii XXY 2
7,41
04,1363,0
28,15,013,0ˆ ++−=−
74,02 =R
Dada la información anterior se estima, con la misma muestra, el siguiente modelo
alternativo
iii XXY 2)1,6(
1)11,14(
25,148,0ˆ += 72,02 =R
Econometría Curso 2012-13
55
(entre paréntesis aparecen los estadísticos t de significación individual)
¿Podríamos elegir un modelo u otro con los datos que se presentan? Justifica tu respuesta.
Pregunta 12. Comenta brevemente, justificando la respuesta, si son verdaderas o falsas las siguientes afirmaciones:
a) Un modelo posee una buena capacidad predictiva si el valor del coeficiente de desigualdad de Theil es igual a 1,15.
b) El estimador máximo verosímil de la varianza de las perturbaciones es insesgado y consistente.
c) En el modelo de regresión lineal general, el supuesto de normalidad de las perturbaciones es necesario para poder obtener los estimadores de MCO de los
parámetros.
d) Un modelo posee una buena capacidad predictiva si el coeficiente de desigualdad de Theil es igual a 0,05 aunque la mayor proporción del ECM del predicción recaiga en
la proporción del sesgo.
Pregunta 13. Sea el modelo de Regresión Lineal Clásico tt22t110t XXY εβββ +++= y
su estimación por MCO t2t1t X082,0X14,055,19Y +−= T=22 e’e=18,54
Indica cuál de los modelos que se presentan a continuación es el modelo restringido que
permite contrastar las siguientes hipótesis. En ambos casos realiza dichos contrastes para un
nivel de significación del 5%.
a) 0:H 210 =+ ββ
b)
=
2
0:H
2
00 β
β
• *tt X103,014,14Y += t1t2
*t XXX −= e’e=23,28
• *t
*t X45,042,80Y +−= t1t
*t XYY −= t1t2
*t XXX −= e’e =1.876,7
• t1*t X2,0Y = 2YY t
*t −= e’e =654,78
• t1*t X76,2Y −= t2t
*t X2YY −= e’e =82.495
Pregunta 14. Con una muestra de 100 observaciones se ha estimado por mínimos cuadrado ordinarios el siguiente modelo:
=
=
==++++++−=
casootro0
tivoAdministra12
0
11
27,10479,0
)2(13212)1(25115010125150ˆ
2
21321
ii
iiiiiiiiii
Dcasootro
DirectivoD
SCTS
XDDXDDXXXY
donde Y es el salario en miles de euros, X1 es el número de años estudiados, X2 el número
de horas trabajadas, X3 el número de años en la empresa y D1 y D2 dos variables ficticias
que recogen la categoría laboral del trabajador (directivo, administrativo y operario).
Econometría Curso 2012-13
56
Indica en cada uno de los dos casos siguientes, cuál es la hipótesis nula del contraste a
realizar y cuál es el modelo restringido. Realiza los contrastes teniendo en cuenta que la
información que aparece en cada apartado corresponde al modelo restringido.
a) ¿Se podría afirmar que la categoría profesional es un factor irrelevante para explicar el comportamiento del sueldo? SCE=932,07
b) ¿Se podría afirmar que el efecto de los años estudiados es distinto dependiendo de la categoría profesional del trabajador? SCR=415
Pregunta 15. Sean dos variables ficticias definidas de la siguiente manera:
∉∈
=Ai
AiiD
0
11
∈∉
=Ai
AiiD
0
12
y sean los siguientes modelos donde Xi es una variable cuantitativa:
1) iiXiDiDoiY εγβββ ++++= 2211
2) iiXiDoiY εγββ +++= 11
3) iiXiXiDiXiDiDoiY εγγγββ +++++= 3221111
4) iiXiXiDiDoiY εγγββ ++++= 21111
5) iiXiDiDiDoiY εγβββ ++++= 21211
Se pide:
a) Indica cuales de estos modelos no se pueden estimar por MCO y explica por qué. b) Explica cuando plantearías cada uno de los modelos que consideras que sí se
pueden estimar por MCO e interpreta sus coeficientes.
Pregunta 16. Dada la información sobre precios (medido en miles de euros) y características de 100 casas vendidas en un determinado año, se tiene la siguiente
estimación:
Variable endógena: PRECIO Variables Estimadores
Constante 13.95 (2.30)
Metros 0.023 (3.28)
Habitaciones 2.46 (4.02)
Piscina 1.3 (3.91)
Vistas 0.081 (2.06)
Metros*piscina 0.11 (4.03)
Piscina*vistas 0.15 (10.01)
0.75
Estadísticos t de Student entre parétesis
donde la variable metros es la superficie de la vivienda expresada en m2; la variable habitaciones es el número de habitaciones de la vivienda; la variable piscina es una variable ficticia que toma el valor 1, si la casa tiene piscina, y 0, en caso contrario; y la
variable vistas es otra variable ficticia que vale 1, si la casa tiene buenas vistas, y 0, en caso contrario.
2R
Econometría Curso 2012-13
57
a) Plantea el modelo que se ha estimado para las modalidades de las variables cualitativas. b) ¿Cuál es el cambio esperado en el precio de una casa con piscina y vistas si tiene 40
metros más que otra de las mismas características? ¿Y si no tiene piscina?
c) ¿Qué efecto tiene sobre el precio medio de una casa sin vistas el hecho de tener piscina a no tenerla? ¿Y si tuviera vistas?
d) ¿Cuál es el cambio esperado en el precio de una casa sin piscina y sin vistas por tener una habitación más? ¿Y en el caso de una casa con piscina y con vistas?
Pregunta 17. Se quiere analizar si el número de espectadores que acuden al cine (ES) está relacionado con el precio de las entradas (P) y con el día de la semana, diferenciado si es
miércoles (día del espectador) o no lo es. Se han obtenido datos diarios desde el 1 de mayo
de 1990 al 31 de diciembre de 2006.
a. Especifica un modelo que permita analizar las diferencias en el número de espectadores atribuibles únicamente a si se acude en el día del espectador o no ¿Cómo contrastarías si
dichas diferencias no son significativas?
b. Se piensa que el precio de las entradas (P) debería estar en el modelo anterior ¿Cómo contrastarías si el efecto del precio de las entradas (P) sobre el número de espectadores
(ES) el miércoles es diferente que dicho efecto el resto de la semana ?
c. Partiendo del modelo del apartado (a), se quiere investigar si una ley del cine que se introdujo en el 1 de Febrero del año 2003 puede haber afectado al número de
espectadores que acuden al cine. Describe dos procedimientos para contrastar esta
proposición y especifica claramente el contraste en cada uno de ellos.
Pregunta 18. Se desea estudiar los efectos de la discriminación por raza en el consumo realizado por un determinado grupo de familias. Se considera el siguiente modelo:
iiiii DDYC εδγββ ++++= 2110 (Modelo 1)
donde iC es el consumo de la familia i, iY es su renta, iD1 es una variable ficticia que toma
valor 1 para las familias de raza oriental y 0 en los demás casos y iD2 es otra variable
ficticia que toma valor 1 para las familias de raza negra y 0 en los demás casos.
Sabiendo que se dispone de una muestra de familias de raza negra, oriental y blanca,
responde razonadamente a las siguientes preguntas:
a) ¿Cuál es el consumo esperado para las distintas razas? b) ¿Cómo contrastarías la hipótesis de que la raza no tiene efecto sobre el consumo? c) Suponiendo que existe discriminación racial ¿cómo contrastarías que el consumo
autónomo esperado únicamente es diferente para las familias de raza blanca? Si esta
hipótesis no se rechaza ¿serían significativas las variables D1 y D2? ¿Por qué?
A partir del modelo 1, construye otro modelo en el que el efecto de la renta sobre el
consumo pueda también ser diferente dependiendo de la raza de la familia.
Pregunta 19. Un investigador planteó las dos especificaciones lineales siguientes
iii uXY ++= 110 ββ (Modelo 1)
iiii vXXY +++= 22110 ααα (Modelo 2)
Explica bajo qué circunstancias serán ciertos cada uno de los siguientes casos:
a) 2
2
2
1 RR ≤ siendo 2
1R el coeficiente de determinación del modelo 1 y 2
2R el del
modelo 2.
Econometría Curso 2012-13
58
b) iu no tiene esperanza nula pero iv sí la tiene.
Pregunta 20 Señala si son verdaderas o falsas las siguientes afirmaciones, justificando adecuadamente la respuesta:
a) Para introducir el efecto de una variable cualitativa con tres modalidades se han construido tres variables ficticias. Si se estima un modelo con término constante y
las tres variables ficticias introducidas de forma aditiva nos encontraremos con un
problema de multicolinealidad imperfecta.
b) Un valor del estadístico de Jarque-Bera próximo a 3 indica que las perturbaciones tienen una distribución normal.
Pregunta 21. Se ha estimado por MCO el modelo siguiente
)92,17()58,7(1031,0446,15ˆii XY += 9198,02 =R 9169,02 =R (Modelo 1)
Posteriormente se procede a estimar, por MCO y con los mismos datos, el modelo 2:
)69,3()86,5()32,4(21 0356,00199,083,9ˆiii XXY ++= 9467,02 =R 9428,02 =R (Modelo 2)
Y por último se estima, también por MCO con los mismos datos, el modelo 3
)541,0()322,3()164,5()817,2(321 0504,0039,00211,07,11ˆ
−−++= iiii XXXY 94,02 =R 9412,02 =R (Modelo 3)
(Entre paréntesis aparece el valor del estadístico t)
A la vista de estos resultados ¿qué propiedades crees que tienen los estimadores del modelo
1? ¿Y los del modelo 2? ¿Y los del modelo 3? Justifica en todos los casos tu respuesta.
Pregunta 22. Se ha estimado por MCO el siguiente modelo
tt XY 44,045,10ˆ −= 96,9=SCR T=1970…1999
Además se dispone de la siguiente información
tt XY 427,081,9ˆ −= 255,0=SCR T=1970…1981
tt XY 31,036,9ˆ −= 85,2=SCR T=1982…1999
¿Es admisible la hipótesis de constancia de los parámetros del modelo en los dos periodos
considerados? Comenta las implicaciones de la conclusión a la que has llegado.
Pregunta 23. Un investigador planteó las dos especificaciones lineales siguientes
iii uXY ++= 110 ββ (Modelo 1)
iiii vXXY +++= 22110 ααα (Modelo 2)
Explica bajo qué circunstancias serán ciertos cada uno de los siguientes casos:
c) 11ˆˆ αβ = siendo 1β el estimador de MCO de 1β y 1α el de 1α .
d) 2
2
2
1 RR ≤ siendo 2
1R el coeficiente de determinación del modelo 1 y 2
2R el del
modelo 2.
e) Se rechaza la hipótesis 0: 10 =βH pero no se rechaza
0: 10 =αH.
f) iu no tiene esperanza nula pero iv sí la tiene.
Pregunta 24. Sea el modelo tttot XXY εβββ +++= 2211 donde tεcumple las hipótesis
clásicas.
Econometría Curso 2012-13
59
¿Se pueden estimar consistentemente los parámetros del modelo mediante MCO bajo el
supuesto: tt XX 12 2 α+=(dondeα es una constante)? ¿Y si se elimina X2 del modelo
anterior? ¿Y si se sustituye X2 por una variable no relevante en la especificación del
modelo? Justifica adecuadamente cada uno de los supuestos.
Pregunta 25. Se ha estimado un modelo con 27 observaciones, obteniéndose
( ) ( )i1
2,07,0i X38,372,1Y +=
SCR=200
Sin embargo se está estudiando la posibilidad de incluir como variable explicativa X2,
quedando entonces el modelo estimado
( ) ( ) ( )i2
1,0i1
7,05,0i X51,0X74,08,1Y ++=
SCR=120
En base a los resultados de estas dos estimaciones, ¿se puede sospechar que existe
multicolinealidad? Para valorar esta posibilidad, calcula el factor de inflación de la varianza
y comenta el resultado.
(Nota: entre paréntesis aparecen las desviaciones típicas)
Pregunta 26. Señala si son verdaderas o falsas las siguientes afirmaciones, justificando adecuadamente la respuesta:
c) La varianza de los EMCO depende, entre otras cosas, de la dispersión de los regresores.
d) Para introducir el efecto de una variable cualitativa con tres modalidades se han construido tres variables ficticias. Si se estima un modelo con término constante y
las tres variables ficticias introducidas de forma aditiva nos encontraremos con un
problema de multicolinealidad imperfecta.
e) Varianzas grandes de los estimadores implican valores grandes de los Factores de Inflación de la Varianza.