10

Click here to load reader

Estimación por VI y por MC2E

Embed Size (px)

Citation preview

Page 1: Estimación por VI y por MC2E

Estimación por MC2E Página 1 de 8

CONTENIDO:

1) Ejemplo: Comparación entre estimador MCO y estimador de VI (pp 1 a 2)2) MC2E con una sóla variable explicativa endógena (pp 2 a 3)3) ¿Por qué se habla de dos etapas? Interpretación del procedimiento (pp 3 a 3)4) Supuestos para la estimación por MC2E (pp 3 a 4)5) La multicolinealidad en MC2E (pp 4 a 4)6) Ejemplo: Adecuación de Variables instrumentales (pp 4 a 5)7) MC2E con más de una variable explicativa endógena (pp 5 a 5)8) Inadecuación de los estadísticos F y W0 para los contrastes en MC2E (pp 5 a 5)9) Error de medición en variables y MC2E (pp 5 a 6) 10) Proxis inadecuadas y MC2E: Scores como VI y control por inobservables (pp 6 a 6)11) Lista de problemas abordables con MC2E (pp 6 a 6)12) Recapitulación final (pp 6 a 7)

¿Cómo influye la educación en el sueldo?

Modelo 1: Log(Wage)=β0+βi·(Educ, Exper, Exper2, otras Xi) + ϵAnte la posibilidad de endogenicidad de Educ (C(Educ, ϵ)# 0) se decide utilizar como VI de Educ la variable: Cerca(: distancia desde domicilio paterno a una facultad)Que C(Cerca, ϵ)= 0 No se puede comprobar, pero no hay motivo para suponer que no se cumpla.Contraste de que C(Cerca, Educ)# 0 H0: ПCerca=0 en el modelo 2 siguienteModelo 2: Educ= 0+ i·(Cerca, Exper… y resto de variables exógenas del modelo 1) + П П ѵNota: A las variables independientes del modelo 2 se les llama “Instrumentos” Coeficiente Desv. Típica Estadístico t Valor p (Variable dependiente: educ) const 16,6592 0,176389 94,45 0,0000 *** exper -0,410008 0,0336939 -12,17 2,74e-033 *** expersq 0,000732287 0,00164995 0,4438 0,6572 black -1,00614 0,0896454 -11,22 1,15e-028 *** smsa 0,403877 0,0848872 4,758 2,05e-06 *** south -0,291464 0,0792247 -3,679 0,0002 *** Cerca 0,337321 0,0825004 4,089 4,45e-05 *** Se rechaza H0 => Se acepta que C(Cerca, Educ)# 0[Nota: la diferencia con los modelos simples es que en los múltiples se debe contrastar que C(Z, X)#0 tras descontar el efecto del resto de instrumentos o variables exógenas del modelo: regresión de X sobre Z y resto de X. Mientras que en un modelo simple basta con la regresión de X sobre Z (Z es la VI de X).]A continuación, hago la estimación por MCO (salida MCO) y por VI (salida VI):

Como se puede ver, el estimador de VI es casi el doble que el de MCO, pero su DS es 18 veces mayor, de forma que si IC95% es muy amplio: de 0,024 a 0,239. Este es un precio que siempre hay que pagar al usar VI para solucionar un problema de endogenicidad.Por otra parte, recordar que el R2 del modelo con VI es siempre menor que el de MCO (si lo que se quiere es maximizar el R2, es decir, el mejor ajuste de la recta a los datos, en lugar de estimar los βi, lo que hay que hacer es usar MCO).Además, el R2 del modelo con VI no tiene una interpretación clara e incluso puede ser negativo), al revés que en el caso de los MCO (% de varianza de Y que es explicada por las X).

Salida VI, usando las observaciones 1-3010Variable dependiente: lwageMediante Instrumentos: educ Instrumentos: const nearc4 exper expersq black smsa south Coeficiente Desv. Típica z Valor p ---------------------------------------------------------- const 3,75278 0,829341 4,525 6,04e-06 *** educ 0,132289 0,0492332 2,687 0,0072 *** exper 0,107498 0,0213006 5,047 4,49e-07 *** expersq -0,00228407 0,000334133 -6,836 8,15e-012 *** black -0,130802 0,0528723 -2,474 0,0134 ** smsa 0,131324 0,0301298 4,359 1,31e-05 *** south -0,104901 0,0230731 -4,546 5,46e-06 ***

Media de la vble. dep. 6,261832 D.T. de la vble. dep. 0,443798Suma de cuad. residuos 459,1785 D.T. de la regresión 0,391033R-cuadrado 0,267322

Salida MCO, usando las observaciones 1-3010Variable dependiente: lwage Coeficiente Desv. Típica Estadístico t Valor p ----------------------------------------------------------------- const 4,73366 0,0676026 70,02 0,0000 *** educ 0,0740090 0,00350543 21,11 2,28e-092 *** exper 0,0835958 0,00664779 12,57 2,22e-035 *** expersq -0,00224088 0,000317840 -7,050 2,21e-012 *** black -0,189632 0,0176266 -10,76 1,64e-026 *** smsa 0,161423 0,0155733 10,37 9,27e-025 *** south -0,124862 0,0151182 -8,259 2,18e-016 ***

Media de la vble. dep. 6,261832 D.T. de la vble. dep. 0,443798Suma de cuad. residuos 420,4760 D.T. de la regresión 0,374191R-cuadrado 0,290505

Page 2: Estimación por VI y por MC2E

Estimación por MC2E Página 2 de 8

MC2E:

Si hay más de una posible VI (p ej, Z1, Z2) para una sola X: Restricciones de exclusión: Z1 y Z2 no se incluyen en la ecuación estructural y no se correlacionan con el error de dicha forma estructural

Seguidamente se aplica la estimación MC2E a diversos problemas de endogenicidad como los creados por omisión de variable explicativa relevante, por Classical errors-in-variables dependientes y por proxi inadecuada:CASO CON UNA SOLA VARIABLE EXPLICATORIA ENDÓGENA (X1):Ecuac. estructural: Y=β0+βi·(X1, resto de exógenas) + ϵ donde se cumple que C(X1, ϵ)#0En lugar de hacer dos estimadores de VI, uno con Z1 y otro con Z2, se crea una nueva VI que sea una combinación lineal de Z1 y Z2. Todas las combinaciones lineales de Z1 y Z2 valdrían, pero la mejor es precisamente la que maximiza el R2, que es la forma reducida (pues se ajusta por MCO):X= 0+ 1·(Z1, Z2, resto de exógenas de la ecuación estructural) + П П ѵ(donde E( )=0 y Cov( , Z1)= Cov( , Z2)= Cov( , resto de exógenas de la ecuación ѵ ѵ ѵ ѵestructural)= 0)Por tanto la VI de X1 será: X1*= 0+ i·(Z1, Z2, resto de exógenas de la ecuación П Пestructural)Es necesario que ПZ1 y/ó ПZ2 sean distintos de cero (el coef de las exógenas incluidas en la ecuac. estructural puede tomar cualquier valor). Esta asunción ES ESENCIAL y se llama CONDICIÓN DE IDENTIFICACIÓN pues si ambos son cero X* no se puede identificar.Para comprobarlo, se hace un contraste de significación conjunta de las : es decir, se Пcontrasta H0: ПZ1= ПZ2 = 0 con una F o con una W0

En realidad, lo que hace la forma reducida es “dividir” la variable exógena X1 en dos partes; la parte exógena X1*, que no se correlaciona con ϵ, y la parte endógena ѵ que cabe esperar que sí se correlacione con ϵPor tanto, estimamos la forma reducida con las observaciones de la muestra:X1= p0+pi·(Z1, Z2, resto de exógenas de la ecuación estructural)+v utilizamos los coeficientes “pi” para calcular los valores X1i* de cada caso y hacemos el contraste de significación conjunta de los coef. de las Z; si no conseguimos rechazar H0 debemos abandonar el procedimiento (las Z no valen como VI de X1).Si rechazamos la H0 anterior, finalmente procedemos a estimar β1 con X1* como VI. Para lo cual se usa el sistema de los momentos, que nos lleva a un sistema de tantas

Page 3: Estimación por VI y por MC2E

Estimación por MC2E Página 3 de 8

ecuaciones e incógnitas como betas tiene la ecuación estructural (esto lo hace el ordenado).O sea, la única diferencia con lo visto hasta aquí es que hay más de una VI, por lo que hay que calcular una especie de promedio ponderado de ellas y del resto de las X exógenas. Ese promedio ponderado es la combinación lineal de la forma reducida.Así que cuando se usan múltiples Instrumentos (Instrumentos: VI no incluidas en la ecuación estructural y variables explicativas exógenas de la ecuación estructural) a la estimación por VI se le llama estimación por MC2E.

¿Por qué se habla de dos etapas? Interpretación del procedimiento :

Supongamos que la ecuac estructural es: Y=β0+ β1X1+ β2X2+ϵ, que nuestro interés es β1, que creemos que X1 es endógena y que hay dos VI: Z1 y Z21ª Etapa de mínimos cuadrados ordinarios para hallar la forma reducida “X1=p0+p1Z1+p2Z2+p3X2+v” a partir de la cual se calcula la nueva VI (combinación de las Z y de las X exógenas a la ecuac estructural) “X1*=p0+p1Z1+p2Z2+p3X2”2ª Etapa de mínimos cuadrados ordinarios para hallar los betas de la ecuac estructural: “Y=b0+b1*X1*+b2X2+e”Es decir, estimar por MC2E β1 supone (1ª) calcular X1* y (2ª) ajustar Y=β0+ β1*X1*+ β2X2+e [el estimador MC2E es el que resulta al sustituir X1 por su instrumento]

Una forma de entender lo que hemos hecho es la siguiente:1ª Etapa: purgamos a X1 de su parte endógena “v” (X1=p0+p1Z1+..+piXi..+ v)= X1*+v) 2ª Etapa: pasamos “v” al término de error de la ecuación estructural:Y=β0+ β1X1+ β2X2+ϵ => Y= β0+ β1X1*+ β2X2+ ϵ + β1vde forma que ahora sí se cumple que E(ϵ+β1v)=0 y que C(X1*, ϵ+β1v)= 0 ya no hay endogenicidad.La 2ª etapa no debe ser hecha a mano porque los errores estándar calculados a mano son erróneos.Si hay más variables explicativas exógenas no cambia gran cosa. Lo único a tener en cuenta es que hay que incluir todas ellas en la forma reducida.

Repaso de las condiciones necesarias para la estimación por MC2E (y por VI):1) E(Y|Xi)= linear en los betas.2) Muestra aleatoria (de las Y, X y Z) => E(med(X))=μ…3) C(Zi, ϵ)= 0 y E(ϵ)=04) Condición de identificación: Al menos ha de haber una variable Zi no incluida en la ecuación estructural cuya correlación PARCIAL con la variable endógena de que será instrumento (X) ha de ser distinta de cero [correlación PARCIAL: se habla de correlación parcial porque no se simplemente que C(Z, X)#0, sino que ha de haber una correlación independiente, tras descartar el efecto de las otra variables incluidas en la forma reducida. Esto significa que el coef. de Z en la forma reducida ha de ser distinto de cero]. Y no debe haber multicolinearidad perfecta entre instrumentos.Si se cumplen las condiciones 1 a 4 los estimadores de VI o de MC2E son consistentes y su distribución muestral es asintóticamente normal => Propiedades asintóticas significa

Page 4: Estimación por VI y por MC2E

Estimación por MC2E Página 4 de 8

que es importante que la muestra sea grande. Normal-> Podemos usar la N(0, 1) para contraste de H0 y para intervalos de confianza. Con sólo estas 4 condiciones los estimadores VI (MC2E) NO SON los estimadores de VI consistentes de mínima varianza (no son los más eficientes de entre los estimadores de VI consistentes).5) Homocedasticidad condicional: V(ϵ| todas las exógenas y las Z)= constante.Si se cumple la homocedasticidad, más las cuatro previas, los estimadores VI (MC2E) Sí SON los estimadores de VI consistentes de mínima varianza (sí son los más eficientes de entre los estimadores de VI consistentes). El problema de la multicolinealidad en MC2E (y VI)La existencia de correlaciones entre los instrumentos (las Z y las X exógenas de la ecuac. estructural) aumenta mucho la varianza de los estimadores MC2E (más incluso que en el caso de MCO.

Ejemplo : Adecuación de Variables instrumentales Prohibición de tener armas (Prohib: 1-sí|0-no)) y tasa de crímenes en las ciudades (Tcrim):Tcrim= β0+ β1Prohib+ β2TasaParo+ β3Población+ β4Edad_18a23+ β5PctEmigrantes+….. ϵSe piensa que C(Prohib, ϵ)# 0 y se decide hacer estimación MC2E.¿Serían buenas VI X1: “porcentaje de suscriptores a revistas de armas” o X2: “porcentaje de poblac que ha acudido a una armería el último año” ó X3: “porcentaje de poblac que se declara no violento”?Pienso que C(X1, Prohib)# 0, C(X2, Prohib)# 0, C(X3, Prohib)# 0Pero pienso que la tasa de crimen puede hacer que varíe el interés por las armas o el pacifismo en la población. Por tanto sería plausible que:Tcrimen X1 => C(Tcrimen, X1)# 0Por otra parte, hay muchos más factores que los incluidos en la ecuación estructural que influyen en la tasa de crímenes (p. ej., ser ciudad portuaria…) => C(Tcrimen, Puerto)# 0C(Tcrimen, X1)# 0 y C(Tcrimen, Puerto)# => C(X1, Puerto)# 0Pero como Puerto no está incluido en la ecuac estructural, su efecto se recoge en el ϵ => ϵ= ѵ+βPuerto C(X1, ϵ)= C(X1, ѵ+βPuerto)= β·C(X1, Puerto) =>

C(X1, ϵ)# 0 X1, X2 y X3 no son VI adecuadas.

CASO CON MÁS DE UNA VARIABLE EXPLICATORIA ENDÓGENA (varias X):Ecuación estructural: Y=β0+ β1X1+ β2X2+βiXi+ϵC(X1, ϵ)# 0; C(X2, ϵ)# 0; C(Xi, ϵ)= 0. Y además se cumplen el resto de condiciones señaladas antes…Nota: Recordar que el sesgo y la inconsistencia por omisión de variable relevante afecta en general a los coeficientes de TODAS LAS VARIABLES EXPLICATIVAS DEL MODELO. Por ello, lo más frecuente será que si en un modelo una X es inconsistente las demás X también lo sean…

Hace falta AL MENOS una VI (Z) que sea exógena al modelo y que no esté incluida en él por cada una de las X endógenas de la ecuación estructural.Seguidamente, se halla por MCO la forma reducida de cada X endógena:X1= p10+ p11Z1+ p12Z2+p1iXi+v1 X2= p20+ p21Z1+ p22Z2+p2iXi+v1Se comprueba si se cumple la Condición de identificación para ello: Es necesario que p11 y p22 sean # 0 Ó QUE p12 p21 sean # 0 Cuando hay más de una X endógena es necesaria la CONDICIÓN DE ORDEN: al menos tantas Z distintas como X endógenas.

CONTRASTE DE HIPÓTESIS EN ESTIMACIÓN por MC2E:

Page 5: Estimación por VI y por MC2E

Estimación por MC2E Página 5 de 8

Como R2 no es válida, los contrastes habituales basados en ella (F y W0) tampoco lo son.ERROR DE MEDICIÓN EN VARIABLES Y MC2E:Hemos visto como los MC2E solucionan la endogenicidad por omisión de variables, vamos a ver la endogenicidad por EM.Sea: Y=β0+ β1X1*+ β2X2+βiXi+ϵPero X1* la medimos con error (X1= X1*+u)= > Y=β0+ β1X1+ β2X2+βiXi+ ϵ - β1uSi C(X1, u)# 0 y C(X1*, u)= 0 (CEV: classical errors in variables) sesgo de atenuación.Si C(X1, u)# 0 y C(X1*, u)# 0 (no CEV: classical errors in variables) Inconsistencia pero no sabemos su magnitud y sentido.En ambos casos, la inconsistencia afecta a los estimadores de TODAS las X (excepto que sean independientes de X1 –ortogonales a X1-, cosa que es difícil que pase)Si C(X1, u)= 0 y C(X1*, u)# 0 (no CEV: classical errors in variables) Consistencia (pero más varianza)Los MC2E pueden solucionar esto en algunos casos: Situación CEV:recordar las asunciones generales de EM en Xi: ϵ es independiente de X1, X1* y de X2 y de u.asunciones específicas de CEV: u independiente de X1* y de X2Por tanto => X1 es endógena y X2 es exógenaSe precisaría una VI “Z1” tal que C(X1, Z1)#0 y que C(ϵ - β1u, Z1)= 0 [ya que el error de la ecuac estructural con X1 es ϵ - β1u] => Por tanto, Z1 debe ser independiente del error de medición “u”. VAMOS A ELLO (a buscar esa Z1):X1* es la variable “correcta” no observable.X1 es una de X1*: medición con error X1=X1*+ux1Si hacemos otra medición de X1* con error: Z1, de forma que Z1=X1*+uz1 Vamos a ver si Z1 sirve como VI de X1:C(Z1, X1)= C(X1*+ uz1, X1*+ ux1)# C(X1*, X1*) etc… => C(Z1, X1)# 0C(Z1, ϵ - β1 ux1)= C(X1*+ uz1, ϵ - β1 ux1)= C(X1*, ϵ) - β1C(X1*, ux1) + C(uz1, ϵ)- β1C(uz1, ux1)Pero por las condiciones previas: C(X1*, ϵ) = β1C(X1*, ux1) = C(uz1, ϵ)= 0 Además, como el EM u es independiente de X1*, ambos EM son independientes entre sí: C(uz1, ux1)=0Por tanto C(X1, ϵ - β1 ux1)= 0 [recuerda que ϵ - β1 ux1 es el error de la ecuac estructural con X1]Así que una segunda medición Z1 sería una variable 1) correlacionada con la primera medición X1, 2) exógena en la ecuac estructural en que la primera medición X1 es endógena y 3) no incluida en dicha ecuac estructural Z1 sería una VI adecuada de X1 en el modelo Y=β0+ β1X1+ β2X2+βiXi+ ϵ - β1u

Page 6: Estimación por VI y por MC2E

Estimación por MC2E Página 6 de 8

Una posibilidad de VI en caso de EM en Xi caso CEV es una segunda medición de Xi*Pero no siempre se dispone de esta segunda medición. Por lo que hay que recurrir a VI exógenasProxis inadecuadas: SCORES Y MC2E:Sea: Log(Wage)=β0+βi·(Educ, Exper, Exper2, Habilidad, otras Xi) + ϵHabilidad es inobservable, por lo que podríamos usar el IQ como proxi.

[NOTA sobre SCORES: El IQ (cociente intelectual) es un score o puntuación ordinal: se sabe que el que tiene 110 tiene más IQ que el que tiene 105. Pero no se puede afirmar que la diferencia entre 110 y 105 sea igual a la diferencia entre 125 y 120. Ni se puede decir que el que tiene 150 tenga el doble de inteligencia que el que tiene 75. Las variables como esta sólo miden la posición de orden, son ordinales o scores. Otro ejemplo de score: Mucho (de lo que sea), bastante, normal, poco, nada score con 5 valores ordinales: 4, 3, 2, 1 , 0. Otro Ejemplo: Satisfacción del consumidor: podría (y seguramente debería) medirse con un score como éste]

Pero si IQ no cumpliera las condiciones adecuadas para ser proxi, dado que es un Score, se puede usar un método basado en VI: IQ podría ser una proxi inadecuada de Habilidad porque:IQ no es exactamente = a la Habilidad. Por tanto, se podría decir que IQ= d1·Habilidad + u1 expresando así la relación entre ambos, la única condición que pongo a IQ es que se relacione linealmente con Habilidad. Pero podría suceder que C(u1, Habilidad)= 0 y que C(u1, IQ)# 0 sería como medir Habilidad con error y en caso CEV => los estimadores de MCO serían inconsistentes e IQ no valdría como proxi de Habilidad.

Supongamos que tenemos otro Score que también tiene que ver con Habilidad, como por ejemplo, “Conocimiento del mundo laboral (CML:Mucho: 4, bastante: 3, normal:, 2, poco: 1, nada: 0)

C(CML, IQ)#0 ya que C(Habilidad, IQ)# 0 y C(Habilidad, CML)#0Tanto IQ como CML afectan a Log(Wage) solo a través de Habilidad (que es lo que realmente afecta a Log(Wage). Por ello, como en la ecuac estructural de Log(Wage) ya está Habilidad, C(C(CML, ϵ)= 0Con lo que hemos conseguido una hermosa VI para el IQ, que en este caso no podíamos utilizarlo como proxi de Habilidad porque era endógeno en la ecuac estructural, debido a que su componente independiente de Habilidad (u1) se correlacionaba con IQ, lo cual lo coloca en una situación homóloga a la Classical errors-in-variables (error de medición en una variable independiente que no se correlaciona con el valor inobservable). CASOS DE ENDOGENICIDAD RESUELTOS MEDIANTE ESTIMACIÓN POR VI Y MC2E

Se ha visto en los epígrafes previos cómo la estimación por VI (llamada MC2E cuando hay más de una VI) puede resolver la inconsistencia de la estimación MCO en caso de endogenicidad de variables explicativas producida por:

- Omisión de variable relevante

- Classical error-in-variable independiente (error de medición en una variable independiente que no se correlaciona con el valor inobservable).

- Proxi endógena.

Sin embargo, ello es a costa de pagar el precio de un aumento de la imprecisión, ya que la varianza de los estimadores por VI y MC2E es mayor que la varianza de los estimadores MCO.

RECAPITULACIÓN FINAL:Recordar también que los estimadores VI son los estimadores consistentes [insesgados asintóticamente] a de VI con mínima varianza en caso de homocedasticidad condicional a TODOS

Page 7: Estimación por VI y por MC2E

Estimación por MC2E Página 7 de 8

LOS INSTRUMENTOS (las Xi exógenas más las Zi). En caso de heterocedasticidad, siguen siendo estimadores VI consistentes, pero no los de mínima varianza. Es importante tener en cuenta que la consistencia de los estimadores VI es una propiedad asintótica (cuando n tiende a infinito) -en ningún sitio se dice que sean estimadores insesgados, solo asintóticamente insesgados- Esto quiere decir que la “validez” (validez= que el estimador coincida con lo estimado) depende mucho de que las muestras sean grandes (pero en ningún sitio he visto qué se considera “grande” para los MC2E).Una condición específica de los estimadores VI (MC2E) es la llamada condición de identificación, orden o rango [no sé cómo decirlo], que se resume en que ha de haber al menos tantas variables exógenas a la ecuac. estructural y no incluidas en ella (variables Z) como variables endógenas de la ecuac estructural. Esto se detecta con los coeficientes de las Z de la forma reducida, que deben ser distintos de cero. Si C(Z, X)#0 y C(Z, ϵ)= 0 los estimadores VI son consistentes. En estimación por VI las principales causas de error son:

- Que no se cumpla alguna de las condiciones C(Z, X)#0 y C(Z, ϵ)= 0 Fatal (inconsistencia). => inconsistencia= ρZ,ϵ·σϵ /(ρZ,X·σX) [Nota: en MCO el sesgo por endogenicidad sería: ρX, ϵ·σϵ/σX]- Que C(Z, X) sea débil el error puede aumentar mucho, incluso aunque C(Z, ϵ)= 0: la varianza aumenta [S2b1VI= SVI2 ·S2Z/(n·S2XZ)= SVI2 /(n·S2X·R2XZ) La varianza aumenta al disminuir R2XZ , que a su vez , es proporcional a C(C, X)] y, en caso de muestras pequeñas, el sesgo también (no el asintótico)- La colinealidad entre variables explicativas aumenta dicha varianza tanto en MCO como en MC2E y VI, el problema es más importante en MC2E y VI. También si C(Z, X) es pequeña.

A la hora de elegir entre un estimador u otro, lo que habría que hacer es comparar la magnitud y sentido de los errores entre ellos. Hay dos clases de error: el aleatorio (Varianza) y el sistemático (sesgo e inconsistencia). - Hay que preferir estimadores consistentes (asintóticamente insesgados) a inconsistentes, con independencia de la varianza. - Si ambos inconsistentes, elegir el de menor inconsistencia (comparar inconsistencias: ρX, ϵ de MCO con ρZ,ϵ/ρZ,X de VI)- Entre los consistentes, si la muestra es grande (consistencia: el estimador se va concentrando sobre el parámetro poblacional al aumentar el n), hay que elegir el de menor varianza. [Siempre ganan los MCO en este sentido ya que S2b1MCO/ S2b1VI = R2XZ]- Entre los consistentes, si la muestra es pequeña, habría que comparar entre ellos el sesgo, si lo tienen (sesgo, distinto de inconsistencia o sesgo asintótico), y la varianza.

o P. ej.:, en caso de omisión de variable relevante (X2) se puede llegar a tener una idea del sesgo en MCO (β2·c1); si se sabe que β2 es muy pequeño y, p. ej., negativo; y que la asociación de X2 con X1 es positiva (Cov(X1, X2)>0 => c1>0) entonces sabremos que el sesgo de los MCO es pequeño y menor que 0. Si en estas condiciones nos sale un estimador de β1 (que es lo que queremos conocer) positivo y estadísticamente significativo, sabré que X1 tiene un efecto real positivo sobre Y (pues a pesar de que tiendo a atenuarlo sigo encontrándolo, luego existe) y que ese efecto real no será mucho mayor del b1 que he calculado, porque sé que el sesgo es de pequeña magnitud absoluta. En ese mismo caso, si quisiera corregir el sesgo de MCO podría buscar una VI “Z” para X1; pero tendría que estar muy seguro de que no estoy produciendo un sesgo mayor (de que Cov(Z, ϵ)=0) y, supuesto que estoy seguro de esto, tendría que comparar las varianzas de MCO y

Page 8: Estimación por VI y por MC2E

Estimación por MC2E Página 8 de 8

de VI, porque puede ser preferible un pequeño sesgo de atenuación y una pequeña varianza de los MCO a una gran varianza de las estimaciones VI, debida a que siempre su varianza es mayor que la de los MCO por tanto, comparar error cuadrático medio de b1 por MCO: Sesgo2+Varianza= (β2·c1)2+ SMCO2/(n·S2X1) con el de b1 por VI: [E(C(Z, ϵ)/ C(Z, X1))]2 + SVI2 /(n·S2X·R2XZ)]