Banco de México
Documentos de Investigación
Banco de México
Working Papers
N° 2018-06
Nowcasting del PIB de México usando Modelos de
Factores y Ecuaciones Puente
Junio 2018
La serie de Documentos de Investigación del Banco de México divulga resultados preliminares de
trabajos de investigación económica realizados en el Banco de México con la finalidad de propiciar elintercambio y debate de ideas. El contenido de los Documentos de Investigación, así como lasconclusiones que de ellos se derivan, son responsabilidad exclusiva de los autores y no reflejannecesariamente las del Banco de México.
The Working Papers series of Banco de México disseminates preliminary results of economicresearch conducted at Banco de México in order to promote the exchange and debate of ideas. Theviews and conclusions presented in the Working Papers are exclusively the responsibility of the authorsand do not necessarily reflect those of Banco de México.
Oscar de Jesús Gálvez-Sor ianoBanco de México
Documento de Investigación2018-06
Working Paper2018-06
Nowcast ing del PIB de México usando Modelos de Factores y Ecuaciones Puente*
Oscar de Jesús Gá lvez-Sor iano †
Banco de México
Resumen: En este documento se evalúan cinco modelos de Nowcasting que pronostican el PIB trimestral de México: un Modelo de Factores Dinámicos (MFD), dos Modelos de Ecuaciones Puente (Bridge Equations; BE) y dos Modelos de Componentes Principales (PCA). Los resultados indican que el promedio de los pronósticos de las BE es estadísticamente mejor que el del resto de los modelos considerados, de acuerdo con la prueba de precisión de pronósticos de Diebold-Mariano (1995). Además, utilizando información en tiempo real, se encuentra que el promedio de las BE es más preciso que la mediana de los pronósticos de los analistas encuestados por Bloomberg y que la mediana de los especialistas que responden la Encuesta de Expectativas del Banco de México.Palabras Clave: Nowcasting, Modelo de Factores Dinámicos, Ecuaciones Puente, Análisis de Componentes Principales, PIB trimestral, prueba de Diebold-Mariano.
Abstract: This paper evaluates five Nowcasting models that forecast Mexico's quarterly GDP: a Dynamic Factor Model (MFD), two Bridge Equation Models (BE) and two Principal Components Models (PCA). The results indicate that the average of the BE forecasts is statistically better than the rest of the models under consideration, according to the Diebold-Mariano (1995) accuracy test. In addition, using real-time information, the BE average is found to be more accurate than the median of the forecasts provided by the analysts surveyed by Bloomberg and the median of the experts who answer Banco de México's Survey of Professional Forecasters.Keywords: Nowcasting, Dynamic Factor Model, Bridge Equations, Principal Component Analysis, Quarterly GDP, Diebold-Mariano test.JEL Classification: C32, C38, C53, E52.
*Agradezco los valiosos comentarios de Alejandrina Salcedo, Aldo Heffner, Rodolfo Ostolaza y dosdictaminadores anónimos del Banco de México, así como los proporcionados por los participantes en losseminarios del Banco de México, el ITAM y la Facultad de Ciencias de la UNAM. † Dirección General de Investigación Económica. Correo electrónico: [email protected].
1
1 Introducción
La información acerca del estado actual de la economía es un aspecto crucial para la toma de
decisiones de los hacedores de política económica. Sin embargo, las estadísticas clave sobre
la evolución de la economía están disponibles con cierto retraso. Este es el caso de las series
que se calculan con frecuencia trimestral, como el Producto Interno Bruto (PIB). En efecto,
el INEGI publica su estimación oportuna del PIB de México y su estimación de Cuentas
Nacionales cuatro y siete semanas después de terminado el trimestre de referencia,
respectivamente. Con la finalidad de contar con información en tiempo real sobre la actividad
económica, en esta investigación propongo utilizar un conjunto de modelos de Nowcasting
que estiman con un pequeño margen de error el crecimiento del PIB de Cuentas Nacionales
para el trimestre de referencia más reciente desde cinco semanas antes de su publicación
oficial.
Para la elaboración del Nowcasting propongo cinco modelos econométricos basados en
investigaciones motivadas en pronosticar el PIB trimestral con base en datos mensuales
(Rünstler y Sédillot, 2003; Baffigi, Golinelli, y Parigi, 2004; Giannone, Reichlin y Small,
2008). Entre los modelos considerados, desarrollo un Modelo de Factores Dinámicos (MFD),
dos modelos de Ecuaciones Puente (Bridge Equations, BE) y dos modelos de Componentes
Principales (PCA). Todos ellos utilizan variables de alta frecuencia (indicadores mensuales)
para pronosticar una variable de menor frecuencia (el PIB trimestral). Las variables de alta
frecuencia consisten en datos de la actividad económica que se divulgan mensualmente
como, por ejemplo, indicadores de ventas, producción, empleo, comercio exterior y
financieros.
Investigaciones previas han propuesto modelos de Nowcasting con el fin de pronosticar el
PIB de México (Caruso, 2018; y Dahlhaus et al., 2017). No obstante, ninguno de estos
trabajos ha incluido en su análisis a las BE ni a los PCA, sino que se limitan a comparar sus
pronósticos con los de la Encuesta sobre las Expectativas de los Especialistas en Economía
del Sector Privado del Banco de México (EEBM). De hecho, mis resultados sugieren que las
BE producen pronósticos del PIB trimestral de México más precisos que los MFD y que los
reportados en la EEBM.
2
Las investigaciones antes citadas sólo han logrado evaluar sus modelos dentro de muestra, lo
que resta robustez para su aplicación práctica debido a que tanto el PIB como las series
mensuales se revisan constantemente. Recientemente, Delajara et al. (2016) recuperaron las
series originalmente publicadas para las cinco variables de su MFD con las cuales lograron
realizar un análisis en pseudo tiempo real; sin embargo, ellos tampoco consideran a las BE
en su análisis. En mi investigación evalúo los pronósticos de las BE en tiempo real, lo cual
no se había hecho anteriormente. Esto ha sido posible debido a que llevé un registro de los
pronósticos de todos los modelos propuestos durante 12 trimestres consecutivos (desde 2014-
II hasta 2017-I, periodo que coincide con la implementación práctica de los mismos). Con
base en estos registros y utilizando la prueba de Diebold-Mariano, encuentro que los modelos
de BE generan predicciones más precisas que la mediana de los pronósticos de los analistas
encuestados por Bloomberg y que la mediana de los pronósticos de los especialistas que
responden la EEBM.
El análisis de los errores de pronóstico de las BE sugiere que su varianza disminuye
consistentemente con la inclusión de mayor información conforme se dispone de nuevos
datos observados. En efecto, para el periodo que comprende del 2014-II al 2017-I, los errores
de pronóstico presentan una importante reducción en su varianza desde un mes antes de que
el INEGI publique el crecimiento del PIB, por lo que el 75 por ciento de las veces el margen
de error de las BE es, en términos absolutos, menor a 0.1 puntos porcentuales de la variación
trimestral del PIB observado.
La estructura de este documento de investigación es la siguiente: en la Sección 1 se presenta
una revisión de la literatura que ha propuesto modelos de Nowcasting; en la Sección 2 se
describen teóricamente las BE, el MFD y el modelo de PCA; en la Sección 3 se exponen los
datos que serán utilizados para aplicar los modelos de la Sección 2 al caso de México,
mientras que en la Sección 4 se exhiben los principales resultados y en la Sección 5 se
presentan las conclusiones.
2 Revisión de Literatura
Las primeras investigaciones que utilizaron variables de alta frecuencia para pronosticar el
PIB trimestral se apoyaron en modelos de BE (Rünstler y Sédillot, 2003; Baffigi, Golinelli,
3
y Parigi, 2004). El método de BE consiste en el uso de ecuaciones dinámicas y lineales donde
las variables explicativas se forman con los agregados trimestrales de series diarias o
mensuales. Sin embargo, las BE implican modelos poco parsimoniosos por el gran número
de variables explicativas incluidas. Con el fin de reducir el número de variables
independientes, Klein y Sojo (1989) utilizan la técnica de PCA y, años más tarde, Stock y
Watson (2002a,b) confirman la eficiencia de los pronósticos obtenidos con este método.
Recientemente, Giannone, Reichlin y Small (2008) desarrollaron un método para obtener
pronósticos de las tasas de crecimiento del PIB usando los factores de una representación de
Estado-Espacio cuyos coeficientes son estimados con el Filtro de Kalman. Este método se
conoce en la literatura como MFD y ha sido ampliamente utilizado para pronosticar el PIB
de países desarrollados (Rünstler et al., 2009; Banbura y Modugno, 2014; Angelini et al.,
2011; Yiu y Chow, 2011; y de Winter, 2011, son algunos ejemplos). Sin embargo, la mayoría
de las investigaciones que utilizan MFD se basan en conjuntos de información grandes que,
de acuerdo con Álvarez, Camacho y Perez-Quiros (2012), implican un supuesto fuerte sobre
la ortogonalidad de los factores obtenidos, el cual no necesariamente se cumple por el gran
número de series que están correlacionadas.1 Los hallazgos empíricos de Álvarez et al. (2012)
indican que, aunque ninguno de los dos modelos (con conjuntos grandes y con conjuntos
pequeños de información) tuvo resultados sistemáticamente superiores sobre el otro, la
precisión de los pronósticos generados por el modelo con el conjunto pequeño fue igual o
superior a la del modelo con el conjunto grande. Recientemente, otros autores (Camacho y
Doménech, 2012; Barnett et al., 2014; Delajara et al., 2016; Dahlhaus et al., 2017; y Caruso,
2018) han optado por usar modelos de pequeña escala. Así, con base en la literatura descrita,
en este documento sólo considero conjuntos de información pequeños en los modelos
propuestos.
La primera investigación que propuso un modelo de Nowcasting para México fue elaborada
por Liu, Matheson y Romeu (2012), quienes evalúan el nowcast y el pronóstico de la tasa de
crecimiento del PIB usando cinco modelos: Modelo Autorregresivo (AR), BE, VAR
1 Por ejemplo, Giannone et al. (2008) usan 200 indicadores mensuales de la actividad económica de los Estados
Unidos Americanos (EUA), mientras que Álvarez et al. (2012) prueban la conveniencia de usar conjuntos
grandes contra conjuntos pequeños; 146 indicadores de EUA como conjunto grande y 13 indicadores
representativos como conjunto pequeño.
4
bivariado, VAR Bayesiano y MFD, para diez países de América Latina.2 Sus resultados
indican que, para la mayoría de los países considerados, el flujo de datos mensuales ayuda a
mejorar la precisión de las estimaciones y que el MFD produce, en general, nowcasts y
pronósticos más precisos relativos a otras especificaciones de modelos. Sin embargo, una de
las excepciones se obtuvo para el caso de México, donde se lograron mejores resultados con
el VAR Bayesiano.
Asimismo, el primer antecedente de la estimación oportuna que publica el INEGI fue
propuesto por Guerrero, García y Sainz (2013), quienes sugieren un procedimiento para hacer
estimaciones oportunas del PIB trimestral de México usando Vectores Autorregresivos
(VAR). Guerrero et al. (2013) estructuran el pronóstico por sectores económicos y luego por
actividad, de forma análoga a como el INEGI elabora el dato oficial. Sus resultados sugieren
que las estimaciones tienen errores relativamente pequeños, por lo que recomiendan utilizar
su modelo para posteriores estimaciones del PIB trimestral de México. Sin embargo, Caruso
(2018) no considera esta propuesta como un nowcast, sino que lo cataloga como un backcast
ya que, con el modelo de Guerrero et al. (2013), no es posible contar con una estimación
durante el trimestre de referencia hasta que hayan transcurrido 15 días después de que éste
ha concluido para poder ofrecer la primera estimación del PIB.
Por lo anterior, Caruso (2018) se inclina por el uso de un MFD basado en Doz, Giannone y
Reichlin (2012), y Banbura y Modugno (2014). Con este modelo el autor pronostica el PIB
de México utilizando series mensuales de México y de Estados Unidos. Sus resultados
indican que el MFD genera pronósticos más precisos que los ofrecidos por el Fondo
Monetario Internacional, la OCDE, los pronósticos de la EEBM y que los pronósticos de los
analistas encuestados por Bloomberg. Sin embargo, las comparaciones que hace Caruso
(2018) entre los pronósticos de su MFD y los de los especialistas no son necesariamente las
más adecuadas, ya que estos últimos se publican en tiempo real, mientras que los del MFD
que estima incluyen las revisiones de las series.
Dahlhaus et al. (2017) utilizan un MFD basado en Giannone et al. (2008) con el fin de
modelar y pronosticar el PIB de Brasil, India, Rusia, China y México (BRIC-M). El MFD
2 Argentina, Brasil, Chile, Colombia, República Dominicana, Ecuador, México, Perú, Uruguay y Venezuela.
5
que los autores usan para México utiliza variables parecidas a las del MFD que propongo en
esta investigación, salvo los indicadores de precios que no considero y el Indicador Global
de la Actividad Económica3 (IGAE), que no es incluido por los autores. Dahlhaus et al.
(2017) comparan los pronósticos de su MFD con los generados por un AR(2) y un MA(4);
sus resultados sugieren que el MFD produce mejores pronósticos que los modelos de
referencia.
En otra investigación semejante a la de Caruso (2018), Delajara et al. (2016) usan un MFD
para pronosticar el PIB de México, pero, a diferencia del primero, los autores hacen pruebas
de su modelo en pseudo tiempo real. Delajara et al. (2016) usan cinco variables de la actividad
económica de México y comparan los pronósticos de su modelo con los ofrecidos por la
EEBM. Sus resultados muestran que su MFD produce pronósticos más precisos que los de
la EEBM. Sin embargo, salvo Lui et al. (2012), ninguna de las investigaciones antes citadas
considera a las BE en sus comparaciones. En este sentido, la presente investigación provee
nueva evidencia acerca de la conveniencia en el uso de BE para hacer Nowcasting del PIB
de México.
3 Nowcasting
El Nowcasting puede definirse como la previsión de la actividad económica en el pasado
reciente, el presente y el futuro cercano. Estas previsiones son calculadas como la proyección
lineal del PIB trimestral (contemporáneo) dado un conjunto de datos de mayor frecuencia.
Intuitivamente, se estiman especificaciones a través de Mínimos Cuadrados Ordinarios en
las que el PIB es una función de sus propios rezagos, así como de los valores contemporáneos
y rezagados de las variables independientes que se construyen a partir de un conjunto de
indicadores mensuales.
Formalmente, denotemos al crecimiento del PIB trimestral como 𝑦𝑡𝑄
, y al conjunto de
información mensual como 𝑋𝑡, donde el superíndice 𝑄 se refiere a variables trimestrales y el
subíndice 𝑡 se refiere al tiempo (meses o trimestres). Deseamos estimar el PIB trimestral
3 El IGAE es un indicador de frecuencia mensual que publica el INEGI aproximadamente ocho semanas después
de terminado el mes de referencia y el cual representa el 93.9% del PIB en el año base, 2008=100.
6
contemporáneo, por lo que calculamos la proyección lineal del PIB dado el conjunto de
información 𝑋𝑡𝑄
:
𝑃𝑟𝑜𝑦[𝑦𝑡𝑄|𝑋𝑡
𝑄]
Partimos del hecho de que nuestro conjunto de información está compuesto por 𝑛 variables,
𝑋𝑖𝑡|𝑣𝑗𝑄
, donde 𝑖 = 1,… , 𝑛 identifica las series individuales y 𝑡 = 1,… , 𝑇𝑣𝑗 denota el tiempo, el
cual varía entre series 𝑣𝑗 de acuerdo a su calendario de publicación, este problema es
conocido en la literatura como jagged edges o ragged edges. En este sentido, los primeros
pronósticos que ofrece el Nowcasting (al principio del trimestre de referencia) se realizan
con observaciones faltantes al final de las series.
El nowcast es calculado como el valor esperado del PIB condicionado en la información
disponible y el modelo subyacente, ℳ, bajo el cual se calcula la esperanza condicional:
�̂�𝑡𝑄 = 𝐸 [𝑦𝑡
𝑄|𝑋𝑣𝑗𝑄 ;ℳ]
Regularmente, se utiliza un modelo lineal en donde los regresores son las variables del
conjunto de información (o los factores principales) y la variable dependiente es el
crecimiento del PIB trimestral. La incertidumbre (varianza) asociada a esta proyección es:
𝑉𝑦𝑡|𝑣𝑗𝑄 = 𝐸 [(�̂�𝑡|𝑣𝑗
𝑄 − 𝑦𝑡𝑄)2
|𝑋𝑣𝑗𝑄 ;ℳ]
Debido a que el número de datos observados va creciendo con el tiempo, la varianza del error
va disminuyendo, es decir:
𝑉𝑦𝑡|𝑣𝑗𝑄 ≤ 𝑉
𝑦𝑡|𝑣𝑗−1𝑄
3.1 Ecuaciones Puente
En las Ecuaciones Puente no se calculan factores, sino que son los mismos indicadores
mensuales los que se utilizan como variables explicativas. Denotemos al vector de 𝑛
indicadores mensuales como 𝑋𝑡 = (𝑋1,𝑡, … , 𝑋𝑛,𝑡), para 𝑡 = 1,… , 𝑇. La ecuación puente es
estimada con agregados trimestrales, 𝑋𝑖,𝑡𝑄
, de los tres datos mensuales correspondientes.
7
𝑋𝑖,𝑡𝑄=1
3(𝑋𝑖,1 + 𝑋𝑖,2 + 𝑋𝑖,3)
Estos agregados trimestrales se utilizan como regresores en la ecuación puente para obtener
un pronóstico del crecimiento del PIB trimestral:
𝑦𝑡𝑄 = 𝜇 + 𝜓(𝐿)𝑋𝑡
𝑄 + 휀𝑡𝑄
donde 𝜇 es el coeficiente de la constante, 𝜓(𝐿) = 𝜓0 + 𝜓1𝐿1 +⋯+ 𝜓𝑝𝐿
𝑝 denota el
polinomio de rezago, y 휀𝑡𝑄
es el término de error, que se asume ruido blanco con distribución
Normal.
3.2 Modelos de Factores Dinámicos
Los MFD fueron desarrollados y aplicados por primera vez por Giannone, Reichlin y Small
(2008) para pronosticar el PIB trimestral de Estados Unidos. Sin embargo, la idea original de
utilizar Modelos de Estado Espacio (SSM) con el fin de obtener indicadores coincidentes de
Estados Unidos ya había sido propuesta y estudiada por Stock y Watson (1988, 1989),
basados en la propuesta original de Geweke (1977).
Consideremos el vector de 𝑛 series mensuales 𝑋𝑡 = (𝑋1,𝑡, … , 𝑋𝑛,𝑡)′, para 𝑡 = 1,… , 𝑇. La
dinámica de los factores considerada por Giannone et al. (2008) está dada por la siguiente
representación de estado espacio:
𝑋𝑡 = 𝛬𝑓𝑡 + 𝜉𝑡, 𝜉𝑡~ℕ(0, 𝛴𝜉) (1)
𝑓𝑡 =∑𝐴𝑖𝑓𝑡−𝑖 + 휁𝑡
𝑝
𝑖=1
(2)
휁𝑡 = 𝐵휂𝑡, 휂𝑡~ℕ(0, 𝕀𝑞) (3)
donde 𝛬 es una matriz 𝑛 × 𝑟 de ponderadores, lo que implica que la ecuación (1) relaciona
las series mensuales 𝑋𝑡 a un vector 𝑟 × 1 de factores latentes 𝑓𝑡 = (𝑓1,𝑡, … , 𝑓𝑟,𝑡)′ más un
componente idiosincrático 𝜉𝑡 = (𝜉1,𝑡, … , 𝜉𝑛,𝑡)′. Se asume que este último es ruido blanco con
una matriz de covarianzas diagonal 𝛴𝜉. La ecuación (2) describe la ley de movimiento de los
factores latentes 𝑓𝑡, los cuales son conducidos por un proceso autorregresivo de orden 𝑝, más
8
un ruido blanco q-dimensional, donde 𝐵 es un matriz 𝑛 × 𝑞, y donde 𝑞 ≤ 𝑟. Es decir, el
número de shocks comunes, 𝑞, es menor o igual al número de factores comunes, 𝑟. En
consecuencia 휁𝑡~ℕ(0, 𝐵𝐵′). Finalmente, 𝐴1, … , 𝐴𝑝 son matrices 𝑟 × 𝑟 de coeficientes y
además se asume que el proceso estocástico de 𝑓𝑡 es estacionario.4
3.3 Modelos de Análisis de Componentes Principales
El método de PCA es una técnica estadística que normalmente se utiliza para la reducción de
datos. Ello implica que de un conjunto grande de información se obtienen vectores
principales a partir de la descomposición de la matriz de covarianzas de las series originales.
Estos vectores describen una serie de combinaciones lineales no correlacionadas de las
variables que contienen la mayor parte de la varianza de todo el conjunto de información. En
mi investigación utilizo esta técnica para hacer pronósticos con dichos vectores, lo que genera
modelos más parsimoniosos.
Partiendo del conjunto de información 𝑋𝑡 de 𝑛 series mensuales, definamos como Σ𝑋𝑡 a la
matriz 𝑛 × 𝑛 de covarianzas del conjunto de información. Existe una matriz 𝑛 × 𝑛 ortogonal,
Φ, cuyas columnas son los 𝑐𝑡 vectores principales de Σ𝑋𝑡, y una matriz diagonal, Ψ, donde
los elementos de su diagonal principal son los eigenvalores de Σ𝑋𝑡, tales que,
Φ′Σ𝑋𝑡Φ = Ψ
Los 𝑛 vectores 𝑐𝑡 son ortogonales y están ordenados de acuerdo a la proporción de la varianza
que representan del conjunto 𝑋𝑡.
4 Datos
En esta investigación, utilizo la serie trimestral del PIB de México, para el periodo que
comprende del primer trimestre de 1993 (1993-I) al primer trimestre de 2017 (2017-I).
Considero tres conjuntos de información para las variables explicativas. El primero (CI-1)
incluye 25 indicadores mensuales que, al trimestralizarlos, presentan una correlación con el
PIB superior a 0.30 (la correlación se calcula sobre las variaciones trimestrales de las series
4 El desarrollo completo del SSM empleado por Giannone et al. (2008) se encuentra en Forni, Giannone, Lippi
y Reichlin (2009).
9
desestacionalizadas). Sin embargo, si el indicador se publica en la primera semana después
del mes de referencia, lo conservo en el conjunto de información, incluso si la correlación es
menor a 0.30. Como criterio adicional, sólo utilizo series mensuales que estén disponibles
desde 1993, con el fin de contar con variables explicativas cuyo periodo de observación
corresponde con el del PIB.
El segundo conjunto de información (CI-2) está formado por ocho variables, algunas de las
cuales están incluidas en el CI-1 pero con una correlación con el PIB más estricta de al menos
0.40. Además dejé de considerar como criterio la fecha inicial de disponibilidad de datos, por
lo que ahora hay indicadores que no estaban incluidos en el CI-1. El tercer conjunto (CI-3)
es exclusivo para la estimación del MFD y en él utilizo 11 variables que elegí arbitrariamente
del CI-1 y el CI-2 por representar sectores distintos de la economía.5
Podemos decir que los tres conjuntos de información están formados por variables “duras” y
variables “suaves”. Las primeras ofrecen información oportuna y coincidente de la actividad
económica, mientras que las segundas, aunque son más oportunas y se adelantan a la
actividad económica, provienen de encuestas de percepción, por lo que pudieran ser
imprecisas. En efecto, los indicadores duros son muy importantes para la estimación de PIB
trimestral, pues tienen un mayor peso en los factores principales, mientras que los indicadores
suaves tienen un menor impacto, lo que refleja el hecho de que la mayor parte de su
contribución se debe principalmente a su oportunidad.
Más aún, en la literatura se ha mostrado que las variables que proporcionan la información
más oportuna contribuyen a una mejora de la estimación sólo al principio del trimestre y que
una vez que se incluyen los datos actualizados (publicados) de los indicadores duros su
contribución se desvanece (Banbura et al., 2013).
Respecto a la utilización de los datos, desestacionalizo todas las variables que integran el
conjunto de información con el programa X12 ARIMA,6 excepto las que ya publica el INEGI
5 La necesidad de tener un conjunto de información especial para el MFD se deriva de su estimación, y del
hecho de que el incluir variables con pocas observaciones (como la Encuesta Mensual sobre Empresas
Comerciales que inicia en 2008) dificulta la solución recursiva del modelo. 6 Todos los modelos de ajuste estacional se sustentaron en el documento “Procedimiento Para Obtener Modelos
de Ajuste Estacional con el Programa X12ARIMA” del Grupo Especializado en Desestacionalización (GED)
del Comité Especializado de Estadísticas Macroeconómicas y Cuentas Nacionales.
10
con ajuste estacional y aquellas que provienen de las encuestas de percepción (porque no
presentan un patrón estacional). Además, sólo trabajo con series estacionarias; para ello,
transformo algunas de las series mediante una diferencia logarítmica, con base en pruebas de
raíz unitaria (véase el Anexo 1, Tabla A.2). Finalmente, como es convención en la literatura,
estandarizo todas las series antes de aplicar las metodologías de Nowcasting.
5 Resultados
Para lidiar con los conjuntos de información incompletos (jagged edges), elaboré modelos
ARIMA para cada variable mensual, con el fin de pronosticar las observaciones faltantes. De
esta manera, para generar el pronóstico del crecimiento del PIB trimestral,7 tanto las BE como
los MFD y los PCA fueron estimados a partir de conjuntos de información previamente
completados con ecuaciones ARIMA. Lo anterior me permite comparar el poder predictivo
de cada modelo independientemente de cómo lidia con los conjuntos de información
incompletos. Esto a pesar de que tanto los modelos de PCA como el MFD podrían hacer los
pronósticos de sus propios factores.
5.1 Estimación de las BE
Realicé la estimación de las BE usando el CI-1 y el CI-2, por lo que obtengo los modelos
BE1 y BE2, respectivamente. Teóricamente, una BE utiliza para su estimación un método de
MCO con rezagos de las variables incluidas en el modelo; sin embargo, la mayoría de las
investigaciones antes citadas proponen modelos ARIMA con variables exógenas, los cuales
mejoran la precisión de las estimaciones. En consecuencia, estimo la siguiente ecuación:
𝜙(𝐿)y𝑡𝑄 = 휃(𝐿)휀𝑡 + 𝜓(𝐿)𝑋𝑡
𝑄 (4)
donde todas las variables se trataron con una diferencia logarítmica para aproximar una tasa
de crecimiento. Se tiene que 𝜙(𝐿), 휃(𝐿) y 𝜓(𝐿) son polinomios de rezago cuyo orden fue
determinado con base en la función de auto-correlación de los errores, el estadístico Q de
Ljung-Box, con pruebas de significancia estadística de los coeficientes estimados y con base
en los criterios de información convencionales. Finalmente, 휀𝑡 se asume ruido blanco con
7 Entendiéndose por crecimiento a la tasa de variación del PIB de un trimestre respecto al inmediato anterior,
utilizando series desestacionalizadas.
11
distribución Normal. La estimación de la ecuación anterior permite hacer pronósticos de la
tasa de crecimiento del PIB (Figura 1).
Figura 1. Pronósticos del crecimiento del PIB usando BE.
5.2 Estimación del MFD
En el caso del MFD sólo utilizo las 11 variables del CI-3. Para estimar los coeficientes del
modelo utilizo el Método de Máxima Verosimilitud (MMV). A su vez, los parámetros de la
función de verosimilitud son estimados con el Filtro de Kalman.8 Este requiere de valores
iniciales para las variables de estado, así como de una matriz de covarianzas para comenzar
con el proceso recursivo. Para ello, utilicé el método sugerido en Hamilton (1994b).9
El modelo de Estado Espacio estimado tiene la siguiente ecuación de estado:
8 Para profundizar en los SSM y el Filtro de Kalman véase Hamilton (1994a, 1994b), Harvey (1989), y
Brockwell and Davis (1991). 9 Es decir, los valores iniciales se obtienen con los coeficientes estimados con una regresión lineal de 𝑋𝑡 sobre
𝑓𝑡, dado que este último sigue una estructura autorregresiva.
-4
-3
-2
-1
0
1
2
32
00
9/0
1
200
9/0
2
200
9/0
3
200
9/0
4
201
0/0
1
201
0/0
2
201
0/0
3
201
0/0
4
201
1/0
1
201
1/0
2
201
1/0
3
201
1/0
4
201
2/0
1
201
2/0
2
201
2/0
3
201
2/0
4
201
3/0
1
201
3/0
2
201
3/0
3
201
3/0
4
201
4/0
1
201
4/0
2
201
4/0
3
201
4/0
4
201
5/0
1
201
5/0
2
201
5/0
3
201
5/0
4
201
6/0
1
201
6/0
2
BE1
BE2
PIB Trimestral Observado
12
(
𝑓𝑡𝜉1,𝑡𝜉2,𝑡𝜉3,𝑡𝜉4,𝑡𝜉5,𝑡𝜉6,𝑡𝜉7,𝑡𝜉8,𝑡𝜉9,𝑡𝜉10,𝑡𝜉11,𝑡)
=
(
𝜑 0 0 0 0 0 0 0 0 0 0 00 𝛿1 0 0 0 0 0 0 0 0 0 00 0 𝛿2 0 0 0 0 0 0 0 0 00 0 0 𝛿3 0 0 0 0 0 0 0 00 0 0 0 𝛿4 0 0 0 0 0 0 00 0 0 0 0 𝛿5 0 0 0 0 0 00 0 0 0 0 0 𝛿6 0 0 0 0 00 0 0 0 0 0 0 𝛿7 0 0 0 00 0 0 0 0 0 0 0 𝛿8 0 0 00 0 0 0 0 0 0 0 0 𝛿9 0 00 0 0 0 0 0 0 0 0 0 𝛿10 0
0 0 0 0 0 0 0 0 0 0 0 𝛿11)
(
𝑓𝑡−1𝜉1,𝑡−1𝜉2,𝑡−1𝜉3,𝑡−1𝜉4,𝑡−1𝜉5,𝑡−1𝜉6,𝑡−1𝜉7,𝑡−1𝜉8,𝑡−1𝜉9,𝑡−1𝜉10,𝑡−1𝜉11,𝑡−1)
+
(
휂𝑡𝜍1,𝑡𝜍2,𝑡𝜍3,𝑡𝜍4,𝑡𝜍5,𝑡𝜍6,𝑡𝜍7,𝑡𝜍8,𝑡𝜍9,𝑡𝜍10,𝑡𝜍11,𝑡)
Con 휂𝑡~ℕ(0,1) y 𝜍𝑖,𝑡~ℕ(0, 𝜎𝑖2).
Mientras que la ecuación de observación es:
(
𝐼𝐺𝐴𝐸𝑡𝐶𝑜𝑛𝑠𝑢𝑚𝑜𝑡𝐼𝑀𝐴𝐼𝑡𝑀𝑡
𝐴𝑁𝑇𝐴𝐷𝑡𝐶𝑒𝑚𝑒𝑛𝑡𝑜𝑡𝑀4𝑡𝐸𝑀𝐸𝐶𝑡𝑋𝑡𝐶𝐹𝐸𝑡
𝑃𝐸𝑀𝐸𝑋𝑡 )
=
(
𝜆1 1 0 0 0 0 0 0 0 0 0 0𝜆2 0 1 0 0 0 0 0 0 0 0 0𝜆3 0 0 1 0 0 0 0 0 0 0 0𝜆4 0 0 0 1 0 0 0 0 0 0 0𝜆5 0 0 0 0 1 0 0 0 0 0 0𝜆6 0 0 0 0 0 1 0 0 0 0 0𝜆7 0 0 0 0 0 0 1 0 0 0 0𝜆8 0 0 0 0 0 0 0 1 0 0 0𝜆9 0 0 0 0 0 0 0 0 1 0 0𝜆10 0 0 0 0 0 0 0 0 0 1 0𝜆11 0 0 0 0 0 0 0 0 0 0 1)
(
𝑓𝑡𝜉1,𝑡𝜉2,𝑡𝜉3,𝑡𝜉4,𝑡𝜉5,𝑡𝜉6,𝑡𝜉7,𝑡𝜉8,𝑡𝜉9,𝑡𝜉10,𝑡𝜉11,𝑡)
Para utilizar el factor que se obtiene a partir de la estimación del MFD (Figura 2) es necesario
hacer una trimestralización del mismo. Esta se obtiene con el promedio de las tres
observaciones mensuales correspondientes a cada trimestre 𝑓𝑡𝑄 =
1
3(𝑓1 + 𝑓2 + 𝑓3). De esta
forma, el crecimiento del PIB se estima con la siguiente ecuación:
𝑦𝑡𝑄 = 𝛼 + 𝛽𝑓𝑡
𝑄 + 휀𝑡𝑄 (5)
Es decir, el Nowcast del PIB trimestral es una función lineal del factor. El procedimiento de
estimación de esta regresión lineal de la ecuación (5) emplea el método de Cochrane-Orcutt
(1949) para obtener estimadores robustos ante la presencia de autocorrelación residual.
13
Figura 2. Crecimiento del PIB trimestral vs. Factor del MFD.
5.3 Estimación del PCA
Finalmente, estimé los modelos de PCA utilizando el CI-1 y el CI-2, obteniendo los modelos
PCA1 y PCA2, respectivamente. En el análisis obtengo todos los componentes (vectores)
principales, 𝑐𝑡, que surgen de cada conjunto de información. Sin embargo, sólo considero los
𝑘 componentes (𝑘 < 𝑛) cuyo eigenvalor sea mayor o igual a la unidad, de acuerdo al criterio
de Kaiser (1958). Después de obtener estos componentes los roto con el fin de distribuir la
varianza explicada por cada uno de ellos, por lo que utilizo el método varimax, lo que también
me permite mantener la propiedad de ortogonalidad entre los componentes aún después de
haber distribuido su varianza. A su vez, el mantener la propiedad de ortogonalidad implica
una reducción importante en el número de componentes obtenidos debido a la alta correlación
entre las variables consideradas. Esto ayuda a mantener la parsimonia en el modelo que
pronostica el PIB.
En consecuencia, de forma análoga a los métodos anteriormente expuestos, en el PCA utilizo
los 𝑘 componentes principales trimestralizados (Figuras 3 y 4) como regresores en la
siguiente ecuación lineal para pronosticar el crecimiento del PIB trimestral:
𝑦𝑡𝑄 = 𝛾 + 𝛿𝑐𝑡
𝑄 + 휀𝑡𝑄 (6)
-4
-3
-2
-1
0
1
2
3
200
0/0
2
200
0/0
4
200
1/0
2
200
1/0
4
200
2/0
2
200
2/0
4
200
3/0
2
200
3/0
4
200
4/0
2
200
4/0
4
200
5/0
2
200
5/0
4
200
6/0
2
200
6/0
4
200
7/0
2
200
7/0
4
200
8/0
2
200
8/0
4
200
9/0
2
200
9/0
4
201
0/0
2
201
0/0
4
201
1/0
2
201
1/0
4
201
2/0
2
201
2/0
4
201
3/0
2
201
3/0
4
201
4/0
2
Factor
PIB
14
donde 𝛿 es una matriz 𝑛 × 𝑘 de coeficientes, 𝑐𝑡𝑄
es el vector de los 𝑘 componentes principales
trimestralizados, y 휀𝑡𝑄
es el término de error, que se asume ruido blanco con distribución
Normal. La estimación de la ecuación (6) se apoya de la técnica de Mínimos Cuadrados
Generalizados (MCG) mediante el método de Cochrane-Orcutt.
Figura 3: Crecimiento del PIB trimestral vs. Componentes del PCA1.
5.4 Pruebas de Diebold-Mariano para las Series Dentro de Muestra
Bajo la hipótesis de que los pronósticos mejorarán tomando el promedio o la mediana de los
cinco modelos, considero ambos estadísticos como pronósticos adicionales. También
considero el promedio de los pronósticos de las BE, así como un modelo univariado, AR(1),
el cual se incluye como modelo de referencia. Este modelo AR utiliza la serie del PIB
trimestral como insumo, tratándola con una diferencia logarítmica para inducir la
estacionariedad y para aproximarse a la tasa de crecimiento del PIB.
Con el fin de evaluar el poder predictivo de cada modelo y así discernir cuál es más apropiado
para realizar Nowcasting, utilizo la prueba de Diebold-Mariano (DM).10 En la Tabla 1 se
resumen dicha prueba comparando cada modelo con el resto. En la diagonal principal se
indica el Error Cuadrático Medio (ECM) de cada modelo y en las columnas se indica qué
modelo resulta más preciso, de acuerdo con esta prueba. Asimismo, señalo con asteriscos la
10 En el Anexo 2 se presentan los detalles de esta prueba.
-6
-4
-2
0
2
4
199
3/0
2
199
4/0
4
199
6/0
2
199
7/0
4
199
9/0
2
200
0/0
4
200
2/0
2
200
3/0
4
200
5/0
2
200
6/0
4
200
8/0
2
200
9/0
4
201
1/0
2
201
2/0
4
201
4/0
2
Componente1
Componente2
PIB
15
significancia estadística de la diferencia de los errores en cada pareja de modelos
comparados. La prueba considera los trimestres que van de 2009-I a 2016-II.
Figura 4: Crecimiento del PIB trimestral vs. Componentes del PCA2.
Tabla 1. Prueba de Diebold-Mariano (criterio de pérdida ECM)
Modelos AR PCA1 PCA2 MFD BE1 BE2 Promedio Mediana Prom(BE)
AR 0.808
PCA1 PCA1 0.665
PCA2 PCA2 PCA2 0.542
MFD MFD* MFD* MFD** 0.120
BE1 BE1* BE1** BE1*** BE1 0.045
BE2 BE2* BE2* BE2*** BE2 BE1* 0.056
Promedio
(Todos los Modelos)
Promedio* Promedio* Promedio*** MFD BE1*** BE2* 0.124
Mediana
(Todos los Modelos)
Mediana* Mediana* Mediana*** Mediana BE1* BE2 Mediana* 0.058
Promedio(BE) Prom(BE)** Prom(BE)** Prom(BE)*** Prom(BE)** Prom(BE)* Prom(BE)*** Prom(BE)*** Prom(BE)*** 0.026
p-value para la significancia de la diferencia del ECM entre los modelos comparados ***p<0.01, **p<0.05, *p<0.1
La muestra incluye los pronósticos de 2009-I a 2016-II. Se emplea el Error Cuadrático Medio (ECM) como criterio de pérdida y se usa el Kernel de una distribución Uniforme para calcular la varianza de largo plazo. En la diagonal principal se encuentran los ECM de cada modelo, estimados con base en la variación trimestral
desestacionalizada del PIB.
-4
-3
-2
-1
0
1
2
32
00
0/0
1
200
0/0
4
200
1/0
3
200
2/0
2
200
3/0
1
200
3/0
4
200
4/0
3
200
5/0
2
200
6/0
1
200
6/0
4
200
7/0
3
200
8/0
2
200
9/0
1
200
9/0
4
201
0/0
3
201
1/0
2
201
2/0
1
201
2/0
4
201
3/0
3
201
4/0
2
Componente1 Componente2
Componente3 PIB
16
Los resultados de la prueba de DM sugieren que los pronósticos generados con el MFD y
con las BE superan estadísticamente (en términos de precisión) a los obtenidos con el AR, el
PCA1 y el PCA2. Si bien no se encontraron diferencias estadísticamente significativas entre
los errores de pronóstico de las BE y los del MFD, sí las hubo entre los errores promedio de
las BE y los del MFD. Más aún, encuentro que los pronósticos que ofrece este promedio de
BE son más precisos que los obtenidos con la media o la mediana de todos los modelos. En
efecto, el promedio de los pronósticos de las Ecuaciones Puente obtuvo el ECM más pequeño
(𝐸𝐶𝑀 = 0.026), el cual implica que, en términos generales, se obtiene un error de 14
centésimas de la variación trimestral desestacionalizada observada (Tabla 2). Con base en
estos resultados, concluyo que el promedio de las BE es el mejor predictor del PIB trimestral
entre los modelos estimados.
Tabla 2. Errores de Pronóstico (2009-I a 2016-II)
Criterio AR PCA1 PCA2 MFD BE1 BE2 Promedio Mediana Promedio
BE
BIAS 0.001 0.295 -0.146 0.035 -0.003 0.000 0.036 0.015 -0.001
MAE 0.550 0.546 0.555 0.243 0.168 0.174 0.248 0.165 0.136
MSE 0.808 0.665 0.542 0.120 0.045 0.056 0.124 0.058 0.026
RMSE 0.899 0.816 0.736 0.346 0.212 0.237 0.353 0.241 0.162
Nota: Los errores de pronóstico se obtienen como la diferencia entre el valor observado y el pronosticado. Los criterios que se muestran
en esta tabla se detallan en la Sección 5.5.
Con el fin de corroborar la robustez de mis resultados, realicé la prueba de DM bajo un
criterio de pérdida distinto. Para ello utilizo el Error Absoluto Medio del Pronóstico (EAM)
como criterio de pérdida y un Bartlett Kernel para calcular la varianza de largo plazo de la
serie de diferencias. Los resultados siguen mostrando que la precisión de los pronósticos
generados con el MFD es mayor que la del modelo univariado y que la de los modelos de
PCA, con diferencias estadísticamente significativas. Este resultado es consistente con los
hallazgos de Giannone et al. (2008), Rünstler et al. (2009) y Banbura y Modugno (2014),
quienes han propuesto el uso de MFD para hacer Nowcasting. Sin embargo, esta nueva
prueba sugiere que los pronósticos generados por todos los modelos (incluidos el MFD) son
superados por las BE, así como por el promedio de éstas, con diferencias significativas al
95% de confianza (véase Tabla A.3. del Anexo 3).
17
Asimismo, realicé pruebas de DM en una muestra más reducida, para no considerar el
periodo de la crisis financiera de 2008-2009. De esta forma, evalué los pronósticos desde
2011-I hasta el final de la muestra (véase Tabla A.4. del Anexo 3). Los resultados favorecen
el uso del promedio de BE sobre cualquier otro modelo, con diferencias significativas de al
menos el 90% de confianza (excepto cuando se compara con el modelo BE1, donde no hay
diferencias significativas). Nuevamente, el MFD ofrece pronósticos más precisos que el AR
y que los modelos de PCA, pero se muestra que las BE producen pronósticos más precisos
que éste.
5.5 Pronósticos Dentro de Muestra de las BE
Para evaluar la eficiencia de las BE realicé un análisis de los errores de pronóstico utilizando
los siguientes criterios, para los cuales 𝑘 se refiere al número de periodos pronosticados.
Sesgo de Pronóstico (BIAS).
𝐵𝐼𝐴𝑆 =1
𝑘∑(�̂�𝑖 − 𝑦𝑖)
𝑘
𝑖=1
Error Promedio del Pronóstico al Cuadrado (MSE).
𝑀𝑆𝐸 =1
𝑘∑(�̂�𝑖 − 𝑦𝑖)
2
𝑘
𝑖=1
Raíz del Error Cuadrático Promedio del Pronóstico (RMSE).
𝑅𝑀𝑆𝐸 = √1
𝑘∑(�̂�𝑖 − 𝑦𝑖)2𝑘
𝑖=1
Realicé la evaluación de los tres criterios previamente descritos utilizando dos enfoques, uno
de ventana móvil (rolling window) y otro de ventana expandida (expanding window). En el
primero estimo la ecuación (6) con datos desde 1993-I hasta 2006-IV (𝑋156, el subíndice 1 se
refiere al primer dato observado [1993-I] y el 56 al 2006-IV, es decir 56 trimestres desde el
primer dato observado). Con dicha estimación pronostico cuatro trimestres (𝑘 = 4) hacia
18
adelante. Análogamente, reestimo la ecuación (4) con datos desde 1993-II hasta 2007-I
(𝑋257), y así sucesivamente de la siguiente forma,
�̂�𝑗,𝑇+𝑖+𝑗𝑄 = 𝐸[𝑦𝑗,𝑇+𝑗
𝑄 |𝑋𝑗𝑇+𝑗] ∀ 𝑖 = (1,4), 𝑗 = (1,28)
Donde �̂�𝑗,𝑇+𝑖+𝑗𝑄
se refiere al pronóstico 𝑖 trimestres después de la estimación hecha desde 𝑗
hasta (𝑇 + 𝑗) trimestres después; 𝑋𝑗𝑇+𝑗
se refiere al conjunto de información que comienza 𝑗
trimestres después de la primera observación y termina (𝑇 + 𝑗) después de esta. Ello implica
que la ventana de estimación tiene siempre la misma longitud, es decir 𝑇 = 56 trimestres.
Las ventanas de estimación se rotaron 28 veces, hasta 2013-IV con el fin de que en la última
rotación se pronosticara hasta 2014-IV.
En el segundo enfoque estimo la ecuación (4) con 𝑋156 y pronostico cuatro trimestres (𝑘 =
4) hacia adelante. A continuación reestimo la ecuación (4) con 𝑋157, es decir, con un trimestre
adicional, y así sucesivamente de la siguiente forma,
�̂�𝑇+𝑖+𝑗𝑄 = 𝐸[𝑦𝑇+𝑗
𝑄 |𝑋𝑇+𝑗] ∀ 𝑖 = 1,… ,4 ∧ 𝑗 = 1,… ,28
Esto implica que en la última ventana hice una estimación desde 1993-I hasta 2013-IV, con
la cual pronostico cuatro trimestres (hasta 2014-IV).
Tabla 3. Análisis de los errores de pronóstico en pseudo tiempo real
Rolling window Expanding window
Estadístico Horizonte de pronóstico
k=1 k=2 k=3 k=4 k=1 k=2 k=3 k=4
BE1
BIAS 0.004 -0.059 -0.053 -0.029 0.017 -0.042 -0.040 -0.022
MSE 0.118 0.133 0.149 0.159 0.117 0.115 0.138 0.159
RMSE 0.344 0.365 0.386 0.399 0.342 0.339 0.372 0.399
BE2
BIAS 0.021 0.033 0.013 0.048 0.076 0.074 0.026 0.077
MSE 0.275 0.229 0.183 0.353 0.220 0.185 0.134 0.229
RMSE 0.524 0.479 0.428 0.594 0.469 0.430 0.366 0.478
Nota: Se muestran los estadísticos promedio que se obtienen de una estimación con una ventana móvil y una
expandida. El tamaño de la primera ventana es de 56 trimestres en BE1 y 28 trimestres en BE2; de 1993-I a 2006-IV
y de 2000-I a 2006-IV, respectivamente.
19
Los resultados de la ventana móvil muestran que los errores de pronóstico generados con
BE1 presentan un comportamiento ascendente a medida que 𝑘 crece. Es decir, los errores se
hacen más grandes cuando el horizonte de pronóstico es más largo. Sin embargo, esto no es
cierto para el modelo de BE2, donde el error más pequeño se obtuvo al pronosticar tres
periodos hacia adelante. En el caso de la ventana expandida tampoco se observa un
incremento en el error de pronóstico en ninguno de los modelos (Tabla 3).
El sesgo del modelo BE1 muestra una subestimación del crecimiento del PIB a medida que
el horizonte de pronóstico crece (excepto en 𝑘 = 4, donde el sesgo se reduce). Por otro lado,
en el modelo BE2 con una ventana expandida, el sesgo se mantiene relativamente constante
e incluso se reduce en 𝑘 = 3. Estos resultados son consistentes con los hallazgos de Giannone
et al. (2008), quienes sugieren utilizar el Nowcasting para pronosticar únicamente el trimestre
del cual no se cuenta con información (forecast one step ahead) y no para trimestres futuros.
5.6 Pronósticos en Tiempo Real (Fuera de Muestra)
Debido a que el promedio de las BE provee pronósticos más precisos del PIB que el resto de
los modelos considerados, realizo pruebas en tiempo real con el fin de analizar la evolución
y sensibilidad del pronóstico ante la publicación de información nueva correspondiente a
cada serie que forma parte del conjunto de información.
Figura 5. Evolución del Nowcasting en tiempo real vs. variación trimestral del PIB (2015-I)
IGAE (dic.)
Balanza Comercial
(ene.)
ANTAD (feb.),
AMIA (feb.)
IMAI (ene.)
Balanza Comercial (feb.)
IGAE (ene.)
ANTAD (mar.),
IMAI (mar.) IMAI (feb.)
Balanza Comercial
(mar.)
IGAE (feb.)
AMIA (abr.)
ANTAD (abr.),
IMAI (mar.)
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
20
-feb
26
-feb
04
-mar
10
-mar
13
-mar
18
-mar
20
-mar
23
-mar
25
-mar
06
-ab
r
09
-ab
r
14
-ab
r
17
-ab
r
22
-ab
r
23
-ab
r
28
-ab
r
30
-ab
r
07
-may
12
-may
BE
Publicado
Intervalos de Confianza del 95%
20
El periodo de estudio comprende del 2014-II al 2017-I, y el análisis consiste en observar la
evolución del pronóstico, actualizándolo con base en la publicación mensual de variables que
“completan” al conjunto de información. Esto permite evaluar ante qué variables es más
sensible el pronóstico y en qué momento mejora su precisión hasta obtener una estimación
confiable del PIB. La Figura 5 muestra un ejemplo de cómo se comporta la actualización del
Nowcasting a medida que se publican cada uno de los indicadores que componen al conjunto
de información. El pronóstico empieza con la publicación del IGAE del tercer mes del
trimestre previo al de referencia, es decir, comienza durante el trimestre en curso.
Con el registro de este análisis, para los doce trimestres evaluados obtuve el error de
pronóstico, el cual fue agrupado por cortes. Identifiqué 12 cortes de particular relevancia que
componen la evolución del pronóstico del PIB en tiempo real para cualquier trimestre 𝑄.
Estos cortes incluyen indicadores de interés que tienen efectos importantes sobre el
Nowcasting:
INICIAL. Publicación del IGAE del último mes del trimestre anterior.
1. Publicación de la Balanza Comercial del primer mes del trimestre de referencia.
2. Publicación de las ventas de autos (AMIA) del segundo mes del trimestre de referencia.
3. Publicación de la Actividad Industrial (IMAI) del primer mes del trimestre de referencia.
4. Publicación de la Balanza Comercial del segundo mes del trimestre de referencia.
5. Publicación del IGAE del primer mes del trimestre de referencia.
6. Publicación de las ventas de autos (AMIA) del tercer mes del trimestre de referencia.
7. Publicación de la Actividad Industrial (IMAI) del segundo mes del trimestre de referencia.
8. Publicación de la Balanza Comercial del tercer mes del trimestre de referencia.
9. Publicación del IGAE del segundo mes del trimestre de referencia.
10. Publicación de las ventas de autos (AMIA) del primer mes del siguiente trimestre.
FINAL. Publicación de la Actividad Industrial del tercer mes del trimestre de referencia.
Con esta información construí un diagrama de cajas y brazos para evaluar la rapidez y
eficiencia del Nowcasting para mejorar su precisión hasta obtener una estimación confiable
del PIB. En la Figura 6 grafico el promedio de los errores de pronóstico en el periodo 𝑡
(representado por un punto sólido) y la mediana de los errores (línea horizontal negra). Las
cajas del diagrama representan los límites de dispersión de los errores de pronóstico en los
cuartiles centrales y los brazos muestran los errores de pronóstico en el primero y último
cuartiles (los círculos vacíos representan valores extremos). La figura muestra que la
información que incorpora la Balanza Comercial del segundo mes del trimestre de referencia
21
(corte 4) al conjunto de datos mejora la precisión del pronóstico respecto al obtenido con la
información acumulada hasta la publicación del Indicador Mensual de la Actividad Industrial
(IMAI) del primer mes del trimestre de referencia.
Figura 6. Errores de pronóstico del Nowcasting en puntos porcentuales
sobre la variación trimestral del PIB (2014-II a 2017-I).
Con la publicación del IGAE del segundo mes del trimestre de referencia (corte 9), el
pronóstico no sólo se aproxima al valor verdadero del PIB, sino que además se reduce aún
más la varianza del error. Ello implica que el modelo que propongo puede ofrecer un
pronóstico preciso del PIB de México un mes antes de que el INEGI publique el dato oficial
del PIB. Una vez que se incluyen al conjunto de información los datos del IGAE del segundo
mes del trimestre de referencia, el pronóstico es, en promedio, igual a la variación trimestral
observada del PIB, y el 75 por ciento de las veces el margen de error es, en términos
absolutos, menor a 0.1 puntos porcentuales de dicha variación trimestral.
5.7 Ecuaciones Puente vs. Especialistas
Como en el caso de Caruso (2018), en esta investigación pongo a competir los pronósticos
del modelo “preferido” de BE con los pronósticos de los analistas encuestados por
Bloomberg, así como los de la EEBM.11 No obstante, los pronósticos introducidos en el
11 Los pronósticos de los analistas encuestados por Bloomberg se obtienen del repositorio disponible en su
plataforma, mientras que los de la EEBM se obtienen de la base de datos que publica el Banco de México en
su sitio web.
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
INICIAL 1 2 3 4 5 6 7 8 9 10 FINAL
Err
or
de
pro
nó
stic
o r
esp
ecto
al
crec
imie
nto
del
PIB
22
análisis de Caruso (2018) no son comparables debido a que los estimados con su MFD no se
realizaron en tiempo real, mientras que los de los especialistas sí. Para enfrentar este
problema, Delajara, et al. (2016) recuperan las series históricas del PIB y de los cinco
indicadores de su MFD para simular la generación de pronósticos en tiempo real y así mejorar
la comparabilidad entre éstos y los ofrecidos por los especialistas.
Tabla 4. Prueba de Diebold-Mariano
Modelos Prom(BE) Bloom EEBM
Promedio (BE) 0.004
Bloomberg Prom(BE)** 0.019
EEBM Prom(BE)*** Bloom* 0.051
p-value para la significancia de la diferencia del ECM entre los modelos
comparados ***p<0.01, **p<0.05, *p<0.1
La muestra incluye los pronósticos de 2014-II a 2017-I. Se emplea el
Error Cuadrático Medio (ECM) como criterio de pérdida. En la
diagonal principal se encuentran los ECM de cada modelo, estimados
con base en la variación trimestral desestacionalizada del PIB.
En mi caso, cuento con un registro desde 2014-II hasta 2017-I de pronósticos generados en
tiempo real con los cinco modelos que propongo en esta investigación. Así que utilizo los
registros del promedio de las BE para compararlos con los de la mediana de los analistas
encuestados por Bloomberg y los de la mediana de los registrados en la EEBM.12
Tabla 5. Errores de Pronóstico en Tiempo
Real (2014-II a 2017-I)
Criterio Promedio
BE Bloomberg EEBM
BIAS 0.022 0.023 0.052
MAE 0.051 0.117 0.197
MSE 0.004 0.019 0.051
RMSE 0.065 0.138 0.227
Nota: Los errores de pronóstico se obtienen como la diferencia entre
el valor observado y el pronosticado.
12 En los resultados de la EEBM que publica el Banco de México sólo se reporta el pronóstico para el
crecimiento anual del PIB con series originales, por lo que traduje estas tasas anuales a sus correspondientes
variaciones trimestrales con series desestacionalizadas. Para ello, desestacionalizo las respectivas series
históricas del PIB con la variación anual pronosticada por los analistas y con los modelos oficiales del INEGI.
23
Para llevar a cabo la comparación utilicé la prueba de DM. Los resultados de la prueba
muestran que el ECM del promedio de las BE es menor al de los pronósticos de Bloomberg,
con diferencias estadísticamente significativas. Análogamente, el ECM de las Ecuaciones
Puente es estadísticamente menor al de la EEBM. El ECM de las BE, 0.004, implica que
durante el análisis en tiempo real, el pronóstico del PIB ha diferido, en promedio, 5
centésimas de la variación trimestral desestacionalizada observada (Tabla 5).
6 Conclusiones
En esta investigación propongo un conjunto de modelos para hacer Nowcasting de las
variaciones trimestrales desestacionalizadas del PIB de México actualizando los pronósticos
a medida que se publica información nueva correspondiente al trimestre de referencia. Los
modelos de pronóstico que considero son un MFD, dos BE y dos modelos de PCA. Utilizo
pruebas de Diebold-Mariano con el fin de evaluar los errores de pronóstico de cada modelo.
La evaluación se realiza dentro de muestra, durante el periodo 2009-I a 2016-II. Como
referencia incluí en el análisis los pronósticos de un modelo univariado (AR).
Los resultados de las pruebas de DM sugieren que el promedio de las BE son mejores
predictores del PIB trimestral de México en comparación con el modelo AR, el MFD y los
modelos de PCA. Aun comparando con la media y la mediana de los pronósticos de todos
los modelos (sin considerar el AR), se prefiere el promedio de las BE. Estos resultados fueron
consistentes bajo pruebas de robustez en las que cambié el criterio de pérdida y el periodo de
análisis. Mis hallazgos contrastan con los de Liu et al. (2012), quienes sugieren el uso de
MFD para pronosticar el PIB de economías emergentes. No obstante, Liu et al. (2012)
tampoco se inclinan por el uso de los MFD para los datos de México, sino que optan por un
modelo VAR Bayesiano; además el conjunto de información que ellos utilizan es
sustancialmente distinto al que propongo en esta investigación.
Adicionalmente, proveo un análisis de los pronósticos en tiempo real. Esto fue posible debido
a que registré el comportamiento del Nowcasting durante doce trimestres consecutivos
(desde 2014-II hasta 2017-I) a medida que se incorporaba información nueva en cada
modelo. De este registro obtuve los errores de pronóstico del promedio de las BE. Mis
resultados muestran que la varianza de los errores se reduce a medida que se cuenta con más
24
información observada del trimestre de referencia. Asimismo, encuentro que el modelo que
propongo en esta investigación puede ofrecer un buen pronóstico del PIB un mes antes de
que el INEGI publique el dato oficial y una semana antes de que publique su estimación
oportuna del PIB. En efecto, una vez que se incluyen al conjunto de información los datos
del IGAE del segundo mes del trimestre de referencia, el pronóstico es, en promedio, igual a
la variación trimestral observada del PIB, y el 75 por ciento de las veces el margen de error
es, en términos absolutos, menor a 0.1 puntos porcentuales de dicha variación trimestral.
Finalmente, utilicé los registros del Nowcasting en tiempo real para compararlos con la
mediana de los pronósticos de los analistas de Bloomberg y con la mediana de los
especialistas de la EEBM, usando la prueba de DM. Los resultados de la prueba muestran
que el ECM del promedio de las BE es menor a la media de los pronósticos provistos por los
analistas encuestados por Bloomberg, con diferencias estadísticamente significativas.
Análogamente, el ECM de las BE es estadísticamente menor al de la EEBM.
25
Referencias
1. Álvarez, R., Camacho, M. and Perez-Quiros, G. (2012). Finite Sample Performance
of Small versus Large Scale Dynamic Factor Models. Documentos de Trabajo Nº
1204. Banco de España.
2. Angelini, E., Camba‐Mendez, G., Giannone, D., Reichlin, L., and Rünstler, G.
(2011). Short‐Term Forecasts of Euro Area GDP Growth. The Econometrics Journal,
14(1), C25-C44.
3. Baffigi, A., Golinellib, R., Parigi, G. (2004). Bridge Models to Forecast the Euro
Area GDP. International Journal of Forecasting 20(3), pp. 447-460.
4. Banbura, M., Giannone, D., Modugno, M., & Reichlin, L. (2013). Now-casting and
the real-time data flow. Working Paper Series 1564, European Central Bank.
5. Banbura, M. and Modugno, M. (2014). Maximum likelihood estimation of factor
models on datasets with arbitrary pattern of missing data. Journal of Applied
Econometrics 29(1), pp. 133-160.
6. Barnett, W., Chauvet, M., and Leiva-Leon, D. (2014). Realtime nowcasting of
nominal GDP under structural breaks. Bank of Canada Working Paper, No. 2014-
39.
7. Brockwell, P. J., and R. A. Davis (1991). Time Series: Theory and Methods. 2nd ed.
New York: Springer.
8. Camacho, M. and Doménech, R. (2012). MICA-BBVA: a factor model of economic
and financial indicators for short-term GDP forecasting. Journal of the Spanish
Economic Association, 3(4), pp. 475-497.
9. Caruso, Alberto (2018). Nowcasting with the help of foreign indicators: The case of
Mexico. Economic Modelling, Elsevier, 69(C), pp. 160-168.
10. Cochrane, D., and G. H. Orcutt (1949). Application of least squares regression to
relationships containing autocorrelated error terms. Journal of the American
Statistical Association 44(245): pp. 32-61.
11. de Winter, J. (2011). Forecasting GDP growth in times of crisis: private sector
forecasts versus statistical models. DNB Working Paper No. 320.
26
12. Dahlhaus, T., J.-D. Guénette, and G. Vasishtha (2017). Nowcasting BRIC+ M in real
time. International Journal of Forecasting, 33, 915-935.
13. Delajara, Hernández-Álvarez and Rodríguez-Tirado (2016). Nowcasting Mexico’s
short-term GDP growth in real-time: A factor model versus professional forecasters.
Economía, 17(1), pp. 167-182.
14. Diebold, F. and Mariano, R. (1995). Comparing Predictive Accuracy. Journal of
Business and Economic Statistics, 13:3, pp. 253-263.
15. Doz, C., Giannone, D. and Reichlin, L. (2012). A quasi–maximum likelihood
approach for large, approximate dynamic factor models. Review of economics and
statistics 94(4), 1014–1024.
16. Forni, M., D. Giannone, M. Lippi, and L. Reichlin (2009): Opening The Black Box:
Structural Factor Models With Large Cross Sections. Econometric Theory, 25(05),
pp. 1319-1347.
17. Gómez-Zamudio, L. and Ibarra, R. (2017) Are daily financial data useful for
forecasting GDP? Evidence from Mexico. Working Paper 2017-17. Banco de
México.
18. Guerrero, V., García, A. and Sainz E. (2013). Rapid Estimates of Mexico’s Quarterly
GDP. Journal of Official Statistics, 29(3), pp. 397–423.
19. Geweke, J. (1977). The Dynamic Factor Analysis of Economic Time Series. [In:]
Aigner DJ, Goldberger AS (ed.), Latent Variables in Socio–Economic Models.
20. Giannone, D., Reichlin, L., and Small, D. (2008). Nowcasting: The Real-time
Informational Content of Macroeconomic Data. Journal of Monetary Economics, pp.
665-676.
21. Hamilton, J. D. (1994a). State Space Models. [In:] Handbook of Econometrics, ed. R.
F. Engel and D. L. McFadden, pp. 3039-3080. Amsterdam: Elsevier.
22. ________. (1994b). Time series analysis. Princeton University Press.
23. Harvey, A. C. (1989). Forecasting, Structural Time Series Models and the Kalman
Filter. Cambridge: Cambridge University Press.
24. Kaiser, H. F. (1958). The varimax criterion for analytic rotation in factor analysis.
Psychometrika 23(3), pp. 187-200.
27
25. Kalman, R. E. (1960). A New Approach to Linear Filtering and Prediction Problems.
Journal of Basic Engineering, 82(1), pp. 35-45.
26. Klein, L.R. and Sojo, E. (1989). Combinations of High and Low Frequency Data in
Macroeconometric Models. [In:] Economics in Theory and Practice: An Eclectic
Approach (pp. 3–16), edited by L.R. Klein and J. Marquez. Norwell, MA: Kluwer
Academic Publishers.
27. Liu, P., Matheson, T., and Romeu, R. (2012). Real-time forecasts of economic activity
for Latin American economies. Economic Modelling, 29(4), pp. 1090-1098.
28. Maddala, G. S. and Kim, I-M., (1998). Unit Roots, Cointegration, and Structural
Change. Cambridge University Press, Cambridge.
29. Rünstler, G. and Sédillot, F. (2003). Short-Term Estimates of Euro Area Real GDG
by Means of Monthly Data. Working Paper Series 276, European Central Bank.
30. Rünstler, Barhoumi, Benk, Cristadoro, Den Reijer, Jakaitiene, Jelonk, Rua, Ruth, and
van Nieuwenhuyze, (2009). Short-term forecasting of GDP using large datasets: a
real-time forecast evaluation exercise. Journal of Forecasting, 28, pp. 595–611.
31. Sánchez, I. and Peña, D. (2001). Properties of Predictors in Overdifferenced Nearly
Nonstationary Autoregression. Journal of Time Series Analysis, 22(1), pp. 45–66.
32. Stock, J. H., and Watson, M. W. (1988). A probability model of the coincident
economic indicators. NBER Working Paper No. 2772.
33. ________. (1989). New indexes of coincident and leading economic indicators. [In:]
NBER Macroeconomics Annual 1989, ed. O. J. Blanchard and S. Fischer, vol. 4, pp.
351-394. Cambridge, MA: MIT Press.
34. ________. (2002a). Macroeconomic forecasting using diffusion indices. Journal of
Business and Economics Statistics, 20(2), pp. 147–162.
35. ________. (2002b). Forecasting Using Principal Components from a Large Number
of Predictors. Journal of the American Statistical Association, 97(460), pp. 1167-
1179.
36. Yiu, M. S., and Chow, K. K. (2011). Nowcasting Chinese GDP: information content
of economic and financial data. China Economic Journal, 3(3), pp. 223-240.
28
Anexo 1. Bases de Datos
Variables de los conjuntos de información
Tabla A.1. Variables de los Conjuntos de Información
Nombre del Indicador Fuente Coeficiente de
correlación con el PIB
(1993-I a 2016-I) CI-1 CI-2 CI-3
IGAE INEGI 0.958
Consumo Privado INEGI 0.850
Actividad Industrial INEGI 0.849
Industria manufacturera INEGI 0.811
Importaciones Mexicanas Banco de México 0.802
Producción Industrial en EUA Federal Reserve
System 0.746
Construcción INEGI 0.699
Ventas de la ANTAD ANTAD 0.626
Exportaciones no petroleras
manufactureras Banco de México 0.617
Indicador adelantado INEGI 0.559
Bolsa Mexicana de Valores INEGI 0.533
Producción de cemento Banco de México 0.478
Producción de vehículos de AMIA AMIA 0.470
Agregado monetario M4 Banco de México 0.443
Ventas al por mayor (EMEC)* INEGI 0.439
Refacciones para automóviles Banco de México 0.387
Producción de aluminio Banco de México 0.373
Exportaciones Mexicanas Banco de México 0.348
Cuartos ocupados (Hoteles) SECTUR 0.348
Ventas de electricidad CFE 0.322
Gases industriales Banco de México 0.319
Transporte en ferrocarril Banco de México 0.288
Producción de llantas Banco de México 0.249
Asistencia a cines Banco de México 0.181
Venta de gasolinas PEMEX 0.176
TIIE INEGI -0.341
Tipo de cambio real Banco de México -0.544
Nota: Las correlaciones de los indicadores con (*) se presentan para periodos más cortos porque las series no comienzan
en 1993.
*El coeficiente de correlación se obtuvo respecto a las variaciones trimestrales desestacionalizadas del PIB y las del
indicador seleccionado.
Variables con diferencias logarítmicas y ajuste estacional
En la Tabla A.2 enlisto todas las variables que forman parte de los tres conjuntos de información.
Asimismo presento los resultados de las pruebas de raíz unitaria. Por último, indico qué variables
29
presentan ajuste estacional del INEGI (marcadas con ). Las variables que no presentan ajuste
estacional (marcadas con X) fueron desestacionalizadas con el programa X12 ARIMA.
Realicé un análisis de correlación entre el PIB trimestral y cada una de las variables trimestralizadas
en el periodo 1993-2016. Finalmente realicé pruebas de raíz unitaria para todas las variables, de
donde concluyo que cuatro de las 27 variables son estacionarias por lo que no las transformé con
diferencias logarítmicas.
Es importante mencionar que hice las pruebas de raíz unitaria sobre las series desestacionalizadas,
aun sabiendo que estas pruebas podrían estar sesgadas. En efecto, de acuerdo con Maddala y Kim
(1998, pp. 364-365), en muestras finitas, los estadísticos de las pruebas de raíz unitaria ADF y
Phillips-Perron podrían estar sesgados a no rechazar la hipótesis nula cuando los datos están
desestacionalizados. Si este fuera el caso para las pruebas previamente hechas, habría algunas
variables sobre-diferenciadas, lo cual no representa un problema de acuerdo a Sánchez y Peña
(2001), quienes sostienen que es mejor sobre-diferenciar a sub-diferenciar cuando se usan modelos
autorregresivos para generar pronósticos.
30
Tabla A.2. Pruebas de raíz unitaria
Nombre del Indicador
Ho: La serie tiene una raíz unitaria Ho: La serie es
estacionaria
Diferencia
Logarítmica
Ajuste
Estacional
del INEGI
Prueba de Dickey-Fuller Aumentada Prueba de Phillips-Perron Prueba de Kwiatkowski-
Phillips-Schmidt-Shin
Ninguno Intercepto Intercepto y
Tendencia Ninguno Intercepto
Intercepto y
Tendencia Intercepto
Intercepto y
Tendencia
Indicador Global de la
Actividad Económica 1.000 0.948 0.395 1.000 0.935 0.159 p<0.01 p<0.01
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Consumo Privado 1.000 0.965 0.107 1.000 0.955 0.213 p<0.01 p<0.01
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Actividad Industrial 0.995 0.664 0.620 0.991 0.659 0.460 p<0.01 p<0.01
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Industria Manufacturera 0.997 0.773 0.693 0.990 0.742 0.500 p<0.01 p<0.01
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Importaciones Mexicanas 0.968 0.912 0.021 0.991 0.939 0.124 p<0.01 0.01<p<0.05
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Producción Industrial en
EUA 0.664 0.096 0.209 0.759 0.364 0.644 p<0.01 0.01<p<0.05
[0.001] [0.010] [0.044] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Construcción 0.946 0.718 0.497 0.939 0.709 0.332 p<0.01 0.05<p<0.10
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Ventas de la ANTAD 1.000 1.000 0.611 1.000 0.999 0.615 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Exportaciones no petroleras
manufactureras 0.990 0.952 0.503 0.985 0.941 0.364 p<0.01 0.01<p<0.05
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Indicador adelantado 0.657 0.000 0.001 0.678 0.012 0.047 p>0.10 p>0.10
X X [0.000] [0.000] [0.000] [0.000] [0.001] [0.003] [p>0.10] [p>0.10]
Bolsa Mexicana de Valores 0.651 0.000 0.000 0.652 0.015 0.066 p>0.10 p>0.10
X X [0.000] [0.000] [0.000] [0.000] [0.000] [0.003] [p>0.10] [p>0.10]
Producción de cemento 0.855 0.747 0.057 0.879 0.421 0.007 p<0.01 0.05<p<0.10
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Producción de Vehículos de
AMIA 0.944 0.895 0.430 0.918 0.801 0.066 p<0.01 0.01<p<0.05
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Agregado monetario M4 1.000 1.000 0.994 1.000 1.000 0.997 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
31
Tabla A.2. Pruebas de raíz unitaria (continuación)
Nombre del Indicador
Ho: La serie tiene una raíz unitaria Ho: La serie es
estacionaria
Diferencia
Logarítmica
Ajuste
Estacional
del INEGI
Prueba de Dickey-Fuller Aumentada Prueba de Phillips-Perron Prueba de Kwiatkowski-
Phillips-Schmidt-Shin
Ninguno Intercepto Intercepto y
Tendencia Ninguno Intercepto
Intercepto y
Tendencia Intercepto
Intercepto y
Tendencia
Ventas al por mayor
(EMEC) 0.967 0.239 0.474 0.954 0.252 0.342 p<0.01 p<0.01
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Refacciones para
automóviles 0.943 0.975 0.887 0.658 0.775 0.155 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Producción de aluminio 0.988 0.991 0.338 0.933 0.906 0.001 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Exportaciones Mexicanas 0.964 0.885 0.031 0.991 0.923 0.161 p<0.01 0.01<p<0.05
[0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Cuartos ocupados (Hoteles) 0.951 0.696 0.004 0.972 0.574 0.008 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Ventas de electricidad 1.000 0.799 0.181 1.000 0.780 0.037 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Gases industriales 0.582 0.001 0.000 0.551 0.004 0.000 p<0.01 0.01<p<0.05
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Transporte en ferrocarril 0.958 0.730 0.382 0.957 0.576 0.022 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Producción de llantas 0.353 0.438 0.148 0.080 0.000 0.000 p<0.01 0.01<p<0.05
X [0.001] [0.010] [0.046] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Asistencia a cines 0.942 0.899 0.297 0.789 0.048 0.000 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Venta de gasolinas 1.000 0.951 0.899 0.999 0.818 0.955 p<0.01 p<0.01
X [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [p>0.10] [p>0.10]
Tasa de interés
interbancaria de equilibrio 0.737 0.002 0.012 0.668 0.012 0.053 p>0.10 p>0.10
X X [0.000] [0.000] [0.000] [0.000] [0.000] [0.002] [p>0.10] [p>0.10]
Tipo de cambio real 0.736 0.000 0.001 0.718 0.029 0.118 p>0.10 p>0.10
X X [0.000] [0.000] [0.000] [0.000] [0.000] [0.001] [p>0.10] [p>0.10]
Nota: las pruebas de raíz unitaria se hicieron para el periodo 1993-2013. Se muestran los p-values para rechazar la Ho. En azul se resaltan las pruebas en las que se considera que la serie tiene una raíz unitaria. El p-value entre corchetes se refiere a las pruebas de raíz unitaria con las diferencias de la serie original.
32
Anexo 2. La Prueba de Diebold-Mariano
Definamos a los errores de pronóstico como:
휀𝑖𝑡 = �̂�𝑖𝑡 − 𝑦𝑡, 𝑖 = 1,2
Se asume que la función de pérdida asociada con el pronóstico 𝑖 es función del error de pronóstico,
휀𝑖𝑡, y se denota por 𝑔(휀𝑖𝑡). La función 𝑔(∙) es una función de pérdida, tal que; toma el valor de
cero cuando no se comete error, nunca es negativa y es creciente a medida que los errores se hacen
más grandes en magnitud. Típicamente, 𝑔(휀𝑖𝑡) es el cuadrado (squared-error loss) o el valor
absoluto (absolute error loss) de 휀𝑖𝑡.
𝑔(휀𝑖𝑡) = 휀𝑖𝑡2
𝑔(휀𝑖𝑡) = |휀𝑖𝑡|
Un problema con estas funciones de pérdida es que son simétricas. De hecho, en algunos casos, la
simetría entre errores de pronóstico, positivos y negativos, podría ser inapropiada.
Definimos la diferencia de pérdida entre dos pronósticos como:
𝑑𝑡 = 𝑔(휀1𝑡) − 𝑔(휀2𝑡)
Decimos que los dos pronósticos tienen igual precisión si y sólo si la diferencia de pérdida tiene
una esperanza de cero para todo 𝑡. De tal manera que nos gustaría probar la hipótesis nula,
𝐻0: 𝐸(𝑑𝑡) = 0 ∀ 𝑡
contra la hipótesis alternativa,
𝐻1: 𝐸(𝑑𝑡) ≠ 0
La hipótesis nula es que los dos pronósticos tienen la misma precisión. La hipótesis alternativa es
que los dos pronósticos tienen diferentes niveles de precisión. Considere la cantidad:
√𝑇(�̅� − 𝜇)
Donde �̅� = ∑ 𝑑𝑡𝑇𝑡=1 es la media muestral de la diferencia entre funciones de pérdida, 𝜇 = 𝐸(𝑑𝑡) es
la media poblacional de la diferencia entre funciones de pérdida 𝑓𝑑(0) =1
2𝜋(∑ 𝛾𝑑(𝑘)
∞𝑘=−∞ ) es la
33
densidad espectral de la diferencia de pérdida a la frecuencia 0, 𝛾𝑑(𝑘) es la autocovarianza de la
diferencia de pérdida al rezago 𝑘.
Es posible mostrar que si la serie generada por la diferencia entre funciones de pérdida
{𝑑𝑡; 𝑡 = 1, … , 𝑇} es covarianza estacionaria y de memoria corta, entonces √𝑇(�̅� −
𝜇) ⟶𝑑 𝑁(0,2𝜋𝑓𝑑(0)). En lo sucesivo asumiremos que la serie generada por la diferencia de
pérdida es covarianza estacionaria y de memoria corta. Suponga que los pronósticos son h(> 1)-
periodos hacia adelante. Para probar la hipótesis nula de que los dos pronósticos tienen la misma
precisión, Diebold-Mariano (1995) utilizan el siguiente estadístico
𝐷𝑀 =�̅�
√2𝜋𝑓�̂�(0)𝑇
Donde 𝑓�̂�(0) es un estimador consistente de 𝑓𝑑(0) definido por
𝑓�̂�(0) =1
2𝜋∑ 𝐼 (
𝑘
ℎ − 1) 𝛾𝑑(𝑘)
𝑇−1
𝑘=−(𝑡−1)
Donde 𝛾𝑑(𝑘) =1
𝑇∑ (𝑑𝑡 − �̅�)𝑇𝑡=|𝑘|+1 (𝑑𝑡−|𝑘| − �̅�), e 𝐼 (
𝑘
ℎ−1) = {
1 𝑝𝑎𝑟𝑎 |𝑘
ℎ−1| ≤ 1
0 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑓𝑜𝑟𝑚𝑎
34
Anexo 3. Análisis de Robustez, Prueba de DM
Como análisis de robustez realicé la prueba de DM con un criterio de pérdida distinto al del ECM,
por lo que utilizo el Error Absoluto Medio (EAM). Para calcular la varianza de largo plazo utilizo
un Bartlett Kernel (Tabla A.3). Asimismo, analizo un periodo distinto con el fin de determinar si
el promedio de las BE es consistentemente mejor al resto de los modelos (Tabla A.4).
Tabla A.3. Prueba de Diebold-Mariano (criterio de pérdida EAM)
Pronósticos de 2009-I a 2016-II
Modelos AR PCA1 PCA2 MFD BE1 BE2 Promedio Mediana Prom(BE)
AR 0.550
PCA1 PCA1 0.546
PCA2 AR PCA1 0.555
MFD MFD** MFD* MFD*** 0.243
BE1 BE1*** BE1*** BE1*** BE1** 0.168
BE2 BE2** BE2** BE2*** BE2** BE1 0.174
Promedio (Todos los
Modelos) Promedio*** Promedio* Promedio*** MFD BE1* BE2* 0.248
Mediana (Todos los
Modelos) Mediana*** Mediana* Mediana*** Mediana** Mediana Mediana Mediana*** 0.165
Promedio(BE) Prom(BE)*** Prom(BE)** Prom(BE)*** Prom(BE)** Prom(BE)* Prom(BE)** Prom(BE)*** Prom(BE)* 0.136
p-value para la significancia de la diferencia del EAM entre los modelos comparados ***p<0.01, **p<0.05, *p<0.1
La muestra incluye los pronósticos de 2009-I a 2016-II. Se emplea el Error Absoluto Medio del Pronóstico (EAM) como criterio de pérdida. Se usa el estimador
Bartlett Kernel para calcular la varianza de largo plazo. En la diagonal principal se encuentran los EAM de cada modelo, estimados con base en la variación
trimestral desestacionalizada del PIB.
La primera prueba de robustez es consistente con los hallazgos previos, a saber, el MFD es más
preciso que el modelo AR, que el PCA1 y que el PCA2, sin embargo no es más preciso que las BE.
Por otro lado, concluyo que en todos los casos, el promedio de las BE provee de pronósticos más
precisos respecto al resto de los modelos, en el periodo analizado, con diferencias estadísticamente
significativas de al menos el 95% de confianza (Tabla A.3).
Adicionalmente realicé la prueba de DM para un periodo distinto de tiempo. Como la prueba
original incluye el periodo de la crisis financiera de 2008-2009, en esta prueba adicional omite
dicho periodo, de tal forma que el análisis se realiza del 2011-I al 2016-II. En esta prueba utilizo
35
el ECM como criterio de pérdida y uso el Kernel de una distribución uniforme para calcular la
varianza de largo plazo.
De acuerdo con las pruebas de DM calculadas en el periodo considerado, confirmo que los
pronósticos de las BE son más precisos que el resto de los modelos, sin embargo, también destaca
el hecho de que el MFD tuvo un buen desempeño, con relación a los modelos de PCA y al AR. En
conclusión, los pronósticos del promedio de los dos modelos de BE son más precisos que el resto
de los modelos de referencia con al menos un 95% de confianza, aunque la diferencia de los ECM
no resultó estadísticamente significativa cuando se compara con el modelo BE1 (Tabla A.4).
Tabla A.4. Prueba de Diebold-Mariano (criterio de pérdida ECM)
Pronósticos de 2011-I a 2016-II
Modelos AR PCA1 PCA2 MDF BE1 BE2 Promedio Mediana Prom(BE)
AR 0.293
PCA1 PCA1*** 0.234
PCA2 AR*** PCA1** 0.378
MDF MDF** MDF* MDF** 0.143
BE1 BE1*** BE1*** BE1*** BE1** 0.026
BE2 BE2** BE2*** BE2*** BE2** BE1* 0.048
Promedio
(Todos los
Modelos)
Promedio*** Promedio*** Promedio*** Promedio BE1** BE2** 0.082
Mediana
(Todos los
Modelos)
Mediana*** Mediana*** Mediana*** Mediana* BE1* BE2 Mediana*** 0.059
Promedio(BE) Prom(BE)*** Prom(BE)*** Prom(BE)*** Prom(BE)** Prom(BE) Prom(BE)** Prom(BE)*** Prom(BE)** 0.020
p-value para la significancia de la diferencia del ECM entre los modelos comparados ***p<0.01, **p<0.05, *p<0.1
La muestra incluye los pronósticos de 2011-I a 2016-II. Se emplea el Error Cuadrático Medio (ECM) como criterio de pérdida. Se usa el Kernel de una distribución Uniforme para calcular la varianza de largo plazo. En la diagonal principal se encuentran los ECM de cada modelo, estimados con base en la variación trimestral
desestacionalizada del PIB.