35
INV- Modelos no lineales en GRETL/2011-II APLICACIÓN DE MODELOS NO LINEALES CON VARIABLE DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL Diego Esteban Eslava Avendaño 1 diciembre de 2011 Resumen: El modelo de regresión lineal clásico no siempre es una buena aproximación en la explicación y análisis de fenómenos económicos debido a que los problemas que se buscan modelar pueden presentar características que hacen que las estimaciones bajo este modelo no sean adecuadas. Por tal motivo, esta investigación tiene como objetivo presentar al lector la aplicación de dos modelos (Logit y Probit) que buscan solucionar dos problemas: considerar la variable dependiente limitada o binaria, y, asumir que la probabilidad de que un evento pase no esté relacionada linealmente con las variables explicativas. Para la aplicación de dichos modelos se van a describir los procesos necesarios para su estimación en GRETL (The Gnu Regression, econometrics and Time- series Library) como un software alternativo a los usualmente utilizados, por lo que se hará una descripción básica del software, se aplicarán los modelos Logit y Probit en éste y se evaluarán los resultados respecto a uno de los programas más reconocidos: Stata. Palabras Clave: Modelo de Probabilidad Lineal, Logit, Probit, GRETL, Stata. APPLICATION OF NON-LINEAR MODELS WITH LIMITED ENDOGENOUS VARIABLE (LOGIT, PROBIT) USING GRETL Abstract: The classic linear regression model is not always a useful approximation for explaining and analyzing the economic phenomena, that is because some problems researchers try to model may have characteristics that make estimations not appropriate under this model. Therefore, this research aims to present the application of two models (Logit and Probit) useful for solving two specific problems: to assume the endogenous variable limited or binary, and, to assume the probability that an event happens is not linearly associated with the exogenous variables. The processes needed for the application of those models will be described in GRETL (The Gnu Regression, econometrics and Time- series Library) as alternative software to the ones usually used. A basic description of the software and the application of Logit and Probit using GRETL will be provided in this document; in addition the results will be evaluated in contrast to one of the most known software: Stata. Keywords: Linear Probability Model, Logit, Probit, GRETL, Stata. 1 Estudiante de Economía de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia, y monitor de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas. Correo Electrónico: [email protected]

Aplicacion de modelos no lineales dependiente_limitada.pdf

Embed Size (px)

Citation preview

Page 1: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

APLICACIÓN DE MODELOS NO LINEALES CON VARIABLE

DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL

Diego Esteban Eslava Avendaño1

diciembre de 2011

Resumen:

El modelo de regresión lineal clásico no siempre es una buena aproximación en la

explicación y análisis de fenómenos económicos debido a que los problemas que se

buscan modelar pueden presentar características que hacen que las estimaciones bajo

este modelo no sean adecuadas. Por tal motivo, esta investigación tiene como objetivo

presentar al lector la aplicación de dos modelos (Logit y Probit) que buscan solucionar dos

problemas: considerar la variable dependiente limitada o binaria, y, asumir que la

probabilidad de que un evento pase no esté relacionada linealmente con las variables

explicativas. Para la aplicación de dichos modelos se van a describir los procesos

necesarios para su estimación en GRETL (The Gnu Regression, econometrics and Time-

series Library) como un software alternativo a los usualmente utilizados, por lo que se

hará una descripción básica del software, se aplicarán los modelos Logit y Probit en éste y

se evaluarán los resultados respecto a uno de los programas más reconocidos: Stata.

Palabras Clave: Modelo de Probabilidad Lineal, Logit, Probit, GRETL, Stata.

APPLICATION OF NON-LINEAR MODELS WITH LIMITED

ENDOGENOUS VARIABLE (LOGIT, PROBIT) USING GRETL

Abstract:

The classic linear regression model is not always a useful approximation for explaining

and analyzing the economic phenomena, that is because some problems researchers try

to model may have characteristics that make estimations not appropriate under this

model. Therefore, this research aims to present the application of two models (Logit and

Probit) useful for solving two specific problems: to assume the endogenous variable

limited or binary, and, to assume the probability that an event happens is not linearly

associated with the exogenous variables. The processes needed for the application of

those models will be described in GRETL (The Gnu Regression, econometrics and Time-

series Library) as alternative software to the ones usually used. A basic description of the

software and the application of Logit and Probit using GRETL will be provided in this

document; in addition the results will be evaluated in contrast to one of the most known

software: Stata.

Keywords: Linear Probability Model, Logit, Probit, GRETL, Stata.

1Estudiante de Economía de la Facultad de Ciencias Económicas de la Universidad Nacional de

Colombia, y monitor de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias

Económicas. Correo Electrónico: [email protected]

Page 2: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

2

Director Unidad Informática:

Henry Martínez Sarmiento

Tutor Investigación: Juan Carlos Tarapuez roa.

Coordinadores:

Jasmin Guerra Cárdenas

Juan Felipe Reyes Rodríguez

Coordinador Servicios Web: John Jairo Vargas

Analista de Infraestructura y

Comunicaciones:

Diego Alejandro Jiménez Arévalo

Analista de Sistemas de Información:

Víctor Hugo Ramos Ramos

Estudiantes Auxiliares:

Camilo Alexandry Peña Talero Cristian Andrés Hernández Caro

Claudia Patricia Ospina Aldana Daniel Francisco Rojas Martín

David Camilo Sánchez Zambrano David Mauricio Mahecha Salas

Diego Esteban Eslava Avendaño

Edward F. Yanquen Briñez Gloria Stella Barrera Ardila

Iván Albeiro Cabezas Martínez Javier Alejandro Ortiz Varela

Jeimmy Paola Muñoz Juan Carlos Tarapuez Roa

Juan David Vega Baquero Juan Fernando López Prieto

Leonardo Alexander Cárdenas

Lina Marcela Igua Torres María Paula Contreras Navarrete

Paola Alejandra Alvarado Castillo Viviana Contreras Moreno

Viviana María Oquendo

Este documento es resultado de un

trabajo conjunto y coordinado de los integrantes de la Unidad de Informática y

Comunicaciones de la Facultad de Ciencias Económicas de la Universidad

Nacional de Colombia.

Esta obra está bajo una licencia reconocimiento no comercial 2.5

Colombia de Creative Commons. Para ver una copia de esta

licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o

envíe una carta a Creative Commons, 171second street, suite 30

San Francisco, California 94105, USA.

Page 3: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

3

APLICACIÓN DE MODELOS NO LINEALES DE VARIABLE

DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL

Contenido

1. INTRODUCCIÓN. ..................................................................................................................5

1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO LINEALES Y

GRETL EN LA FCE. ..................................................................................................................5

2. DESCRIPCIÓN BÁSICA DE GRETL. ...............................................................................7

2.1. INSTALACIÓN. ...............................................................................................................7

2.1.1. Linux. .......................................................................................................................7

2.1.2. MS Windows. ..........................................................................................................8

2.2. EXPLORACIÓN BÁSICA DEL PROGRAMA. ..........................................................8

2.2.1. Ventana Principal .................................................................................................8

2.2.2. Importación de archivos .....................................................................................9

2.2.3. Herramientas de trabajo ...................................................................................11

2.3. ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE VARIABLES. ......11

2.3.1. Estadísticos y gráficos descriptivos. .............................................................12

2.3.2. Transformación y generación de nuevas variables. .................................15

3. APLICACIÓN DE MODELOS ECONOMÉTRICOS. ....................................................17

3.1. MÍNIMOS CUADRADOS ORDINARIOS. ...............................................................17

3.1.1. Contraste de supuestos. ...................................................................................18

3.1.2. Intervalos de confianza. ....................................................................................18

4. MODELOS CON VARIABLE DEPENDIENTE BINARIA ............................................19

4.1. MODELO DE PROBABILIDAD LINEAL (MPL). ...................................................19

4.1.1. Desventajas del MPL ..........................................................................................21

4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA. ................................21

4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit ........24

4.2.2. Pruebas de hipótesis múltiples. .....................................................................26

4.3. CONCLUSIONES.........................................................................................................27

Page 4: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

4

5. APLICACIÓN DE MODELOS LOGIT Y PROBIT EN GRETL. ..................................27

6. APLICACIÓN DE LOGIT Y PROBIT EN STATA. .........................................................31

7. CONCLUSIÓN. .....................................................................................................................34

8. REFERENCIAS. ...................................................................................................................35

Page 5: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

1. INTRODUCCIÓN.

En la práctica cada vez toma mayor importancia el análisis de la efectividad de

políticas y medidas aplicadas en diversas esferas de la sociedad mediante el uso

de modelos econométricos. Sin embargo, debido a la complejidad de la realidad

económica encontrar modelos que se ajusten al problema analizado sugiere un

gran problema para el investigador, que se agrava al sumársele el problema de

encontrar software que le permita la exploración de nuevas herramientas y

modelos, fáciles de utilizar y que no sean restrictivos en su uso.

Bajo este contexto, la presente investigación tiene como objetivo darle a los

estudiantes una introducción a la aplicación de dos modelos que buscan mayor

precisión en el análisis: Logit y Probit; estos modelos responden específicamente

a dos problemas básicos que presenta el modelo de regresión lineal clásico. Junto

con esto, se ofrece una guía de aplicación de dichos modelos en un software

alternativo a los utilizados generalmente en el análisis estadístico: GRETL,

haciendo énfasis en el fácil acceso y utilización de dicho programa que favorece la

interacción del usuario. Para contrastar los resultados de la aplicación de los

modelos en GRETL, se va a realizar el mismo proceso en Stata, uno de los

software más reconocidos y utilizados en el área.

1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO

LINEALES Y GRETL EN LA FCE.

La enseñanza de los distintos métodos econométricos debe considerar como

componente de gran importancia los procesos necesarios para la estimación de

modelos y el contraste de supuestos utilizando la diversidad de paquetes

econométricos que existen en el mercado. Estos programas regularmente han

sido desarrollados utilizando códigos y procedimientos propios, por lo que para

los nuevos usuarios resulta un reto el hecho de tener que, además de aprender la

teoría estadística detrás de cada modelo, entender el lenguaje del software que se

está utilizando y los resultados que le son mostrados al ejecutar un

procedimiento.

Dentro de la Facultad de Ciencias Económicas se ha evidenciado la falta de

diversidad en los programas utilizados para la aplicación de la teoría tomada en

clase, esta problemática se puede deber principalmente a dos factores: el primero,

es la falta de medios explicativos para que los estudiantes aprendan a utilizar los

diferentes paquetes (clases auxiliares con monitores que conozcan diversos

programas, documentos de apoyo, ejemplos, etc.); el segundo, los problemas de

acceso a los software por fuera del aula, pues debido a que ciertos de ellos,

generalmente los más utilizados, requieren licencias y permisos, su uso está

restringido.

Page 6: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

6

Como forma de colaborar a disminuir el problema que se evidencia en la facultad,

la presente investigación busca, en primera instancia, ofrecerles a los estudiantes

una guía para el uso básico de GRETL, un software que se ajusta a las

necesidades de la academia y que cuenta con gran cantidad de funcionalidades. A

continuación se hace un análisis de los contenidos de las materias básicas de la

línea de econometría relacionándolos con GRETL:

Materia2 Funcionalidad en GRETL

Econometría I

Contenidos:

Modelo de regresión simple y MCO.

Modelo de regresión múltiple:

estimación y supuestos Inferencia.

Problemas asociados:

heteroscedasticidad,

multicolinealidad, variables

omitidas, error de medición y

simultaneidad.

Estimación de modelos por MCO, contraste

de supuestos, intervalos de confianza,

gráficos de variables estimadas y

observadas, gráfico de residuos, intervalos

de confianza.

Econometría II

Contenidos:

Análisis de Componentes

Principales.

Datos panel.

Procesos estocásticos: lineales,

estacionarios y no estacionarios.

Modelos ARMA y ARIMA:

especificación y propiedades,

identificación, estimación,

verificación y uso del modelo

(predicción).

Pruebas de raíz unitaria.

Modelo ARIMA estacional.

Análisis de componentes principales (arroja

los resultados básicos de valores propios

con su varianza y varianza acumulada y

los vectores propios asociados a cada

valor), estimación de datos panel (por

efectos fijos, efectos aleatorios, MCO

ponderados), análisis de series de tiempo

con modelos ARMA y ARIMA.

TABLA 1. PERTINENCIA DE GRETL EN LA FCE

Como se observa en la relación descrita, el programa se ajusta a las necesidades

de las clases del núcleo básico que ofrece la carrera. A través del presente

documento se mostrarán las características básicas para el uso del programa en

las que se hace énfasis en la facilidad y versatilidad que este ofrece, lo cual

fortalece la pertinencia de su uso en la facultad, pues puede servir como medio

2 Contenidos tomados del Sistema de Información Académica de la Universidad Nacional de

Colombia

Page 7: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

7

para incentivar el trabajo autónomo de los estudiantes que no se van a ver

limitados por problemas de entendimiento usuario-software, como tampoco por el

acceso restringido al uso del programa; sin dejar de asegurar la calidad en las

estimaciones y en los procesos realizados.

Respecto a la calidad en los procesos que GRETL realiza, el documento busca

abarcar un tema complementario a los normalmente enseñados en los cursos de

la facultad (presentados en la Tabla 1) se trata de la aplicación de modelos no

lineales con variable dependiente binaria, modelos muy utilizados para el análisis

de la realidad pero que por la dificultad en su interpretación no tienen cabida en

los cursos iniciales de econometría. De esta manera, se busca hacer una

aproximación básica a temas complementarios que incentivan el aprendizaje de

los estudiantes por fuera del aula de clases. Los resultados que se obtengan de la

estimación de dichos modelos serán confrontados con los resultados obtenidos de

uno de los programas más utilizados, como lo es Stata, buscando validar la

pertinencia del uso alternativo de GRETL.

2. DESCRIPCIÓN BÁSICA DE GRETL.

GRETL (The Gnu Regression, Econometrics and Time-series Library) es un

paquete econométrico desarrollado bajo los principios del software libre y la

“General Public License (GPL)” de GNU. De este modo está dirigido

principalmente al sistema operativo Linux, aunque cuenta con versiones

desarrolladas para Windows y Mac. La principal fortaleza pedagógica del

programa reside en que además de ofrecer una interfaz agradable para el usuario,

incluye gran cantidad de datos de ejercicios de libros de econometría

ampliamente usados en la enseñanza de esta herramienta.

GRETL, además de permitir desarrollar gran cantidad de métodos y pruebas

estadísticas, permite asociarse con otros programas ya sea en importación de

datos (lee bases de datos de SPSS, Excel, Stata, Eviews, etc.) o de exportación de

documentos donde trabaja conjuntamente con LaTeX. Sumado a esto, el

programa tiene un enlace con R-Project, que se puede usar para un análisis de

datos más avanzado.

2.1. INSTALACIÓN.

2.1.1. Linux.

En Linux existe la posibilidad de elegir entre dos tipos de instalaciones. Por un

lado, se puede instalar GRETL desde la compilación y construcción de su código,

esto es útil para las personas que pretenden hacer desarrollos sobre la

plataforma o quieren adecuar el programa a sus necesidades; Por el otro, existe

un paquete “pre-construido” el cual es instalado por los usuarios corrientes, pues

Page 8: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

8

el primer tipo requiere de un conocimiento del código de programación. Algunas

distribuciones de Linux como Debian y Ubuntu incluyen dentro de sus paquetes

a GRETL y sus librerías, además se pueden encontrar ciertos paquetes listos para

ejecutar en la página principal del programa, sección descargas

(http://gretl.sourceforge.net/gretl_espanol.html).

2.1.2. MS Windows.

En Windows el proceso de instalación se reduce a un archivo ejecutable que se

encuentra en la dirección http://gretl.sourceforge.net/win32/index_es.html. Al

ejecutar el archivo y elegir el directorio donde va a ser instalado el programa se

instala automáticamente. Aparte de encontrar el instalador de GRETL para

Windows, en esta página están diversos paquetes que se han venido

desarrollando, tales como TRAMO/SEATS, datos de libros de enseñanza de

Econometría, etc. Además se encuentran de opciones para actualización y

construcción del programa.

Tanto para Windows como para Linux el programa busca actualizaciones

recurrentemente, sin embargo para el caso de Windows, el usuario puede decidir

si desea que el programa actualice automáticamente. Para esto el usuario debe

cerrar GRETL, ejecutar el programa “gretl updater” y cuando este termine volver a

abrir GRETL.

2.2. EXPLORACIÓN BÁSICA DEL PROGRAMA.

2.2.1. Ventana Principal

A. VENTANA PRINCIPAL

Page 9: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

9

La ventana principal de GRETL es supremamente sencilla e intuitiva para el

usuario, el cual no tiene que tener un conocimiento en programación para poder

usarlo. GRETL le ofrece opciones que tan sólo tiene que elegir con unos cuantos

clics y que simplifican el trabajo del investigador. Sin embargo, para usuarios

avanzados que quieren aumentar la experiencia en GRETL, el código del

programa es abierto y pueden colaborar en el desarrollo de este. A continuación

se hará revisión de las principales herramientas que ofrece la ventana principal:

Barra de herramientas: Contiene las principales herramientas del

programa en lo que se refiere a gestión de archivos y análisis estadístico y

econométrico. Además, contiene una ventana de ayuda que enriquece el

aprendizaje del investigador.

Variables disponibles: Esta ventana, que ocupa el espacio más amplio de

la ventana principal, muestra al usuario las variables que son cargadas

dándole a cada variable un orden, un nombre y una descripción básica.

Barra de acceso rápido: Ubicada en la parte inferior izquierda de la

ventana principal, le ofrece al usuario un acceso rápido a ciertas

herramientas básicas como es calculadora, guía de instrucciones, guía de

usuario, consola y la vista de íconos de sesión donde se encuentra la

información principal del conjunto de datos que está siendo trabajado.

Características del conjunto de datos: Es un pequeño espacio ubicado

en la parte inferior central de la ventana principal. Muestra la periodicidad

de los datos y los años que comprende.

2.2.2. Importación de archivos

Para importar datos a GRETL hay que utilizar la herramienta Abrir Datos ubicada

en el menú archivo de la barra de herramientas, al dar clic en esta opción el

programa mostrará tres opciones:

Archivo de usuario: en la que el usuario busca en su equipo el conjunto

de datos que desea importar.

Archivo de muestra: Aquí el usuario tiene a disposición, por defecto, tres

librerías de datos las cuales muestran una cantidad de conjuntos de datos

precargadas y que se pueden aplicar a gran cantidad de modelos según

sus características (revisar Ilustración B). En la página de GRETL es

posible más bases de datos procedentes de libros de econometría. Para

más información revise el siguiente vínculo

http://gretl.sourceforge.net/gretl_data_es.html

Page 10: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

10

Importar: GRETL permite importar datos de diversos programas y

extensiones, como son: Octave, texto/csv, Eviews, Gnumeric, Stata, SPSS,

entre muchos más.

B. ARCHIVOS DE MUESTRA

Además de esta opción, existe la posibilidad de cargar guiones para ejecutar por

medio de la consola, esto se hace desde la opción Archivos de guion del menú

Archivo. Aquí se encontrarán las opciones comunes de cargar un guion ya sea

por el mismo archivo del usuario o precargadas con el programa o crear una

nueva de tipo R, GRETL, Octave, entre otros.

Otra función útil que GRETL contiene es la carga de archivos de funciones, que

también se encuentra ubicada en el menú Archivo, en ésta opción se puede

cargar paquetes de funciones que hayan sido desarrolladas por algún usuario o

por usted mismo, evitando el proceso de tener que desarrollarla por medio de

programación.

Por último existe la opción de configurar el directorio predeterminado de GRETL,

la opción Archivo – Directorio de trabajo, permite configurar el directorio y las

opciones de uso como se observa en la Ilustración C.

C. SELECCIÓN DE DIRECTORIO

Page 11: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

11

De este modo al trabajar con nuestro directorio predeterminado el programa

automáticamente buscará allí todos los archivos que se llamen usando los

comandos open, run o include, por medio de la consola. Además cualquier trabajo

que sea guardado o editado quedara grabado en este directorio.

GRETL ofrece la opción de guardar y abrir sesiones de trabajo en el programa, así

se tendrán a salvo los datos usados, algunos modelos aplicados y algunas

gráficas que el usuario al cerrar la sesión haya decido guardar.

Ciertas veces puede ser necesario dar información acerca de la naturaleza de la

información, esto se lleva a cabo a través de la opción “Estructura del conjunto de

datos” ubicada en la pestaña Datos de la barra de herramientas, aquí se podrá

especificar si los datos son de tipo sección cruzada, serie temporal o panel.

2.2.3. Herramientas de trabajo

La opción Herramientas, ubicada en la barra de herramientas de la ventana

principal, cuenta con ciertas opciones útiles tanto para mejorar la eficiencia o la

capacidad de uso del programa, como para el análisis estadístico básico. Por el

momento se hará referencia a las herramientas de trabajo del programa, en la

próxima sección se revisarán las herramientas de análisis.

La principal función que podemos encontrar es la consola de GRETL, desde aquí

podemos trabajar todas las funciones usando la línea de comandos del programa.

Las funciones que el programa contiene se encuentran, o escribiendo “help” en la

consola de comandos o en el menú de ayuda, ubicado en la barra de

herramientas, donde aparece la opción “guía de instrucciones”. Aquí tendremos a

nuestra disposición una descripción de todos los comandos disponibles en el

programa.

Adicional a esta herramienta está disponible una opción llamada “historial de

instrucciones” la cual muestra los comandos que han sido utilizados durante la

sesión de trabajo, junto con una opción de enlace a GNU R, la cual nos va a llevar

a la interfaz de R-Project, que puede llegar a ser útil en el desarrollo de funciones

más avanzadas que GRETL puede no contener.

2.3. ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE

VARIABLES.

GRETL ofrece al usuario ciertas herramientas útiles para la creación de

estadísticos descriptivos de las variables que se estén trabajando. Una ventaja del

software es que no sólo tiene un proceso muy intuitivo para generar los

estadísticos principales sino que además contiene una serie de calculadoras o

Page 12: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

12

programaciones que nos muestran, por ejemplo, tablas estadísticas, valores-p,

gráficas de distribuciones, estadísticos de contraste, entre otros.

2.3.1. Estadísticos y gráficos descriptivos.

En la barra de herramientas se encuentra la opción Variable que desplegará

opciones de edición y análisis estadístico, hay que tener en cuenta que cualquier

opción que se elija va a arrojar el resultado para la variable que se haya

seleccionado previamente en la ventana principal del programa. En relación con

las opciones de edición se encontrarán opciones para cambiar datos, atributos de

la serie (cambiar el nombre y número) y para establecer el código que reconocerá

valores ausentes.

Una de las opciones a tener en cuenta es el tipo de estructura de los datos,

opción que se ejecutará automáticamente al importar una base de datos, o que se

encuentra ubicada en la opción Datos de la barra de herramientas de la ventana

principal. Aquí se podrá especificar la naturaleza de los datos y el orden que

tiene, algo básico para la estimación correcta del modelo. Las opciones se

muestran en la Ilustración D.

D. ESTRUCTURA DE LOS DATOS

Page 13: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

13

En cuanto al análisis descriptivo las opciones que es posible encontrar son

básicamente:

Estadísticos principales: La salida de esta opción nos mostrará: media,

mediana, máximo, mínimo, desviación estándar o típica, coeficiente de

variación, de asimetría y el excedente de curtosis.

E. ESTADÍSTICOS PRINCIPALES

Además de esta opción, desde la barra de acceso rápido se puede encontrar

una herramienta aún más interesante: dando clic en el botón “vista de

iconos de sesión” se encontrará la opción Resumen la cual

automáticamente nos mostrará la media, mediana, mínimo y máximo de

todos los datos que contiene la base que ha sido cargada.

F. ESTADÍSTICOS DEL CONJUNTO DE DATOS GENERAL

Page 14: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

14

Contraste de normalidad: El programa automáticamente hace cuatro

pruebas de normalidad para la serie escogida: Doornik-Hansen, W de

Shapiro-Wilk, Lilliefors y Jarque-Bera. Para cada una el programa

muestra el estadístico y su valor-p asociado.

G. CONTRASTE DE NORMALIDAD

Gráfico Q-Q normal: Esta herramienta nos permite comparar los cuantiles

empíricos de la serie en cuestión contra los cuantiles de una distribución

normal. Para llevar a cabo este proceso mínimo hay que contar con 20

datos y el programa por defecto calcula la distribución normal con la media

y varianza de los datos que se están utilizando. Además hay dos opciones

más para trabajar con datos estandarizados o enfrentar a los cuantiles

brutos contra una normal de media 0 y varianza 1.

H. Q-Q NORMAL.

Page 15: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

15

Gráfico de Cajas (Boxplot): Dando clic derecho sobre la variable es posible

encontrar la opción de gráfico de cajas que nos permite ver la distribución

de la variable, usando su mínimo, máximo, sus cuartiles, su media y su

mediana.

I. BOXPLOT

2.3.2. Transformación y generación de nuevas variables.

Otra función muy útil de GRETL es la variedad de opciones que ofrece para

convertir en diferentes formas funcionales las variables que se han cargado. Así

mismo, es muy útil para agregar con tan sólo un clic variables dummy

estacionales, variables aleatorias, entre otras herramientas que su construcción

podría llevar mucho más tiempo. Todas estas herramientas las encontramos en el

botón Añadir de la barra de herramientas de la ventana principal. Las opciones

disponibles son: logaritmos, cuadrados, retardos, primeras diferencias,

diferencias de logaritmos y diferencias estacionales de las variables

seleccionadas.

Además de esto existe la opción para definir una nueva variable que se quiera

introducir, una gran ventaja pues dinamiza el trabajo de tener que ir hasta la

base de datos original para poder incluirla, o para crear una matriz ya sea

utilizando las series que están cargadas o introduciendo su tamaño y

posteriormente los datos, o mediante una función que incluya una relación

matemática entre ciertas variables.

Apenas se haga clic sobre la opción que se desea, la nueva variable que ha sido

creada aparecerá en la ventana principal, de esta forma ya puede ser llamada en

cualquier proceso que se vaya a realizar.

Page 16: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

16

2.3.3. Análisis de componentes principales.

Uno de los procesos estadísticos no inferenciales más útiles que se pueden

realizar es el Análisis de componentes principales (ACP). Aunque GRETL tiene

una función desarrollada para este proceso es muy básica respecto a los procesos

que se pueden desarrollar en otros programas como R y SPSS.

La aplicación de ACP en GRETL se limita a una opción que se encuentra en el

botón Ver de la barra de herramientas o al comando acp de la consola. Al dar clic

sobre la opción de ACP el programa abrirá automáticamente una ventana que

pedirá seleccionar las variables a analizar y decidir si se trabaja con la matriz de

covarianzas o con la de correlaciones (paso básico para la determinación de los

componentes). Si se realiza el proceso por medio del comando en la consola hay

que especificar las variables a analizar, o en su defecto si se desea analizar toda

la base simplemente hay que escribir el comando y dar enter.

J. ANÁLISIS DE COMPONENTES PRINCIPALES

La ventana de salida que se obtiene nos muestra, en primera instancia, la

varianza de cada componente (vector propio) y la varianza acumulada que sirven

como criterio de selección las componentes a retener. Debajo de estos datos se

encontrará la ponderación que cada componente le otorga a cada variable, lo cual

es útil para hacer el proceso de descripción de los componentes retenidos.

Page 17: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

17

3. APLICACIÓN DE MODELOS ECONOMÉTRICOS.

GRETL contiene programación para realizar procesos en aproximadamente 28

métodos econométricos, dentro de estos encontramos mínimos cuadrados

ordinarios, estimación de la matriz de covarianzas robusta, datos panel estático y

dinámico, mínimo cuadrados no lineales, Estimación de máxima verosimilitud y

modelos de series de tiempo univariados y multivariados, entre muchos otros.

Este documento se centrará al estudio de modelos que se enfrentan a problemas

de variables discretas, como ya se verá más adelante al hacer referencia a los

modelos Logit y Probit. Sin embargo, para explorar un poco más en detalle el

programa se pretende hacer a continuación una exposición de la estimación de

un modelo de regresión lineal por mínimos cuadrados ordinarios.

3.1. MÍNIMOS CUADRADOS ORDINARIOS.

El proceso de estimar un modelo de regresión lineal por mínimos cuadrados

ordinarios (MCO) en GRETL se puede desarrollar, al igual que la mayoría de los

procesos, por medio de la interfaz de usuario o por medio de la consola.

En la barra de herramientas se encontrará la pestaña Modelo en donde

aparecerán los diferentes conjuntos de modelos que se pueden aplicar a los datos

con los que se cuenta. Por consiguiente, en este menú aparecerá la opción de

MCO que al seleccionarla mostrará una ventana en donde se debe seleccionar la

variable dependiente y las variables independientes del modelo. Si se desea

proceder usando la consola, se puede realizar con el comando ols seguido de la

variable independiente y después de las independientes.

K. MÍNIMOS CUADRADOS ORDINARIOS

Page 18: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

18

3.1.1. Contraste de supuestos.

Al haber estimado el modelo, aparecerá una ventana de salida en la cual se

muestran los principales resultados de la estimación. Así mismo, se encuentra

una barra de herramientas con todas las opciones disponibles para analizar y

contrastar el modelo. Específicamente, la opción contrastes muestra una gran

cantidad de contrastes a los supuestos del modelo, tal como muestra la

Ilustración L. Al seleccionar cualquiera de los contrastes aparecerá

automáticamente en otra ventana el proceso realizado por el programa y se creará

debajo de los resultados principales de la estimación del modelo (obtenidos

anteriormente) un resumen de la prueba realizada, mostrando la hipótesis nula,

el estadístico y su valor-p principalmente.

L. CONTRASTES DE LOS SUPUESTOS, TEST RESET DE RAMSEY.

La diferencia entre las dos formas de aplicar el modelo (interfaz o consola) está en

que para hacer los contrastes de los supuestos del modelo la primera opción

ofrece en el documento de salida el menú explicado anteriormente. Al proceder

mediante la consola se deben seguir utilizando los comandos correspondientes a

los contrastes que se desean hacer, por ejemplo, para hacer el test de Ramsey se

procede con el comando reset.

3.1.2. Intervalos de confianza.

Una de las fortalezas con las que GRETL cuenta es la fácil estimación de los

intervalos de confianza para cada una de las variables del modelos que se haya

ejecutado, simplemente hay que dirigirse a la sección análisis en la ventana de

Page 19: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

19

salida de resultados del modelo, donde aparece la opción de intervalos de

confianza, estos automáticamente serán generados.

M. INTERVALOS DE CONFIANZA

4. MODELOS CON VARIABLE DEPENDIENTE BINARIA3

La aplicación del modelo de regresión múltiple lineal puede ser no adecuada para

la explicación de problemas en los cuales la respuesta que se espera toma

únicamente dos valores, por ejemplo, cuando se quiere hacer un análisis de

políticas las únicas respuestas que se pueden esperar es si estas fueron exitosas

o no en el medio en el cual fueron aplicadas. Para estos casos es necesario

utilizar nuevas herramientas que difieren del modelo de regresión múltiple y que

plantean nuevos mecanismos de medición. A continuación se consideraran

ciertos modelos que son útiles para solucionar problemas con variable

dependiente binaria, estos son: Modelo de probabilidad lineal, modelo Logit y

modelo Probit.

4.1. MODELO DE PROBABILIDAD LINEAL (MPL).

El modelo de probabilidad lineal (MPL) es básicamente una variación del modelo

de regresión lineal múltiple enfocada a la explicación de eventos cualitativos. En

este documento sólo se considerarán el caso en que el evento a explicar tiene

resultados binarios, de este modo la variable dependiente del modelo de regresión

lineal sólo podrá tomar valores de cero o uno.

Al tener un modelo,

Con y como una variable bivariada, la interpretación común de los no puede

seguir siendo utilizada, pues los cambios en y ya no son continuos ante cambios

en las X. De este modo hay que recurrir a una nueva forma de entender el modelo

con el fin de hallar su utilidad.

3Explicación de modelos basada en Wooldridge (2009)

Page 20: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

20

Al admitir el supuesto de media condicional cero, , el modelo

puede ser expresado como,

El punto clave de la explicación del modelo de regresión lineal con variable

dependiente binaria está en que siempre se tiene que el valor esperado de y es

igual a su probabilidad de éxito, que es la probabilidad de que y sea igual a 1,

expresado de otra forma: . De este modo el modelo dice que la

probabilidad de éxito es función lineal de las variables x, lo que se puede expresar

como,

Así mismo, dado que las probabilidades tienen que sumar uno podemos decir que

, que también es función lineal de las variables x. Este

modelo es llamado Modelo de Probabilidad Lineal (MPL) debido a la linealidad de

los parámetros del éste. El modelo se estima por Mínimos Cuadrados Ordinarios

(MCO) como un modelo común de regresión lineal múltiple.

La interpretación de los se puede entender como “la variación de la

probabilidad de éxito al variar , permaneciendo los demás factores constantes”

(Wooldridge, 2009):

Cuando se tiene variables independientes binarias el coeficiente que se obtiene

“mide la diferencia que se predice para la probabilidad en relación con el grupo

base” (Wooldridge, 2009)

N. MPL BASE DE DATOS WOOLDRIDGE (2009)

Page 21: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

21

Al ser el modelo estimado por MCO, en GRETL se debe seguir el proceso

explicado en la sección 3.1 con la variable independiente bivariada que exprese

una relación cualitativa.

Con el ánimo de evaluar los resultados de GRETL, se va a utilizar la base de

datos MROZ del libro de Wooldridge (2009) la cual se puede encontrar dentro de

la biblioteca de datos lista para instalar en el programa utilizando el enlace

especificado en la sección 2.2.2 de este documento.

4.1.1. Desventajas del MPL

El modelo MPL tiene dos desventajas principalmente que lo hacen débil frente a

los modelos que posteriormente se explicarán. La primera debilidad reside en

que es posible que se den, con ciertas combinaciones de las variables

independientes, resultados en donde la probabilidad es negativa o mayor a uno;

probabilidades que generan un problema de interpretación y que por lo tanto

requieren de un cambio en la forma de entender y estimar el modelo.

La segunda debilidad del modelo es que no se puede considerar que la

probabilidad esté relacionada linealmente con las variables independientes para

todos los valores, ciertos efectos sobre la variable dependiente varían en su

magnitud según aumenta la variable independiente, el MPL no es capaz de

recoger dichos cambios. Sin embargo, si los valores de las variables

independientes están cerca del promedio el modelo es útil para predecir.

4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA.

Los modelos Logit y Probit pueden superar las limitaciones que tienen los

modelos de probabilidad lineal vistos en la sección anterior, pero la principal

desventaja de estos modelos es el grado de dificultad que adquiere la

interpretación de estos.

Para especificar los modelos Logit y Probit se puede partir de la ecuación (3) y

hacer una variación para considerar una clase de modelos como el siguiente:

Donde G se considera una función con valores ente cero y uno estrictamente,

para todos los números reales z. Esta primera condición elimina el problema del

MPL de poder tener valores negativos o mayores a 1.

Por otro lado, la función G es una función no lineal que cumple con la

característica anterior de valores estrictamente entre cero y uno. Las funciones

que se han utilizado más ampliamente en las aplicaciones de modelos de variable

dependiente limitada son:

Page 22: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

22

Función logística (modelo Logit): función de distribución acumulada

para una variable logística estándar.

Se encuentra entre cero y uno para todos los números reales.

Función de distribución acumulada normal estándar (Modelo Probit):

Donde es la densidad normal estándar

Una forma de derivar los modelos Logit y Probit es a través de un modelo de

variable latente subyacente.

Se parte de considerar a como una variable inobservable determinada por la

ecuación (9) que introduce la notación de una función indicador, lo que

significa que esta función asume el valor de uno si se cumple la condición dentro

de los corchetes y de cero si no se cumple.

Los errores, se suponen independientes de y que tienen la distribución

logística estándar o la distribución normal estándar. Esto significa que en

cualquier caso los errores se distribuyen simétricamente en torno a cero y así

para todos los números reales z se tiene que .

Con las consideraciones anteriores es posible calcular la probabilidad de

respuesta para y en los modelos Logit y Probit como,

(

Recordando que en los modelos de respuesta binaria toma importancia explicar

los efectos de las variables independientes sobre la probabilidad de éxito, es

importante tener en cuenta que aunque a primera vista parezca que lo

importante está en mirar los efectos de las sobre la variable latente , en los

modelos Logit y Probit la dirección del efecto sobre y sobre

es la misma. De este modo, dado que la variable

latente regularmente no tiene una unidad de medida definida, toma mayor

Page 23: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

23

importancia la estimación de los efectos de las sobre la probabilidad de éxito.

Ahora el problema está en que la no linealidad de las funciones G complica la

estimación e interpretación de dichos modelos.

Para solucionar el problema hay que recurrir a la derivación, pues si es una

variable aproximadamente continua el efecto parcial sobre la probabilidad de

éxito, , se obtiene de la derivada parcial (Wooldridge, 2009), que

se define como:

Con G definida una función de distribución de probabilidad de una variable

aleatoria continua y g como una función de densidad de probabilidad. Al ser G

una función estrictamente creciente (como en los casos de Logit y Probit), g(z)

siempre va a ser mayor a cero y así de (11) se puede decir que el efecto de sobre

la probabilidad de éxito p(x) va a depender únicamente del signo de ,

reafirmando así su importancia en la explicación de los efectos.

Cuando hay variables explicativas binarias, el efecto parcial de que sea cero o

uno, ceteris paribus, es:

Que indica el cambio en la probabilidad de tener o no cierta característica

representada por la variable binaria, teniendo en cuenta las demás

características que permanecen constantes. En resumen el que representa la

variable binaria determinará el cambio en la probabilidad de éxito de acuerdo a

su signo y la cantidad en que varía se estima mediante (12).

También es útil utilizar (12) para mirar los cambios en la probabilidad para

variables discretas, de este modo se puede medir el efecto de que cambie de

a siguiendo la misma lógica:

Para estimar los modelos de variables dependientes limitadas es necesario utilizar

la Estimación de Máxima Verosimilitud (EMV) debido a la naturaleza no lineal de

los modelos utilizados.

Estos modelos se pueden poner bajo la forma: “Sea la función de

densidad para una extracción aleatoria de la población, condicional en ”

(Wooldridge, 2009), al suponerse que se tiene una muestra aleatoria de tamaño n,

la densidad de , para los modelos Logit y Probit, se determina por dos

Page 24: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

24

valores .

Concretamente, la densidad va a estar dada por:

Para = 0, 1. El estimador de máxima verosimilitud de maximiza la función de

log-verosimilitud:

El vector b es el argumento binario en el problema de maximización. En general

(Estimación de máxima verosimilitud) es consistente y tiene una distribución

normal aproximada en muestras grandes (Wooldridge, 2009).

Para los modelos Logit y Probit la función de log-verosimilitud se obtiene al

aplicar el logaritmo a la ecuación (14), lo cual, para la observación i quedaría

expresado como una función de los parámetros y los datos ( :

Así el problema de maximización que expresa (15) se puede escribir como:

Más adelante se revisará como GRETL realiza muestra los resultados del proceso

de estimación por máxima verosimilitud.

4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit

Con los paquetes econométricos los problemas de estimación de los modelos

debido a su complejidad deja de ser un problema, ahora toma importancia la

forma en cómo se interpretan las estimaciones que resultan. Anteriormente, se

dijo que los coeficientes resultantes de la estimación del modelo reflejan los

efectos parciales de cada sobre la probabilidad de respuesta, con una

significancia estadística determinada por la prueba de hipótesis , a un

nivel de significancia suficiente.

Inicialmente existe una medida de la bondad de ajuste del modelo conocido como

“porcentaje predicho correctamente” que consiste en definir un predictor binario

Page 25: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

25

de como uno si la probabilidad que el modelo predice es mayor o igual a 0.5 y

cero si ésta es menor de 0.5.

(18)

Con esta herramienta es posible observar que tan bien predice el a en cada

observación del modelo. En GRETL la salida que se obtiene al aplicar el modelo

contiene un análisis del porcentaje predicho correctamente y que observaremos

posteriormente. Una deficiencia de este método es que en casos particulares

puede no predecir correctamente el resultado menos probable.

Entre las variantes a este método está el de cambiar el umbral de acuerdo a la

fracción de éxitos en la muestra y partir de ahí para considerar si es 1 o 0. De

este modo si el porcentaje de éxitos en nuestra muestra es 7% en la ecuación (18)

hablaríamos de .

Al calcularse un modelo sin utilizar MCO, el que servía como medida para la

capacidad de ajuste del modelo ya no aplica, pues el procedimiento utilizado para

calcular no ha sido minimizando la varianza sino por máxima verosimilitud. El

equivalente para estos modelos ha sido conocido como pseudo . Uno de los

más utilizados y que GRETL calcula automáticamente al correr el modelo es el

Pseudo de McFadden que sugiere la siguiente medida:

Con como la función de log-verosimilitud para el modelo estimado y como

la función de log-verosimilitud con sólo el intercepto. “La log-verosimilitud del

modelo del intercepto es tratada como la suma total de cuadrados, y la log-

verosimilitud del modelo completo como la suma de los errores al cuadrado”

(UCLA, What are Pseudo R-squareds?) en comparación con el de MCO.

El ratio entre y nos muestra la capacidad de mejoramiento sobre el

modelo del intercepto que ofrece el modelo completo. Sabemos por la ecuación

(16) que las log-verosimilitudes de los modelos Logit y Probit siempre van a ser

negativas por lo cual , por lo tanto, si el modelo tiene baja

probabilidad la log-verosimilitud será mayor en valor absoluto que la de un

modelo con mayor probabilidad. Así, entre el ratio de log-verosimilitudes sea más

cercano a cero el será más cercano a uno, que indica que el modelo se ajusta

bien. Si el modelo completo no tiene poder explicativo el ratio va a ser cercano o

igual a 1, con lo que el del modelo será igual o cercano a 0.

Page 26: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

26

Para estimar los efectos de las sobre las probabilidades de éxito, se parte de la

derivada parcial y los efectos en el cambio de la probabilidad estimada de éxito

para cambios pequeños de , que se puede escribir como:

La dificultad de estimar el efecto está en que el factor de escala

depende de todas las variables explicativas, así que se tiene que recurrir a

diferentes medidas de como las medias, los máximos, los cuartiles, entre otras,

y así ver cómo cambia el factor.

Para GRETL el factor escalar es medido utilizando las variables explicativas en el

promedio muestral, de este modo “se obtiene el efecto parcial de para la

persona “promedio” en la muestra” (Wooldridge, 2009).

El procedimiento es realizado tanto para variables explicativas continuas como

discretas. Críticas y alternativas a este procedimiento en Wooldridge (2009).

4.2.2. Pruebas de hipótesis múltiples.

Para probar restricciones de exclusión en los modelos Logit y Probit existen tres

métodos: El multiplicador de Lagrange, el test de Wald y la Razón de

verosimilitudes. GRETL en el resultado que muestra al usuario aplica la Razón de

verosimilitudes.

La prueba de la razón de verosimilitudes parte de considerar que, dado que la

EMV maximiza la función de log-verosimilitud, la omisión de variables ocasiona

generalmente una log-verosimilitud no mayor a la del modelo completo. Así, la

prueba está basada en la diferencia de las funciones de log-verosimilitud entre un

modelo restringido y uno no restringido y de este modo se puede concluir si la

disminución en la log-verosimilitud es lo suficientemente grande para considerar

a las variables omitidas significativas.

Este estadístico es dos veces la diferencia de las log-verosimilitudes del modelo no

restringido ( ) y el restringido ( ).

) (21)

Con q como el número de restricciones de exclusión. La hipótesis nula del

contraste considera que los parámetros de las variables excluidas en el modelo

restringido son iguales a cero.

Page 27: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

27

4.3. CONCLUSIONES.

Como se observó anteriormente, los modelos Logit y Probit han surgido como

nuevos métodos para superar las deficiencias del modelo de regresión lineal

aplicado a variables endógenas restringidas (Modelo de Probabilidad Lineal) y así

generar predicciones más precisas sobre los fenómenos observados y modelados.

Sin embargo, se reconoce que la dificultad en el proceso de estimación e

interpretación del modelo es mayor para los modelos Logit y Probit, planteando

un nuevo reto a los investigadores en cuanto a cómo entender los resultados que

obtienen. Evaluar las salidas de los programas utilizados para estimar los

modelos toma cierta importancia en cuanto a las facilidades que le ofrece al

usuario.

Este apartado del documento busca únicamente ser una guía teórica de los

modelos MPL, Logit y Probit; con el fin de evaluar posteriormente los resultados

que GRETL arroja al usuario y su utilidad en la interpretación de dichos modelos.

5. APLICACIÓN DE MODELOS LOGIT Y PROBIT EN

GRETL.

Utilizando los mismos datos que se tomaron para ilustrar el proceso del MPL

(sección 4.1) se ejecutará GRETL utilizando en este caso los modelos Logit y

Probit.

Dentro de la pestaña modelo, de la barra de herramientas de la interfaz, aparece

la opción llamada Modelos no lineales, aquí se encontrarán los dos modelos en

cuestión, tal como lo muestra la figura M. En este caso, solo se están

considerando los modelos binarios o con variable endógena restringida, así que la

opción Binario es la única que será trabajada en este documento.

O. MODELOS NO LINEALES

Page 28: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

28

Al seleccionar la opción de aplicar el modelo Binario, tanto para Logit o Probit,

aparecerá la ventana de selección de variables que ya había sido explicada en el

apartado 3.1, las diferencias respecto a la explicada anteriormente son

nombradas en la Ilustración P, a saber, opciones para mirar pendientes o p-

valores, y detalles sobre iteraciones.

De acuerdo a la teoría explicada anteriormente, las pendientes en la media son

útiles para mirar los efectos parciales de las en la probabilidad de éxito. Debido

a que este efecto parcial depende de las , GRETL por defecto calcula ésta

pendiente en la media, lo cual indica que los resultados obtenidos se interpretan

respecto al “individuo promedio” de la muestra. Los detalles sobre las iteraciones

mostrarán los valores de la función de log-verosimilitud de cada iteración

realizada hasta maximizar la función.

P. ESPECIFICACIÓN DE LOGIT

Dentro de la salida de GRETL para la estimación de un modelo no lineal con

variable restringida, aparecen ciertos recursos estadísticos de gran ayuda para la

interpretación de los resultados por parte del usuario. De acuerdo a la teoría

enunciada anteriormente los más importantes son: El pseudo de McFadden, El

contraste de razón de verosimilitudes, el número de casos “correctamente

predichos” y un cuadro que muestra en detalle el acierto del modelo en su

predicción mediante la comparación entre los predichos y los observados.

Page 29: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

29

Q. SALIDA LOGIT (CON DETALLES DE ITERACIONES)

Por supuesto, en la parte central de la salida aparecerán los coeficientes

estimados, la desviación típica, las pendientes o los p-valores según la elección

tomada al momento de especificar el modelo.

Una de las opciones que puede ser interesante para contrastar el modelo es el

Test de Wald, aunque no se revisó teoría sobre este permite probar restricciones

múltiples sobre el modelo y cumple una función similar a la del estadístico de

razón de verosimilitudes.

R. OMISIÓN DE VARIABLES, TEST DE WALD

Page 30: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

30

Los pasos para llevar a cabo este test es mediante la opción contrastes que

aparece en la barra de herramientas de la ventana de salida del programa.

Mediante la opción omitir variables el programa permitirá estimar otro modelo

con variables omitidas o restringidas.

La Ilustración P muestra la ventana para la omisión de variables. Los pasos a

seguir son: seleccionar las variables a omitir y seleccionar la opción de Contraste

de Wald. La hipótesis nula de la prueba es que los parámetros de las variables

omitidas son cero.

La salida generada por esta prueba mostrará detalles sobre la hipótesis nula y el

estadístico de contraste utilizado. Si se comparan los resultados del contraste de

Razón de Verosimilitudes y el de Wald los resultados generalmente tendrán

conclusiones similares.

S. CONTRASTE DE OMISIÓN DE WALD

Otro forma por medio de la cual se puede estimar un modelo Logit o Probit es el

mediante la consola de GRETL se hace mediante el comando Logit o probit, según

sea el caso. El comando solo pide la especificación de las variables separadas por

un espacio. Para activar opciones adicionales como ver los p-valores en vez de las

pendientes (p-values), errores estándar robustos (robust), mostrar la matriz de

covarianzas (VCV) o mostrar detalles de las iteraciones (verbose); sólo hay que

dejar un espacio después de las variables escribir dos guiones seguido de la

opción u opciones que deseamos, tal como se muestra a continuación:

logit inlf const nwifeinc exper expersq kidslt6 --verbose --vcv

Para llevar a cabo pruebas de restricción múltiples y en este caso el test de Wald,

el comando es omit, seguido de las variables a restringir y la opción de Wald:

omit nwifeinc exper expersq kidslt6 --wald

Así se llegará al mismo resultado descrito anteriormente.

Page 31: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

31

Debido a que la única diferencia entre la aplicación de un modelo Logit y Probit

está en la función utilizada, para efectos del proceso necesario en el software para

su estimación no varía en absoluto.

6. APLICACIÓN DE LOGIT Y PROBIT EN STATA.

Como una forma de comparar los resultados obtenidos en GRETL, se pretende a

continuación hacer una exposición rápida de la estimación de un modelo Logit o

Probit mediante STATA. Al ser reconocido STATA como uno de los programas de

estadística más completos en el mercado, éste será un buen referente para

comparar los resultados obtenidos con GRETL. A continuación se explicarán los

comandos y paquetes necesarios para la estimación del modelo y todos los pasos

para su consecución. Se seguirá trabajando con la misma base de datos que ha

venido utilizándose en el documento.

Para la estimación de un modelo Logit o Probit es STATA hay que utilizar los

mismos comandos Logit o Probit, según sea el caso. Cuando no se adhieren

opciones adicionales para la estimación del modelo la estructura del código

utilizado en GRETL y STATA es el mismo.

T. LOGIT EN STATA

Sin embargo, la salida por defecto de Stata, en comparación a la de GRETL, no

contiene información sobre las pendientes del modelo respecto a cada variable

exógena, que como se revisó en la teoría es la única herramienta que permite la

explicación de los efectos de las variables independientes sobre la probabilidad de

éxito. Para conseguir esta información en Stata se recurre al comando mfx, el

cual arroja información tal como muestra la Ilustración U.

Page 32: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

32

U. MODELO LOGIT CON PENDIENTES EN STATA

El test de Wald y la razón de verosimilitudes son ejecutados por Stata mediante

dos comandos: test y lrtest, respectivamente. Para el primero, simplemente se

necesita haber corrido el modelo deseado, después se ejecuta el comando test

seguido de las variables que se van a omitir y el software calcula la prueba y

arroja el p-valor correspondiente. El resultado de este proceso se observa en la

Ilustración V.

V. TEST DE WALD EN STATA

Para calcular el estadístico de razón de verosimilitudes el proceso que se debe

realizar no es tan intuitivo como el test de Wald, en este caso se deben hacer

unos cuántos pasos antes de ejecutar el comando lrtest que calcula el estadístico,

pues este comando pide especificar los dos modelos (restringido y no restringido)

que va a ser comparados.

Por tal motivo es necesario (mediante el comando estimates store el cual nos

permite guardar los modelos estimados dándoles un nombre) guardar las

estimaciones del modelo restringido y no restringido, para el modelo restringido

tan sólo hay que ejecutar el modelo con la variable independiente. Los comandos

necesarios para la estimación del test en el ejemplo que ha sido trabajado en todo

el documento se especifican en la Ilustración W.

Page 33: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

33

W. ESTIMACIÓN RAZÓN DE VEROSIMILITUDES EN STATA

Por último, el comando que permite ver los casos “correctamente predichos” es

estat classification el cual muestra principalmente el cuadro de predichos y

observados con los casos en que el modelo predijo correctamente respecto al dato

observado (al igual que en GRETL se considera predicho correctamente cuando el

valor observado es uno y el valor de la estimación es mayor a 0,5; o cuando el

observado es 0 y la estimación menor a 0,5). En la salida de Stata “True D”

representa un dato observado de 1 y “Classified +” una estimación mayor a 0,5.

X. CASOS CORRECTAMENTE PREDICHOS EN STATA

En el último campo de la salida del comando estat classification aparece el

porcentaje de casos correctamente predichos el cual sirve para mirar que tan

bueno fue el modelo especificado.

Page 34: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

34

7. CONCLUSIÓN.

Aunque no se han explorado más funcionalidades de GRETL y Stata para la

estimación de modelos no lineales con variable dependiente limitada, se ha hecho

una revisión de los principales comandos que le permitirían al estudiante o

investigador estimar e interpretar en un nivel básico un modelo no lineal de este

tipo.

Respecto a los dos software utilizados, es posible observar que las estimaciones y

pruebas realizadas no varían entre los dos programas, por lo cual arrojan los

mismos datos y conclusiones. Además, las salidas que se obtiene de los dos

programas tienen un aspecto similar que permite una fácil comprensión por parte

del usuario; en este punto es importante decir que GRETL genera la mayoría de

cálculos con el mismo comando mientras que en Stata se deben buscar diversos

comandos para analizar el modelo estimado, esto sin duda presenta una

diferencia entre GRETL y Stata, pues para los nuevos usuarios puede llegar a ser

más complicada la búsqueda de los comandos necesarios para llegar a buenas

conclusiones.

Esto demuestra que GRETL al ser software libre de código abierto, se presenta

como un programa útil para el análisis econométrico con buenas estimaciones,

una interfaz agradable e intuitiva en varios idiomas, de fácil instalación y

disponible para cualquier usuario. Aunque todavía necesite desarrollos que

fortalezcan su potencia en la ejecución de varios modelos, se presenta como una

oportunidad para los usuarios que no pueden acceder a otros programas por los

altos costos de las licencias o por la dificultad de entender cómo funcionan.

Además, al ofrecer una librería gratuita con gran cantidad de bases de datos de

los libros más reconocidos en la enseñanza de la econometría, GRETL se

convierte en una herramienta muy interesante para el aprendizaje.

Modelos como Logit y Probit son utilizados recurrentemente para la estimación de

fenómenos en el mundo real, sin embargo debido a lo complejo que es su

estimación no son tomados en cuenta en los cursos básicos. La pertinencia de

aplicar modelos que no son vistos en la línea de econometría del programa de

pregrado de la Facultad utilizando interfaces tan intuitivas como GRETL, está en

que los estudiantes y las personas interesadas en profundizar en temas

diferentes, como los modelos no lineales estudiados aquí, no necesitan de un

tutor o profesor que los guíe sino de una guía teórica y práctica que los

introduzca en el tema y les ofrezca las bases, incentivando así el auto-

aprendizaje como complemento a la formación que se recibe en las aulas.

Page 35: Aplicacion de modelos  no lineales dependiente_limitada.pdf

INV- Modelos no lineales en GRETL/2011-II

8. REFERENCIAS.

Cottrell, A., & Lucchetti, R. (Julio de 2011). GRETL user´s guide. Recuperado el 9

de Septiembre de 2011, de GRETL Web page:

http://gretl.ecn.wfu.edu/pub/gretl/manual/PDF/gretl-guide-a4.pdf

UCLA. (s.f.). Stata Data Analysis Examples: Logistic regression. Recuperado el 25

de Noviembre de 2011, de http://www.ats.ucla.edu/stat/stata/dae/logit.htm

UCLA. (s.f.). What are Pseudo R-squareds? Recuperado el 16 de Noviembre de

2011, de

http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm

Wooldridge, J. (2009). Introductory Econometrics: A modern approach. Cengage

Learning.