Inferencia en el modelo lineal

Embed Size (px)

Citation preview

  • 7/26/2019 Inferencia en el modelo lineal

    1/50

    UNIDAD III

    Qu es la inferencia en el modelolneal?

  • 7/26/2019 Inferencia en el modelo lineal

    2/50

    UNIDAD III

    Qu es la inferencia en el modelolineal?

    Toda empresa extraordinaria slo puede lograrse mediante la aplicacin de una extrema cautela

    en lo relacionado con sus comienzos y basesI Ching

    Qu es un intervalo de confianza, una dcima de hiptesis? Qu es un coeficiente de determinacin, de correlacin y de determinacin? En que consiste la inferencia en el modelo lineal, el anlisis de varianza total y parcial? Qu permite la prueba de Reset de Ramsey? En qu consiste el anlisis de la estabilidad estructural?

    Con formato:Fuente: Times New

    Roman

  • 7/26/2019 Inferencia en el modelo lineal

    3/50

    108

    INFERENCIA EN EL MODELO LINEAL

    ESQUEMA CONCEPTUAL

    COMPETENCIAS A LOGRAR

    CONCEPTUAL PROCEDIMENTAL ACTITUDINALExplica que es una

    inferencia, intervalos ycoeficientes utilizados.

    Ejecuta el proceso de

    inferencia para explicarlas variables.

    Valora y analiza los

    modelos de prediccin

    CONCEPTOS CLAVE

    Inferencia, intervalos, coeficientes, varianza.

    INFERENCIA EN EL MODELOLINEAL

    Intervalos de confianza

    I. C. para los parmetros

    Construccin de intervalos

    Dcima de hiptesis individual

    Coeficientes

    De determinacin

    De Correlacin

    Anlisis de Varianza

    Total

    Parcial

  • 7/26/2019 Inferencia en el modelo lineal

    4/50

    109

    LECCIN 1

    INTERVALO DE CONFIANZA

    1. ESTIMACIN

    La estimacin puntual. La estimacin de intervalo

    La estimacin puntual.- Se vale de un estadstico para estimar el parmetro en un slovalor o punto.

    Una estimacin de intervalo.- Es la que define un intervalo probable (nivel deconfianza) dentro del cual puede estar el parmetro desconocido.

    Ejemplo de estimadoresSi se desea conocer el nivel de ingresos promedio mensual de los hogares deldepartamento de Lima en el ao 2004, es difcil calcular la media de toda la poblacin.Es ms fcil calcular la media de una muestra de hogares y a partir de ella hacer unaestimacin de la media poblacional.

    El ejemplo de estimacin puntual de la media poblacional sera el valor que resultade una muestra de n = 500 hogares y hallar X= 437.10 nuevos soles.

    El ejemplo de estimacin de intervalosera asegurar con un 95% de confianza que elingreso promedio se encuentra entre 325.60 y 548.60 nuevos soles.

    Es decir una estimacin puntual utiliza un nmero o valor nico para determinar unaestimacin del parmetro. Un intervalo de confianza denota un rango o recorrido dentrodel cual se podra encontrar el parmetro dado un nivel de confianza.

    Nivel de confianza.Es la probabilidad (1-), (generalmente expresada en porcentaje) de contener dentro desus lmites el valor verdadero del parmetro. Los ms usados convencionalmente sontres: 99, 95 y 90%. Un ejemplo para este caso estara formado por el ingreso promedio(media poblacional), de una empresa dedicada a la venta de artculos para oficina queespera obtener al 95% de probabilidad entre 35000 y 38000 nuevos soles de ingresospara el mes de junio del 2004.

    El principio del intervalo de confianza.- Todo intervalo de confianza tiene un lmitesuperior y un lmite inferior de confianza.

    2. INTERVALO DE CONFIANZA PARA LOS PARMETROS

    A fin de establecer los intervalos de confianza para los coeficientes de regresin (i) yteniendo la varianza poblacional desconocida se construye un intervalo asumiendo queesta variable tiene una distribucin estadstica t- student.Es as que el intervalo deconfianza para 1se define como:

  • 7/26/2019 Inferencia en el modelo lineal

    5/50

    110

    =+

  • 7/26/2019 Inferencia en el modelo lineal

    6/50

    111

    Aplicando el paquete E-views, se obtienen los siguientes resultados:

    Dependent Variable: YMethod: Least SquaresDate: 08/27/02 Time: 15:13Sample: 1990 2001Included observations: 12

    Variable Coefficient Std. Error t-Statistic Prob.C 2.209520 6.334633 0.348800 0.7345X 1.061520 0.212218 5.002038 0.0005R-squared 0.714452 Mean dependent var 19.30000Adjusted R-squared 0.685897 S.D. dependent var 32.97040S.E. of regression 18.47822 Akaike info criterion 8.822074

    Sum squared resid 3414.446 Schwarz criterion 8.902892Log likelihood -50.93244 F-statistic 25.02038Durbin-Watson stat 0.918447 Prob(F-statistic) 0.000536

    En el cual se observa que los valores estimados de los parmetros son:

    2.2095201= ;que significa que cuando la Tasa anual de retorno es nula el FondoAfuture es de 2.209520.

    1.061520 2= Es decir que por una unidad porcentual que aumente la tasa de retorno, elfondo Afuture aumentar en 1.06152.

    Con los datos de las salidas, se calcularn los intervalos de confianza para dichosparmetros estimados con un nivel de confianza del 95%.

    Por lo tanto se puede decir que el fondo Afuture mnimo (1) estar entre -11.904 y16.323 con un 95% de confianza.

    ( )

    ( )

    ( ) 5%16.32311.904-P

    0.05.950-12.228*6.3346332.2095202.228*6.3346332.209520P

    -1t,tP

    1

    1

    2/1112/11

    =

  • 7/26/2019 Inferencia en el modelo lineal

    7/50

    112

    3. DCIMAS DE HIPTESIS

    Se realiza con el fin de determinar si los coeficientes son significativos, es decirdiferentes de cero.

    1. Planteamiento de hiptesis

    H0: i=0 hiptesis nulaH1: i0 hiptesis alternativa

    2. Estadstico de contrasteUtilizando la distribucin t-student el estadstico de contraste se define como:

    iii

    0

    t

    iiii

    =

    =

    =

    3. Nivel de significancia (): Es la probabilidad de error al afirmar que elcoeficiente es diferente de cero, tambin se le conoce como la probabilidad decometer el Error de tipo I, es decir, Rechazar Ho cuando es verdadera.

    4. Establecer una regin crtica (RC ) o zona de rechazo de la hiptesis nula.

    RC = (t /tc > t(n-k, 1-/2) tc< -t(n-k, 1-/2) )

    (1-) zona de aceptacin de hiptesis nula 0i =

    2/1c2/1 ttt:Si

  • 7/26/2019 Inferencia en el modelo lineal

    8/50

    113

    Si el t calculado cae dentro de la regin crtica (RC), se rechaza la hiptesis nula,

    por lo tanto 0i , en consecuencia iX si explica el comportamiento de lavariable dependiente. Se concluye que el coeficiente de la variable essignificativo.

    Enfoque del Intervalo de Confianza

    1. El primer paso es construir un intervalo de confianza para los parmetros(coeficientes de regresin):

    =+

  • 7/26/2019 Inferencia en el modelo lineal

    9/50

    114

    4. Regin crtica (RC)Regin de aceptacin

    RCRC

    como 228.2t0020.5t 025.0,10c =>= se Rechaza Ho

    Por lo tanto se concluye que ser rechazada la hiptesis H0, es decir que elcomportamiento del fondo Afuture (Y) es explicado por la tasa de retorno (X)

    - Por el Enfoque del Intervalo de Confianza:

    ( )

    ( )

    ( ) 5%91.534589.0:tantolopor

    0.95.050-12.228*0.2122181.061522.228*0.2122181.06152

    :tienesemostradonteanteriormelopor,-1,

    2

    2

    2/2222/22

    =

  • 7/26/2019 Inferencia en el modelo lineal

    10/50

    115

    ( )

    +=24

    23C

    6

    2AnJB

    Donde A significa asimetra y C apuntamiento o curtosis.

    ( )[ ]( )[ ]32

    23

    xE

    xEA

    =

    ( )

    ( )[ ]424

    xE

    xEC

    =

    Habitualmente la probabilidad de rechazar la hiptesis nula es del 5%

    Ejemplo:

    En el grfico adjunto (elaborado en el paquete E-views1

    ), para el modelo anterior sobreel fondo Afuture (Yt) en funcin a las tasas anuales de retorno (Xt), podemos observaruna serie de indicadores relacionados con el trmino de perturbacin a partir del anlisisde los residuales en la serie 1990-2001 (e) que como se sabe son sus estimadores :

    0

    2

    4

    6

    8

    -40 -30 -20 -10 0 10 20 30 40 50

    Series: ResidualsSample 1990 2001Observations 12

    Mean -5.56E-15Median 0.538596Maximum 44.59083

    Minimum -30.77794Std. Dev. 17.61829Skewness 0.971084Kurtosis 5.060079

    Jarque-Bera 4.007968Probability 0.134797

    Se observa que el valor del estadstico es de 4.007; al mismo tiempo la probabilidadasociada al estadstico Jarque Bera (0.134797).Es decir la probabilidad de rechazar lahiptesis nula es de 13%; que es mayor al 5%. Por lo tanto no podemos rechazar lahiptesis nula de normalidad de los errores.

    Se concluye que se cumple el supuesto de normalidad de los errores del Modelo LinealGeneral.

    1Ver Anexo: La Inferencia Estadstica y el Programa E-Views

  • 7/26/2019 Inferencia en el modelo lineal

    11/50

    116

    LECCIN 2

    COEFICIENTE DE DETERMINACIN, CORRELACIN YDETERMINACIN MLTIPLE

    1. COEFICIENTE DE DETERMINACIN (R2)

    Es un indicador de la bondad de ajuste de la lnea de regresin, que mide laproporcin de la variacin total en la variable dependiente Y, que se explica o sedebe a la variacin de la(s) variable(s) independiente(s) X.

    Para obtener el R2 ser necesario descomponer la variacin de Y, lo cual se puedeilustrar en el grfico siguiente:

    En este grfico se observa que la variacin total entre el punto Yi y el promedio Y :YYi se puede dividir en la variacin ii YY y YYi

    Planteada la relacin inicial, sta se mantendr cuando se establezcan las relaciones apartir de las sumatorias de sus desviaciones cuadrticas, por lo tanto:

    ( )2

    i

    2

    ii

    2

    i YYYYYY

    +

    =

    SCESCRSCT += Donde:

    SCT (Suma Total del Cuadrado): Variacin total del Yi observado con respecto a sumedia muestral,

    ( ) 22i2

    i YnYYYSCT ==

    SCR (Suma de los Cuadrados Residuales): Variacin residual o no explicada de losvalores de Y respecto a la lnea de regresin.

    ( ) 2i21i2

    ii )XY(YYSCR ==

    YYi

    YYi

    ii YY Y

    Y

    Xi

    (Xi, Yi)Yi

  • 7/26/2019 Inferencia en el modelo lineal

    12/50

    117

    SCE (Suma de los cuadrados explicados): Variacin de los valores estimados Y i conrespecto a su media.

    ( ) 2i212

    i )YX(YYSCE ==

    Luego R2se define como:

    1R0SCTSCR

    1SCTSCE

    R 22 ==

    El coeficiente de determinacin se interpreta como la proporcin de la variacin total deY que la regresin es capaz de explicar. Es decir, el R2 mide la efectividad que posee la

    variable independiente X para explicar la variacin que la variable dependienteexperimenta a lo largo de la muestra. Por lo tanto, cuando R2es muy cercano a 1 se diceque el modelo de regresin es capaz de explicar un alto porcentaje de las variacionesque registra la variable explicada.

    Propiedades

    1. Es una cantidad no negativa.

    2. Sus lmites son 1R0 2 , por lo que R variar entre cero y uno.

    R2=1 cuando el ajuste es perfecto, es decir los valores observados coincidenperfectamente con la recta estimada

    R20 es decir que no hay relacin entre la variable dependiente y las variablesexplicativas.

    Este R2 no mide el grado de asociacin entre x e y, para ello se acude a otro indicadorque es el Coeficiente de correlacin (R)

    Nota:Para la regresin lineal mltiple la interpretacin es similar, es decir el R2mide elnivel de ajuste de las variables independientes con respecto a la variable dependiente, suclculo manual es ms complejo por lo cual necesitaremos de un paquete (software)estadstico (SPSS).

  • 7/26/2019 Inferencia en el modelo lineal

    13/50

    118

    2. COEFICIENTE DE CORRELACIN

    Es una medida de asociacin lineal entre dos variables

    Poblacional Muestral

    ( ) ( )( )

    ( ) ( )1n

    YY

    1n

    XX

    YYXXY,XCovr

    2i

    2i

    ii

    2y

    2x

    =

    =

    DondeSCTSCR

    1SCTSCE

    Rr 2 === ; siendo el signo de la correlacin el mismo

    al del coeficiente estimado.

    Propiedades

    Sus lmites estn entre: 1r1

    - Es de naturaleza simtrica, es decir el coeficiente de correlacin entre X e Y (rxy)es igual al coeficiente de correlacin entre Y y X (ryx)

    - Si X, Y son estadsticamente independientes, el coeficiente de correlacin escero; pero si r = 0 no implica necesariamente independencia entre las variables.

    - Es una medida de asociacin lineal, es decir mide la asociacin lineal entre dos

    variables.- El signo negativo indica una relacin inversa es decir a medida que aumenta (o

    disminuye) la variable X, la variable Y disminuye (o aumenta), mientras que elsigno positivo indica una relacin directa, es decir a medida que aumenta (odisminuye) la variable X , la variable Y tambin aumenta (o disminuye)

    Nota:Para el caso mltiple el Coeficiente de Correlacin Global R vara entre 0 y 1, yse interpreta como el grado de asociacin entre las variables explicativas y la variabledependiente.

    3. COEFICIENTE DE DETERMINACIN MLTIPLE CORREGIDO

    En el caso de regresin lineal mltiple, en ocasiones se desea comparar el nivel deajuste que pueden proporcionar diferentes combinaciones de variables explicativas conrespecto a una variable dependiente comn, para ello el R2no es muy preciso, pues amedida que el nmero de variables independientes se incrementa, el R2 tiende aincrementarse, es decir que el valor R2favorecera a los modelos con mayor cantidad devariables, para corregir esta deficiencia se construye un coeficiente R2corregido por losgrados de libertad.

  • 7/26/2019 Inferencia en el modelo lineal

    14/50

    119

    ( )

    ( ) 11

    1

    1

    2

    =

    =

    nSCT

    knSCR

    nYY

    knYYR

    i

    ii

    Ejercicio ilustrativo:

    Volviendo al modelo sobre el fondo Afuture (Y t) en funcin a las tasas anuales deretorno (Xt), y las salidas, obtenemos el coeficiente de determinacin y el Coeficientede determinacin mltiple corregido:

    R-squared 0.714452Adjusted R-squared 0.685897

    El R2es 0.714; es cercano a 1, por lo tanto se concluye que el modelo de regresin es

    capaz de explicar un alto porcentaje de las variaciones que registra la variable explicada(fondo Afuture).

    Evaluando el2

    R , este tambin es alto 0.685.

    El coeficiente de correlacin se calcula mediante: 2Rr = y dado que el coeficiente1.061520 2= , es positivo, entonces el coeficiente de correlacin tambin toma el signo

    positivo:

    0.8450.714Rr 2 ==+=

    Se concluye que la asociacin lineal entre la variable independiente e independiente, esalta y directa. Es decir, cuando aumenta la tasa de retorno (Xt), aumenta el fondoAfuture (Yt).

  • 7/26/2019 Inferencia en el modelo lineal

    15/50

    120

    LECCIN 3

    INFERENCIA EN EL MODELO LINEAL

    El proceso de inferencia consiste en establecer la validez de determinadas afirmacionesacerca de los parmetros (desconocidos) utilizando un estimador obtenido a partir deuna muestra, pero del cual se puede determinar su distribucin muestral.

    1. ANALISIS DE VARIANZA

    El anlisis de varianza tiene por finalidad investigar la explicacin conjunta de todas lasvariables explicativas que participan en el modelo. Es decir, mide la significancia delmodelo de regresin lineal mltiple, a partir del estudio de los componentes de la

    variabilidad total.

    SCT = SCR + SCE

    El anlisis de varianza se interpreta mediante la siguiente tabla ANOVA (Anlisis OfVariance):

    Fuentes deVariacin

    Grados delibertad

    Suma decuadrados

    CuadradoMedio

    Estadstico FF-calculado

    Explicada por lasvariables Xi queintervienen en el

    modelo

    k-1 SCE1k

    SCECME

    =

    CMRCME

    Fc =

    Residual n-k SCRkn

    SCRCMR

    =

    Total n-1 SCT=SCE+SCR

    Donde:SCT: Suma Total del CuadradoSCR: Suma de los Cuadrados ResidualesSCE: Suma de los Cuadrados Explicados

    CME: Cuadrado Medio ExplicadaCMR: Cuadrado Medio Residual

    k: Nmero de parmetros estimados (nmero de variables independientes msuno).

    n: Tamao de muestra o nmero de unidades de anlisis (personas, hogares,empresas, reas de trabajo, etc.)

    En esta tabla se distinguen las tres fuentes de variacin y su finalidad es construir elestadstico de contraste F, que podr ser usado para contrastar la hiptesis designificacin conjunta de las variables independientes

  • 7/26/2019 Inferencia en el modelo lineal

    16/50

    121

    a)Planteamiento de hiptesis (significancia del modelo)

    El anlisis de varianza plantea una prueba global de los parmetros (coeficientes deregresin) con la lgica de que, si al menos uno de los coeficientes de regresin esdiferente de cero el modelo es significativo, por ello las hiptesis se plantean:

    H0: i = 0 para i = 1,2,, k-1H1: Al menos un i0 para i = 1,2,, k-1

    b)Estadstico de contraste (F)

    El estadstico que nos ayuda a probar la hiptesis anterior es como se menciona en latabla ANOVA:

    CMRCME

    Fc= , la cual se distribuye con una F-Fisher con (k-1, n-k) grados de

    libertad

    c)Nivel de Significancia ()

    Se plantea un nivel de error al rechazar Ho, normalmente es del 5%

    d)Regin Crtica (RC)

    Se acepta H0si k-n1;-k;FF

    Se rechaza H0si k-n1;-k;FF > ,es decir, rechazamos H0para valores grandes de F.

    1- R.C

    F1-

  • 7/26/2019 Inferencia en el modelo lineal

    17/50

    122

    2. ANLISIS DE VARIANZA PARCIAL

    Usado para la comparacin de modelos, en donde es posible determinar si laincorporacin de alguna variable o grupo de ellas pueden explicar mejor el modelo.

    Fuente de VariacinSuma de

    CuadradosG.L. Media de Cuadrados

    Debido a:

    r1 X,....,X

    Debido a:

    sr1rr1 X,...,X,X,....,X ++

    ISCE

    SCE II

    r 1

    (r 1)+s

    1r/SCE I

    s)1-/(rSCE II +

    Debido a:

    sr1r X,...,X ++

    Residual del ModII

    SCE-SCESCE IIIs=

    IISCR

    s

    n (r+s)

    sSCEs

    s)(rnSCRII +

    Total SCT n - 1

    r: Nmero de variables consideradas en el primer modelos: Nmero de variables consideradas en el segundo modelo

    SCR: Suma de los Cuadrados ResidualesSCEI: Suma de los Cuadrados Explicados del primer modelo

    SCEII: Suma de los Cuadrados Explicados del primer modelo

    Entonces:

    )(/

    /

    srnSCR

    sSCEF

    II

    s

    C += ( Valor comparado con el obtenido de tabla)

    a)Planteamiento de hiptesis

    H0: r+1= r+2=.....=s= 0

    H1: r+1r+2.....r+s0

    b)Regin Crtica (RC)

    Bajo el enfoque de la prueba de significancia, se construye la regin crtica de lasiguiente manera:

    F}F{R.C. C>=

    Siendo: s)(r-ns,FF +=

    Se acepta H0si FFc

  • 7/26/2019 Inferencia en el modelo lineal

    18/50

    123

    Se rechaza H0si FFc> Es decir, rechazamos H0para valores grandes a F, es decir, la

    incorporacin de variables mejorara el modelo.

    Ejemplo:

    Se tiene los siguientes modelos para el consumo (C) de las familias

    ( )( )IIITPRYNDC

    IYNDC4321

    211+++=

    +=

    Donde:YND : Ingreso DisponiblePR : PreciosTI : Tasa de inters

    Adems la tabla de anlisis de varianza es:

    Fuente de VariacinSuma de Cuadrados G.L.

    Media deCuadrados

    Debido a: YND

    Debido a: YND, PR, TI

    SCEI= 963188.02

    SCEII= 1002196.15

    2 1

    (2 1)+2

    963188.02 / 1

    100219.15 / 3

    Debido a: PR, TI

    Residual del ModII

    SCEs=1002196.15 963188.02

    = 39008.13

    SCR = 155862.6

    2

    19- 4

    39008.13 / 2... (A)

    155862.60 /15...(B)

    Entonces: 877.184.1039007.19504

    BA

    FC === (que se compara con el de la tabla)

    F2,15; 0.05= 3.68 (valor obtenido de tabla)

    Dado que: FC= 1.877 < F2,15; 0.05= 3.68.Se concluye que la incorporacin de las variables precios relativos y la tasa de intersgeneral no mejoran la explicacin del modelo, estando ya incorporada la variable

    ingreso disponible.

  • 7/26/2019 Inferencia en el modelo lineal

    19/50

    124

    LECCIN 4

    CORRECTAMENTE ESPECIFICACIN DEL MODELO:TEST DE RESET DE RAMSEY

    La prueba de Reset de Ramsey permite comprobar la correcta especificacin polinmicade un modelo estimado.

    El contraste se basa en la prueba de regresin aumentada tal como se indica acontinuacin.

    - Si la regresin actual es:+= XY

    - El test construir la siguiente relacin:

    ++= ZXY

    Donde las variables en la matriz Z son regresores presumiblemente omitidos en laregresin original. La prueba de hiptesis que se llevar a cabo, intentar contrastar si es nulo.

    Supongamos por ejemplo que el modelo inicial es el siguiente:

    XXY 33221 +++=

    Si la verdadera forma del modelo es la que se muestra a continuacin, se tiene unaespecificacin incorrecta del modelo inicial, debido a la omisin de la variable X1elevada al cuadrado.

    XXXY 2333221 ++++=

    Luego, la estructura de la ecuacin coincide con la planteada para el test.

    Para un segundo ejemplo supngase que la especificacin correcta del modelo fuera:

    XXaY 32 a3a21 +=

    Dicha forma corresponde a un modelo no lineal, sin embargo es posible contrastar estahiptesis mediante la estructura de la ecuacin de prueba del test de Ramsey, ya que lamatriz Z podra estar construida de las potencias enteras productos cruzados de todas lasvariables explicativas incluidas en el modelo original.

    Adems para realizar esta prueba no hace falta incluir explcitamente todas las potenciasy variables cruzadas en el modelo de prueba, ya que para este fin puede utilizarse eltrmino ajustado del modelo.

  • 7/26/2019 Inferencia en el modelo lineal

    20/50

    125

    Obsrvese que, dado: XaXaaY 33221 ++=

    Se tiene:)XaXaa(Y 233221

    2 ++=

    )XaXaa(Y 3332213 ++=

    En el desarrollo de las potencias anteriores se tendrn potencias y productos cruzados detodas las variables incluidas en el modelo original.

    La implementacin del Test de Ramsey, se realiza en dos etapas.

    - En la primera, se estima en el modelo sujeto a anlisis en su forma original:

    XXY 33221 +++=

    - En la segunda, se toma la serie estimada por los parmetros de la regresin anterior yse anexan sus potenciales enteras a la misma regresin como parmetros auxiliares:

    u...)YY(XXY 332

    233221 ++++++=

    La dcima de hiptesis que se realiza en este caso ser:

    0:H0....YY:H

    1

    33

    220

    =++=

    Estadstico de prueba:

    ( )( )( )nuevomodeloelenparametrosdenumeronR1

    nuevosregresoresde/nmeroRRF 2

    nuevo

    2viejo

    2nuevo

    =

    Ejercicio ilustrativo

    Retomando el modelo sobre el fondo Afuture (Yt) en funcin a las tasas anuales deretorno (Xt), y las salidas, obtenemos el test de Ramsey (elaborado en el paqueteEviews):

    La hiptesis:

    H0: El modelo est correctamente especificadoH1: El modelo no est correctamente especificado

    El nivel de significancia () o la probabilidad de rechazar la hiptesis nula cuando esverdadera es del 5%. La prueba se hace utilizando el estadstico FEl test de Reset Ramsey indica que aadiendo 2 trminos al test Y2, Y3 el valor delestadstico F es 1.16 y la probabilidad asociada al error de rechazar la hiptesis nulacuando es verdadera es de 35.99% mayor al 5%; por lo tanto se acepta que el modeloest correctamente especificado.

  • 7/26/2019 Inferencia en el modelo lineal

    21/50

    126

    Ramsey RESET Test:

    F-statistic 1.164495 Probability 0.359856Log likelihood ratio 3.066156 Probability 0.215870Test Equation:Dependent Variable: YMethod: Least SquaresDate: 08/27/02 Time: 16:20Sample: 1990 2001Included observations: 12

    Variable Coefficient Std. Error t-Statistic Prob.C 11.24011 11.44699 0.981928 0.3549X 1.211993 0.393447 3.080453 0.0151

    FITTED^2 -0.016729 0.017389 -0.962047 0.3642FITTED^3 0.000151 0.000293 0.515680 0.6200

    R-squared 0.778838 Mean dependent var 19.30000Adjusted R-squared 0.695902 S.D. dependent var 32.97040S.E. of regression 18.18156 Akaike info criterion 8.899894Sum squared resid 2644.553 Schwarz criterion 9.061530Log likelihood -49.39937 F-statistic 9.390841Durbin-Watson stat 1.244793 Prob(F-statistic) 0.005340

  • 7/26/2019 Inferencia en el modelo lineal

    22/50

    127

    LECCIN 5

    ANLISIS DE LA ESTABILIDAD ESTRUCTURAL

    Uno de los supuestos que se acepta al estimar el modelo de regresin, es que los valoresde los estimadores de los parmetros se mantienen constantes para la muestra utilizada.Es decir, la relacin planteada es vlida para todas las observaciones, y que no hayelementos que muestren patrones de relacin diferente. Para verificar estos supuestosexisten 3 tipos de contrastes: A partir de la prueba de Chow, del anlisis de losresiduales, y del uso de las variables dictomicas. En primer lugar haremos uso de losdos primeros

    1. TEST DE CHOW (CONTRASTE DE CAMBIO ESTRUCTURAL)

    Un contraste de mucha importancia, tanto por su inters como por la frecuencia con queaparece en aplicaciones empricas, es la hiptesis nula donde dos submuestras songeneradas por una misma estructura econmica. Luego se contrasta la hiptesis nula deausencia de cambio estructural, y el contraste suele denominarse Test de ChowGeneralmente se produce cuando se tiene informacin acerca de una variacinestructural que ocurri en algn momento del periodo muestral, y se pretende contrastarsi dicha variacin fue suficientemente importante como para generar cambios en loscoeficientes del modelo.

    El modelo restringido (MR) es:

    T,T,T,,2,1tXy21t

    '

    tt

    KK=+=

    mientras que el modelo sin restringir (MSR) es :

    T,,TtXY

    T,,2,1tXY

    2t2'tt

    1t1'tt

    K

    K

    =+=

    =+=

    La suma residual restringida es la que proviene de la estimacin del modelo restringido(MR), denotada por SRR, mientras que la suma residual sin restringir es el agregado delas sumas residuales de cada una de las regresiones de las submuestras, que denotamospor SR1y SR2.

    El estadstico F para el contraste de la hiptesis nula de ausencia de cambio estructurales:

    ( )

    ( )k2n,k21

    21

    C F

    k2n

    SRSRk

    SRSRSRR

    F

    +

    +

    =

  • 7/26/2019 Inferencia en el modelo lineal

    23/50

    128

    2. RESIDUOS RECURSIVOS (CONTRASTE DE ESTABILIDAD)

    Los Residuos Recursivos se obtienen a partir de una estimacin recursiva de losparmetros del modelo. La estimacin recursiva es similar a la estimacin por MCOpero realizada sta de un modo recursivo, es decir, aumentando el tamao de la muestrade modo paulatino. Esto es, trabajando con una muestra de tamao r-1, el estimador quese obtiene es:

    ( ) 1r' 1r1

    1r'

    1r1r YXXX

    =

    donde el subndice r-1, hace referencia al nmero de observaciones que se utilizan parala estimacin de los parmetros2.

    Una vez estimados los parmetros del modelo con las r-1 primeras observaciones, se

    incorpora, para la matriz de regresores, la informacin de la observacin siguiente; esdecir el vector fila Xr , y con sta se realiza una prediccin para la observacin r de lavariable endgena rY

    )

    . A partir de sta se calcula el error de prediccin para laobservacin r utilizando las primeras r-1 observaciones. Este error de prediccinformar parte del residuo recursivo wr que se define como una tipificacin de aqul.

    ( ) r1

    1r'

    1r'r

    1r'rr

    r

    XXXX1

    XYw

    +

    = r = k+1, k+2, ..., n

    Este procedimiento se repite sucesivamente hasta finalizar realizando la prediccin para

    la ltima observacin. As, de este modo, se obtiene una serie de n-k residuos recursivoshomocedsticos e incorrelacionados.

    ( )I,0Nw 2

    Estos nuevos residuos permiten analizar la perturbacin del modelo de regresin conmayor objetividad ya que, a diferencia de los residuos MCO, verifican las hiptesisdeseables para dicha perturbacin puesto que su distribucin s es normal esfrica.

    Los contrastes basados en los residuos recursivos los podemos clasificar en dos grupos;contrastes grficos y contrastes numricos. Los primeros se utilizan de un modo generalpara detectar si existe o no estabilidad en el modelo de regresin; puesto que se basan enanlisis grficos. Son contrastes bastante generales que detectan de modo vago lapresencia de problemas en el modelo.

    Los contrastes numricos permiten detectar especficamente si se cumple o no, porseparado, las hiptesis de homocedasticidad e incorrelacin de las perturbaciones.

    Como hiptesis nula se especifica la estabilidad, tanto de los parmetros como de lasvarianzas de la perturbacin, a lo largo de los n periodos considerados.

    2Ntese que el nmero mnimo de observaciones que se necesita para la estimacin del modelo es r-1= k, siendo k elnmero de parmetros del modelo de regresin.

  • 7/26/2019 Inferencia en el modelo lineal

    24/50

    129

    H0: 1= 2= ..... = n=

    H1 ====2

    n

    2

    2

    2

    1 .... y se especifican dos contrastes que permiten decidir si existe estabilidad o rupturaestructural.

    3. CONTRASTE DE SUMA ACUMULADA (TEST CUSUM)

    Este contraste consiste en la acumulacin progresiva de los residuos recursivos queposteriormente se normalizan dividindolos entre la estimacin insesgada de ladesviacin tpica de la perturbacin (S). De este modo se calcula el valor acumulado W r,que se representa grficamente frente al nmero de valores acumulados (r).

    S

    wW

    r

    1kjj

    r

    +== r = k+1, k+2, ... , n

    Donde:kn

    SCRS

    =

    Estos valores de las sumas acumuladas, en el supuesto de estabilidad, deberan oscilarentre las lneas de significacin representadas por las rectas que se definen a partir delos pares de puntos siguientes:

    { } { }kna3,nykna,k

    { } { }kna3-,nykna-,k En caso contrario, es decir cuando los valores de W rsobrepasen dichas rectas (marcadascon trazos ms gruesos) se puede considerar falta de estabilidad en el modelo. Para elclculo de estas rectas se necesita determinar los valores de a que se encuentrantabulados para distintos niveles de significacin siendo los ms usuales.

    (%) 1% 5% 10%

    A 1.143 0.948 0.850

    La representacin grfica de este contraste dibujara los residuos recursivos sobre elgrfico siguiente:

  • 7/26/2019 Inferencia en el modelo lineal

    25/50

    130

    Wr

    kna3

    kna

    k n r

    - kna

    - kna3

    4. CONTRASTE DE SUMA ACUMULADA DE CUADRADOS (TEST CUSUM2)

    Este contraste, anlogo al anterior, utiliza en el numerador la suma acumulada delcuadrado de los residuos recursivos y en el denominador el valor de la Suma deCuadrados de la totalidad de los Residuos Recursivos.

    +=

    +== n

    1kj

    2j

    r

    1kj

    2j

    r

    w

    wS r = k+1, k+2, ... , n

    Para este estadstico rS se consideran tambin unas rectas de significacin definidas apartir del valor esperado del estadstico sumndole (y restndole) una cantidad fijadependiendo del nivel de significacin elegido ().

    Ntese que el valor esperado del estadstico oscila entre cero y uno; as, E(Sr) = 0cuando r = k, y, cuando r = n, E(S r) = 1.

    Estos lmites se dibujan frente a r, obtenindose el siguiente grfico conocido comoCUSUM2.

  • 7/26/2019 Inferencia en el modelo lineal

    26/50

    131

    Sr

    E(Sr) + C0

    k n rE(Sr)

    E(Sr) - C0

    Al igual que en el contraste anterior, se considera que existe evidencia suficiente pararechazar la hiptesis nula de homogeneidad del modelo, cuando la representacingrfica de los valores del estadstico Srse sitan fuera de las bandas (marcadas en trazoms grueso). Con respecto a este contraste existe cierta evidencia emprica que permiteconsiderarlo ms poderoso que el test de suma acumulada (Test CUSUM).

    Ejercicio ilustrativo

    En el modelo definido anteriormente: Yt= 2.209520 + 1.061520Xt+ t

    Donde: Yt= fondo Afuture ; Xt= tasa anual de retorno

    En el paquete E-Views, se calcular el Test de CUSUM para analizar H o:

    H0: Los parmetros son estables en el perodo de pruebaH1: Los parmetros no son estables en el perodo de prueba

    En el resultado se observa que el estadstico CUSUM se mantiene dentro de las bandasde confianza, con lo cual se puede afirmar que los parmetros son estables a lo largo delperodo de anlisis en un 95% de confianza.

  • 7/26/2019 Inferencia en el modelo lineal

    27/50

    132

    ANEXO

    LA INFERENCIA ESTADSTICA Y EL PROGRAMA E-VIEWS

    El E-views es un programa especializado que sirve para hacer anlisis, regresiones yprediccin as como simulaciones y evaluaciones de eficiencia y prediccin de modelos.

    Dado los siguientes datos hipotticos (Perodo 1991-1995)

    AO Y X1 X21991 3 3 51992 1 1 41993 8 5 61994 3 2 41995 5 4 6

    Estime el modelo Yt= 1+ 2X1t+ 3X2t+t

    Yt: variable dependiente o endgenaX1t: variable independiente o exgenaX2t: variable independiente o exgena

    PROCEDIMIENTO:

    A.Ingresar al programa E-Views Inicio Programas Eviews (hacer clic) Aparece el cuadro siguiente:

    1. Barra de Men2. Barra de comandos3. Area de Trabajo4. Lnea de Estado

    1

    2

    3

    4

  • 7/26/2019 Inferencia en el modelo lineal

    28/50

    133

    B.

    Crear un Workfile (archivo de trabajo) File New Workfile Aparece la siguiente caja de dialogo Se especifica periodicidad o frecuencia

    Seleccionar OK Se crea vector c y serie de residuos Aparece el workfile:

    En la barra del men Principal, hacer clic en Quick y seleccionar Empty Group(Edit series)

    Se crea grupo Aparece el siguiente cuadro:

    Escribir la fecha de inicio y la fecha final de los datos

  • 7/26/2019 Inferencia en el modelo lineal

    29/50

    134

    Se sombrea la primera columna vaca (de la izquierda) Se escribe el nombre de la primera variable en la primera celda vaca: Y, y

    ENTER. Se sombrea la segunda columna vaca y se escribe en la primera celda X1 y

    luego ENTER. Luego se selecciona la tercera columna y se escribe en la primera celdas X2 y

    Luego ENTER. Seguidamente digitar los datos (igualmente se puede importar la informacin de

    otro software, por ejemplo el excel), que puede ser por fila o por columna. Terminado el tipeado o pegado de los valores numricos hacer clic en el botn

    de la esquina superior del cuadro y hacer clic en YES. El workfile aparecer con las nuevas series:

    Alternativas Adicionales

    Adicionalmente, tambin se puede editar series mediante las siguientes formas:

    Crear y editar series

    Para crear una seriehaga clic en Objects / New Objects/ Series. En la ventana emergente escribir el nombre de la serie y OK. Para llenar o editar una serie generada o importada hacer doble clic en la serie (o

    clic derecho en Open). Una vez abierta la serie en el men hacer clic en Edit +/- y editar la serie y para

    finalizar nuevamente Edit +/- . Copy/paste:Seleccionar las celdas a copiar desde Excel (Copy) y pegarlas en

    Eviews (Paste).

  • 7/26/2019 Inferencia en el modelo lineal

    30/50

    135

    Importar datos de hoja de clculo

    Para importar informacin desde archivos hojas de clculo, hacer clic en Procs /Import./ (Read Text-Lotus-Excel)

    Aparecer la ventana Open donde se debe buscar y seleccionar el archivo autilizar.

    Si usted hace doble clic en le nombre del archivo, ver un segundo cuadro dedilogo pidindole detalles acerca del archivo (Excel Spreadsheet Import)

    Para un archivo de hoja de clculo (Excel o Lotus), se debe especificar lascoordenadas de la celda superior-izquierda que contiene la informacin. Porejemplo, si los datos empiezan el la celda A2, entonces usted deber especificaresta celda como celda de datos superior izquierda.

    Luego escribir el nombre o los nombres de las series. Si el archivo cuenta con varias hojas de trabajo, entonces se debe especificar el

    nombre de donde se desea importar. Hacer clic en OK y los datos sern incorporados en el archivo de trabajo.

    C.Estimacin de la ecuacin: Yt= 1+ 2X1t+ 3X2t+t

    En la barra de comandos se escribe: LS Y C X1 X2 y luego ENTERDonde: LS (Last Square) (Mnimos Cuadrados)

    Aparece las siguientes salidas (ESTIMATION OUTPUT):

    Dependent Variable: YMethod: Least SquaresDate: 07/26/02 Time: 16:28Sample: 1991 1995Included observations: 5

    Variable Coefficient Std. Error t-Statistic Prob.C 4.000000 4.474930 0.893869 0.4657

    X1 2.500000 0.866025 2.886751 0.1020X2 -1.500000 1.369306 -1.095445 0.3876

    R-squared 0.946429 Mean dependent var 4.000000Adjusted R-squared 0.892857 S.D. dependent var 2.645751S.E. of regresin 0.866025 Akaike info criterion 2.833904Sum squared resid 1.500000 Schwarz criterion 2.599567Log likelihood -4.084760 F-statistic 17.66667Durbin-Watson stat 1.666667 Prob(F-statistic) 0.053571

    EncabezadoSe especifica cul es la variable dependiente, el nmero de observaciones, lasvariables explicativas y el mtodo de estimacin.

    Primera ColumnaSe refiere a qu parmetro est estimando. Es decir aquel que acompaa a lavariable que se seala.

  • 7/26/2019 Inferencia en el modelo lineal

    31/50

    136

    Segunda ColumnaSe tienen los valores estimados de los parmetros.

    Tercera ColumnaMuestra la desviacin estimada de los parmetros.

    Cuarta ColumnaSe presentan los valores calculados de los estadsticos t donde se tiene comohiptesis nula que cada uno de los parmetros es igual a cero. Para ello los valores tcalculados para cada parmetro son la divisin de los respectivos valores de lasegunda y tercera columna. La prueba individual de significancia estadstica para unparmetro es justamente el valor del parmetro calculado dividido por la desviacinestndar calculada y ello es lo que se obtiene en la cuarta columna.

    Quinta ColumnaPresenta, el valor de la probabilidad (p-value), de rechazar la hiptesis nula cuandoes verdadera, (nivel de significacin) con los datos estimados de la muestra quetenemos.

    Al escoger el nivel de significacin estadstica estamos eligiendo el punto quesepara la regin de rechazo de la regin de aceptacin de la hiptesis nula cuandoHo es verdadero. Si se escoge el nivel de significacin del 5%, quiere decir que si laprobabilidad de que la hiptesis nula es cierta es mayor al 5% no podemos rechazarla hiptesis nula.

    R-squared(R2): Es el coeficiente de determinacin.

    Adjusted R-squared(R2 ajustado): Coeficiente de determinacin ajustado.

    F-statistic: Valor del estadstico F, permite contrastar la capacidad explicativaconjunta de las variables introducidas en el modelo.

    Prob(F-statistic): Valor que mide la probabilidad de rechazar la hiptesis nula designificancia conjunta.

    Durbin-Watson stat: Valor usado para contrastar la hiptesis de autocorrelacin

    ANLISIS DE LAS SALIDAS DE LA REGRESIN:

    a. Verificacin de la significancia individual de cada uno de los coeficientes apartir de la hiptesis nula, que nos dice que la variable Xi no essignificativa en el modelo (prueba t, para lo cual su valor debe ser superior aun t de tabla, que para este caso debe ser con (n-2, es decir 5-2 grados delibertad y un nivel de significacin = 0.05).

    Alternativamente la prueba t se docima con la observacin de la ltimacolumna (Prob = Probabilidad de rechazar la hiptesis nula cuando escierta).

  • 7/26/2019 Inferencia en el modelo lineal

    32/50

    137

    Si la probabilidad asociada es mayor al 0.05, entonces se acepta la Ho de nosignificatividad de la variable X

    i, en caso contrario se rechaza la Ho a un

    nivel de confianza del 95%.

    En este modelo las probabilidades asociadas son superiores a 0.05, por lotanto se acepta la Ho, es decir que todas las variables no son significativas enel modelo.

    b.Verificacin de la significancia global del modelo (Prueba F). Al igual que laprueba estadstica t se puede analizar de 2 formas: En base a la lectura delestadstico F statistic, o en base a la lectura del valor de Prob(F-statistic).Cualquiera conduce a la misma decisin.La Hiptesis Nula es: la variable dependiente no es explicada por el modeloen su conjunto.

    La Hiptesis Alternativa es: la variable dependiente es explicada por elmodelo en su conjunto.

    Si la probabilidad asociada (valor de Prob(F-statistic)), es superior a 0.05,entonces se acepta la Ho.En nuestro modelo se observa que la probabilidad asociada es superior a0.05, entonces se acepta la Ho, es decir que la variable dependiente no esexplicada por el modelo en su conjunto.

    D.Para ver la representacin clsica de la regresin hacer: VIEW REPRESENTATIONS Aparece la siguiente ecuacin: 21 X*1.5-X*2.54Y +=

    E.Para ver los valores observados de la variable dependiente (Y), los valores estimadoscon la ecuacin y los residuos, proceder de la siguiente manera: Estando en las salidas de la regresin (ESTIMACIN OUTPUT), hacer clic en

    VIEW que muestra una serie de alternativas. Escoger ACTUAL FITTED RESIDUAL para ver los residuos, si presenta o no

    autocorrelacin. Luego hacer clic en: ACTUAL FITTED RESIDUAL, TABLE

    Tambin se puede escoger la alternativa ACTUAL FITTED RESIDUALGRAPH (para observar la grfica):

  • 7/26/2019 Inferencia en el modelo lineal

    33/50

    138

    -1.5

    -1.0

    -0.5

    0.0

    0.5

    1.0 0

    2

    4

    6

    8

    10

    1991 1992 1993 1994 1995

    Residual Actual Fitted

    F.Hallar la matriz de varianzas y covarianzas: Estando en las salidas de la regresin, hacer clic en VIEW Luego hacer clic en covariance matriz, aparecer el siguiente cuadro:

    C X1 X2C 20.025 3.375 -6X1 3.375 0.75 -1.125X2 -6 -1.125 1.875

    G.Normalidad de los Residuos

    La hiptesis de normalidad de las perturbaciones es fundamental para la realizacin deinferencia en el modelo. En el E-views se puede calcular el estadstico Jarque Bera, elcual permite contrastar la hiptesis de normalidad de los residuos.

    Procedimiento Regresionar el modelo MCO Ingresar a VIEW/ RESIDUAL TEST Seleccionar la opcin HISTOGRAM-NORMALITY TEST. El estadstico Jarque Bera nos permite verificar la normalidad de los residuos. La

    Ho es que los residuos se distribuyen normalmente. Si la probabilidad asociadaal estadstico es mayor al 5%, entonces no se puede rechazar la Ho denormalidad de los residuos.

    H.Test de Punto de Quiebre de Chow Regresionar el modelo MCO Ingresar a VIEW/ STABILITY TEST / BREAKPIONT TEST Ingresar la Fecha de quiebre estructural. La Hiptesis nula es que no hay cambio estructural. Si la probabilidad asociada

    al test es mayor al 5%, entonces no se puede rechazar la Ho.

    I. Test de Residuos Recursivos Regresionar el modelo MCO

  • 7/26/2019 Inferencia en el modelo lineal

    34/50

    139

    Ingresar a VIEW/ STABILITY TEST / RECURSIVE ESTIMATES

    Seleccionar la opcin RECURSIVE RESIDUALS

    Si la grfica de residuos recursivos sale fuera de las bandas, entonces losparmetros son inestables en el perodo de anlisis (al 5% de significancia).

    J. Test Cusum y Cusum Cuadrado Regresionar el modelo MCO Ingresar a VIEW/ STABILITY TEST / RECURSIVE ESTIMATES Seleccionar la opcin CUSUM O CUSUM OF SQUARES TEST. El programa reporta un grfico, conteniendo la evolucin de un estadstico. Si el

    estadstico se encuentra dentro de las bandas, entonces los parmetros sonestables en el perodo de anlisis (al 5% de significancia). No existe suficienteevidencia para rechazar la Ho de estabilidad de los parmetros.

    K.Test de Reset Ramsey En el Output de la regresin hacer clic en View/ Stability Tests/ Ramsey RESETTest/ 2

    La Ho es que el modelo est correctamente especificado. El programa reporta unas salidas. Si la probabilidad asociada a este estadstico es

    mayor que el nivel de significancia del 5%, no se debe rechazar la Ho, es decirque el modelo est correctamente especificado.

  • 7/26/2019 Inferencia en el modelo lineal

    35/50

    140

    LABORATORIO

    Ejercicio Aplicativo 1

    Se presenta un modelo para la inflacin en el Per para el periodo de Enero de 1992 Diciembre de 1998. El carcter exploratorio de este modelo, apunta a esclarecer el rolde variables adicionales a los agregados monetarios en la determinacin de los nivelesinflacionarios.

    1. Estimacin, inferencia e interpretacin.

    Al estimar el modelo en logaritmos por MCO, para el perodo 1992:011998:12,encontramos los siguientes resultados:

    LTCCIRPROMLIPC 321 ++= Donde:

    LIPC : Logaritmo del ndice de Precios al ConsumidorCIRPROM : Circulante promedioLTC : Logaritmo del Tipo de Cambio

    Dependent Variable: LIPCMethod: Least SquaresDate: 12/13/01 Time: 21:35Sample: 1992:01 1998:12

    Included observations: 84Variable Coefficient Std. Error t-Statistic Prob.C 4.342678 0.082939 52.35958 0.0000LCIRPROM 0.355330 0.013456 26.40709 0.0000LTC 0.500555 0.026611 18.81012 0.0000R-squared 0.993782 Mean dependent var 7.414901Adjusted R-squared 0.993628 S.D. dependent var 0.325085S.E. of regression 0.025949 Akaike info criterion -4.430295Sum squared resid 0.054542 Schwarz criterion -4.343480Log likelihood 189.0724 F-statistic 6472.723Durbin-Watson stat 0.628449 Prob(F-statistic) 0.000000

    Al hacer una descripcin de los resultados de la regresin vemos que los test t midenapropiadamente la significancia estadstica de los parmetros. Adems, todas lasprobabilidades asignadas para cada uno de los parmetros son todas iguales a cero porlo que los parmetros estimados son significativos a un nivel de aceptacin del 95%.Por otro lado, nuestro modelo tiene un nivel de ajuste del 99.37% tal como lo muestra elcoeficiente de determinacin R2 (y su valor ajustado). Adems la prueba designificancia global (F- statistic) nos permite afirmar que en conjunto ninguno de losparmetros estimados es NO significativo. El grado de ajuste, tanto de los valoresrealizados como de los estimados, as como los residuos de la ecuacin anterior sepuede apreciar de manera grfica

  • 7/26/2019 Inferencia en el modelo lineal

    36/50

    141

    -0.10

    -0.05

    0.00

    0.05

    0.10

    6.5

    7.0

    7.5

    8.0

    92 93 94 95 96 97 98

    Residual Actual Fitted

    Modelo de InflacionValores realizados, estimados y residuos

    2. Tests de Estabilidad de Los Parmetros

    Para analizar la estabilidad de los parmetros, se propone utilizar los siguientes test:

    a. Test de Residuos Recursivos.b. Test CUSUM.c. Test CUSUM de Cuadrados.d. Test de Punto de Quiebre de Chow:

    a. Test de Residuos Recursivos

    -0.08

    -0.06

    -0.04

    -0.02

    0.00

    0.02

    0.04

    0.06

    0.08

    93 94 95 96 97 98

    Recursive Residuals 2 S.E.

    Test de los residuos recursivos

  • 7/26/2019 Inferencia en el modelo lineal

    37/50

    142

    La representacin de la serie de los residuos recursivos junto con sus bandas deconfianza nos permite detectar la inestabilidad en los parmetros cuando uno o variosde los residuos sobrepasan sus bandas tal como ocurre para junio de 1993 hastaaproximadamente octubre del mismo ao, fecha en la que retorna a situarse dentrode las bandas (como tambin ocurre para julio de 1994 y para finales de 1998) por loque concluimos que los parmetros son inestables.

    b.Test del Cusum y Cusum Cuadrado

    Dado que la curva sale fuera de las bandas, en ambos casos, concluimos que losparmetros estimados son inestables.

    -30

    -20

    -10

    0

    10

    20

    30

    93 94 95 96 97 98

    CUSUM 5% Significance

    Test del CUSUM

    -0.2

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    1.2

    93 94 95 96 97 98

    CUSUM of Squares 5% Significance

    Test del CUSUM Cuadrados

    c. Test de Punto de Quiebre de Chow

    Probamos la posibilidad que exista un quiebre estructural en julio de 1994:

    Chow Breakpoint Test: 1993:12

    F-statistic 7.059748 Probability 0.000293Log likelihood ratio 20.17847 Probability 0.000156

  • 7/26/2019 Inferencia en el modelo lineal

    38/50

    143

    Rechazamos la hiptesis de que no hay cambio estructural al 99% de confiabilidad.Por lo tanto, concluimos que en julio de 1994 se produjo un cambio estructural.

    3. Test de Error de Especificacin

    El E-views permite usar el RESET test propuesto por Ramsey (1969). La hiptesis nulaes que el modelo esta bien especificado. A un nivel de 5% de significancia aadiendo 2trminos al test, la probabilidad asociada es de 43.53% mayor al 5%; por lo tanto serechaza la hiptesis nula, concluyndose que el modelo est correctamente especificado.

    Ramsey RESET Test:

    F-statistic 0.614881 Probability 0.435271Log likelihood ratio 0.643157 Probability 0.422570

    Test Equation:Dependent Variable: LIPCMethod: Least SquaresDate: 09/22/02 Time: 09:18Sample: 1992:01 1998:12Included observations: 84Variable Coefficient Std. Error t-Statistic Prob.C 4.558636 0.287682 15.84610 0.0000LCIRPROM 0.493996 0.177350 2.785424 0.0067LTC 0.667595 0.214686 3.109635 0.0026FITTED^2 -0.025285 0.032246 -0.784144 0.4353R-squared 0.993829 Mean dependent var 7.414901

    Adjusted R-squared 0.993598 S.D. dependent var 0.325085S.E. of regression 0.026011 Akaike info criterion -4.414142Sum squared resid 0.054126 Schwarz criterion -4.298389Log likelihood 189.3940 F-statistic 4294.837Durbin-Watson stat 0.645581 Prob(F-statistic) 0.000000

    4. Normalidad de las Perturbaciones

    0

    2

    4

    6

    8

    10

    12

    - - -

    Series: ResidualsSample 1992:01 1998:12Observations 84

    Mean 1.50E-15Median 0.004828Maximum 0.066321Minimum -0.063627Std. Dev. 0.025635Skewness -0.302419Kurtosis 3.145839

    Jarque-Bera 1.354843Probability 0.507925

    Normalidad de las perturbaciones

  • 7/26/2019 Inferencia en el modelo lineal

    39/50

    144

    Aunque podemos observar en el histograma que las frecuencias mximas no sepresentan en el centro de manera clara, como debera de ser si se sigue una distribucinnormal, sin embargo, el valor del coeficiente de asimetra muestral (-0.3024) es prximoa cero y el coeficiente de apuntamiento kurtosis- es de 3.1458 no es lejano a 3.Finalmente, el estadstico Jarque-Bera no permite rechazar la hiptesis nula denormalidad, pues su valor (1.3548) genera una probabilidad (de rechazar dichahiptesis siendo verdadera) superior a 0.05

    Ejercicio Aplicativo 2

    Suponga que Ud. desea dedicarse a la produccin de Kiwi, producto que requiere grancuidado en cuanto a las condiciones del medio ambiente como tambin de riego.

    La siguiente informacin corresponde a la experiencia de una cooperativa, suponiendo

    que el resto de los factores que inciden en la produccin de Kiwi son homogneos a losdel resto del Per, utilice esta informacin para planificar su produccin.

    Ao Productoton./h.

    Cantidadde agua

    TemperaturaPromedio (C)

    1990 60 9 13.31991 50 10 8.31992 70 11 11.701993 70 10 11.701994 80 12 13.31995 50 9 8.31996 60 11 6.71997 40 8 6.7

    1. Estime un modelo que considere solamente el agua como variable explicativa y otroque incluya al agua y la temperatura.

    Considerando Solamente al Agua, realizando una regresin lineal simple, tendremosque la ecuacin de regresin resulta:

    Variable Coefficient Std. Error t-Statistic Prob.CANT_AGUA 8.333333 2.256677 3.692745 0.0102

    C -23.33333 22.73539 -1.026300 0.3443R-squared 0.694444 Mean dependent var 60.00000

    Adjusted R-squared 0.643519 S.D. dependent var 13.09307S.E. of regression 7.817360 Akaike info criterion 7.162889Sum squared resid 366.6667 Schwarz criterion 7.182749Log likelihood -26.65155 F-statistic 13.63636Durban-Watson stat 1.856061 Prob(F-statistic) 0.010176

    Se puede observar de la tabla anterior, que la variable cantidad de agua es significativapara el modelo planteado, cosa que no ocurre para la constante (tiene un p-valorsuperior a 0.05). Por lo tanto ser necesario estimar otra vez el modelo pero sinconsiderarla, este resultado se muestra en la tabla siguiente:

  • 7/26/2019 Inferencia en el modelo lineal

    40/50

    145

    Variable Coefficient Std. Error t-Statistic Prob.CANT_AGUA 6.034483 0.275378 21.91347 0.0000R-squared 0.640805 Mean dependent var 60.00000Adjusted R-squared 0.640805 S.D. dependent var 13.09307S.E. of regression 7.847060 Akaike info criterion 7.074624Sum squared resid 431.0345 Schwarz criterion 7.084554Log likelihood -27.29849 Durbin-Watson stat 1.490000

    La ecuacin de regresin finalmente queda determinada por la siguiente relacin:

    Agua*034.6oductoPr =

    Considerando el Agua y la Temperatura: Al igual que en el caso anterior no ser

    necesario considerar el trmino constante en el modelo (p>0.05), en tal sentido laecuacin de regresin estimada final resulta:

    aTemperatur*379.2Agua*662.3oductoPr +=

    Variable Coefficient Std. Error t-Statistic Prob.CANT_AGUA 3.661719 0.782738 4.678091 0.0034TEMP_PROM 2.378622 0.762748 3.118492 0.0206R-squared 0.862946 Mean dependent var 60.00000Adjusted R-squared 0.840104 S.D. dependent var 13.09307S.E. of regression 5.235532 Akaike info criterion 6.361132Sum squared resid 164.4647 Schwarz criterion 6.380992Log likelihood -23.44453 F-statistic 37.77838Durbin-Watson stat 1.580261 Prob(F-statistic) 0.000850

    2. Suponga que la produccin se realizar en un galpn cerrado en el cual, podrcontrolar la temperatura a un nivel de 10 grados Centgrados Cul ser la relacinrelevante para planificar su produccin?

    Si la produccin se realizar en un galpn cerrado en el cual es posible mantener latemperatura constante a un nivel de 10C la relacin relevante para planificar laproduccin de kiwi ser:

    10*379.2Agua*662.3oductoPr +=

    con lo cual al realizar las operaciones respectivas se obtendr la relacin siguiente :

    Agua*662.327.452oductoPr +=

  • 7/26/2019 Inferencia en el modelo lineal

    41/50

    146

    Ejercicio Aplicativo 3

    Dado el modelo siguiente: t21t PBII ++=

    Donde:I : InversinPBI : Producto Bruto Interno

    Ao I PBI1992 14,758 83,4011993 16,487 87,3751994 21,931 98,5771995 26,374 107,0391996 25,094 109,7091997 28,825 117,1101998 28,255 116,4851999 24,455 117,5902000 23,554 121,2672001 21,663 121,513

    Fuente: BCRP.

    a. Calcule el estimador MCO, de los parmetros e interprtelos.

    Dependent Variable: IMethod: Least Squares

    Date: 02/26/03 Time: 10:36Simple: 1992 2001Included observations: 10

    Variable Coefficient Std. Error t-Statistic Prob.C -4873.554 8093.987 -0.602120 0.5638

    PBI 0.259365 0.074391 3.486533 0.0082R-squared 0.603094 Mean dependent var 23139.60Adjusted R-squared 0.553481 S.D. dependent var 4628.697S.E. of regression 3092.991 Akaike info criterion 19.08852Sum squared resid 76532765 Schwarz criterion 19.14904Log likelihood -93.44261 F-statistic 12.15591Durbin-Watson stat 0.565595 Prob(F-statistic) 0.008240

    I = -4873.553604 + 0.2593652018*PBI

    - 1 (-4873.554): significa que la inversin es negativa cuando el PBI es cero.- 2 (0.259366): significa que la inversin aumenta en 0.259366 cuando el PBI

    aumenta en una unidad monetaria.

  • 7/26/2019 Inferencia en el modelo lineal

    42/50

    147

    b. Matriz de Varianza y Covarianza.

    C PBIC 65512622 -597.7039

    PBI -597.7039 0.005534

    c. Significancia individual de las variables.

    Para 1 :Como se tiene un p-valor de 0.5638 el cual es mayor que 0.05 ; se acepta la hiptesisnula (no es significativo), lo que origina que en este modelo no ser necesario utilizar eltermino constante lo que significa que cuando el PBI sea cero no existir inversin .

    Para 2 :

    inversinladenetocomportamielexplicardecapazesPBIel0:

    inversinladenetocomportamielexplicanoPBIel0:

    21

    20

    =

    H

    H

    Se tiene un p-valor de 0.0082, el cual es menor que 0.05; lo que origina que se rechazela hiptesis nula; por lo que se concluye que el PBI puede explicar el comportamientode la inversin a partir del modelo inicialmente planteando.

    d. Intervalo de confianza al 95% para el segundo parmetro ( 2 )

    Se sabe que: P ( 2 - t * Stad Error < 2 < 2 + t * Stad Error) = 0.95, reemplazandovalores:

    P (0.259365-2.036* 0.074391 < 2 < 0.259365 +2.036* 0.074391) = 0.95.

    P (0.107904924< 2 < 0.410825076) = 0.95

    Por lo tanto el valor del segundo parmetro se encuentra entre 0.107904924 y0.410825076.

    e. Verificacin de la significancia global del modelo ( Prueba F)

    regresoreslosdeusoelporexplicadaesinversinla0:Hregresoreslosdeusoelporexplicadaesnoinversinla0:H

    i1

    i0

    =

    Se tiene un Prob (F-statistic) de 0.008240, el cual es mayor que cero lo que hace que serechace la hiptesis nula, por lo tanto se concluye que el modelo en su conjunto essignificativo, a un nivel de confianza del 95%.

  • 7/26/2019 Inferencia en el modelo lineal

    43/50

    148

    Ejercicio de autoconocimientoPorqu realizar el proceso de inferencia?

    SI NO NO S

    1. Porque permite establecer la validez dedeterminadas afirmaciones acerca de losparmetros (desconocidos).

    2. Porque mediante el anlisis (de varianza), seinvestiga la explicacin conjunta de todas lasvariables explicativas que intervienen en el

    modelo.

    3. Para analizar el pasado y predecir el futuro de laempresa.

    4. Porque mediante un programa especializadoEviews se podr hacer anlisis, regresiones yprediccin as como simulaciones y evaluacionesde eficiencia y prediccin de modelos.

    5. Para utilizar el modelo correcto y adecuado paraun pronstico

    6. Para establecer la importancia del estudio de lasvariables.

    7. Porque se puede ingresar a las variablesindependientes e introducir los nuevos valores.

    8. Para realizar aplicaciones con datos de larealidad.

    9. Para estimar intervalos y contrastar hiptesis.

    10.Para predecir sucesos futuros.

    CALIFICACION

    Puntuar con un punto cada respuesta SI.Si obtienes de de 1 - 3 puntos tienes pocas expectativas de hacer una buena prediccinempresarial.Si tienes entre 4 - 7, tienes buenas expectativas de hacer una buena prediccinempresarial.Y si tienes entre 8 - 10, denotas excelentes expectativas de hacer una buena prediccinempresarial.

  • 7/26/2019 Inferencia en el modelo lineal

    44/50

    149

    RESUMEN

    Los coeficientes de confianza son los niveles de confianza que tenemos en que elintervalo contiene el valor desconocido del parmetro.

    El principio del intervalo de confianza: Tiene un Lmite superior de confianza y unlmite inferior de confianza.

    En: =+ 1)tt(obPr 2/1112/11

    El coeficiente de confianza: 1 Lmites de confianza inferior: 2/11 t

    Lmites de confianza superior: 2/11 t +

    Estimacin de la varianza del trmino de perturbacin:

    kn

    Y'X'Y'Y

    )kn(

    e'e2

    =

    =

    Docima de hiptesis, se refiere a una distribucin de frecuencias, y se plantea con el finde comprobar si se cumple una relacin.Hiptesis propuesta o sometida a anlisis.

    H0: i= C hiptesis nulaH1: iC hiptesis alternativas

    Coeficiente de determinacin (R2),es un indicador de la bondad de ajuste de la lnea

    de regresin que mide la proporcin de la variacin total en la variable dependiente Y,que se explica o se debe a la variacin de la variable independiente X. (0 R21).

    Coeficiente de correlacin, es una medida de asociacin lineal entre dos variables.

    COEFICIENTE FORMULA

    COEFICIENTE DEDETERMINACION

    1R0SCT

    SCR1

    SCT

    SCER

    22==

    COEFICIENTE DECORRELACION

    Poblacional Muestral

    1n )y(y1n )x(x

    )y)(xx(x

    )y,x(Covr

    2

    i

    2

    i

    ii

    2

    y

    2

    x

    =

    =

    COEFICIENTE DEDETERMINACION

    MULTIPLECORREGIDO 1n/

    2)iyi

    y(

    kn/2

    )i

    yi

    y(12R

    =

  • 7/26/2019 Inferencia en el modelo lineal

    45/50

    150

    La finalidad delAnlisis de varianzaes investigar la explicacin conjunta de todas lasvariables explicativas que intervienen en el modelo, a partir del estudio de loscomponentes de la variabilidad total.

    Para efectuar la dcima se construye un estadstico:licadaexpianzanovar

    licadaexpVarianzaFc=

    Eviews es un programa especializado que sirve para hacer anlisis, regresiones yprediccin as como simulaciones y evaluaciones de eficiencia y prediccin de modelos.

    EXPLORACION ON LINE

    1. Regresin lineal entre dos variables: INFERENCIA

    http://bayes.escet.urjc.es/~jmmarin/libroelec,tema8/inferencia

    2. Inferencia sobre los coeficientes del modelo

    http://www.udc.es/mate/estadisticas2/sec8.htm

    3. Inferencia en el Modelo Lineal

    http://uhu.es/45132/ficheros-datos

    http://bayes.escet.urjc.es/~jmmarin/libroelec,)temahttp://www.udc.es/mate/estadisticas2/sec8.htmhttp://www.udc.es/mate/estadisticas2/sec8.htmhttp://bayes.escet.urjc.es/~jmmarin/libroelec,)tema
  • 7/26/2019 Inferencia en el modelo lineal

    46/50

    151

    LECTURA

    Aplicacin estadstica del Anlisis de Varianza

    The Wall Street Journal public hace poco un artculo sobre Ruport Murdoch, el editornacido en Australia que ha construido un imperio mundial de medios de difusin conprstamos concedidos por bancos de todo el mundo.

    Como afirmaba el Wall Street Journal, ahora se enfrenta al perodo de apalancamientoal de tomar decisiones difciles en relacin con las amortizaciones.

    Gran parte de la deuda se contrajo durante una poca de expansin, en la compra yformacin de tres nuevas empresas, TV Guide, Sky Lab y la red de televisin Fox (que

    atraviesa ciertas dificultades a pesar del xito de Bart Simpson y su familia deinadaptados).

    El artculo afirmaba que Murdoch tendra que comprara las situaciones deudorasrelativas de cada uno de los tres nuevos aspectos de su aventura empresarial.

    Quiz fuera preciso recurrir alAnlisis de Varianza para comparar los niveles medios de endeudamiento en cada unade las tres nuevas y arriesgadas empresas.

    Allen L. Webster

  • 7/26/2019 Inferencia en el modelo lineal

    47/50

    152

    ACTIVIDADES

    1. En esta frmula: =+ 1)tt(obPr 2/1112/11

    Cul es el coeficiente de confianza?, Cul es el lmite de confianza inferior yCul es el lmite de confianza superior?

    2. Menciona los puntos importantes de las Dcimas de Hiptesis

    3. Escribir la frmula del coeficiente de correlacin y el significado de las siglas SCT,SCR, SCE.

    4. Explicar en forma resumida el anlisis de las salidas de la regresin (del programaE-Views).

    5. Para los modelos lineales que se proponen a continuacin:

    a. Y = 1 + 2X2+ Y : produccin de trigo (quintales por hectrea)X2: Cantidad de fertilizante (kilos por hectrea)

    b. Y = 1+ 2X2+ Y : Ganancia de la empresa.X2: Gastos de Inversin

    Determinar algunas de la variables cuyo efecto estn contenidas en la .

    6. Los datos siguientes corresponden al producto bruto interno por tipo de gasto,consumo de hogares, consumo del gobierno, formacin bruta del capital,exportaciones e importaciones en el periodo 1991-2002.

    a. Determinar el modelo que ms se adecua a los datos. Cul se utilizara comovariable dependiente y cuales como variables independientes, justifique?

    b. Luego de realizar el inciso anterior realice la regresin ms adecuada y estimelos parmetros convenientes, seguidamente calclese sus intervalos de confianzarespectivos.

    c. Cmo puede asegurar que el modelo que ha seleccionado es el adecuado?d. El modelo que planteo inicialmente cumple con algn supuesto bsico de un

    modelo de regresin. Realice las pruebas convenientes

    Considere:

    Y : Producto Bruto InternoX1 :Consumo de hogaresX2 :Consumo de gobiernoX3 :Formacin bruta de capitalX4 :ExportacionesX5 :Importaciones

  • 7/26/2019 Inferencia en el modelo lineal

    48/50

    153

    Ao Y X1 X2 X3 X4 X5

    1991 26686 20607 2 067 4613 3260 38621992 44953 34934 3566 7780 5628 69541993 69262 52996 5568 13376 8627 113041994 98577 71306 8672 21931 12590 159221995 120858 85933 11786 30013 15118 219911996 136929 98598 13827 31283 17975 247541997 157274 110782 15487 37952 22272 292191998 165949 118269 17296 39321 22076 310141999 173957 122261 18854 36894 25855 299072000 185281 131565 19717 37545 29851 333962001 188172 136040 20290 35082 30020 332602002 198437 142960 20703 36563 32612 34402

    Fuente: Instituto Nacional de Estadstica e Informtica-Direccin Nacional de Cuentas Nacionales.

    AUTOEVALUACIN

    Encierra en un crculo la letra que contenga la alternativa correcta.

    1. Si el de la Hiptesis nula est dentro del intervalo de confianza se.... lahiptesis nula; contrariamente, si el est fuera del intervalo se... lahiptesis.

    a. Rechaza-aceptab. Rechaza-rechaza

    c. Acepta-rechazad. Todas las anteriores

    2. El rango del coeficiente de determinacin R2 es el siguiente:

    a. 0> R2> 1.b. 0R21.c. 0> R21.d. Ninguna de las anteriores

    3. Cuando R2 es muy... se dice que el modelo de regresin es capaz deexplicar un alto porcentaje de las variaciones que registra la variable explicada.

    a. Cercano a 1b. Cercano a 0c. Lejano a 1d. Todas las anteriores

    4. El proceso de inferencia consiste en establecer la validez de determinadasafirmaciones acerca de.. (desconocidos) utilizando un estimador obtenidoa partir de una muestra, pero del cual se puede determinar su distribucin muestral.

    a. Los estimadoresb. Las muestras

  • 7/26/2019 Inferencia en el modelo lineal

    49/50

    154

    c. Los coeficientesd.

    Los parmetros

    5. El anlisis de varianza tiene por finalidad investigar la explicacin conjunta detodas:

    a. Las variables explicadas intervinientes en el modelo.b. Las variables aleatorias en el modelo.c. Las variables explicativas intervinientes en el modelod. Ninguna de las anteriores.

    6. Mencione el Test de contraste de cambio:

    a. Test de Chow

    b. Test de Cusumc. Test de suma acumuladad. Ninguno de los anteriores

    7. Los datos siguientes corresponden al gasto promedio del hogar segn actividadeconmica del jefe del hogar y corresponden al ao 2002.

    Considere:

    Y:Gasto mensual del hogarX1: AlimentosX2:Vestido y CalzadoX3: Alquiler de Vivienda, Combustible, Electricidad y Conservacin de Vivienda

    X4: Muebles y EnseresX5:Cuidado y conservacin de la saludX6:Transportes y Comunicaciones

    X1 X2 X3 X4 X5 X6 Y344.13 29.50 65.50 17.12 44.56 23.43 585.08596.23 47.36 380.40 43.98 111.60 116.82 1 547.68628.64 68.70 237.27 51.29 151.15 136.79 1 586.46597.22 53.36 324.35 51.58 129.70 162.37 1 599.22699.82 75.72 470.63 63.70 138.02 180.20 1 972.95

    559.50 49.00 266.64 37.65 84.25 68.18 1 277.54592.19 42.84 332.73 46.96 114.69 94.26 1 498.61791.74 42.81 289.59 35.69 134.48 65.78 1 603.19676.34 61.72 346.36 59.45 133.70 173.60 1 720.58655.51 66.57 374.11 64.67 146.09 145.50 1 848.41635.96 54.49 434.68 80.71 176.65 227.35 1 992.75367.28 27.93 373.74 40.66 128.28 124.38 1 212.56

    Fuente: ENAHO: 2002

  • 7/26/2019 Inferencia en el modelo lineal

    50/50

    Planteando un modelo de regresin lineal para estas variables, se estim el modelopor MCO y se obtuvieron los siguientes resultados:

    Dependent Variable: YMethod: Least Squares

    Variable Coefficient Std. Error t-Statistic Prob.X1 1.0474 0.1202 8.7116 0.0003X2 2.8746 1.0435 2.7548 0.0401X3 1.0607 0.1404 7.5557 0.0006X4 6.9652 1.8482 3.7687 0.0130X5 1.7287 0.5802 2.9797 0.0308X6 -0.1579 0.5122 -0.3083 0.7703C -118.9702 41.8257 -2.8444 0.0361R-squared 0.9977 Mean dependent var 1537.0860Adjusted R-squared 0.9950 S.D. dependent var 383.6970S.E. of regresin 27.2004 Akaike info criterion 9.7355Sum squared resid 3699.3140 Schwarz criterion 10.0184Log likelihood -51.4132 F-statistic 363.9769Durbin-Watson stat 2.2961 Prob(F-statistic) 0.0000

    Cul de las siguientes alternativas es la correcta?

    a. No existe ningn parmetro estimado significativo, R2 = 0.9950b. Solo el parmetro de X1 es significativo, R

    2 = 0.9590c. Solo el parmetro de X6 es no significativo, R

    2 = 0.9977

    d. Los parmetros de X1 y X2 son significativos, R

    2

    = 0.9850

    RESPUESTAS DE CONTROL

    1. c, 2. b, 3. a, 4. d, 5. c, 6.a 7.c