GUIAS DEL SPSS.pdf

  • Upload
    kaly

  • View
    228

  • Download
    0

Embed Size (px)

Citation preview

  • 7/23/2019 GUIAS DEL SPSS.pdf

    1/47

    TTULO : GUA DE USO DE SPSS

    SESIN 1: PROCEDIMIENTOS BSICOS CON SPSSSESIN 2: ESTADSTICA DESCRIPTIVASESIN 3: INTERVALOS DE CONFIANZA Y PRUEBA DE HIPTESISSESIN 4: REGRESIN LINEAL SIMPLESESIN 5: REGRESIN CURVILINEAL

    SESIN 6: REGRESIN LINEAL MLTIPLE

  • 7/23/2019 GUIAS DEL SPSS.pdf

    2/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    2

    SESIN 1: Procedimientos bsicos con SPSS

    1) Se desea elaborar una base de datos para en base a la siguiente encuesta de opinin:

    ENCUESTA DE OPININApellidos:

    _________________________________

    Nombres:

    ______________________________Carrera :_________________________________

    N veces que llevas el curso:__________________

    N cursos matriculados:______________________

    N crditos matriculados__________________

    N crditos acumulados______________________Con qu profesor llevaste el curso de EstadsticaAplicada a los negocios?

    Nota obtenida en el cursoEstadstica Aplicada a losnegocios:

    1. En una escala de 0 a 5 puntos (donde 0: completamente en desacuerdo y 5:completamente de acuerdo) responde lo siguiente:1.1.Tengo facilidad para desarrollar operaciones

    que involucra realizar muchos clculos.0 1 2 3 4 5

    1.2.No s como calcular la varianza con micalculadora.

    0 1 2 3 4 5

    1.3.Prefiero dar prcticas calificadas utilizandopaquetes de cmputo.

    0 1 2 3 4 5

    1.4.Cuando no me sale el resultado inmediatamenteme pongo muy nervioso.

    0 1 2 3 4 5

    1.5.Me aburre la clase. 0 1 2 3 4 51.6.Estadstica se me hace complicado. 0 1 2 3 4 5

    1.7.Tengo temor que mis compaeros se burlen dem si no respondo correctamente. 0 1 2 3 4 5

    1.8.Siempre estudio con mucho tiempo deanticipacin a una prctica.

    0 1 2 3 4 5

    1.9.No es necesario estudiar constantemente, yaque con el examen final se puede aprobar elcurso.

    0 1 2 3 4 5

    1.10. Prefiero hacer trabajos de investigacin antesde asistir a clase o asistir a las prcticas.

    0 1 2 3 4 5

    2. Qu opinin tienes sobre este curso?

    3. Practicas algn deporte?3.1.S 3.2. No

    4. Qu deporte practicas?

    Se puede hacer en SPSS?

    Veamos previamente como es el entorno del SPSS con un pequeo ejemplo paraposteriormente elaborar la base de datos en SPSS.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    3/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    3

    Descripcin Preliminar del entorno del SPSS

    La pantalla principal del SPSS presenta dos ventanas principales: Vista de datos yVista de variables a las cuales se puede acceder dando un click en las pestaasubicadas en la parte inferior izquierda.

    En la ventana Vista de datos se ingresan los datos (valores numricos o carcter) decada una de las variables, mientras que en la ventana Vista de variables se define laestructura de las variables que comprende la tabla de datos.

    Por ejemplo:Elabore un archivo con la siguiente informacin:

    NApellidos yNombres

    Especialidad PC1 PC2 PC3Ex.final(40%)

    Prom.PC(60%)

    Prom.final

    1 Oscar Estrada Economa 18 19 18 102 Miriam Castro Finanzas 5 10 14 133 Enrique Palacios Economa 15 12 15 124 Mario Poggi Economa 20 15 18 125 Maruja Ostolaza Economa 19 12 12 15

    6 Julio Hinostroza Finanzas 12 11 13 167 Rosa Martn Economa 15 15 12 128 Lourdes Paredes Finanzas 15 16 10 139 Tania Mendoza Finanzas 14 14 15 13

    10 Jos Rodrguez Finanzas 10 12 11 1011 Julio Campos Finanzas 12 11 15 1712 Santiago Quispe Economa 11 5 10 12

    Nota: La variable Especialidad ser codificada de la siguiente manera1: Economa2: Finanzas

    para que sea ms fcil su digitacin.

    a) Defina la estructura de las variablesIngrese a la ventana Vista de variables, defina cada uno de los campos de la estructurade las variables: Nombre: Aqu se puede definir el nombre de la variable. Este campo no permite

    que se ingresen algunos caracteres como: *, $, , etc.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    4/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    4

    Tipo: Mediante esta opcin se puede indicar el tipo de variable, las cuales puedenser: Numrica, Coma, Punto, Notacin cientfica, fecha, Dlar, Monedapersonalizada, Cadena.

    Por lo general se usan variables de tipo numrico y cadena (de caracteres, como el casode nombres)

    Anchura: Define la cantidad de dgitos o caracteres que puede ocupar la variable,esto incluye el punto decimal.

    Decimales: Define la cantidad dedecimales que puede tener la variable, siempre ycuando esta no sea de tipo fecha o cadena.

    Etiqueta: Se puedeindicar alguna descripcin de la variable.

    Valores: Algunas variables tienen valores predefinidos o codificados, mediante estaopcin se pueden definir dichos valores.

    Se debe escribir el cdigo en el recuadro Valor y en el recuadro Etiqueta se debedigitar el nombre que se le asigna al valor. Finalmente se da un click en el botnAadir.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    5/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    5

    Perdidos: Aqu se define si existen valores perdidos.

    Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, unrango de valores perdidos o un rango ms un valor de tipo discreto.

    Columnas:Se define el nmero de caracteres que desea estn visibles en la pginade vista de datos.

    Alineacin: Se define la alineacin en la que se quiere que aparezcan los datos quepuede ser: izquierda, derecha o centrado.

    Medida: Define el tipo de medida de la variable, que puede ser: Escala, Nominal,Ordinal.

    Finalmente se debe obtener una estructura como la siguiente:

    Vista de Variables

  • 7/23/2019 GUIAS DEL SPSS.pdf

    6/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    6

    b) Visualice los datos ingresadosIngrese a la opcin Vista de datos, digite los datos presentados anteriormente

    Vista de datos

    c) Grabe el archivo con el nombre LISTA.Ingrese a la opcin Archivo de la Barra de Men y posteriormente elija Guardarcomo. Aparecer la siguiente ventana:

    Especifique el nombre en el recuadro File name, por defecto SPSS guarda losarchivos con extensin sav.

    d) Ordenar a los estudiantes por especialidadIngrese a la opcin Datosde la barra de men y de ah elija Ordenar casos

  • 7/23/2019 GUIAS DEL SPSS.pdf

    7/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    7

    Aparecer la siguiente ventana; en el recuadro Ordenar por, se debe seleccionar lavariable con la cual desea ordenar los datos (Especialidad)

    e) Calcule el promedio de las prcticas calificadasIngrese a la opcin Transformarde la barra de men y de ah elija Calcular

    Aparecer la siguiente ventana; en el recuadro Expresin numrica se debeespecificar la expresin de clculo

  • 7/23/2019 GUIAS DEL SPSS.pdf

    8/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    8

    f) Calcule el promedio final considerando los pesos de cada evaluacin.Ejercicio para Ud.

    g) Si la nota aprobatoria es por lo menos 11, seleccione a los alumnos aprobados.Ingrese a la opcin Datosde la barra de men y elija Seleccionar casos. En la partederecha existen opciones de seleccionar casos, elija la opcin Si se satisface lacondicinde un clic en el botn Si

  • 7/23/2019 GUIAS DEL SPSS.pdf

    9/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    9

    Aparecer la siguiente pantalla:

    En el recuadro de la derecha escriba la condicin.

    Finalmente, en la ventana Vista de datos aparecer una nueva variable Filtroque indicar a los elementos que pertenecen a una u otra categora.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    10/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    10

    SESIN 2: ESTADSTICA DESCRIPTIVA

    1. Con los datos del archivo LISTA.SAV, desarrolle lo siguiente:

    1. Calcule la media y la desviacin estndar para cada una de las tres prcticascalificadas.

    Seleccione las variables correspondientes a las Prcticas y haga clik en el tringuloquesepara los dos campos, para que las variables seleccionadas pasen al campo de variables

    Haga clic en el botnAceptar. Debe obtener los siguientes resultados:

    Estadsticos descriptivos

    12 5.00 20.00 13.8333 4.19596

    12 5.00 19.00 12.6667 3.52480

    12 10.00 18.00 13.5833 2.74552

    12

    Prctica 1

    Prctica 2

    Prctica 3

    N vlido (segn lista)

    N Mnimo Mximo Media Desv. tp.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    11/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    11

    2. En qu prctica se obtuvieron notas ms altas? (Rpta: Primera)3. En qu prctica se obtuvieron notas ms variables? (Rpta: Primera)4. Cuntos alumnos son de economa? Cuntos de finanzas?

    En Analizarseleccione Estadsticos descriptivosy luego Frecuencias

    Seleccione la variable especialidady psela al campo de Variables

    Resultado (Fjese en las frecuencias):

    especial

    6 50.0 50.0 50.0

    6 50.0 50.0 100.0

    12 100.0 100.0

    Economia

    Finanzas

    Total

    VlidosFrecuencia Porcentaje

    Porcentaje

    vlido

    Porcentaje

    acumulado

  • 7/23/2019 GUIAS DEL SPSS.pdf

    12/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    12

    5. Compare mediante un grfico el promedio de prcticas por especialidad. Quespecialidad tiene mejor promedio?

    Debe aparecer el siguiente cuadro de dilogo:

  • 7/23/2019 GUIAS DEL SPSS.pdf

    13/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    13

    Manteniendo oprimido el botn izquierdo del mouse, arrastr el grfico de barras(primero en la parte superior izquierda) al centro de la zona de presentacinpreliminar. Luego arrastr la variable Promedio de Prcticas al eje vertical y lavariable especialal eje horizontal.

    Finalmente de clic en aceptar.

    El resultado ser el siguiente:

    especial

    FinanzasEconomia

    MediaPromedioPrcticas

    15,00

    10,00

    5,00

    0,00

  • 7/23/2019 GUIAS DEL SPSS.pdf

    14/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    14

    6. Compare mediante un grfico las notas de las tres prcticas calificadas porespecialidad.

    En este caso seleccione la opcin de barras agrupadas, y en el eje vertical, coloque lastres prcticas calificadas.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    15/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    15

    Obtendr el siguiente resultado:

    especial

    FinanzasEconomia

    Media

    20,00

    15,00

    10,00

    5,00

    0,00

    Prctica 3

    Prctica 2

    Prctica 1

  • 7/23/2019 GUIAS DEL SPSS.pdf

    16/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    16

    2. Los datos que se presentan a continuacin corresponden al nmero de meses deexperiencia para una muestra de 30 trabajadores de una empresa.

    96 43 54 83 120 68 52 113 49 4634 137 66 48 70 103 48 75 124 171

    144 36 190 138 67 114 115 244 143 26

    a) Ingrese estos datos en una columna del editor de datos de SPSS.

    b) Calcule la media, la desviacin estndar y el coeficiente de asimetra para estosdatos.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    17/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    17

    Los resultados obtenidos deben ser los siguientes:

    Estadsticos descriptivos

    30 93.90 52.046 .981 .427

    30

    Experiencia

    N vlido (segn lista)

    Estadstico Estadstico Estadstico Estadstico Error tpico

    N Media Desv. tp. Asimetra

    c) Elabore un histograma con los datos de esta variable. Comente sobre la asimetrade la distribucin.

    En el men Grficosentre en el generador de grficos, y seleccione la opcin

    histograma.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    18/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    18

    Arrastre la primera opcin, Histograma simple, al rea de presentacin preliminar, yarrastre la variable Experiencia al eje horizontal.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    19/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    19

    El grfico que se obtiene ser el siguiente:

    Experiencia

    250200150100500

    Frecuencia

    8

    6

    4

    2

    0

    Media =93,9Desviacin tpica =52,046

    N =30

    El grfico refleja lo encontrado en la pregunta (b) para el coeficiente de asimetra,esto es, que los datos presentan asimetra positiva (valores agrupados al ladoizquierdo del grfico y valores extremos al lado derecho).

    3. En el archivo Datos de empleados.sav se presentan datos para el salario de los

    empleados de una empresa, clasificados de acuerdo con su categora laboral.

    a) Calcule las estadsticas descriptivas para el sueldo actual en cada categoralaboral.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    20/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    20

    Debe obtener los siguientes resultados:

    Descriptivos

    $27,838.54 $397.217

    $27,057.40

    $28,619.68

    $27,290.50

    $26,550.00

    57274548

    $7,567.995

    $15,750

    $80,000

    $64,250

    $8,400

    1.905 .128

    7.977 .255

    $30,938.89 $406.958

    $30,102.37$31,775.40

    $31,007.72

    $30,750.00

    4471602.6

    $2,114.616

    $24,300

    $35,250

    $10,950

    $1,200

    -.368 .448

    3.652 .872

    $63,977.80 $1,990.67

    $60,018.44

    $67,937.16

    $62,728.31

    $60,500.00

    3.3E+008

    $18,244.78

    $34,410

    $135,000

    $100,590

    $20,475

    1.181 .263

    2.107 .520

    Media

    Lmite inferior

    Lmite superior

    Intervalo de confianzapara la media al 95%

    Media recortada al 5%

    Mediana

    Varianza

    Desv. tp.

    Mnimo

    Mximo

    Rango

    Amplitud intercuartil

    Asimetra

    Curtosis

    Media

    Lmite inferior

    Lmite superior

    Intervalo de confianzapara la media al 95%

    Media recortada al 5%

    Mediana

    Varianza

    Desv. tp.

    Mnimo

    Mximo

    Rango

    Amplitud intercuartil

    Asimetra

    Curtosis

    Media

    Lmite inferior

    Lmite superior

    Intervalo de confianzapara la media al 95%

    Media recortada al 5%

    Mediana

    Varianza

    Desv. tp.

    Mnimo

    Mximo

    Rango

    Amplitud intercuartil

    Asimetra

    Curtosis

    Categora laboral

    Administrativo

    Seguridad

    Directivo

    Salario actual

    Estadst ico Error tp.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    21/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    21

    b) Compare los ingresos en las tres categoras laborales utilizando un diagrama decajas.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    22/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    22

    El resultado ser el siguiente:

    Categora laboral

    DirectivoSeguridadAdministrativo

    Salarioactual

    $125.000

    $100.000

    $75.000

    $50.000

    $25.000

    $0

    303291 281

    206

    126

    272

    218

    29

    386

    234

    161

    146

    80

    72

    52

    175

    343

    32

    18

  • 7/23/2019 GUIAS DEL SPSS.pdf

    23/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    23

    SESIN 3: Intervalos de confianza y prueba de hiptesis

    El concepto de p valor

    Cuando se interpretan los reportes en pruebas de hiptesis, las conclusiones estn

    basadas en una regla de decisin; sta se establece tendiendo en cuenta el riesgo queasume el investigador de cometer un error de tipo I, siendo la probabilidad de este errorel nivel de significacin . Pero en algunas ocasiones, sin embargo, la decisin a tomarpuede realizarse con un nivel de significacin diferente, con lo cual seria til conocerque tipo de decisin se puede adoptar segn el nivel de significacin real de una pruebabasndose en los datos observados. Este concepto actuar como contrapuesto al nivel designificacin elegido antes de realizar la prueba.

    p-valor: probabilidad que, bajo H0el estadstico de contraste tome un valor al menostan alejado como el realmente obtenido.Cuanto ms pequeo sea el p-valormayor es la evidencia en contra de H0.

    Prueba t para una muestra

    Ejemplo1Los conductores metlicos o tubos huecos se usan en el cableado elctrico. En la pruebade tubos de una pulgada, se obtienen los datos siguientes respecto del dimetro exterior(en pulgadas).

    1,281 1,288 1,292 1,289 1,291 1,293 1,293 1,291 1,289 1,2881,287 1,291 1,290 1,286 1,289 1,286 1,295 1,296 1,291 1,286

    Suponga que el muestreo se realiza en una distribucin normal.

    a) Determine un intervalo del 90% de confianza para la media del dimetro exteriorb) Pruebe la hiptesis de que la longitud media del dimetro exterior es de 1,29

    pulgadas. Use un nivel de significacin del 10%

    Solucin:Comenzamos introduciendo los datos en el editor de datos de SPSS como unavariable de nombre Dimetro.

    a) Elegimos en el men Analizar Comparar medias Prueba T para unamuestra.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    24/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    24

    Rellenamos la siguiente ventana

    Observe que en valor de prueba se ha considera el valor cero, para obtenerdirectamente el intervalo de confianza solicitado

    Para indicar al SPSS el nivel de confianza hacemos un clic en Opciones y enIntervalo de confianza escribimos 90(es nuestro caso) y continuamos.

    Al hacer clic en aceptar obtenemos:

    Segn este resultado el intervalo de confianza para la media se encuentra en el rango de

    [1,288; 1,291]

    Prueba para una muestra

    1647.613 19 .000 1.289600 1.28825 1.29095Dimetro exteriort gl Sig. (bilateral)

    Diferenciade medias Inferior Superior

    90% Intervalo deconfianza para la

    diferencia

    Valor de prueba = 0

    Lmite inferior de confianza de la media

    Lmite superior de confianza de la media

    Estadsticos para una muestra

    20 1.28960 .003500 .000783Dimetro exteriorN Media

    Desviacintp.

    Error tp. dela media

    Estimacin puntual de la media

  • 7/23/2019 GUIAS DEL SPSS.pdf

    25/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    25

    Tenemos un 90% de confianza de que el intervalo [1,288; 1,291] contenga alverdadero dimetro medio de los conductores metlicos usados en el cableado

    elctrico

    b) Para probar la hiptesis de que la longitud media del dimetro exterior es de 1,29procedemos de la misma manera que en la parte a)

    Las hiptesis son:

    29,1:

    29,1:

    1

    0

    =

    H

    H

    El nivel de significacin que se usa en esta prueba es del 10% ( 10,0= )

    Procedimiento:Elegimos en el men Analizar Comparar medias Prueba T para unamuestra.

    Rellenamos la siguiente ventana

    Observe que en valor de prueba se ha considera el 1,29 es decir se ha considerado elvalor hipottico (hiptesis nula)

    Para indicar a SPSS el nivel de confianza hacemos un clic en opciones y enIntervalo de confianza escribimos 90 (es nuestro caso) y continuamos.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    26/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    26

    y al hacer clic en aceptar obtenemos:

    Como 29,1:0 =H frente a 29,1:1 H se trata por tanto de una prueba de hiptesis

    de dos colas (bilateral), el estadstico de prueba toma el valor -0,511. En este caso nopodemos rechazar la hiptesis nula, el valor p de 0,615 es mayor que el nivel designificacin de 0,10.

    Bajo un nivel de significacin del 10% concluimos que la longitud media del dimetro

    exterior de los tubos usados en el cableado elctrico es de 1,29 pulgadas

    Observacin:

    Puede calcularse el intervalo de confianza de la media sumando a la mediahipottica los valores -0,00175 y 0,00095 de la tabla anterior y obtenemos el

    mismo resultado que en la parte a)

    Cuando la prueba de hiptesis es de una sola cola (lateral izquierda o lateralderecha), el nivel de significacin debe compararse con la mitad de Sig que aparece

    en la tabla anterior

    Prueba t para dos muestras independientes cuando las varianzaspoblacionales son similares

    Ejemplo 2.

    Se piensa que el rendimiento de combustible en un modelo especfico de automvilsera ms alto si se utiliza gasolina sin plomo Premium que con la gasolina sin plomonormal. A fin de recopilar datos para sustentar esta afirmacin, se selecciona en formaaleatoria 10 vehculos de una lnea de montaje y se prueban con una marca especifica degasolina Premium, adems de seleccionar al azar otros 10 y probarlos con la de gasolina

    Estadsticos para una muestra

    20 1.28960 .003500 .000783Dimetro exteriorN Media

    Desviacintp.

    Error tp. dela media

    Prueba para una muestra

    -.511 19 .615 -.000400 -.00175 .00095Dimetro exteriort gl Sig. (bilateral)

    Diferenciade medias Inferior Superior

    90% Intervalo deconfianza para la

    diferencia

    Valor de prueba = 1.29

    El criterio de decisin se basa en lacomparacin de esta probabilidad con el nivel

    de significacin de la prueba

    En el caso de pruebas unilateralesbebe tomarse la mitad de este

    valor

  • 7/23/2019 GUIAS DEL SPSS.pdf

    27/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    27

    normal. Las pruebas se realizan bajo condiciones controladas idnticas. Los datosresultantes son los siguientes:

    Premium 35,0 34,5 31,6 32,4 34,8 31,7 35,4 35,3 36,6 36,0

    Normal 40,0 29,6 32,1 35,4 34,0 34,8 34,6 34,8 32,6 32,2

    Suponga que las muestras provienen de poblaciones normales.a) Determine e interprete un intervalo del 99% de confianza para la diferencia del

    rendimiento medio de la gasolina sin plomo Premium y de la gasolina sin plomonormal

    b) Realice una prueba de hiptesis para comparar la media de rendimiento decombustible con esas dos gasolinas. Use un nivel de significacin del 1%. Interpretelos resultados en el contexto del problema.

    Solucin:

    a) Comenzamos introduciendo los datos en el editor de datos de SPSS creando dosvariables: una de ellas corresponde al tipo de gasolina (variable de agrupacin): 1:

    gasolina sin plomo premium y 2: gasolina sin plomo normal (existen tantos 1 comorepeticiones tiene el tipo de gasolina sin plomo Premium; existen tantos 2 comorepeticiones tiene el tipo de gasolina sin plomo Normal), una segunda variable es elrendimiento, cuyos valores estn dados por el rendimiento en ambos tipos degasolina. La ventana siguiente muestra una de las formas de tratar esta informacin.

    Para determinar el intervalo de confianza solicitado, es necesario saber si lasvarianzas de las poblaciones de las cuales se han extrado las muestras sonhomogneas, entonces debe realizarse una prueba de hiptesis de homogeneidad devarianza.

    Las hiptesis son:

    22

    1

    22

    0

    :

    :

    NP

    NP

    H

    H

    =

    Consideramos un nivel de significacin del 1% en esta prueba

    Para realizar esta prueba aprovechamos el reporte de SPSS, obtenido mediante elsiguiente procedimiento:

    Elegimos en el men AnalizarComparar mediasPrueba T para muestrasindependientes.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    28/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    28

    Debe llenarse ahora la siguiente ventana

    Una vez seleccionadas las variables como se indica con las flechas, hacemos clic endefinir gruposy digitamos los grupos definidos anterior mente.

    Para indicar a SPSS el nivel de confianza hacemos un clic en Opcionesy en Intervalode confianza escribimos 99(es nuestro caso) y continuamos.luego de hacer clic enaceptar obtenemos el siguiente reporte:

    Estadsticos de grupo

    10 34.370 1.8105 .5725

    10 33.980 2.6720 .8450

    Tipo_gasGasolina sinplomo premium

    Gasolina sinplomo normal

    RendN Media

    Desviacintp.

    Error tp. dela media

  • 7/23/2019 GUIAS DEL SPSS.pdf

    29/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    29

    Observamos que la prueba de Levene para la igualdad de varianza result nosignificativa (SIG. 0,535), es decir que, las varianzas de las poblaciones de las cualesse ha extrado stas dos muestras son similares. En base a este resultado los lmitesinferior y superior de confianza del 99% para la diferencia de medias son -2,5479 y3,3279 respectivamente.

    Existe un 99% de confianza de que el intervalo [-2,5479; 3,3279] contenga laverdadera diferencia del rendimiento medio de la gasolina sin plomo Premium y de la

    gasolina sin plomo normal

    Tambin podemos concluir que el rendimiento medio de la gasolina sin plomo Premium

    y el rendimiento medio de la gasolina sin plomo normal son similares(puesto que elintervalo en mencin contiene el cero).

    b) En este caso aprovechamos el reporte anterior:

    Las hiptesis son:

    NP

    NP

    H

    H

    =

    :

    :

    1

    0

    Nivel de significacin: 1%

    En esta prueba tambin requerimos saber si las varianzas de las poblaciones de lascuales se han extrado las muestras son homogneas, pero en la parte a) se ha concluidoque las varianzas son similares.

    Prueba de muestras independientes

    .401 .535 .382 18 .707 .3900 1.0207 -2.5479 3.3279

    .382 15.825 .707 .3900 1.0207 -2.5955 3.3755

    Se han asumido

    varianzas iguales

    No se han asumidovarianzas iguales

    RendF Sig.

    Prueba de Levene

    para la igualdad de

    varianzas

    t gl Sig. (bilateral)

    Diferencia

    de medias

    Error tp. de

    la diferencia Inferior Superior

    99% Intervalo de

    confianza para ladiferencia

    Prueba T para la igualdad de medias

    Lmite inferior deconfianza para ladiferencia de mediasasumiendo varianzasiguales

    0,535 >0,01: No serechaza la hiptesisnula de varianzasiguales

    Lmite Superior deconfianza para ladiferencia de mediasasumiendo varianzasiguales

  • 7/23/2019 GUIAS DEL SPSS.pdf

    30/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    30

    Conclusin:

    Bajo un nivel de significacin del 1% concluimos que los rendimientos medios de

    ambos tipos de gasolinas son similares.

    Como puede observarse este resultado concuerda con el resultado obtenido en laparte a).

    Prueba t para dos muestras independientes cuando las varianzaspoblacionales no son similares

    Ejemplo 3Se obtienen los datos siguientes de la produccin de energa elctrica, en kilowatts, dedos nuevos motores Diesel de dos autos compactos, los datos son los siguientes:

    Inyeccin directa de combustible

    38,5 38,2 39,2 38,538,9 38,0 39,1 39,1

    37,4 37,6 39,0 38,0

    39,0 37,7 38,1 37,4

    a) Construya un intervalo de confianza de 95% para la diferencia de medias deproduccin de energa elctrica cuando se usa inyeccin directa de combustible ycuando se usa inyeccin indirecta

    b) El intervalo de la parte a) nos indica que existe una diferencia en la media de

    produccin de energa de esos dos motores? Explique su respuestac) Con una probabilidad de cometer error tipo I de 0,05; pruebe la hiptesis de que la

    produccin media de energa en ambos casos son similares.

    Solucin:

    Procedemos de la misma manera que en el ejemplo 2

    Inyeccin indirecta de combustible

    37,7 39,2 39,1 39,0

    36,8 39,7 36,9

    38,2 35,9 37,339,2 37,8 36,4

    Prueba de muestras independientes

    .401 .535 .382 18 .707 .3900 1.0207 -2.5479 3.3279

    .382 15.825 .707 .3900 1.0207 -2.5955 3.3755

    Se han asumidovarianzas iguales

    No se han asumido

    varianzas iguales

    RendF Sig.

    Prueba de Levene

    para la igualdad devarianzas

    t gl Sig. (bilateral)

    Diferencia

    de medias

    Error tp. de

    la diferencia Inferior Superior

    99% Intervalo deconfianza para la

    diferencia

    Prueba T para la igualdad de medias

    Valor del estadstico deprueba cuando las varianzasson similares

    p = 0,707 >0,01: No serechaza la hiptesis nula de

    medias iguales

    Si la prueba fuera unilateral estevalor debe dividirse entre dos ycompararse con el nivel designificacin

  • 7/23/2019 GUIAS DEL SPSS.pdf

    31/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    31

    Prueba de hiptesis

    a) para la igualdad de varianzas

    22

    1

    220

    :

    :

    IIID

    IIID

    H

    H

    =

    Nivel de significacin: 5%Como Sig. = 0,007 < 0,05; rechazamos la hiptesis nula de varianzas iguales

    Estadsticos de grupo

    16 38.356 .6408 .1602

    13 37.938 1.2319 .3417

    Tipo de InyeccinInyeccin directa

    Inyeccin idirecta

    Produccin de energaN Media

    Desviacintp.

    Error tp. dela media

    Prueba de muestras independientes

    8.568 .007 1.178 27 .249 .4178 .3547 -.3101 1.1457

    1.107 17.192 .283 .4178 .3774 -.3777 1.2133

    Se han asumidovarianzas iguales

    No se han asumidovarianzas iguales

    Produccin de energaF Sig.

    Prueba de Levenepara la igualdad de

    varianzas

    t gl Sig. (bilateral)Diferenciade medias

    Error tp. dela diferencia Inferior Superior

    95% Intervalo deconfianza para la

    diferencia

    Prueba T para la igualdad de medias

  • 7/23/2019 GUIAS DEL SPSS.pdf

    32/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    32

    Bajo un nivel de significacin del 5%, podemos afirmar que existe evidenciaestadstica suficiente para concluir que las varianzas de las poblaciones de las cualesfueron extradas las muestras noson similares

    Luego los lmites inferior y superior de confianza del 95% para la diferencia demedias de produccin de energa elctrica cuando se usa inyeccin directa de

    combustible y cuando se usa inyeccin indirecta de combustible son -0,3777 y1,2133 respectivamente.

    Existe un 95% de confianza de que el intervalo [-0,3777; 1,2133] contenga laverdadera diferencia de produccin de energa elctrica cuando se usa inyeccin

    directa de combustible y cuando se usa inyeccin indirecta de combustible.

    b) Mediante este intervalo tambin podemos concluir que las producciones medias deenerga elctrica cuando se usa inyeccin directa de combustible y cuando se usainyeccin indirecta son similares. (el cero est contenido en este intervalo), es decir,no existe diferencias significativas entre las producciones medias de energa

    cuando se usa inyeccin directa e inyeccin indirecta de combustible.

    La misma conclusin debe obtenerse al realizar la siguiente prueba de hiptesis

    c) Prueba de hiptesis para la diferencia de medias

    NP

    NP

    H

    H

    =

    :

    :

    1

    0

    Nivel de significacin: 5%

    Dado que las varianzas no son similares, el valor del estadstico de prueba es 1,107 (nose han asumido varianzas iguales) y la significacin bilateral es de 0,283; por lo tantono podemos rechazar la hiptesis nula de igualdad de media, entonces la conclusin es:

    Bajo un nivel de significacin del 5% podemos concluir que no existen diferenciassignificativas entre las producciones medias de energa cuando se usa inyeccin directa

    e inyeccin indirecta de combustible.

    Prueba de muestras independientes

    8.568 .007 1.178 27 .249 .4178 .3547 -.3101 1.1457

    1.107 17.192 .283 .4178 .3774 -.3777 1.2133

    Se han asumid

    varianzas igual

    No se han asuvarianzas igual

    Produccin de enF Sig.

    Prueba de Leveneara la igualdad de

    varianzas

    t gl ig. (bilateralDiferenciae medias

    rror tp. dea diferencia Inferior Superior

    95% Intervalo deconfianza para la

    diferencia

    Prueba T para la igualdad de medias

  • 7/23/2019 GUIAS DEL SPSS.pdf

    33/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    33

    SESIN 4: REGRESIN LINEAL SIMPLE

    A continuacin se muestra la base de datos con la que se explicar los procedimientosinvolucrados al realizar un anlisis de regresin lineal simple.

    Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en lasque una compaa opera. Dicha compaa se dedica a la venta de repuestos paraautomviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero dedistribuidoras establecidas en cada regin y el nmero de automviles registrados paracada regin.

    MATRIZ DE CORRELACIONES

    El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizandodicha matriz se podr determinar cul de las variables independientes esta mscorrelacionada con la variable dependiente.La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:

  • 7/23/2019 GUIAS DEL SPSS.pdf

    34/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    34

    Obtenemos el siguiente resultado:

    Correlaciones

    1 .739** .548

    .009 .081

    11 11 11.739** 1 .670*

    .009 .024

    11 11 11

    .548 .670* 1

    .081 .024

    11 11 11

    Correlacin de Pearson

    Sig. (bilateral)

    NCorrelacin de Pearson

    Sig. (bilateral)

    N

    Correlacin de Pearson

    Sig. (bilateral)

    N

    Ventas (mills $)

    Nro distribuidoras

    Nro Autos (mills)

    Ventas(mills $)

    Nrodistribuidoras

    Nro Autos(mills)

    La correlacin es significativa al nivel 0,01 (bilateral).**.

    La correlacin es significante al nivel 0,05 (bilateral).*.

    Se observa que la variable ventas est ms correlacionada con la variable Nmero dedistribuidoras (correlacin 0.739) por lo que un primer paso ser realizar un anlisis deregresin lineal simple con esta variable independiente.

    REGRESION LINEAL SIMPLE ENTRE LA VARIABLE INDEPENDIENTEMS CORRELACIONADA CON Y

    La secuencia es:Analizar, Regresin, Lineal,se mostrar el siguiente cuadro de dilogo:

    Por el momento slo se proceder a obtener la ecuacin del modelo as como algunosvalores representativos para la validacin de dicho modelo.Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresinlineal mltiple.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    35/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    35

    Resultados obtenidos:

    Resumen del modelo

    .739a .546 .496 9.7718

    Modelo1

    R R cuadrado

    R cuadrado

    corregida

    Error tp. de la

    estimacin

    Variables predictoras: (Constante), Nro distribuidorasa.

    El coeficiente de determinacin, denotado por R2 (0.546) implica que el 54.6% devariacin en las ventas pueden ser explicadas por el modelo de regresin.

    ANOVAb

    1033.836 1 1033.836 10.827 .009a

    859.393 9 95.488

    1893.229 10

    Regresin

    Residual

    Total

    Modelo1

    Suma de

    cuadrados gl

    Media

    cuadrtica F Sig.

    Variables predictoras: (Constante), Nro distribuidorasa.

    Variable dependiente: Ventas (mills $)b.

    La tabla de Anlisis de Varianza permite realizar la prueba de significacin global delmodelo, se propone las siguientes hiptesis:

    modeloelparaivasignificatesvariableunamenoslAH

    modelolancontribuyenovariableslasconjuntaformaEnH

    i

    o

    0:

    0:

    1

    10

    ==

    Analizando el P-Valor (0.009), el cual es inferior al 5% (nivel de significacinpropuesto usualmente para la prueba), se decide que se debe rechazar la hiptesis nulacon lo cual concluimos que la variable Nmero de distribuidoras s contribuye almodelo.

    Coeficientesa

    10.881 6.409 1.698 .124

    .012 .004 .739 3.290 .009

    (Constante)

    Nro distribuidoras

    Modelo1

    B Error tp.

    Coeficientes noestandarizados

    Beta

    Coeficientes

    estandarizados

    t Sig.

    Variable dependiente: Ventas (mills $)a.

    El modelo estimado para el presente caso ser:

    )(012.0881.10 orasdistribuiddeNroentasV += Adems de la prueba de verificacin global se puede realizar la prueba de verificacinindividual de cada variable independiente.

    modeloelparaivasignificatesvariableLaH

    modeloelparaivasignificatesnovariableLaH

    i

    io

    0:

    0:

    1

    =

    Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba deverificacin global.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    36/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    36

    Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico dedispersin, el cul muestra la posible tendencia y/o relacin posible entre variabledependiente e independiente.La secuencia para obtener dicho grfico es la siguiente:

    En el cuadro de dilogo se ingresar la informacin de la siguiente manera:

    El resultado que se obtiene es el siguiente:

  • 7/23/2019 GUIAS DEL SPSS.pdf

    37/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    37

    125 480 650 1233 1694 1699 1840 2011 2214 2302 2850

    Nro distribuidoras

    3.5

    16.0

    20.2

    25.2

    26.0

    30.0

    33.1

    35.0

    38.2

    46.2

    52.3

    Ventas(mills$

    )

  • 7/23/2019 GUIAS DEL SPSS.pdf

    38/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    38

    SESIN 5: REGRESIN CURVILINEAL

    Analizaremos los diferentes modelos curvilneos que puedan formarse para determinarcul de ellos es el mejor. Los datos se muestran en la siguiente grfica:La secuencia para realizar una regresin curvilnea es la siguiente:

    Analizar, Regresin, Estimacin Curvilnea

    Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Paradesarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisisde varianza de los modelos: Lineal, Logartmico, Cuadrtico, Cbico y Exponencial.

    Los resultados que obtenemos son los siguientes:

    LINEAL

    Resumen del modelo

    R R cuadradoR cuadradocorregida

    Error tpico de laestimacin

    .966 .933 .920 9.017

    La variable independiente esMillas.

    ANOVA

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Regresin 5675.152 1 5675.152 69.795 .000

    Residual 406.557 5 81.311

    Total 6081.709 6

    La variable independiente esMillas.

    Coeficientes

  • 7/23/2019 GUIAS DEL SPSS.pdf

    39/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    39

    Coeficientes noestandarizados

    Coeficientesestandarizados

    B Error tpico Beta t Sig.

    Millas -2.040 .244 -.966 -8.354 .000

    (Constante) 91.660 5.080 18.042 .000

    LOGARTMICO

    Resumen del modelo

    R R cuadradoR cuadradocorregida

    Error tpico de laestimacin

    .973 .946 .936 8.071

    La variable independiente esMillas.

    ANOVA

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Regresin 5756.025 1 5756.025 88.368 .000

    Residual 325.683 5 65.137

    Total 6081.709 6

    La variable independiente esMillas.

    Coeficientes

    Coeficientes noestandarizados

    Coeficientesestandarizados

    B Error tpico Beta t Sig.

    ln(Millas) -22.189 2.360 -.973 -9.400 .000(Constante) 106.754 5.818 18.350 .000

    CUADRTICOResumen del modelo

    R R cuadradoR cuadradocorregida

    Error tpico de laestimacin

    .993 .986 .979 4.584

    La variable independiente esMillas.

    ANOVA

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Regresin 5997.661 2 2998.830 142.721 .000

    Residual 84.048 4 21.012

    Total 6081.709 6

    La variable independiente esMillas.Coeficientes

  • 7/23/2019 GUIAS DEL SPSS.pdf

    40/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    40

    Coeficientes noestandarizados

    Coeficientesestandarizados

    B Error tpico Beta t Sig.

    Millas -3.924 .497 -1.858 -7.900 .001

    Millas ** 2 .048 .012 .922 3.918 .017

    (Constante) 99.897 3.330 29.998 .000

    CBICOResumen del modelo

    R R cuadradoR cuadradocorregida

    Error tpico de laestimacin

    .997 .994 .988 3.559

    La variable independiente esMillas.

    ANOVA

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Regresin 6043.709 3 2014.570 159.047 .001

    Residual 38.000 3 12.667

    Total 6081.709 6

    La variable independiente esMillas.

    Coeficientes

    Coeficientes noestandarizados

    Coeficientesestandarizados

    B Error tpico Beta t Sig.

    Millas -5.626 .972 -2.664 -5.786 .010

    Millas ** 2 .160 .059 3.055 2.695 .074

    Millas ** 3 -.002 .001 -1.371 -1.907 .153

    (Constante) 103.925 3.339 31.124 .000

    EXPONENCIAL

    Resumen del modelo

    R R cuadradoR cuadradocorregida

    Error tpico de laestimacin

    .989 .979 .974 .104

    La variable independiente esMillas.

    ANOVA

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Regresin 2.496 1 2.496 229.924 .000

    Residual .054 5 .011

    Total 2.550 6

    La variable independiente esMillas.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    41/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    41

    Coeficientes

    Coeficientes noestandarizados

    Coeficientesestandarizados

    B Error tpico Beta t Sig.

    Millas -.043 .003 -.989 -15.163 .000

    (Constante) 99.496 5.840 17.036 .000

    La variable dependiente es ln(Porcentaje).

    40,0020,000,00

    Millas

    100,00

    80,00

    60,00

    40,00

    20,00

    0,00

    Porcentaje

    Exponencial

    Cbico

    Cuadrtico

    Logartmico

    Lineal

    Observada

  • 7/23/2019 GUIAS DEL SPSS.pdf

    42/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    42

    SESIN 6: REGRESIN LINEAL MLTIPLE

    Para la explicacin de los procedimientos relacionados con el anlisis de regresin

    mltiple, se usar el siguiente caso:

    Un analista realiza una investigacin de las ganancias por accin de grandescorporaciones. Las variables de prediccin que estima le sern tiles son las siguientes:ventas en millones de dlares, utilidades como porcentaje de inversin, activos enmillones de dlares e inversin de los accionistas millones de dlares.Como primer paso de anlisis veremos las correlaciones entre las variables involucradasen el anlisis.

    Analizar, Correlaciones, Bivariadas, se obtiene los siguientes resultados:Correlaciones

    1 .316 .333 .355 .451*

    .089 .072 .054 .012

    30 30 30 30 30

    .316 1 .994** .978** -.085

    .089 .000 .000 .653

    30 30 30 30 30

    .333 .994** 1 .992** -.062

    .072 .000 .000 .744

    30 30 30 30 30

    .355 .978** .992** 1 -.051

    .054 .000 .000 .790

    30 30 30 30 30

    .451* -.085 -.062 -.051 1

    .012 .653 .744 .790

    30 30 30 30 30

    Correlacin de Pearson

    Sig. (bilateral)

    N

    Correlacin de Pearson

    Sig. (bilateral)

    N

    Correlacin de Pearson

    Sig. (bilateral)

    N

    Correlacin de Pearson

    Sig. (bilateral)

    N

    Correlacin de Pearson

    Sig. (bilateral)

    N

    Ganancias por accin

    Ventas (mills)

    Activos (mills)

    Inversion de accionistas

    Utilidades %

    Gananciaspor accin Ventas (mil ls) Activos (mi lls)

    Inversion deaccionistas Utilidades %

    La correlacin es significante al nivel 0,05 (bilateral).*.

    La correlacin es significativa al nivel 0,01 (bilateral).**.

    Como se observa, existe una baja correlacin entre la variable dependiente y lasposibles predictoras. Adems, existe una alta correlacin entre las variablesindependientes.

    MULTICOLINEALIDAD:

    El problema de multicolinealidad se presenta cuando existe una alta correlacin entrevariables independientes, como es el caso: correlacin entre Ventas y Activos (0.994);correlacin entre Ventas e Inversin (0.978).

    Adems se comprueba la multicolinealidad siguiendo el criterio propuesto en clase:Menor correlacin entre Y y las Xs 0.316Existe correlaciones entre Xs mayor que 0.316

    An en la presencia detectada de multicolinealidad estimaremos el modelo paradeterminar lo adecuado que puede ser su uso para la prediccin:Seguimos la siguiente secuencia: Analizar, Regresin, Lineal

  • 7/23/2019 GUIAS DEL SPSS.pdf

    43/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    43

    En el cuadro mostrado se selecciona la variable dependiente y las independientes segnse indica:

    Los resultados obtenidos son los siguientes:

    Resumen del modelo

    .600a .360 .257 2.70416

    Modelo1

    R R cuadradoR cuadradocorregida

    Error tp. de laestimacin

    Variables predictoras: (Constante), Utilidades %, Inversionde accionistas, Ventas (mills), Activos (mills)

    a.

    El porcentaje de variacin que es explicado por la ecuacin de regresin es bajo, slo36%.

    ANOVAb

    102.660 4 25.665 3.510 .021a

    182.812 25 7.312

    285.472 29

    Regresin

    Residual

    Total

    Modelo1

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Variables predictoras: (Constante), Utilidades %, Inversion de accionistas, Ventas(mills), Activos (mills)

    a.

    Variable dependiente: Ganancias por accinb.

    En forma conjunta las variables son significativas para el modelo, considerando un nivelde significacin del 5% (P-Valor = 0.021). Las hiptesis que se proponen son lassiguientes:

    modeloelparaivasignificatesvariableunamenoslAH

    modelolancontribuyenovariableslasconjuntaformaEnH

    i

    o

    0:

    0...:

    1

    410

    ====

    El siguiente cuadro permite analizar la contribucin individual de cada variableregresora al modelo propuesto:

    Ingresar aqu la variabledependiente

    Ingresar aqu las variablesindependientes

  • 7/23/2019 GUIAS DEL SPSS.pdf

    44/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    44

    Coeficientesa

    -.039 1.313 -.029 .977

    .000 .001 .457 .275 .786

    .000 .001 -1.444 -.549 .588

    .001 .001 1.364 .966 .343

    .186 .065 .470 2.862 .008

    (Constante)

    Ventas (mills)Activos (mills)

    Inversion de accionistas

    Utilidades %

    Modelo1

    B Error tp.

    Coeficientes noestandarizados

    Beta

    Coeficientesestandarizad

    os

    t Sig.

    Variable dependiente: Ganancias por accina.

    En forma individual, slo la variable Utilidades es significativa para el modelo pues suP-Valor (0.008) es menor al nivel de significacin usual (5%), sin embargo las otrasvariable no contribuyen de manera individual al modelo.

    modeloelparaivasignificatesvariableLaH

    modeloelparaivasignificatesnoivariableLaH

    i

    io

    0:

    0:

    1

    =

    MTODO DE SELECCIN DE VARIABLES: HACIA ADELANTE

    Se ha determinado hasta el momento que el modelo presenta deficiencias puesto que elporcentaje de variacin explicado es bajo, se ha detectado la presencia demulticolinealidad y de manera individual existe variables que no contribuyen al modelo.

    El siguiente paso consiste en retirar las variables que presentan multicolinealidad yanalizar el nuevo modelo resultante.

    Lo propuesto se puede realizar en la opcin: Mtodo. Al seleccionar Introducir, el

    programa ir ingresando variables al modelo y a la vez verificar su contribucin.

    Los resultados obtenidos son los siguientes:

    Aqu se debe seleccionar elmtodo par seleccionar

    variables

  • 7/23/2019 GUIAS DEL SPSS.pdf

    45/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    45

    Resumen del modelo

    .451a .204 .175 2.84917

    .589b .347 .298 2.62787

    Modelo1

    2

    R R cuadradoR cuadradocorregida

    Error tp. de laestimacin

    Variables predictoras: (Constante), Utilidades %a.Variables predictoras: (Constante), Utilidades %, Inversionde accionistas

    b.

    ANOVAc

    58.175 1 58.175 7.166 .012a

    227.297 28 8.118

    285.472 29

    99.018 2 49.509 7.169 .003b

    186.454 27 6.906

    285.472 29

    Regresin

    Residual

    Total

    Regresin

    Residual

    Total

    Modelo1

    2

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Variables predictoras: (Constante), Utilidades %a.

    Variables predictoras: (Constante), Utilidades %, Inversion de accionistasb.

    Variable dependiente: Ganancias por accinc.

    Coeficientesa

    .493 1.243 .397 .695

    .179 .067 .451 2.677 .012

    -.054 1.168 -.047 .963

    .186 .062 .471 3.022 .005

    .000 .000 .379 2.432 .022

    (Constante)

    Utilidades %

    (Constante)

    Utilidades %

    Inversion de accionistas

    Modelo1

    2

    B Error tp.

    Coeficientes noestandarizados

    Beta

    Coeficientesestandarizad

    os

    t Sig.

    Variable dependiente: Ganancias por accina.

    Variables excluidasc

    .357a 2.259 .032 .399 .993

    .362a 2.304 .029 .405 .996

    .379a 2.432 .022 .424 .997

    -.349b -.449 .657 -.088 .041

    -.808b -.662 .514 -.129 .017

    Ventas (mills)

    Activos (mills)

    Inversion de accionistas

    Ventas (mills)

    Activos (mills)

    Modelo1

    2

    Beta dentro t Sig.Correlacin

    parcial Tolerancia

    Estadsticosde

    colinealidad

    Variables predictoras en el modelo: (Constante), Utilidades %a.

    Variables predictoras en el modelo: (Constante), Utilidades %, Inversion de accionistasb.Variable dependiente: Ganancias por accinc.

    MODELO FINAL:

    Luego, el programa nos entrega el mejor modelo. En este caso las variables deprediccin seleccionadas son Ventas y Activos. A continuacin se muestra elresumen para este modelo:

  • 7/23/2019 GUIAS DEL SPSS.pdf

    46/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    46

    Resumen del modelo

    .589a .347 .298 2.62787

    Modelo1

    R R cuadradoR cuadradocorregida

    Error tp. de laestimacin

    Variables predictoras: (Constante), Utilidades %, Inversionde accionistas

    a.

    ANOVAb

    99.018 2 49.509 7.169 .003a

    186.454 27 6.906

    285.472 29

    Regresin

    Residual

    Total

    Modelo1

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Variables predictoras: (Constante), Utilidades %, Inversion de accionistasa.

    Variable dependiente: Ganancias por accinb.

    Coeficientesa

    -.054 1.168 -.047 .963

    .000 .000 .379 2.432 .022

    .186 .062 .471 3.022 .005

    (Constante)

    Inversion de accionistas

    Utilidades %

    Modelo1

    B Error tp.

    Coeficientes noestandarizados

    Beta

    Coeficientesestandarizad

    os

    t Sig.

    Variable dependiente: Ganancias por accina.

    SUPUESTO DE NORMALIDAD:

    Otro supuesto del modelo es la normalidad que presentan los errores. Para verificar estesupuesto podemos realizar el grfico de probabilidad normal.Lo primero que se debe hacer es seleccionar la opcin guardar y en el cuadro dedilogo que se muestra marcar las pociones: Residuos: No tipificados y Valores

    Pronosticados: No tipificados. Los valores de los residuos se generaranautomticamente y se guardaran en dos columnas adicionales en nuestra base de datos.

  • 7/23/2019 GUIAS DEL SPSS.pdf

    47/47

    Gua de la laboratorio SPSS Gonzalo Cuadros Herrera

    El siguiente paso es ingresar a la opcin grficos y marcar la opcin de grfico deprobabilidad normal.

    El resultado que se obtiene es el que se muestra:

    1,00,80,60,40,20,0

    Prob acum observada

    1,0

    0,8

    0,6

    0,4

    0,2

    0,0

    Probacumesperada

    Grfico P-P normal de regresin Residuo tipificado

    Variable dependiente: Ganancias por accin

    Primero generar los valoresde residuales

    Luego generar el grfico conlos residuales ya calculados

    en el paso anterior