Ayuda SPSS-Chi Cuadrado Notas as

Embed Size (px)

Citation preview

AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA1/19 AYUDA SPSS CHICUADRADO NOTAS METODOLGI CAS Rubn Jos Rodr guez Oct ubr e de 2004 I NTRODUCCI N ChiCuadradodePearsonesunestadsticonoparamtricoyesunapotenteherramientapara pruebasdesignificacindelahiptesisnuladeindependenciaestadsticaentrevariables categorialesentablasdecontingencia.Parapoderrealizarunacorrectaaplicacine interpretacin de Chi Cuadrado se han desarrollado estas Notas Metodolgicas que sistematizan las consideraciones de los principales tratadistas en la materia. Se hace hincapi en los anlisis delosresiduos(diferenciasentrelasfrecuenciaobservadasyesperadas),especficamenteen los residuos tipificado corregidos (o residuos ajustados), dado que nos permiten interpretar con precisinelsignificadodelaasociacindetectada,entrminosdelpuntajestandardizadoZ. TambinsedesarrollaformulasalternativasdelChiCuadradodePearsonparaciertas condicionesdeuso.SecomparalaPruebadeIndependenciadelaLeydelproductoodela probabilidad compuesta en el marco de la Teora matemtica de la probabilidad'a prior' de Pierre SimnLaplace,conlosresultadosdeChiCuadrado.SeexponelaRegladeHansZeizelpara calcularlosporcentajesdeceldas.Seintroducelanocindeceldafalsificadoradelahiptesis nula(ylasceldasverificadorasdelahiptesisalternativaodelinvestigador).Serealizaruna lectura de los porcentajes de celdas y se interpreta la diferencia porcentual. Se utiliza la prueba t de diferencia de media de proporciones para muestras independientes como va alternativa deestablecerlasignificacinestadsticadeladiferenciaentreporcentajescondicionalesode celdas. Por ltimo se expone el caso TITANIC (ver Ayuda SPSS - Chi Cuadrado_Caso TITANIC) paraejemplificarlodesarrolladoesestasnotasmetodolgicasybrindarunadefinicine interpretacindelP-value.SeresumeelmodeloChiCuadrado,seformulanlashiptesis estadsticas (nula y del investigador), se establecen las reglas de decisin de Pearson y Fisher, y se adjunta la tabla de Chi Cuadrado para identificar el Chi Cuadrado terico segn determinados grados de libertad y nivel de significacin.Not as I[ RJR] :a) RazndeVer osi mi l i t udJi - cuadr ado: La razn de verosimilitud Ji-cuadrado es unaalternativaalestadsticoJi-cuadrado(X2=Chicuadrado)dePearsonpara contrastar la hiptesis de independencia entre las variables. Mientras el estadstico Ji-cuadrado de Pearson se basa en las diferencias entre lasfrecuenciasobservadasylas frecuenciasesperadas,lar azndever osi mi l i t udJi - cuadr adosebasaenelcoci ent e ent r e el l as(si) el p- valor asociado a la razn de verosimilitud Ji-cuadrado (Significance=0,00000) tambin es menor que P = 0,05. En consecuencia, al nivel de significacin 0,005, tambin se rechazar la hiptesis nula de independencia entre lasvariablespodrasucederque,paraunmismoniveldesignificacin,elp- valor asociado a uno de estas test, fuera menor que el nivel de significacin, mientras que el p- valor asociado a la otra prueba fuera mayor, en dicho caso, debera optarse por el ms conservador (por el que presente menor p- valor). Ferrn Aranaz, Magdalena (1996). SPSSpar aWi ndow s.Pr ogr amaci ny anl i si s est adst i co. Madrid,EditorialMcGraw-Hill.1996.ISBN84-481-0589-3,pgs.144-145. b)El Test del aRazndeVer osi mi l i t udes:ComoalternativaalcontrasteChi-cuadrado,S.Wiks(1935),( TheLikelihoodt est ofindependenceincont ingency AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA2/19 t ables ,Annals of Mathematical Statistics, N 6, pg. 190), ha propuesto el siguiente estadstico: 2 iiiiio:: , es decir, la cantidad de casos o de valores que se han registrado para cada valor de la variable,si es una tabla de contingencia. (f ) Frecuencias observaFG 2 F * lnEFEdasFrecuenc :siendo| |= |\ .esuponiendo que la hiptesisnula que se ensaya es verdadera.ias espera(f ) d , as (en general), se obtienen resultados muy similares en todos los casos y, por lo tanto, el uso de uno u otro procedimiento sera, en principio, indiferente. Ello no obstante, el t est del ar azndever osi mi l i t udpresentaunaventajaconrespectoalChi-cuadrado: No r equi er e que t odas f r ecuenci as esper adas sean may or es de5 Garca,RobertoM.(1995).Cont r ast eChi - cuadr ado.BuenosAires,Cuadernosde UADEn123,DepartamentodeMatemticayMtodosCuantitativos,UADE,1995, ISBN 987-519-1-012-8, pg. 27. c) Chicuadr ado de l a r azn de ver osi mi l i t ud Li k el i hood r at i o chisquar e Estadstico de bondad de ajuste similar al Chi cuadrado de Pearson. Para tamaos de muestragrandes,losdosestadsticossonequivalentes.Laventajadelchicuadrado delarazndeverosimilitudesquepuedesubdividirseenunaseriedepartes interpretables por separado que, sumadas, equivalen al total. Di cci onar i o Est adst i co, http://www.estadistico.com/dic.html?p=122 d) cuando se pide el test de Ji-Cuadrado al programa, SPSSproporciona adems la Razn de Ver osi mi l i t ud ( Li k el i hood Rat i o) , y el Mantel-Haenzel Test (Asociacin linealporlineal).Elprimerodeestosestbasadoenlateorademxima verosimilitud, y su valor es dosveceslasumadelasfrecuenciasobservadasdecada celdamult iplicadasporellogarit moneperianodelafrecuenciaobservadadividida ent relafrecuenciat erica.Con grandes tamaos de muestra adopta valores similares al test Ji-Cuadrado. El Mantel-Haenzel Test es una medida de avocacin que analiza la relacin existente entre las filas y columnas de una tabla; y se calcula multiplicando el coeficiente de correlacin de Pearson por el nmero de casos menos uno. Como ha sealadoNorusis,hayquetenerencuentaquenicamentedebeserutilizadocon variables ordinales y de intervalo (Norusis, 1990:131).DazdeRada,Vidal(1999):Tcni casdeanl i si sdedat ospar ai nvest i gador es soci al es.AplicacionesprcticasconSPSSparaWindows:Madrid,Ra-Ma,1999,p. 171. [RJR] Not a I I[ RJR] : Anl i si sdel osResi duos: La prueba de la Ji-cuadrada que hemos explicado en 6.3.1. sirve para ver si la relacin entre unpar devar i abl eses estadsticamente significativa.Elanlisisdelosresiduosvaautilizarlasideasdelaji-cuadradapara AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA3/19 estudiar de una manera pormenorizada la tabla: en lugar de ver si las dos variables estn relacionadas estudiamos l a r el aci n ent r e cada par ej a de cat egor as. Bsicamente, el anlisis de los residuos (diferencia entre valor observado (fo), Oi j) y el valor esperado (fe), Ei j) es una aplicacin de la Ji-cuadrada al estudio de las parejasdecategoras:observamoslasfrecuenciasobtenidasylascomparamoscon lasesperadassilaparejadecategorasnoestuvierarelacionadaelclculose realizasegnelprocedimientoexplicadoen6.3.1.Del amagni t uddel r esi duo concl ui r emossobr el ar el aci nent r el ascat egor asCadacasilladelatabla incluyeelnmerodecasos,ovaloresobservados( COUNT) ,losvaloresesperados ( EXPECTED) ,ladiferenciaentreobservadosyesperados( RESI D) ,losresiduos estandarizados ( SRESI D)y estos mismos residuos ajustados segn procedimiento de Haberman ( ASRESI D) . Veamos el clculo de cada uno de estos valores: -Los r esi duos ( RESI D) : ij(RESID) R ( )ij ijO E = dondeOij y Eij sonlosvaloresobservadosyesperados,respectivamente,encasilla definida por la fila i y la columna j . Snchez Carrin, Juan Javier (1995): Manual deanl i si sest adst i codel osdat os, 2ed.Revisada,Madrid,AlianzaEditorial,1999,captulo6:Lastablasde contingencia: relacin entre variables nominales (ordinales), pp. 341-344. [RJR]. La diferencia entre un valor observado y el valor pronosticado por el modelo. El valor pronosticadoeselnmerodecasosqueseesperaranenlacasillasinohubiera relacinentrelasdosvariables.Unresiduopositivoindicaquehaymscasosenla casilladelosquehabraenellasilasvariablesdefilaycolumnafueran independientes. SPSS11.51,Ay udacont ex t ual , Tablas de Contingencia, Chi Cuadrado, Mostrar en las celdas, Residuos. [RJR] -Los r esi duos est andar i zados ( SRESI D) :

ij(SRESID) SR ( ) /ij ij ijO E E = Estos residuos eliminan el efecto que sobre el valor del residuo puedan tener los marginales de ambas variables Snchez Carrin (1995: 341-344). [RJR] El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que sonconocidostambincomolosresiduosdePearsonoresiduosestandarizados, tienen una media de 0 y una desviacin tpica de 1. SPSS11.51,Ay udacont ex t ual , Tablas de Contingencia, Chi Cuadrado, Mostrar en las celdas, Residuos tipificados. [RJR] -Los r esi duos aj ust ados ( ASRESI D) : AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA4/19

ij(SRESID) AR /ij ijSR V = donde Vi j es la varianza estimada de SRi j,de valor igual a: | |. .1 ( / ) 1 ( / )ij i jV O n O n( = siendoOi . y O.jsonlasfrecuenciasobservadas,respectivamente,enlafilaiyla columna j , y nel tamao de la muestraCuant omay or seael val or absol ut odelr esi duo aj ust ado, may orser l a r el aci n ent r e l a par ej a de cat egor as. Snchez Carrin (1995: 341-344). [RJR] El residuo de una casilla (valor observado menos valor pronosticado) dividido por una estimacin de su error tpico. El residuo tipificado resultante viene expresado en unidades de desviacin tpica, por encima o por debajo de la media. SPSS15. 0,Ay udacont ex t ual ,TablasdeContingencia,ChiCuadrado,Mostraren las celdas, Residuos tipificados corregidos [RJR]. LosResi duost i pi f i cadoscor r egi dosdeHaberman(1973).Estosresiduosse distribuyen normalmente con media 0 y desviacin tpica 1. Se calculan dividiendo el residuo de cada casilla por su Error Tpico ( ES o SE) , que en tablas bidimensionales se obtienen como la raz cuadrada de: mij (1-ni) (1-nj)/n2 . Lagranut ilidaddelosResi duost i pi f i cadoscor r egi dosradicaenque, puest oque sedist ribuyenormalment econmediaceroydesviacint picauno, N( 0, 1) , son fcilment eint erpret ables: ut ilizandounniveldeconfianzade0, 95, podemosafirmar quelosresiduosmayoresde1, 96delat ancasillasconmscasosdelosquedebera haberenesacasillasilasvariablesest udiadasfueranindependient es; mient rasque losresiduosmenoresde- 1, 96delat ancasillasconmenoscasosdelosquecabra esperar baj o la condicin de independencia.Ent ablasdecont ingenciaconvariablesnominales, unavezquehemosest ablecido queent redosvariablesexist easociacinsignificat iva( mediant eelest adst icoChi-cuadrado) yquehemoscuant ificadoesaasociacinconalgnndicedeasociacin ( Coeficient edeCont ingencia, CC) , losresiduost ipificadoscorregidosconst it uyenla mej orherramient adisponibleparapoderint erpret arconprecisinelsignificadodela asociacindet ect adaLosdist int osporcent aj espuedenayudarnosaint uirposibles paut as deasociacin, perosonlos Resi duos t i pi f i cados cor r egi doslos que nos permit eint erpret ardeformaprecisalarelacinexist ent eent relas variablesBast aconfij arnosenaquellos( punt aj esz) quesonmayoresque + 1, 96 o menores que - 1, 96. .[Ver ejemplo Tabla 5 y 6 en Nota IV d)] Gua 10.0 SPSS par a elAnl i si s de Dat os, captulo 12: Anlisis de variables categricas, p. 39 y 41. (En lnea): ht t p: / / w w w .uca.es/ ser v/ sai / manual es/ spss/ Pant al l a/ 12cont i n.pdf[Consulta: 10 de octubre de 2004] AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA5/19 Not a I I I :[ RJR]Pr uebaEst adst i cadeFi sher : Pruebaestadsticaideadaparaelcasodetablas dicotmicasenlasquenosepuedaaplicareltestX2porserlafrecuenciao frecuenciasdealgunadesuscasillasmsbajasquelopermitidopordichotest,es decir, inferiores a cinco. Frmula: (a+b)!(c+d)!(a+c)!(b+d)!P=N! a!b! c! d! Tieneelinconvenientedeladificultaddesuclculoporelnmerodefactoriales(!) que comprende la frmula (El paquete estadstico SPSS calcula automticamente esta prueba). SierraBravo,Restituto(1991):Di cci onar i oPr ct i codeEst adst i ca,Madrid, Editorial Paraninfo, 1991, p. 379. [RJR] En caso de t abl as de 2 X 2 (las dos variables dicotmicas o dicotomizadas mediante un punto de corte), p- val ueasociado al estadstico Ji- cuadradode Pearson puede ser poco preciso. En el caso de que el nmero total de observaciones en l amuest r asea gr ande,unaalternativaalestadsticoJi- cuadradodePearson,queincorporauna cor r ecci npor cont i nui dady,porlotanto,unp- valuemspreciso,esJi -cuadr adopor Cor r ecci ndeCont i nui daddeYat es puede ser poco preciso. En el casodequeelnmerototaldeobservacionesenlamuestraseagrande,una alternativa al estadstico. Si el t amaomuest r al espequeo,mediante l apr ueba del apr obabi l i dadex act adeFi sher ,sepuedecalcularlaprobabilidadexactade observarunconjuntoparticulardefrecuenciasenunatabla2X2.El pr opi o pr ogr amaSPSSopt ar por unauot r adel aspr uebasenf unci ndel t amao muest r alyde l as f r ecuenci as esper adas en l as cel dasFerrn Aranaz, Magdalena (1996): SPSSpar aWi ndow s.Pr ogr amaci nyAnl i si s Est adst i co, Madrid, McGraw-Hill, 1996, captulo 7: Tablas de contingencia y medidas de asociacin, p. 145. [RJR] Not a I V:[ RJR]Pr uebas de i ndependenci a: Esnecesariosistematizarlasdistintasopcionesestadstico-metodolgicasdeanalizarla independencia estadstica entre dos variables, dado que en la bibliografa segn sea la disciplina quetrateestadsticaometodologa-nodesarrollandemodoexhaustivolosdiferentesmodos alternativosdeanalizaroprobarlaexistenciaonodeindependenciaestadstica:Existencinco modos alternativos para analizar la independencia estadstica: a)Una manera es calculando la proporcin entre la frecuencia condicional de una celda y la frecuenciamarginaldecolumna,comparndolaconlaproporcinentrela correspondientefrecuenciamarginal,deesafila,ylafrecuenciatotal.Sisedauna igualdad entre ambas proporciones, se comprueba que ambas variables son independientes. Es decir, que la distribucin condicin es igual a la distribucin marginal, o lo que es lo mismo, la distribucin bivariada se comporta del mismo modo que la distribucin univariada. Por lo que laconclusinesquelaintroduccindelasegundavariableenlascolumnasnoafecta,no modifica lasdistribuciones condicionales. En caso contrario, que se de una desigualdad entre lasproporciones,sesostienelaNoindependenciaentrelascategoras,ygeneralizando,entre las variables comparadas. Obsrvese que no se afirma la dependencia entre las variables, sino la No independencia entre las mismas. AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA6/19 b)Otro modo de comprobar lo mismo es recurrir a la Prueba de independencia, en el marco de la Teora de Clsica de la Probabilidad formulada por Jean Batiste Laplace, donde se compara la probabilidad simple de un evento con su probabilidad condicional.En las siguientes tablas se dan simblicamente, y se expresan analticamente ambos casos. TABLA I Var i abl e X Var i abl e Y01Tot al1aba+ b 0c dc+ d Totala+ c b+ dn [Elaboracin propia][RJR] a)Igualdad de proporciones entre distribuciones condicionales y marginales: SI: Independenciad c db d n+= + a)Un segundo mtodo de la clculo lo brinda la Prueba de independencia de la 2 Ley de la Multiplicacin de Laplace para sucesos simultneos dependientes: P(A)=P A/BIndependencia (Se lee: Si la P(A) es igual a su Probabilidad Condicional, es decir, la P(A sabiendo que se hadado B), se concluye que ambas categoras son independientes) Aplicando ambos criterios a una tabla emprica, para averiguar si el Sexo es independiente o no respecto del Estado Civil, tenemos: TABLA 2

Sierra Bravo (1991: 365) PA/B P(A) Sex o Est ado Ci vi l Hombre MujerTot alSolteros8.0005.00013.000 Casados10.00012.00022.000 Viudos 1.0004.0005.000 Total 19.000 21.00040.000 AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA7/19 b)Laproporcinentreladistribucincondicionalcomparadaconladistribucinmarginal, del ejemplo, da: f (viudo)/f (total) f (viudo y mujer)/f (mujer)

5.000/40.000 4.000/21.000 0,125 0,191No independencia La desigualdad nos confirma que el hecho de ser mujer No es independiente del Estado Civil que se posee. Se pueden comparar las proporciones de cada una de las celdas y se obtendr la misma conclusinparacadapardecategoras.Porloquepodemosgeneralizarlasconclusionesparael conjunto del cuadro bivariado: el Sexo No es independiente del Estado Civil.

b) Si P(A) es la Probabilidad Simple de que una persona sea Viudo, es decir, la Probabilidad de ser Viudo, es igual a la cantidad de Viudos divido el Total de personas, es decir: P (Viudo) = 5.000/40.000= 0,125 Y P (B) la Probabilidad Simple de que una persona sea Mujer, es igual: P (Mujer)= 21.000/40.000= 0,525 Pero,P(A/B)eslaProbabilidadCondicionaldeSerViudosabiendoqueesMujer,esdecir,la Probabilidad de ser Viudo condicionado a que sea Mujer, es igual a: P (Viudo/Mujer)= 4.000/21.000= 0,191 Comparando los resultados, comprobamos que ambas probabilidades son distintas: P (Viudo) P (Viudo/Mujer) 0,125 0,191 No independencia Obsrvese que analticamente, la expresin P (Viudo/Mujer)= f (viudo y mujer)/f (mujer), con lo cual se demuestra que ambos criterios (a) y (b) de Prueba de Independencia son equivalente. c)Untercermodoalternativodeanlisisempricodeuncuadrobivariadoesconvertirlas frecuenciasabsolutasenfrecuenciasrelativas,esdecirenporcentajes,ycalcularlaDiferencia Porcentual (d%). Para ello debemos tener en cuenta la Regla de Hans Zeisel 1: Porcentuar en el

1 Galtung, Johan (1966): Teora y mtodos de la investigacin social, 2 ed., Buenos Aires, Eudeba, Tomo II,1969, p. 234: La regla es muy simple: sacar porcentajes tomando siempre como base los valores de lo que se considera variable independiente en el modelo subyacente. AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA8/19 sentido de la variable independiente, -tomando como base el marginal de esta ltima- y comparar losporcentajesensentidoopuesto.Tambindebemosobservarlaformadeladistribucin condicionalrelativa(distribucindiagonalorinconal),eidentificarlasceldasverificadoras (circuladas en rojo en el ejemplo) y las celdas falsificadoras de la hiptesis que subyace al cuadro. En nuestro ejemplo:TABLA 3 Obsrvese que los porcentajes resaltados en azul, coinciden con las proporciones y probabilidades obtenidasmedianteloscriteriosalternativos(a)y(b).LaDiferenciaporcentual,nosindicala fuerza o intensidad relativa de la asociacin entre las variables, y no solamente es una Prueba de Independencia. Si la d% = 0 indica independencia estadstica, o asociacin nula,y si la d% = 100,estarasealandomximaasociacin.Ennuestroejemplo,(d%=-13,8)indicaleve asociacin.HubieseexistidoasociacinnulasegnlossubndicesdelaTABLA1-silos porcentajes hubiesen sido iguales: 00 01p p = viudo y hombre viudo y mujerp = p Y hubiese existido algn grado de asociacin si los porcentajes hubiesen sido: 00 01p p = viudo y hombre viudo y mujerpp = Noobstanteque,ladiferenciaporcentualcomomedidadeasociacin,actacomomedidade influenciadeunavariableXsobreotraY,debeserinterpretadamediantelapruebatde diferenciademediasdeproporcionesparamuestrasindependientes(Galtung,1969,II:241) para medir la significacin estadstica del tamao de la diferencia, pues una d% = 10%, puede ser tantoladiferenciaentre95-85%comoentre25-15%.Sibienenamboscasoslad%esigualal 10%.Enelprimercasoladiferenciadel10%enproporcinalporcentajemenorrepresentaun incremento porcentual (%) del 11,76%: Sex o ( % )Est ado Ci vi l Hombre Mujer% d%Solteros42,123,832,518,3 Casados55,657,155,0-1,5 Viudos5,319, 112,5- 13, 8 Total100,0 100,0100,0: 0 AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA9/19 95 85% 100 11, 76%85(. = - = ( Mientrasqueenelsegundocasoladiferenciadel10%enproporcinal15%representaun incremento(%)del66,67%.Enestesentido,sepuedeopinarqueesmssignificativoeste segundo caso que el primero. 25 15% 100 66, 67%15(. = - = ( d) Un cuarto modo es, justamente, l a pr ueba tde di f er enci as de pr opor ci ones de dosmuest r asi ndependi ent es, que permite verificar diferencias entre proporciones oporcentajes(d%)dedosmuestra(grandes)independientes.Loscomponentesdel modelo y los pasos para el clculo del estadstico de prueba, son: Model oest adst i co: Distribucindediferenciasdeproporcionesmuestrales, conmediaigualalaMedi adel adi st r i buci ndi f er enci asdepr opor ci ones muest r al esyconDesvoStandardigualal Er r or Est ndar del asdi f er enci as de pr opor ci ones muest r al es. En smbolos: 0D =

1 1 2 21 2Dp q p qn no- -= + = ESD Hi pt esi sest adst i cas: Lahiptesisnulaplantealaigualdaddelas proporciones en las dos muestras, o lo que es lo mismo, que su diferencia es igual a0.Mientrasquelahiptesisalternativa,lahiptesisdelinvestigador,plantea quelasproporcionesmuestralessondistintas,esdecir,quesusdiferenciasson distintas de 0, divergiendo del mero azar. Simblicamente: 0 1 2H 0 p p D = = = 1 1 2H 0;o0 p p D = = = Est adst i co de pr ueba: CasoI : t deSt udent par adi f er enci asdepr opor ci onesmuest r al es i ndependi ent es ( muest r as gr andes) . AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA10/191 21 21 1 2 21 2%p pDp p dtp q p qn no= =- -+ Est adst i co de pr ueba: CasoI I : t deSt udent di f er enci asdemedi asdemuest r asi ndependi ent es ( muest r as gr andes) . ( )1 21 21 22 21 21 2 X XDX XDDX Xts sn no = =+ Cl cul o delest adst i co de pr ueba:Si aplicamos la prueba t para el caso II, al Fi cher oVent as- Benef i ci os- 1994- 95X83empr esas2paraponerapruebala hiptesisnuladelanoexistenciadediferenciaentrelasmediasdeBenef i ci os ant esdei mpuest osenl 995(bai95) entreempr esasdel sect or ser vi ci ose i ndust r i al es. Para ello, debemos dar los siguientes pasos: i . Recodificar la variable Sector (sect or)asignando los viejos cdigos del sector de actividaddelavariablesect oralanuevavariabledicotomizadasect orb, categorizada en Sect orServicios( 1) y Sect orI ndust rial( 2) . Dato que la prueba t compara dos medias en base a una variable de agrupacin dicotmica.i i . Luego se abre la cuadro de dilogo: Compar armedi as> Pr ueba T par a muest r as i ndependi ent es, del men Anal i zar .i i i . En dicho cuadro seleccionamos la variables bai95 y la pasamos a la ventana Cont r ast arvar i abl es ( TestVariable) ,en Var i abl es de agr upaci n, seleccionamos la nueva variable que recodifica los sectores: sect orb. /h

2VisautaVinacua,Bienvenido(1997):AnlisisestadsticoconSPSSparaWindows(6.1),Madrid, McGraw-Hill, 1997, captulo 4: Test de hiptesis: Comparacin de medias, pp. 111-114. AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA11/19i v. Luego se definen los grupos: Usarval or es especi f i cados O Punt o de cor t e. Oprimir Cont i nuarpara volver a la ventana original o primaria. Y luego Acept ar . SPSS ejecuta el comando T- Testy arroja dos tablas con los resultados que se observan en el Visor de SPSS: TABLA 4 Estadsticos de grupo Sector-Servicio-Industria NMediaDesviacin tp.Error tp. de la media Beneficios antes de impuestos (1995) Sector Servicios39 23.068,74 50.154,834 8.031,201 Sector Industrial36 10.774,83 32.247,476 5.374,579 TABLA 5 Prueba de muestras independientes

Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias FSig.tgl Sig.(bilateral) Diferencia de medias Error tp. de la diferencia 95% Intervalo de confianza para la diferencia InferiorSuperior Se han asumido varianzas iguales 2,356,1291,251 73 ,215 12.293,91 9.827,639 -7.292,54631.880,367 Beneficios antes de impuestos (1995) No se han asumido varianzas iguales 1,272 65,413 ,208 12.293,91 9.663,658 -7.003,43631.591,256AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA12/19 vi . Luego para visualizar los resultados reemplazamos en la frmula del estadstico t los datos obtenidos en el out puty confirmamos el t - value: ( )1 21 21 22 21 21 2 X XDX XDDX Xts sn no = =+ 1 212.293,911, 2519.827,639X Xt= = vi i . Por ltimo, tomamos la decisin estadstica con relacin a la hiptesis nula. Dado que aplicando la Regl a de Deci si n de Fi sher , tenemos que: SiP- Val ue 0,05H0 y H1 y concluimos que no hay diferencias en los Benef i ci osant esdei mpuest osen 1995, en las 83 empresas entre los Sect or es Ser vi ci os e I ndust r i a.d)Porultimo,unaquintaformadeprobarlahiptesisdeindependenciaes mediante el estadstico ChiCuadr ado. Enlatabla6:Dest i nodesobr evi vi ent esal hundi mi ent odel TI TANI CbySex o,ponemosapruebalahiptesisnuladequenohaydiferenciasentrelos hombresymujeresqueperecieron.Encambioelinvestigadorsostendrqueen los datos se puede poner a prueba la hiptesis de que en el siniestro del TITANIC se evidenci una vez ms la aplicacin del principio marinero Primero las mujeres ylosniosysegundoloshombres.Porloqueesperaramoshallarenlacel da v er i f i cador a(rayadooblicuoenr oj o)mujeres/niosysobrevieronuna proporcin ( p)mayor que en la celda hombre y sobrevivieron. Observemos qu decisin nos indica tomar Chi Cuadrado respecto de la hiptesis nula. 0 hombres y sobrevivieron mujeres y sobrevivieron1 hombres y sobrevivieron mujeres y sobrevivieronH % 0H % 0p p dp p d= = = == = = = AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA13/19TABLA 6 Tabla de contingencia: Destino en el hundimiento del TITANIC segn el Sexo del pasajero Adaptado y reelaborado de Sanchez Carrin (1999: 331-333) (S.S. Tit anic,Whit e St ar Line,14 de abril de 1912)[RJR] Sexo del pasajero Hombres Mujeres-Nios Totald% Recuento637 163800 % de Sexo de pasajero 82,2%32,0%62,3%+50,2%Residuo154,5 -154,5Residuos tipificados 7,0 -8,7Perecieron Residuos corregidos 18,2 -18,2Recuento138 347485 % de Sexo de pasajero 17,8%68,0% 37,7%-50,2%Residuo-154,5 154,5Residuos tipificados -9,0 11,1Destino en el hundimiento Se salvaron Residuos corregidos -18,218,2

TotalRecuento775 5101285 % de Sexo de pasajero 100,0% 100,0%100,0% AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA14/19TABLA 7 Pruebas de chi-cuadrado Valorgl Sig. asinttica (bilateral) P-value Sig. exacta (bilateral) Sig. exacta (unilateral) Chi-cuadrado de Pearson330,307(b) 1 ,000 Correccin por continuidad de Yates (a) 328,172 1 ,000 Razn de verosimilitud338,182 1 ,000 Estadstico exacto de Fisher ,000,000Asociacin lineal por lineal330,050 1 ,000 N de casos vlidos1285 aCalculado slo para una tabla de 2x2. b0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 192,49. TABLA 8 Medidas simtricas Valor Sig. aproximada Nominal por nominalPhi,507,000 V de Cramer,507,000 Coeficiente de Contingencia,452,000 N de casos vlidos1285aAsumiendo la hiptesis alternativa. bEmpleando el error tpico asinttico basado en la hiptesis nula. Lasconclusionesquesepuedenobtenerapartirdelosresultadosdelasdistintas medias, pruebas y coeficientes, son: Ladiferenciaporcentual(d%=82,2-32,0=50,2%)actacomomedidadela influencia que tuvo el sexo en la suerte corrida por los pasajeros. Seconfirmaunadistribucindiagonaldelasfrecuenciascondicionalesrelativas, efectivamente,laceldaverificadoraesperadasegnelprincipiomarinero,confirma que el porcentaje de mujeres/nios que sobrevivieron es 3,8 veces ms (68,0/17,8) que los hombres que se salvaron. Siendo importante esta magnitud de l adi f er enci a por cent ual . LosResiduostipificadoscorregidos(18,2)seubicana9,2DesvosStandard respecto del valor crtico 1,96 esperado por azar (18,2/1,96= 9,2), con un intervalo deconfianzade.95.Untaldesvonopuedeseratribuidoalazarsinoquecabe esperarqueparaproducirseunataldiferenciaesprobable(95vecesdecada100) AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA15/19que haya operado una decisin y una voluntad en el alto mando del S.S. TITANIC, de hacer cumplir el principio marinero de salvar a las mujeres y nios primero. El valor del Chi cuadrado calculado o emprico (Chi-square value) es de una magnitud muy grande (330,307) y acusa una Si gni f i caci nasi nt t i cabi l at er al de .000. Esta cifra es una probabilidad y significa = P- Val ue. Cuando esta probabilidad es inferior a 0,05, (P: Nivel de Significacin = 5%) se suele rechazar la hiptesis de independencia Ho de no relacin entre las variables segn la Regl adedeci si ndeFi sher -, para aceptar la hiptesis alternativa H1, que indica que la relacin entre las variables existe yesestadsticamentesignificativaynosedebealazar.Sepuedeconcluirqueel capitndelS.S.Titanichizohonoralaarmadabritnicaaplicandoconfirmezael principiomarineroquedice:Primerolasmuj eresylosnios, yluegoloshombres, permitiendo que sobrevivan ms mujeres que hombres, ms all del azar, que es lo sostenido por la hiptesis del investigador. En smbolos: Resumen delmodel o Chisquar e v al ue:330,337 ChiCuadr ado- Cor r ecci n porcont i nui dad de Yat es:328, 172 P:0,05 (Nivel de significacin) P- v al ue:0,000 (Significacin asinttica bilateral) Gr ados de Li ber t ad:1 [df: (c-1)*(f-1)] Chi Cuadr adodeTabl a: 3,841(VerTabladeChiCuadradopara1glyP: 0,05) Regl a de deci si n de Fi sher : SiP- Val ue 3,841 HH AYUDA SPSS -CHICUADRADO- NOTAS METODOLGI CA16/19P 0, 05 =Di st r i buci n de l a Cur v a de Chi - Cuadr ado: 0Aceptacion H0Rechazo H P-value= 0,000 Zona de Riesgo

( )2 2teorico 1; 0 , 05 X X 3,841 = =2calculado X 300, 337 Chi square value = = [Elaboracin Propia. RJR] Finalmente,lamagnituddeloscoef i ci ent esdeasoci aci nindican, efectivamente,unarelacinentreambasvariablesdelordende0,452y0,507. Expresandounamedianafuerzadeasociacinteniendoencuentaqueestos coeficientes varan entre 0 y 1.CALCULADORA CHI-CUADRADO3 CORRECCION DE CONTINUIDAD DE YATES ABSUM I 637 163 800 II 138 347 485 SUM 775 510 1285 Chi-square value (X):328.172423 Difference (p