Proba

Preview:

DESCRIPTION

ejercicios de probabilidad

Citation preview

1 IntroduccinEmendemos aqu como variable categrica una variable que puede asumir un nmerolimitado devalores discretos, genricamente denominados categoras, pero cuya escala de medidano quedapor ellorestringida, pudiendoser nominal (categoras noordenadas, dicotmicas opolitmicas),ordinal (categoras ordenadas) o de intervalo. as variables categricas nominales sonen ocasio!nes tambin llamadas variables cualitativas o variables de clasi"cacin. En tal caso, losnivelesdeunavariabledeclasi"cacin(oclases) soncategorasmutuamentee#cluyentes,porque sede"nen de modo que cada unidad de la poblacin solo puede ser asignada a una nicacategora,y e#$austivas, porque acomodan a lodos los miembros de la poblacin.os datos categricos suponen la e#istencia de observaciones registradas sobremltiplesindividuos, procedentes de una muestra representativa de la poblacin, sobre una o m%svariablescategricas. &uandouna muestra seclasi"ca endos om%s categoras es posibleregistrar la'recuencia total o canteo de casos que se asigna a cada categora. a representacin deconteopuede adoptar una de dos 'ormas tpicas() En el caso de una nica variable categrica, los datos se presentan ba*o la 'orma deuna tablade 'recuencias, cuyas columnas son las categoras de la variable. +or e*emplo, si se pidea un grupo de ,-- individuos que clasi"quen su grado de satis'accin en el traba*o enunade cuatro categoras (./lto., .0edio., .1a*o.y .2ulo.), la tabla de 'recuencias resultantepodra ser como la siguiente() En el caso de una nica variable categrica, los datos se presentan ba*o la 'orma deuna tablade 'recuencias, cuyas columnas son las categoras de la variable. +or e*emplo, si se pidea un grupo de ,-- individuos que clasi"quen su grado de satis'accin en el traba*o enunade cuatro categoras (./lto., .0edio., .1a*o.y .2ulo.), la tabla de 'recuencias resultantepodra ser como la siguiente(3rado de satis'accin en eltraba*o/lto 0edio 1a*o 2ulo 4otal5recuencia+roporcin67,89817.:6.1:.7: .-6,--1.--) +ara el caso de dos (o m%s) variables categricas, los datos se representan medianteunatabla de contingencia bidimensional (o multidimensional), con un nmero de'las;columnasdeterminado por el nmero de categoras de las variables en cuestin. asintersecciones de"las y columnas (o celdillas) contienen las 'recuencias de ocurrencia de lascombinacionesde categoras correspondientes. +or e*emplo, si se administra la misma tarca anterior ados grupos detraba*adores, 1--varones y1--mu*eres, latabladecontingenciaresultantepodra ser como la siguiente(3rado de satis'accin en eltraba*o, ,1--1--4otal 67 ,8 98 17 ,--a labia de contingencia bi o mu tridimensional es a no dudar la 'orma m%s comn de re!presentacin de datos categricos. ?e a$ que los trminos an%lisis de tablas decontingencia yan%lisis de datos categricos se utilicen indistintamente en la literatura.Este captulo se organi@a como sigue. a primera seccin aborda la perspectiva clasica alan%lisisdedatoscategricosmedianteel an%lisisdetablasdecontingenciacon;( ypruebas deasociacin. a segunda seccin desarrolla la moderna perspectiva del a*uste de modelos(0a#Aelly ?clancy, 1BB-Cunncborg, 1BB7, /rmingcr, &logg y ). distinguiendotresgrandes, El en'oque cl%sico a las tablas de contingencia,.1 4ablas de contingencia bidimensionalesa tabla de contingencia m%s simple es la tabla , # , (/ # 1), que puede generali@arsecon'acilidad al caso a # ,, al caso , # b y al caso bidimensional general a # b. ?e $ec$o, unapr%ctica todava comn entre investigadores (a pesar de los riesgos que conlleva, comotrataremosdespus) consiste en reducir tablas de contingencia de cualquier dimensin a las m%smane*ablestablas bidimensionales.En estrec$o paralelismo con la terminologa utili@ada en los modelos de diseDoe#perimen!tal (/to, 1BB1, cap. 9) la notacin que seguiremos aqu, re'erida al caso general de latablabidimensional, distingue entre valores observados (Ey), a partir de cuales puedenobtenerse lasprobabilidades(pF*), yvaloresesperados(mF*), dondeel subndicei sere"erealavariable de"la y * a la variable de columna.En las tablas 1 y ,, las magnitudes nF. y mF. representan totales marginales de Gila y sede"nencomo la suma de las b categoras de la i!csima "la (n,. H I,b*Hi Ji;)! K!as cantidades n* ym* representan por su parte totales marginales de columna y se de"nen como la sumade lasa categoras de la *!sima columna Lm.F H MNHi mF*). a suma de los totales marginalesde"la;columna produce el gran total,O...4abla1( 4abladevaloresobservados /# li.=ariable de columna (1)1 , G b 4otales1 J1,. nPF ... nPb Jl., O,1 J,, ni) J,.=ariable ) ( Kde i Jn J, J."la C C K K KtK K) )(/) a JQ*R na, naF Jo$4orales 1.1 J, ) J.; J/0aterial protegido por derec$os cS9, 0. /to, G.G. pe@ y 0.?. Tidalgo4abla,( 4abladevaloresesperados /# 1.=ariable de columna1 , ; b 4otales1 mu mP, mPF mPb mP., O,1 O,, mUi* mu, J1,.=ariable ) ) B Kde i mu mn )mF* mFb m."la . C mR! KK Ka maP mVW... ma.4otales mP O1., .. .m., ... m$4odo el proceso analtico trata de comparar las 'recuencias observadas con las'recuenciasesperadas generadas a partir de una $iptesis particular acerca de la distribucin de las'recuenciasobservadas. a prueba estadstica resultante es por ello unaprueba de bondad de a*uste.5reeman(1B96, pp. :9!B) distingue tres pruebas estadsticas de bondad de a*uste, basadas en ladistribucinX,, a saber() a m%s conocida es la cl%sica prueba XU, introducida por Y. +earsonen 1B--,quesedeDnemediante(n,F ! mF*),#, H EM(?0enos comn es la prueba de mnimos cuadrados ponderados Z, desarrollada por 2ey!man (1B7B), que se di'erencia de la anterior por emplear valores observados (en lugardeestimados) en el denominador.I=, H [ [ (JiC U mi)),(,)&on di'erencias muy sutiles entre ambos (vase 1$apSar, 1B9-, p. :>>!B) el estadsticoI=, es algebraicamente similar al estadstico de \ald, y es una 'orma cuadr%tica del tipo/unque menos utili@ada en el marco de tablas de contingencia, la prueba m%sconvenientees la prueba de Fa ra@n de verosimilitud ?, de"nida como,Hi GHi Pmu;(:)E#iste un debate "los"co, sustentado sobre bases $istricas, respecto a cu%l de estoses!Gsticos de bondad de a*uste de modelos es el m%s conveniente desde un punto de vistain'eren!ai (vase ]ead y &rcssic, 1B99). &omo m%s adelante $aremos patente, $ay poderosasra@ones0aterial protegido por derec$os de%lisis de datos categricos9:#a pre'erir el estadstico ? sobre los dem%s (la principal de las cuales es la caractersticadeitividad que no posee X,), en particular si se emplea m%#ima verosimilitud como mtododetimacin de par%metros (\illiams, 1B68C &$ristensen, 1BB-, pp. 7>).Femplo 1