8
1 Introducción Emendemos aquí como variable categórica una variable que puede asumir un número limitado de valores discretos, genéricamente denominados categorías, pero cuya escala de medida no queda por ello restringida, pudiendo ser nominal (categorías no ordenadas, dicotómicas o politómicas), ordinal (categorías ordenadas) o de intervalo. Las variables categóricas nominales son en ocasio- nes también llamadas variables cualitativas o variables de clasificación. En tal caso, los niveles de una variable de clasificación (o clases) son categorías mutuamente excluyentes, porque se definen de modo que cada unidad de la población solo puede ser asignada a una única categoría, y exhaustivas, porque acomodan a lodos los miembros de la población. Los datos categóricos suponen la existencia de observaciones registradas sobre múltiples individuos, procedentes de una muestra representativa de la población, sobre una o más variables categóricas. Cuando una muestra se clasifica en dos o más categorías es posible registrar la frecuencia total o canteo de casos que se asigna a cada categoría. La representación de conteo puede adoptar una de dos formas típicas: • En el caso de una única variable categórica, los datos se presentan bajo la forma de una tabla de frecuencias, cuyas columnas son las categorías de la variable. Por ejemplo, si se pide a un grupo de 200 individuos que clasifiquen su grado de satisfacción en el trabajo en una de cuatro categorías ('Alto', 'Medio', 'Bajo' y 'Nulo'), la tabla de frecuencias resultante podría ser como la siguiente: • En el caso de una única variable categórica, los datos se presentan bajo la forma de una tabla de frecuencias, cuyas columnas son las categorías de la variable. Por ejemplo, si se pide a un grupo de 200 individuos que clasifiquen su grado de satisfacción en el trabajo en una de cuatro categorías ('Alto', 'Medio', 'Bajo' y 'Nulo'), la tabla de frecuencias resultante podría ser como la siguiente:

Proba

Embed Size (px)

DESCRIPTION

ejercicios de probabilidad

Citation preview

1 IntroduccinEmendemos aqu como variable categrica una variable que puede asumir un nmerolimitado devalores discretos, genricamente denominados categoras, pero cuya escala de medidano quedapor ellorestringida, pudiendoser nominal (categoras noordenadas, dicotmicas opolitmicas),ordinal (categoras ordenadas) o de intervalo. as variables categricas nominales sonen ocasio!nes tambin llamadas variables cualitativas o variables de clasi"cacin. En tal caso, losnivelesdeunavariabledeclasi"cacin(oclases) soncategorasmutuamentee#cluyentes,porque sede"nen de modo que cada unidad de la poblacin solo puede ser asignada a una nicacategora,y e#$austivas, porque acomodan a lodos los miembros de la poblacin.os datos categricos suponen la e#istencia de observaciones registradas sobremltiplesindividuos, procedentes de una muestra representativa de la poblacin, sobre una o m%svariablescategricas. &uandouna muestra seclasi"ca endos om%s categoras es posibleregistrar la'recuencia total o canteo de casos que se asigna a cada categora. a representacin deconteopuede adoptar una de dos 'ormas tpicas() En el caso de una nica variable categrica, los datos se presentan ba*o la 'orma deuna tablade 'recuencias, cuyas columnas son las categoras de la variable. +or e*emplo, si se pidea un grupo de ,-- individuos que clasi"quen su grado de satis'accin en el traba*o enunade cuatro categoras (./lto., .0edio., .1a*o.y .2ulo.), la tabla de 'recuencias resultantepodra ser como la siguiente() En el caso de una nica variable categrica, los datos se presentan ba*o la 'orma deuna tablade 'recuencias, cuyas columnas son las categoras de la variable. +or e*emplo, si se pidea un grupo de ,-- individuos que clasi"quen su grado de satis'accin en el traba*o enunade cuatro categoras (./lto., .0edio., .1a*o.y .2ulo.), la tabla de 'recuencias resultantepodra ser como la siguiente(3rado de satis'accin en eltraba*o/lto 0edio 1a*o 2ulo 4otal5recuencia+roporcin67,89817.:6.1:.7: .-6,--1.--) +ara el caso de dos (o m%s) variables categricas, los datos se representan medianteunatabla de contingencia bidimensional (o multidimensional), con un nmero de'las;columnasdeterminado por el nmero de categoras de las variables en cuestin. asintersecciones de"las y columnas (o celdillas) contienen las 'recuencias de ocurrencia de lascombinacionesde categoras correspondientes. +or e*emplo, si se administra la misma tarca anterior ados grupos detraba*adores, 1--varones y1--mu*eres, latabladecontingenciaresultantepodra ser como la siguiente(3rado de satis'accin en eltraba*o, ,1--1--4otal 67 ,8 98 17 ,--a labia de contingencia bi o mu tridimensional es a no dudar la 'orma m%s comn de re!presentacin de datos categricos. ?e a$ que los trminos an%lisis de tablas decontingencia yan%lisis de datos categricos se utilicen indistintamente en la literatura.Este captulo se organi@a como sigue. a primera seccin aborda la perspectiva clasica alan%lisisdedatoscategricosmedianteel an%lisisdetablasdecontingenciacon;( ypruebas deasociacin. a segunda seccin desarrolla la moderna perspectiva del a*uste de modelos(0a#Aelly ?clancy, 1BB-Cunncborg, 1BB7, /rmingcr, &logg y ). distinguiendotresgrandes, El en'oque cl%sico a las tablas de contingencia,.1 4ablas de contingencia bidimensionalesa tabla de contingencia m%s simple es la tabla , # , (/ # 1), que puede generali@arsecon'acilidad al caso a # ,, al caso , # b y al caso bidimensional general a # b. ?e $ec$o, unapr%ctica todava comn entre investigadores (a pesar de los riesgos que conlleva, comotrataremosdespus) consiste en reducir tablas de contingencia de cualquier dimensin a las m%smane*ablestablas bidimensionales.En estrec$o paralelismo con la terminologa utili@ada en los modelos de diseDoe#perimen!tal (/to, 1BB1, cap. 9) la notacin que seguiremos aqu, re'erida al caso general de latablabidimensional, distingue entre valores observados (Ey), a partir de cuales puedenobtenerse lasprobabilidades(pF*), yvaloresesperados(mF*), dondeel subndicei sere"erealavariable de"la y * a la variable de columna.En las tablas 1 y ,, las magnitudes nF. y mF. representan totales marginales de Gila y sede"nencomo la suma de las b categoras de la i!csima "la (n,. H I,b*Hi Ji;)! K!as cantidades n* ym* representan por su parte totales marginales de columna y se de"nen como la sumade lasa categoras de la *!sima columna Lm.F H MNHi mF*). a suma de los totales marginalesde"la;columna produce el gran total,O...4abla1( 4abladevaloresobservados /# li.=ariable de columna (1)1 , G b 4otales1 J1,. nPF ... nPb Jl., O,1 J,, ni) J,.=ariable ) ( Kde i Jn J, J."la C C K K KtK K) )(/) a JQ*R na, naF Jo$4orales 1.1 J, ) J.; J/0aterial protegido por derec$os cS9, 0. /to, G.G. pe@ y 0.?. Tidalgo4abla,( 4abladevaloresesperados /# 1.=ariable de columna1 , ; b 4otales1 mu mP, mPF mPb mP., O,1 O,, mUi* mu, J1,.=ariable ) ) B Kde i mu mn )mF* mFb m."la . C mR! KK Ka maP mVW... ma.4otales mP O1., .. .m., ... m$4odo el proceso analtico trata de comparar las 'recuencias observadas con las'recuenciasesperadas generadas a partir de una $iptesis particular acerca de la distribucin de las'recuenciasobservadas. a prueba estadstica resultante es por ello unaprueba de bondad de a*uste.5reeman(1B96, pp. :9!B) distingue tres pruebas estadsticas de bondad de a*uste, basadas en ladistribucinX,, a saber() a m%s conocida es la cl%sica prueba XU, introducida por Y. +earsonen 1B--,quesedeDnemediante(n,F ! mF*),#, H EM(?0enos comn es la prueba de mnimos cuadrados ponderados Z, desarrollada por 2ey!man (1B7B), que se di'erencia de la anterior por emplear valores observados (en lugardeestimados) en el denominador.I=, H [ [ (JiC U mi)),(,)&on di'erencias muy sutiles entre ambos (vase 1$apSar, 1B9-, p. :>>!B) el estadsticoI=, es algebraicamente similar al estadstico de \ald, y es una 'orma cuadr%tica del tipo/unque menos utili@ada en el marco de tablas de contingencia, la prueba m%sconvenientees la prueba de Fa ra@n de verosimilitud ?, de"nida como,Hi GHi Pmu;(:)E#iste un debate "los"co, sustentado sobre bases $istricas, respecto a cu%l de estoses!Gsticos de bondad de a*uste de modelos es el m%s conveniente desde un punto de vistain'eren!ai (vase ]ead y &rcssic, 1B99). &omo m%s adelante $aremos patente, $ay poderosasra@ones0aterial protegido por derec$os de%lisis de datos categricos9:#a pre'erir el estadstico ? sobre los dem%s (la principal de las cuales es la caractersticadeitividad que no posee X,), en particular si se emplea m%#ima verosimilitud como mtododetimacin de par%metros (\illiams, 1B68C &$ristensen, 1BB-, pp. 7>).Femplo 1