22
Estadística social Hubert M. Blalock Fondo de Cultura Económica Buenos Aires, 1998 Este material se utiliza con fines exclusivamente didácticos

Blalock Cap XIII Prueba de Dos Muestras

Embed Size (px)

DESCRIPTION

Analisis de estadística - Muestras

Citation preview

  • Estadstica social

    Hubert M. Blalock

    Fondo de Cultura Econmica

    Buenos Aires, 1998

    Este material se utiliza con fines exclusivamente didcticos

  • NDICE

    Prefacio ................................................................................................................................................... 9

    Primera Parte INTRODUCCIN

    1. Introduccin: objetivos y lmites de la estadstica............................................................................. 15 1.1. Funciones de la estadstica ............................................................................................................. 16 1.2. El lugar de la estadstica en el proceso de la investigacin ........................................................... 19 1.3. Advertencia .................................................................................................................................... 20 Bibliografa ........................................................................................................................................... 21 II. Teora, medicin y matemticas ...................................................................................................... 22 II.1. Teora e hiptesis: definiciones operativas ................................................................................... 22 II.2. El nivel de medicin: escalas nominales, ordinales y de intervalo ............................................... 26 II.3. Medicin y estadstica .................................................................................................................. 32 II.4. Organizacin del libro .................................................................................................................. 37 Bibliografa............................................................................................................................................ 40

    Segunda Parte

    ESTADSTICA DESCRIPTIVA UNIVARIADA

    III. Escalas nominales: proporciones, porcentajes y razones ............................................................... 43 III.1. Proporciones ................................................................................................................................. 43 III.2. Porcentajes.................................................................................................................................... 45 111.3. Razones....................................................................................................................................... 49

    Bibliografa ........................................................................................................................................... 52

    IV. Escalas de intervalo: distribuciones de frecuencia y representacin grfica .................................. 53 IV.1. Distribuciones de frecuencia: agrupamiento de los datos ........................................................... 53 IV.2. Distribuciones de frecuencia cumulativa .................................................................................... 60 IV.3. Presentacin grfica: histogramas, polgonos de frecuencia y ojivas ......................................... 61 Bibliografa ........................................................................................................................................... 66 V. Escalas de intervalo: medidas de tendencia central ......................................................................... 67 V.1. La media aritmtica ...................................................................................................................... 67 V.2. La mediana ................................................................................................................................... 71 V.3. Clculo de la media y la mediana de datos agrupados ................................................................. 73 V4. Comparacin de la media y la mediana ......................................................................................... 81 V.5. Otras medidas de tendencia central .............................................................................................. 85 V.6. Deciles, cuartiles y percentiles ..................................................................................................... 86 Bibliografa ........................................................................................................................................... 88 VI. Escalas de intervalo: medidas de dispersin .................................................................................. 90 VI.1. El recorrido .................................................................................................................................. 90 VI.2. La desviacin cuartil ................................................................................................................... 92 VI.3. La desviacin media .................................................................................................................... 92 VI.4. La desviacin estndar ................................................................................................................ 93 VI.5. El coeficiente de variabilidad .................................................................................................... 101 VI.6. Otras medidas resumidas ........................................................................................................... 102 Bibliografa ......................................................................................................................................... 103

    2

  • VII. La distribucin normal ................................................................................................................. 104 VII.1. Distribuciones de frecuencias finitas versus infinitas ............................................................... 104 VII.2. Forma general de la curva normal............................................................................................. 107 VII.3. reas bajo la curva normal ....................................................................................................... 109 VII.4. Ilustraciones suplementarias del empleo de la tabla normal .................................................... 113 Bibliografa ......................................................................................................................................... 116

    Tercera Parte

    ESTADSTICA INDUCTIVA VIII. Introduccin a la estadstica inductiva ....................................................................................... 119 VIII.1. Estadstica y parmetros ......................................................................................................... 119 VIII.2. Pasos en la verificacin de una hiptesis ................................................................................ 120 VIII.3. La falacia de afirmar el consecuente ...................................................................................... 123 VIII.4. La forma de las hiptesis estadsticas ...................................................................................... 124 Bibliografa ......................................................................................................................................... 127

    IX. Probabilidad ................................................................................................................................. 128 IX.1. Probabilidad a priori .................................................................................................................. 129 IX.2. Propiedades matemticas de las probabilidades ........................................................................ 133 IX.3. Permutas .................................................................................................................................... 145 IX4. Valores esperados ....................................................................................................................... 151 IX.5. Independencia y muestreo aleatorio .......................................................................................... 153 Bibliografa.......................................................................................................................................... 159 X. Pruebas de hiptesis: la distribucin binomial .............................................................................. 160 X1. La distribucin de muestreo binomial ......................................................................................... 160 X.2. Pasos en las pruebas estadsticas ................................................................................................ 164 X.3. Aplicaciones de la binomial ........................................................................................................ 177 X.4. Extensiones del binomio ............................................................................................................. 181 X.5. Sumario ....................................................................................................................................... 183 Bibliografa ......................................................................................................................................... 186 XI. Pruebas de muestras simples que implican medias y proporciones. ............................................. 187 XI.1. Distribucin en muestreo de las medias .................................................................................... 187 XI.2. Prueba para la media de la poblacin, conociendo. ................................................................... 194 XI.3. La distribucin t de Student........................................................................................................ 199 XI.4. Pruebas que comportan proporciones ........................................................................................ 204 Bibliografa ......................................................................................................................................... 210 XII. Estimacin de punto e intervalo .................................................................................................. 211 XII.1. Estimacin del punto ................................................................................................................ 212 XII.2. Estimacin del intervalo ........................................................................................................... 215 XII.3. Intervalos de confianza para otros tipos de problemas ............................................................ 221 XII.4. Determinacin del tamao de la muestra .................................................................................. 224 Bibliografa ......................................................................................................................................... 227

    Cuarta Parte

    ESTADISTICAS BIVARIADAS Y MULTIVARIADAS XIII. Pruebas de dos muestras: diferencia de las medias y las proporciones. ..................................... 231

    3

  • XIII.l. Prueba de la diferencia de las medias ...................................................................................... 231 XIII.2. Diferencia de proporciones ..................................................................................................... 240 XIII.3. Intervalos de confianza ............................................................................................................ 245 XIII.4. Muestras dependientes: pares asociados.................................................................................. 246 XIII.5. Comentarios a propsito de los esquemas experimentales y pruebas de significacin .......... 248 Bibliografa ......................................................................................................................................... 255 XIV. Escalas ordinales: pruebas no paramtricas de dos muestras. ................................................... 256 XIV1. Fuerza y eficiencia de la fuerza ............................................................................................... 257 XIV.2. La prueba de las secuencias (runs) de Wald-Wolfowitz ........................................................ 263 XIV.3. La prueba de Mann-Whitney o de Wilcoxon ......................................................................... 269 XIVA. La prueba de Kolmogorov-Smirnov ....................................................................................... 277 XIV.5. La prueba de Wilcoxon de pares asociados y rdenes provistos de signo ............................. 280 XIV.6. Resumen ................................................................................................................................. 284 Bibliografa ......................................................................................................................................... 288

    XV. Escalas nominales: problemas de contingencia .......................................................................... 289 XV.1. La prueba de la X-cuadrada ..................................................................................................... 289 XV.2. La prueba exacta de Fisher ...................................................................................................... 301 XV.3. Medidas de la fuerza de la relacin ......................................................................................... 306 XV.4. Control de otras variables ........................................................................................................ 319 Bibliografa ......................................................................................................................................... 330 XVI. Anlisis de la variancia .............................................................................................................. 332 XVI.1. Anlisis simple de la variancia ................................................................................................ 332 XVI.2. Comparacin de medias especficas ........................................................................................ 343 XVI.3. Anlisis bimodal de la variancia.............................................................................................. 349 XVIA. Alternativas no paramtricas del anlisis de variancia ........................................................... 365 XVI.5. Medidas de asociacin: correlacin intraclase ....................................................................... 370 Bibliografa ......................................................................................................................................... 376 XVII. Correlacin y regresin ............................................................................................................ 377 XVII.1. Regresin lineal y mnimos cuadrados ................................................................................. 377 XVII.2. Correlacin ............................................................................................................................ 393 Bibliografa ......................................................................................................................................... 413 XVIII. Correlacin y regresin [conclusin] ...................................................................................... 414 XVIII.1. Prueba de significacin e intervalos de confianza ............................................................... 414 XVIII.2. Correlacin no lineal y regresin ......................................................................................... 425 XVIII.3. Efectos de los errores de medicin ...................................................................................... 431 XVIII.4. Escalas ordinales: correlacin de rangos ............................................................................. 433 Bibliografa ......................................................................................................................................... 445 XIX. Correlacin mltiple y parcial .................................................................................................... 447 XIX.1. Regresin mltiple y mnimos cuadrados- .............................................................................. 447 XIX.2. Correlacin parcial ................................................................................................................. 451 XIX.3. Correlacin parcial e interpretaciones causales....................................................................... 461 XIX.4. Mnimos cuadrados mltiples y los coeficientes beta ............................................................ 469 XIX.5. Correlacin mltiple ............................................................................................................... 473 XIX.6. Regresin mltiple y no linealidad ......................................................................................... 479 XIX.7. Pruebas de significacin e intervalos de confianza ................................................................ 484

    4

  • Bibliografa.......................................................................................................................................... 489

    XX. Anlisis de covariancia y variables simuladas ............................................................................ 491 XX.1. Relacin de dos escalas de intervalo, control de la escala nominal ......................................... 492 XX.2. Relacin de una escala de intervalo y una escala nominal, control de la escala de intervalo... 510 XX.3. Extensiones del anlisis de covariancia ................................................................................... 516 XX.4. Anlisis de la variable simulada .............................................................................................. 517 XX.5. Observaciones finales .............................................................................................................. 521 Bibliografa ......................................................................................................................................... 526

    Quinta Parte MUESTREO

    XXI. Muestreo .................................................................................................................................... 531 XXI.1. Muestreo aleatorio sencillo ..................................................................................................... 532 XXI.2. Muestreo sistemtico .............................................................................................................. 537 XXI.3. Muestreo estratificado ............................................................................................................ 539 XXI.4 Muestreo por conglomerados .................................................................................................. 546 XXI.5. Muestreo sin probabilidad ...................................................................................................... 552 XXI.6. Errores no de muestreo y tamao de la muestra ..................................................................... 553 Bibliografa ......................................................................................................................................... 554

    APNDICES

    I. Resumen de operaciones algebraicas .............................................................................................. 559 Cuadros ............................................................................................................................................... 565 ndice de figuras ................................................................................................................................. 599 ndice de cuadros ................................................................................................................................ 603

    5

  • XIII. PRUEBAS DE DOS MUESTRAS: DIFERENCIA DE LAS MEDIAS Y LAS PROPORCIONES

    En el captulo XI se examinaron pruebas que consideraban una sola muestra. Hallamos que dichas

    pruebas no eran muy prcticas para el socilogo, ya que por lo regular no es posible encontrar una hiptesis suficientemente concreta para predecir un valor para o pu. Sin embargo, cuando el inters se centra en comparaciones entre varias categoras de muestras, resulta innecesario concretar los niveles absolutos de uno u otro de los grupos. En lugar de ello, puede probarse sencillamente la hiptesis nula de que no existe entre ellos diferencia alguna. As, por ejemplo, sera extremadamente difcil anticipar el nivel de ingreso de los negros en Detroit o el nivel de prejuicio de los blancos en esa ciudad. Sin embargo, supngase que nos interesaba probar la hiptesis de que el ingreso promedio de los negros es el mismo que el de los blancos nacidos en el extranjero, o que los judos tienen para los negros el mismo grado de prejuicio que los no judos. Este ltimo tipo de hiptesis lo reconsideraremos aqu.

    En una ciencia social como la sociologa, el inters propende a centrarse en establecer relaciones entre variables. Esto contrasta con el tipo de la encuesta que rene datos y en la cual, segn vimos, la estimacin del punto y el intervalo de un solo parmetro puede revestir importancia primordial. Cuando se establecen comparaciones entre dos muestras, tenemos la clase ms simple de problema en el que dos variables pueden referirse una a otra. Hasta aqu slo nos hemos ocupado de una sola variable a la vez. sta es tal vez la razn principal de que las pruebas examinadas hasta el presente no hayan sido demasiado tiles para los socilogos. En este captulo vamos a ocuparnos de pruebas en las que una simple variable dicotmica puede ser referida a otra variable. As, por ejemplo, al comparar a los judos y los no judos por Io que se refiere al prejuicio, relacionamos de hecho a ste con la religin. Y en forma anloga, podra quererse comparar los dos sexos con respecto a otros aspectos o desde el punto de vista de otras caractersticas relativas a la personalidad. Las comparaciones pueden establecerse asimismo entre un grupo de control y un grupo de experimento en el que se ha introducido alguna variable. En los captulos siguientes se examinarn pruebas que comportan ms de dos muestras. XIII.1. Prueba de la diferencia de las medias

    Con objeto de extender la prueba de las medias de una muestra nica a una prueba en la que pueda

    establecerse una comparacin entre las medias de dos muestras, hemos de servirnos nuevamente del teorema del lmite central. Un teorema importante, derivado, puede enunciarse como sigue: si se extraen muestras independientes al azar, de los tamaos N1 y N2 respectivamente, de poblaciones que son respectivamente Nor(1, 21) y Nor(2, 22), la distribucin de muestreo de la diferencia entre las dos medias de las muestras ( X 1 X 2) ser igual a Nor (1 2, 21/N1 + 22/N2). Lo mismo que en el caso de muestras individuales, este teorema puede generalizarse en el caso de muestras grandes para abarcar cualesquier poblaciones de medidas 1 y 22 y de variancias 21 y 22 respectivamente. En efecto, a medida que N1 y N2 aumentan, la distribucin de seleccin de X 1 X 2 se aproxima a la normalidad, lo mismo que antes. Examinemos ahora este teorema ms de cerca.

    Se hace referencia a muestras aleatorias independientes. Esto significa que las muestras han de seleccionarse independientemente una de otra. El hecho de que la muestra sea al azar asegura independencia en el interior de ella, en el sentido de que el conocimiento de la marca del primer individuo seleccionado no nos ayuda a predecir la marca del segundo. Esto no es, con todo, lo que aqu se entiende por muestras al azar independientes. En efecto, no slo ha do haber independencia en el interior de cada muestra (asegurada por el hecho de la seleccin al azar), sino que ha de haberla adems entre las muestras. As, por ejemplo, las muestras no pueden aparearse, como sera eventualmente el caso entre grupos de control y grupos de experimento. Si se fueran a comparar, por ejemplo, los dos sexos, no podra utilizarse la prueba de la diferencia de las medidas en muestras compuestas de parejas de marido y mujer.

    El requisito de que las muestras sean independientes una de otra es sumamente importante, aunque a menudo se lo pase por alto en la investigacin, particularmente cuando se maneja con una muestra en grupo. Si la muestra en conjunto es estrictamente al azar, y si se comparan dos submuestras tomadas de una misma muestra aleatoria mayor, el supuesto de independencia entre las dos submuestras en cuestin tendr lugar, ya que todos los casos de la muestra mayor se habrn seleccionado independientemente uno de otro. Por ejemplo: si se comparan varones con hembras, deberemos hacer un muestreo general de los varones y otro

    6

  • muestreo, seleccionado independientemente, de todas las hembras. Es decir: la seleccin de Bob Jones no tiene influencia ninguna en la probabilidad de que sea seleccionada Susie Smith.

    Por lo regular, en la investigacin social tomamos una sola muestra mayor, aunque con fines de anlisis podamos considerar los datos como procedentes de diversas muestras independientes. En la mayora de los casos, el problema de la falta de independencia entre las muestras no se plantear, a menos que deliberadamente las hayamos apareado. Como pueden darse circunstancias en las que el diseo del muestreo no sea tan sencillo, deber prestarse atencin a la posibilidad de que no se satisfaga el supuesto de independencia entre las muestras.

    En el teorema en cuestin se nos dice que si continuramos a seleccionar indefinidamente, seleccionando cada vez dos muestras y estableciendo una grfica de sus medias, la distribucin de seleccin de esta diferencia entre medias sera normal o aproximadamente normal. El lector ha de tratar de representarse exactamente lo que aqu ocurre. Tenga presente que, coma socilogo, l slo obtendr en realidad dos muestras y una sola diferencia, en tanto que aqu tratamos de la distribucin hipottica de todas las diferencias posibles. Como quiera que la distribucin de muestreo es para una diferencia entre medias de muestras, la media de la distribucin de muestreo est dada por la diferencia entre dos medias de poblacin, ms bien que por cualquiera de ellas separadamente. En el caso especial en que y 2 sean iguales, la media de la distribucin de muestreo ser cero. Si l > 2, esperamos que la mayora de las X 1 ser mayor que las X 2, correspondientes, y que la media de la distribucin de seleccin ser por consiguiente positiva. Por ejemplo, 1 = 60 y 2 = 40, la distribucin de X 1 X 2 tendr 20 como media o valor esperado.

    No es en cambio tan fcil ver por qu la variancia habra de ser 21/N1 + 22/N2 o sea la suma de las variancias de la distribucin de muestreo de las medias separadas. Es obvio que no podra emplearse una diferencia de variancias 21/N1 + 22/N, ya que podra obtenerse, para la distribucin de muestreo, cero o una variancia negativa. En cambio, la variancia 21/N1 + 22/N2 es mayor que cualquiera de las dos variancias 1/N1 o 2/N2. Por qu es esto as? Aunque no pueda darse una justificacin completa de la frmula sin recurrir al razonamiento matemtico, puede, can todo darse cierto tipo de explicacin intuitiva. Fundamentalmente, esperamos que el error estndar correspondiente a la diferencia de las medias sea mayor que cualquiera de los errores estndar separados, porque tenemos ahora dos fuentes de error, o sea una en cada muestra. As, pues, la mitad de las veces las dos X estarn en error en sentidos opuestos. Con fines de simplificacin, supongamos que l = 2 . En este caso, si X 1 es mayor que l y X 2 es mayor que 2, el resultado de la sustraccin ser una cantidad grande positiva, porque los errores son en sentidos opuestos. Por ejemplo, si X 1 es ms grande en 20 que l y X 2 es menor en 15 que 2, la diferencia resultante, X 1 X 2 diferir de 1 2 en 35, combinando, pues, los errores implicados. Y en forma anloga, si X 1 es pequea y X 2 es grande, puede resultar una diferencia negativa sustancial. En otros trminos : con mucha frecuencia obtendremos diferencias relativamente grandes entre las medias de las muestras, ya que cada media variar independientemente de la otra. En consecuencia, la distribucin de muestreo de una diferencia tendr una desviacin estndar mayor que cualquiera de las distintas distribuciones de muestreo separadas.

    * La frmula para el valor esperado y la variancia de X 1 X 2 puede ser deducida utilizando una vez ms las expresiones correspondientes a las combinaciones lineales. Se recordar que si Y = c1X1+c2X2, tendremos E(Y) = c1E(X1)+c2E(X2), y 2Y = c12 x12 + c22 x22, a condicin de que X 1 y X 2 sean independientes. Si hacemos ahora que Y represente una diferencia de medias, sustituyendo X1 por X 1 y X 2 por X 2, haciendo c1 = 1 y c2 = -1, tendremos, como caso especial, los resultados

    E(Y)=E ( X 1 X 2) = (1) E( X 1)+ (1) E( X 2) = l - 2 y

    2Y = (1)2 21X + ( 1)2 2

    2X =

    NN 2

    2

    2

    1

    2

    1 + Obsrvese que si hubisemos formado la suma de X 1 y X 2, la expresin de la variancia para dicha

    cantidad hubiera sido la misma que la correspondiente a su diferencia. En el captulo XVI estudiaremos otros

    7

  • tipos ms complejos de comparaciones en las que se incluye una generalizacin de esta simple comparacin de dos medias de muestras.

    Vamos a ver ahora un ejemplo ilustrativo del empleo de la prueba de la diferencia de las medias. El caso de las a conocidas no lo examinaremos, ya dicho problema es obvio y ms bien poco prctico. Supondremos, pues, que las o no se conocen. Consideraremos dos casos particulares: en el primero supondremos que 1 = 2, en tanto que en el segundo se supondrn dos 0 desiguales. Es obvio que estos dos modelos comprenden todas las alternativas posibles.

    Problema. Se establece una comparacin entre dos tipos de distritos, o sea entre los predominantemente urbanos y los que son fundamentalmente rurales. Los distritos en cuestin se comparan en relacin con el porcentaje de personas que votan por los demcratas en una eleccin presidencial, con los siguientes resultados :

    Distritos urbanos Distritos rurales N1 =33 N2 = 19 X 1= 57% X 2 = 52 % s1 =11% s2 = 14% Presentan estos datos motivos razonables para suponer que existen diferencias significativas en las

    preferencias electorales de dichos dos tipos de distritos? Supngase que stos se han seleccionado al azar de una lista de todos los distritos del Far West, y que estudios previos han mostrado que las respectivas distribuciones de poblacin son aproximadamente normales.

    Modelo 1: 1 = 2

    1. Supuestos

    Nivel de medicin: el porcentaje de votos democrticos es una escala de intervalo Modelo: muestras aleatorias independientes poblaciones normales, 1 = 2 = Hiptesis: l = 2 El supuesto de normalidad puede abandonarse siempre que las N sean grandes (por ejemplo, ambas

    sobre 50). El supuesto 1 = 2 puede comprobarse efectivamente por medio de la prueba F que se examinar en el captulo XVI. Esta prueba comporta una comparacin de las dos desviaciones estndar de las muestras. Si s1 y s2 no difieren mucho no podr rechazarse la hiptesis de que 1 = 2. Si de acuerdo con los resultados de la prueba F el supuesto de desviaciones estndar iguales es razonable, ser ms eficaz aprovecharse de ello para apreciar el valor comn de . Dado el supuesto de que las dos poblaciones sean normales, los supuestos adicionales de medias y desviaciones estndar iguales equivalen a sostener que las dos poblaciones son idnticas.

    Como quiera que estamos interesados en saber si existe o no alguna diferencia entre los dos tipos de distritos, nuestra hiptesis nula ser la de que no existe diferencia. Por lo visto, sospechamos que s existe diferencia, y por ello formulamos una hiptesis que deseamos descartar. En este caso podemos designar legtimamente la hiptesis como hiptesis nula, que no indica relacin entre las variables tipo de distrito y preferencia electoral. Se concibe que hubiramos podido estar en condiciones de concretar que las medias de la poblacin se espera que sea alguna constante distinta de cero. As, por ejemplo, las hiptesis pudieron haber adoptado la forma de 1 2 = 10, si se hubiera anticipado que la votacin en favor de los demcratas sera un 10 % superior en los distritos urbanos. Sin embargo, en ciencias sociales estamos raramente en condiciones de poder concretar tanto.

    2. Distribucin de muestreo. Nos serviremos de la distribucin t, ya que las a no se conocen y que el nmero total de casos es muy inferior a 120.

    3. Nivel de significacin. Escojamos el nivel de .01 y una prueba de dos colas. 4. Clculo del estadstico de la prueba. Se recordar que la distribucin t se calcula tomando la

    diferencia entre el valor obtenido de la muestra y la media de la distribucin de muestreo, y dividiendo entre una estimacin del error estndar de esta distribucin. Nos interesa aqu la diferencia entre las medias de la muestra, X 1 X 2. Como quiera que la media de la distribucin de muestreo es 1 2, obtenemos para t la siguiente expresin:

    8

  • ( ) ( )

    =

    XX

    t XX

    21

    2121 (XIII.1)

    en donde XX 21 es una estimacin del error estndar de la diferencia entre las medias de las

    muestras. Como quiera que en la hiptesis nula se ha supuesto que l = 2, la expresin para t se convierte, en este caso especial, en

    ( )

    XXXX

    21

    21

    La semejanza entre el numerador anterior y el que utilizamos en la prueba de una sola muestra es

    ms o menos casual, o sea resultado del hecho de que, en la hiptesis nula, las se eliminaron. Sin embargo, no debe sacarse la conclusin de que la del primer tipo de problema se ha remplazado simplemente por la media de la muestra de la segunda de stas. En realidad, la expresin ( X 1 X 2) ha remplazado a X , (l -

    2) ha remplazado a , y

    XX 21 , ha remplazado a

    X .

    Nos falta ahora evaluar XX 21 Sabemos, por supuesto, que

    NNXX 2

    2

    2

    1

    2

    1

    21

    += Como quiera que en este caso 1 = 2, podemos indicar el valor comn como , sacarlo del radical, y

    simplificar la expresin de XX 21 como sigue:

    NNNN

    NNNNXX 2121

    212

    2

    1

    211

    21

    +=+=+= (XIII. 2) La variancia comn 2 puede evaluarse ahora obteniendo una apreciacin combinada de ambas

    muestras. Como quiera que las dos variancias de las muestras se basarn por lo regular en nmeros distintos de casos, podemos obtener una apreciacin de 2 tomando un promedio ponderado de las variancias de las muestras, poniendo cuidado en dividir entre los grados propios de libertad, con objeto de conseguir una estimacin insesgada. Extrayendo la raz cuadrada, obtenemos la estimacin de como sigue:

    221

    2

    22

    2

    11

    ++=NN

    sNsN

    9

  • Puesto que: sN 211 = (= N

    ii XX

    1

    111 ) 2 , podremos sustituir sN 211 por: , en donde =

    N

    iix

    1

    1

    2

    1

    XXx ii 111 = Si hacemos lo mismo para sN 222 , obtenemos

    2211 1

    2

    2

    2

    1

    1 2

    ++

    = = =

    NNxx

    N N

    i iii

    De este modo, si tomamos la suma de los cuadrados alrededor de la media de la primera muestra y

    sumamos a ella la suma de los cuadrados de las desviaciones alrededor de la media de la segunda muestra, dividiendo finalmente entre N1 + N2 2, obtenemos una estimacin combinada de la variancia comn.

    Obsrvese que el smbolo se emplea ahora para representar una estimacin distinta de la que vimos en los captulos anteriores. Para indicar una estimacin insesgada se emplea a menudo en la literatura estadstica el smbolo ^. Como quiera que, hemos perdido 2 grados de libertad, uno en cada clculo de s1 y s2 a partir de X 1 y X 2, los grados totales de libertad quedan en N1 + N2 2. Para obtener nuestra estimacin, nos hemos servido de ambas muestras, dando un mayor peso a la variancia de la mayor de ellas. Semejante estimacin combinada ser ms eficaz que las estimaciones basadas en una u otra sola de las

    muestras en cuestin. A ttulo de control del clculo, el valor numrico de se situar por lo regular entre los de s1 y s2.

    Finalmente, obtenemos una estimacin de XX 21 tomando nuestra estimacin de y multiplicando por

    NNNN

    21

    21+ como en la ecuacin (XIII.2). As:

    NNNN

    NNsNsN

    XX 2121

    21

    2

    22

    2

    11

    221

    ++

    += (XIII. 4)

    Obsrvese que la ecuacin (XIII.4) se diferencia de la ecuacin (XIII.2) en que el a de la ecuacin

    (XII1.2) ha sido sustituido por su estimado , como se define en la ecuacin (XIII.3). En este punto la frmula parece terrible. Sin embargo, el lector debera repasar los pasos algebraicos examinados anteriormente, para convencerse de que la frmula no es tan complicada como a primera vista parece.

    En nuestro ejemplo numrico obtenemos los siguientes resultados:

    ( ) ( )( ) ( )( ) 58.3288.42.121933

    1933219331961912133

    21

    ==+++=

    XX Por lo tanto, ( )

    40.158.3

    52570

    21

    21 === XXt

    XX

    10

  • Obsrvese que nuestro estimado = 12.42 cae entre s1 = 11 y s2=14. 5. Decisin. Como quiera que se utiliz una estimacin combinada de la desviacin estndar comn,

    los gradas de libertad asociados a t sern N1 + N2 2, o sea 50. Encontramos que t = 1.40, cuya probabilidad sera considerablemente superior a .01 si todos los supuestos fueran correctos. Decidimos, pues, no descartar la hiptesis nula al nivel de .01, y llegamos en consecuencia a la conclusin de que no se dan diferencias electorales significativas entre los distritos urbanos y rurales del Far West.

    Modelo 2: 1 2. Vemos ahora cules modificaciones resultan necesarias cuando es imposible suponer que las dos poblaciones presentan las mismas desviaciones estndar. Probablemente habremos verificado y descartado la hiptesis de 1 = 2. En consecuencia, ya no es posible ahora simplificar la frmula XX 21 introduciendo un valor comn para a, ni lo es tampoco formar una estimacin combinada. En semejante caso, estimamos las dos desviaciones estndar (distintas) separadamente. Estimamos 12/Nl a partir de s12/ (N1 1), y 22/N2, sobre la base de s22/ (N2 1), con lo que obtenemos:

    11 2

    2

    2

    1

    2

    1

    21+=

    N

    sN

    sXX (XIII.5)

    En el ejemplo empleado anteriormente tenemos, pues:

    83.367.1489.1078.318/19632/12121

    ==+=+= XX

    Y por consiguiente, 31.183.3

    5257 ==t As, pues, los resultados obtenidos en los dos modelos distintos no difieren grandemente. Si bien el procedimiento empleado en el modelo 2 es ms sencillo desde los puntos de vista lgico y

    de clculo a la vez, la estimacin de XX 21 no es, con todo, tan eficaz, en l, como la que se obtuvo anteriormente. Por otra parte, aun si suponemos poblaciones normales, el modelo 2 resulta algo dudoso en los casos en que las N no son muy grandes o en que los tamaos de las muestras difieren mucho una de otra. La dificultad se hace presente al escoger el grado adecuado de libertad. As, por ejemplo, si la primera muestra fuera excepcionalmente pequea, sera muy falaz servirse de N1 + N2 2 como grados de libertad, ya que s1 sera una estimacin muy deficiente de al, ya que el valor de s12/ (N1 1) sera por lo regular mucho mayor que el de s22/ (N2 1). Esto es cierto porque no siendo muy diferentes los valores de s12 y s22, los tamaos relativos de las dos fracciones vendrn fundamentalmente determinados por sus denominadores. Se ha sugerido que, a menos que las N sean grandes, es preferible servirse de la siguiente expresin para obtener una aproximacin de los grados correctos de libertad:

    ++

    +

    +=

    11

    2

    22

    11

    1

    21

    11

    2

    2

    1

    2

    2

    2

    2

    2

    1

    2

    1

    11 NNs

    NNs

    Ns

    Ns

    df (XIII.6)

    En esta forma obtenemos en el ejemplo anterior:

    ( )( ) ( ) ( ) ( ) 3289.31289.33220/134/1

    67.14

    89.1078.3 222

    ==+

    =df

    11

  • Obsrvese que algunas de las magnitudes de la frmula de los grados de libertad ya se calcularon anteriormente. De la tabla t, sirvindonos de 32 grados de libertad, vemos que la hiptesis nula no debera descartarse al nivel de .01.

    Por lo que se refiere a los supuestos, la nica diferencia entre los modelos 1 y 2 es el supuesto de que l = 2. Obsrvese que nada hay en el segundo procedimiento que requiera que las desviaciones estndar sean desiguales. Si ocurre que son iguales (o casi) el segundo modelo ser sencillamente el ms eficaz. Parecer tal vez que el segundo procedimiento sea preferible en general, porque no requiere el supuesto de l = 2. Sin embargo, segn acabamos de ver, este modelo necesita aproximaciones para los grados de libertad. En el caso de muestras grandes, los dos mtodos proporcionarn por lo regular resultados similares, si las desviaciones estndar son efectivamente iguales, ya que las dos desviaciones estndar de las muestras sern, una y otra, buenas estimaciones de la a comn.

    Si se da el caso de que las e se conocen para ambas poblaciones, entonces sus respectivos valores pueden ponerse directamente en la frmula de XX 21 , ya que no se requiere estimacin alguna. Puede en este caso calcularse Z y utilizarse el cuadro normal. Con las a conocidas, no habr necesidad, por supuesto, de distinguir entre los modelos 1 y 2. Es obvio, sin embargo, que los casos en que ambas sean conocidas sern extremadamente raras en la investigacin prctica. XIII.2. Diferencia de proporciones

    Lo mismo que en el caso de pruebas que comportan proporciones de una sola muestra, la diferencia

    entre dos proporciones puede tratarse como caso particular de la diferencia entre dos medias. Si comparamos dos muestras aleatorias, independientes, en relacin con las proporciones de personas afectadas de prejuicios, podemos formular la hiptesis nula de que las proporciones pl y p2 respectivamente, de personas con prejuicios son iguales en las dos poblaciones. Como quiera que ya se demostr en el caso de proporciones

    que qp 111 = y qp 222 = , sguese que las desviaciones estndar de las dos poblaciones han de ser iguales. Por lo tanto, el siguiente ejemplo se sirve esencialmente de los mismos procedimientos empleados en el primer modelo, en el caso de la prueba de diferencia de las medias.

    Problema. Supngase que se establece una comparacin a propsito de los hbitos de recreacin

    entre trabajadores de lnea de ensamble y personas cuyo trabajo no consiste en una mera repeticin ni se halla sujeto al ritmo de la mquina. Supongamos que el investigador sospecha que los trabajadores de lnea de ensamble sern ms propensos a escoger formas de recreacin del tipo de espectador pasivo. En una muestra aleatoria de 150 trabajadores de ensamble en una determinada fbrica se encuentra que el 57 por ciento dan preferencia a las formas de recreacin pasivas. En una segunda muestra, seleccionada asimismo al azar, el 46 por ciento de los trabajadores, sobre 120, indican tambin preferencia por las formas de recreo pasivas. Existe al nivel de .05 diferencia significativa alguna entre ambos grupos?

    1. Supuestos. Nivel de medicin: el tipo de recreacin como dicotoma Modelo: muestreo al azar independiente Hiptesis: pl = p2 (implica l = 2) 2. Distribucin de muestreo. Como quiera que ambas N son relativamente grandes, la

    distribucin de muestreo de las diferencias entre las proporciones ser aproximadamente normal, con la media pl p2, = 0, y una desviacin estndar de:

    Nqp

    Nqp

    NNpsps 212

    2

    2

    1

    2

    1 2211

    21

    +=+= en donde q1 q2 y que son iguales, respectivamente, a 1 q1 y 1 q2.1

    1 Si las muestras son pequeas, nos servimos de la prueba de Fisher, descrita en el captulo XV.

    12

  • 3. Nivel de significacin y regin crtica. El problema especifica que hemos de servirnos del nivel .05. Resulta indicada una prueba de una sola cola, ya que la direccin de la diferencia se anticipa. Por consiguiente, cualquier valor positivo superior a 1.65 indicar que los resultados son tan improbables, con dichos supuestos, que la hiptesis nula ha de descartarse.

    4. Clculo de la estadstica de la prueba. Como quiera que por hiptesis tenemos q1 = q2, sguese que l = 2 = , pudiendo emplearse la frmula especial:

    NNNNpsps 21

    21

    21

    += Anteriormente, en la prueba de proporciones de una sola muestra, pudo prescindirse de la estimacin

    de , ya que el valor de p se supona. Ahora, en cambio, la hiptesis enuncia simplemente que p1 = p2, pero sin especificar, con todo, cul sea el valor real de estas proporciones. sta es la razn de que necesitemos una estimacin combinada del error estndar. En lugar de buscar un promedio ponderado de las dos variancias de las muestras, que es lo que hicimos antes, podemos obtener una estimacin ligeramente menor, calculando

    una estimacin combinada de p. Encontramos luego por sustraccin. Ya que:

    p

    q

    = qp

    As, pues

    NNNN

    qpNNNNpsp

    s 21

    21

    21

    21

    21

    +=+=

    (XIII.8)

    Con objeto de obtener , se toma un promedio ponderado de las proporciones de las muestras de

    la manera siguiente:

    p

    NNpNpN

    pss

    21

    2211

    ++=

    (XIII.9)

    Obsrvese que el numerador de esta expresin no es ms que el nmero total de los individuos de

    ambas muestras que prefieren formas de recreacin de tipo pasivo. As, en el caso de nuestro ejemplo numrico, obtenemos:

    ( ) ( ) 521.120150

    46.12057.150 =++=p

    Por lo tanto, = 1 = .479

    qp

    y ( )( ) ( )( )120150120150479.521.

    21

    += psps

    = (.4996) (.1225) = .0612

    Y de ah que

    13

  • ( )80.1

    0612.46.57.0

    21

    21 ==

    = pp

    pp

    ss

    ssz

    5. Decisin. Como quiera que con una prueba de una sola cola la probabilidad de obtener un valor de

    Z igual o mayor que 1.80 es de .036, siempre que la hiptesis nula sea efectivamente correcta, podemos descartar esta hiptesis al nivel de .05. Concluimos, pues, que existe una diferencia significativa en relacin con la preferencia de tipos de recreacin pasiva entre las dos clases de trabajadores de la fbrica considerada.

    Hay que mencionar aqu que existen diversas clases alternativas de pruebas, la ms importante de las cuales es la de la al cuadrado, que se examinar en el captulo XV, que pueden utilizarse en lugar de la prueba de la diferencia de las proporciones. Como quiera que, en efecto, el empleo de la prueba de la diferencia de las proporciones est limitado a dos muestras y una variable dicotmica, sta no resulta tan prctica como la prueba al cuadrado, que puede aplicarse lo mismo a tres o ms muestras. Sin embargo, una de las ventajas de la prueba de la diferencia de las proporciones es que, mediante modificaciones adecuadas, se la puede utilizar en el caso de muestras de reas o por conglomerados. Desafortunadamente, las modificaciones en cuestin no tienen cabida en el marco del presente texto.

    * Diferencia de diferencias de proporciones. Podemos ampliar fcilmente el principio de una prueba para una diferencia de proporciones (o medias) hasta abarcar una diferencia de diferencias, o incluso una diferencia de diferencias de diferencias. Supongamos, por ejemplo, que tenemos datos relativos tanto a trabajadores como a trabajadoras, y que deseramos comparar los sexos en arden a la relacin entre los trabajos realizados y las preferencias recreacionales. Tal vez encontraramos en el caso de los hombres una diferencia tal como la que acabamos de ilustrar, pero ninguna en el caso de las mujeres. O tal vez la direccin de la diferencia pueda resultar contraria entre ambos sexos. Ampliando esta ilustracin podramos desear agregar el dato relativo a las edades. En tal caso puede concebirse que tendramos una diferencia de diferencias (entre hombres y mujeres) en el caso de los trabajadores jvenes, y un resultado distinto para los trabajadores adultos. Puede observarse que estamos anticipando problemas que tal vez surjan cuando manejemos ms de dos variables, y cuando las diferentes variables puedan causar peculiares efectos combinados. En tales casos se afirma que hay interaccin entre las variables, o que sus efectos unidos son no aditivos. En los captulos XVI y XX tendremos oportunidad de estudiar con ms detalle estos tipos de posibilidades.

    En el muy sencillo ejemplo en el que deseamos comparar las diferencias de proporciones entre hombres y mujeres, supongamos que p1 y p2, representan las proporciones de poblacin para hombres, como en el anterior ejemplo. Tendremos entonces dos proporciones semejantes, p3 y p4 que representarn las mujeres, y podramos hacer una prueba similar de la hiptesis nula, tal como, para las mujeres p3 = p4. Pero podemos probar asimismo la hiptesis ms compleja de que las diferencias (de poblacin) para los sexos son tambin idnticas. Nuestra hiptesis nula pasa as a ser

    p1 p2 = p3 = p4 o (p1 p2 ) (p3 p4 ) = 0 Expresado de otra manera, estamos sentando la hiptesis de que la relacin entre clase de trabajo y

    preferencias recreativas (medida por una diferencia de proporciones), es igual para ambos sexos. Una hiptesis alternativa podra consistir en que la diferencia es mayor entre los hombres que entre las mujeres.

    Podemos utilizar de nuevo el principio de las combinaciones lineales, planteando

    Y = c1ps1 + c2ps2 + c3Ps3 + c4ps4 En cuanto a la hiptesis nula que estamos considerando, haremos cl = c4 = 1, y c2 = c3 = 1, resultando

    (siempre que se trate de muestras seleccionadas independientemente) E(Y) = E(psl)-E(ps2)-E(ps3)+E(ps4).= (p1 p2) (p3 p4) y

    14

  • Nqp

    Nqp

    Nqp

    Np

    y q4

    44

    3

    33

    2

    22

    1

    12 1 +++= podemos ya formar Z, como sigue : ( ) ( )

    Nqp

    Nqp

    Nqp

    Nqp

    pppp ssZ

    4

    44

    3

    33

    2

    22

    1

    11

    4321

    +++

    =

    y usar el cuadro normal en forma directa. Como el denominador contiene las incgnitas pi y qi ,

    podemos estimrselas mediante las correspondientes psi y qsi, fijando conservadoramente cada grupo como igual a .5.

    Es importante advertir que la expresin para la variancia de Y comprende cuatro Ni diferentes, las que aparecen como denominadores en fracciones separadas. Como quiera que los productos piqi se encuentran normalmente cerca del valor .25, veremos que el valor de cada fraccin ser primordialmente funcin del tamao de la submuestra. En un terreno prctico, si hay una submuestra muy pequea, sta puede dominar la expresin correspondiente a la variancia de Y, y por tanto tambin al denominador de Z. De esta manera, y para lograr un mximo de eficacia, desearemos usar submuestras del mismo tamao aproximado. Si una submuestra es muy pequea, podr no resultar significativa la prueba anterior, por razn de ser grande el denominador de Z, resultando adems injustificada la aproximacin normal.

    Puede seguirse exactamente el mismo procedimiento en relacin con las diferencias entre las medias, por ejemplo ( )XX 21 ( )XX 43 . Habremos sin embargo de aplazar este asunto hasta que en el captulo XVI abordemos las comparaciones generales entre k medias. XIII.3. Intervalos de confianza

    En el caso de problemas de una sola muestra, ya vimos que la construccin de un intervalo de

    confianza constituye a menudo un procedimiento ms prctico que la verificacin de las hiptesis. En la investigacin social, sin embargo, los intervalos de confianza raramente se emplean como alternativas de pruebas de dos muestras. La razn de ello reside en que nos interesa por lo regular establecer la existencia de una relacin entre dos variables, esto es, de una diferencia significativa. En tanto que interesa menos, en cambio, la magnitud efectiva de la diferencia en cuestin. El socilogo, en efecto, raramente trata de sacar la conclusin de que la diferencia entre dos medias se sita entre 17 y 28, por ejemplo. Por lo regular, se da por satisfecho si encuentra alguna diferencia significativa cualquiera. Este hecho revela indudablemente la falta de madurez de las ciencias sociales y la preponderancia de los estudios exploratorios. Es posible que, a medida que las hiptesis se vayan haciendo ms precisas, aumente tambin la necesidad de los intervalos de confianza en los problemas de dos muestras.

    El procedimiento empleado para el establecimiento de intervalos de confianza es una extensin directa del que se examin anteriormente. Se toman simplemente los resultados de las muestras, en este caso una diferencia entre sus medias, y se sita un intervalo alrededor de ( )XX 21 , que sea un mltiplo adecuado del error estndar. As, por ejemplo, si se deseaba un intervalo de confianza del 95 por ciento, lo obtendramos como sigue:

    ( ) XXXX 2196.121 Si se requiriera una estimacin del error estndar y de la distribucin t, la frmula se modificara de

    la manera usual.

    15

  • XIII.4. Muestras dependientes: pares asociados En ocasiones resulta ventajoso concebir un estudio en el que las muestras no sean independientes una

    de otra. Uno de los tipos ms comunes de los problemas de esta clase es aquel en que los casos de las dos muestras se han asociado por pares. Puede haber grupos de control y grupos experimentales, en los que los miembros se hayan apareado desde el punto de vista de algunas caractersticas importantes. O puede emplearse un simple esquema antes y despus, en el que las mismas personas se comparan antes y despus de haberse introducido alguna variable experimental. En este ltimo caso, las dos muestras constan de los mismos individuos. Es obvio que semejantes muestras no son independientes una de otra. En efecto, el conocimiento de las marcas de los primeros miembros de cada par (primera muestra) ayudara a predecir las de los segundos. De hecho, el objeto del apareamiento, o de servirse dos veces de los mismos individuos, consiste en controlar las ms variables posibles, aparte de la experimental. Se persigue hacer las dos muestras lo ms iguales posibles, o sea mucho ms que si se hubieran seleccionado independientemente.

    En relacin con semejantes problemas, el investigador podra verse tentado a usar una prueba de diferencia de las medias. Sin embargo, habra de ser obvio que este procedimiento no estara justificado, ya que no tenemos 2N casos (N en cada muestra) que se hayan seleccionado independientemente. Como quiera que, en efecto, las muestras se han apareado deliberadamente, cualesquier peculiaridades de las muestras se darn probablemente lo mismo en la otra. En realidad, slo se tienen N casos independientes, siendo cada caso un par de individuos, uno de cada uno de las muestras. Par consiguiente, si tratamos cada pareja de individuos, como un solo caso, podemos legtimamente proceder a efectuar pruebas estadsticas, a condicin que se cumplan los dems supuestos requeridos. En lugar de efectuar una prueba de diferencia de las medias, podernos proceder por comparacin directa por pares, obteniendo una marca de diferencia para cada par. Si nos servimos de la hiptesis nula de que no existe diferencia alguna entre las dos poblaciones, suponiendo as que la variable experimental no produce efecto alguno, podemos establecer simplemente la hiptesis de que la media de las diferencias por pares (D) es cero. El problema se reduce as a una verificacin de una sola muestra de la hiptesis D = 0.

    Problema. Supngase que un grupo de accin se propone influir a los electores urbanos para que voten en favor de unas propuestas de viviendas populares en las prximas elecciones, Se aparean cuidadosamente las ciudades del Estado en relacin con variables que se suponen ser significativas, y se emplean dos mtodos distintos de ejercer influencias sobre los electores. El mtodo del grupo A comporta un procedimiento indirecto consistente en influir sobre los elementos directivos de las ciudades, pero sin apelar directamente a la masa. En las ciudades del grupo B, en cambio, la organizacin acta como grupo de presin, apelando, como organizacin ajena, directamente al elector. Las cifras siguientes indican los porcentajes de votos en favor de la fluorizacin. Es uno de los mtodos superior al otro?

    Nm. del par Grupo A, % Grupo.B, % Diferencia, %

    1 63 68 5 2 41 49 8 3 54 53 1 4 71 75 4 5 39 49 10 6 44 41 3 7 67 75 8 8 56 58 2 9 46 52 6

    10 37 49 12 11 61 55 6 12 68 69 1 13 51 57 6

    52 1. Supuestos Nivel de medicin: El porcentaje de los votos es una escala de intervalo Modelo: muestreo aleatorio diferencias de poblacin distribuidas normalmente Hiptesis: D = 0.

    16

  • Hay que suponer que los pares que figuran en las muestras han sido seleccionados al azar de alguna poblacin de pares. Como, se ver ms abajo, este supuesto plantea algunas veces un problema difcil de interpretacin. Como quiera que son las diferencias de cada par las que nos interesan directamente, hay que suponer que la poblacin de todas las diferencias posibles est distribuida normalmente. Si N fuera grande, podra prescindirse de este supuesto.

    2. Distribucin de muestreo. Como quiera que no se da la desviacin estndar de las diferencias de la poblacin, hay que recurrir a la distribucin t, con N 1, o sean 12 grados de libertad. Obsrvese que stos representan la mitad de los grados de libertad que se habran utilizado si la prueba de la diferencia de las medias (con 1 y 2) hubiera sido posible.

    3. Nivel de significado y regin crtica. Sirvmonos del nivel de .05 y de una prueba de dos colas. Por consiguiente, con 12 grados de libertad, si t >=2.179, descartaremos la hiptesis nula.

    4. Clculo de la estadstica de la prueba. Primero hallamos la media de las diferencias de la muestra sumando las de la columna de diferencias y dividiendo entre N (= 13). Se obtiene adems la desviacin estndar de la muestra de las diferencias.

    0.413/52 ==X D

    ( )023.5

    13328

    2

    === N

    XXs DDD Por consiguiente:

    76.212023.500.4

    1/==

    =N

    tsX

    D

    DD Obsrvese que una vez que se ha obtenido la columna de diferencia, dejamos de prestar atencin a

    las restantes columnas. Este mismo principio es de aplicacin en situaciones ms complejas, en las que por ejemplo podemos tener una diferencia de diferencias por cada par. (Ver ejercicio 5.)

    5. Decisin. Con 12 grados de libertad, una probabilidad de .02 corresponde a una t de 2.681. Decidimos, en consecuencia, descartar la hiptesis nula y, observando la direccin de la diferencia, concluimos que el mtodo B es superior al A. XIII.5. Comentarios a propsito de los esquemas experimentales y pruebas de significacin

    Pese a que no sea posible profundizar mucho en un texto como ste en cuestiones de la planificacin

    de experimentos, unos breves comentarios tienen con todo aqu su lugar adecuado.2 El lector podr acaso haberse preguntado a s mismo cmo sea que preferamos siempre servirnos de muestras asociadas, en lugar de muestras independientes. Indudablemente, se pierden con aqullas algunos grados de libertad y, como quiera que el empleo de las muestras asociadas, implica partir los casos por la mitad (en relacin con la prueba), es que no se pierde ms, con ello, de lo que se gana? Todo esto depende de cun acertados estemos en el apareamiento de los casos. Por supuesto, el objeto de la asociacin est en reducir las diferencias debidas a variables extremas. Esto significa que un apareamiento cuidadoso debera reducir considerablemente cada una de las diferencias por pares. En otros trminos: cuanto mejor sea el apareamiento, tanto menor ser la desviacin estndar de las diferencias. As, pues, si bien el nmero de casos se reduce, la SD debera reducirse asimismo. Si se obtiene una fuerte reduccin de la desviacin estndar de las diferencias en relacin con la prdida de casos, entonces salimos ganando al aparear. Como quiera que, por lo regular se perdern casos en los procedimientos de apareamiento (vase infra), la conclusin lgica es la siguiente: no se apareje, a menos de estar completamente seguro de haber localizado las variables significativas importantes. Si el lector est estudiando la delincuencia y aparea conforme al color del pelo, se ver probablemente ms apurado que si no apareara en absoluto.

    2 Para ms detalles acerca de los esquemas experimentales, vase cualquier texto corriente sobre mtodos de investigacin. Vase en particular [8], captulo IV.

    17

  • Los textos sobre mtodos suelen por lo regular mencionar el hecho de que es probable que con el procedimiento de apareamiento se perder un nmero considerable de casos. O sea que habr que eliminar muchos casos, porque no hay casos similares con los que se dejen aparear. Semejante reduccin puede resultar desastrosa en el caso del supuesto de la muestra aleatoria. En efecto, un socilogo puede eventualmente partir de una muestra aleatoria de 1 000 casos y terminar con 200 que se dejen aparear. Al proceder as, es probable que se sesgue fuertemente su muestra final, eliminando la mayora de los casos ms extremos o poco comunes, difciles, efectivamente, de aparear. En esta forma resulta a menudo difcil determinar el carcter de la poblacin a cuyo propsito se est generalizando. Por ello hay que proceder con la mayor prudencia al generalizar los resultados. Por lo tanto, este tipo de esquema es probablemente ms til en estudios en que el inters por generalizar respecto de una poblacin finita concreta, tal como la de los blancos nativos en Chicago, es secundario.

    En conexin con semejante reduccin de casos y las dificultades en cuanto a generalizar a una poblacin concreta, se sostiene a menudo que no hay verdadero inters en la poblacin misma, ya que el objeto fundamental del investigador consiste en establecer relaciones entre variables. As, por ejemplo, un psiclogo puede acaso empezar sirvindose de aquellos novatos varones blancos que siguen un curso de introduccin a la psicologa y se prestan voluntariamente como sujetas de estudio. Puede producirse mayor muestreo todava, a medida que algunos sujetos se van eliminando en el proceso de apareamiento. Supngase que se encuentra entonces una relacin entre la variable experimental y alguna variable dependiente. Se propender, en este caso, a sacar la conclusin que la misma relacin subsistira independientemente de la poblacin estudiada, esto es, concluir que se trata de una relacin universal. Si ella resulta efectivamente ser as, el socilogo puede muy bien afirmar que no tiene inters alguno por extender la generalizacin a cierta poblacin finita cualquiera. Pero, sobre cul base puede suponer que la relacin hallada en una poblacin tan restringida es cierta asimismo en relacin con otras poblaciones? Obviamente, antes de poder hacer legtimamente semejante afirmacin, el experimenta ha de efectuarse sobre un gran nmero de poblaciones muy distintas. Pese a que en un experimento cuidadosamente dispuesto se puede obtener el control de cierto nmero de variables, prodcese casi siempre una prdida correspondiente del grado en que los resultados se pueden generalizar a poblaciones ms extensas.

    En el agrupamiento por pares resulta indicado seleccionar al azar en el interior de cada par echando una moneda al aire para decidir cul miembro del par deba asignarse al grupo experimental y cul al grupo de control. Semejante procedimiento confiere mayor contenido lgico a la interpretacin de los resultados, en el sentido de que cabe excluir la autoseleccin. As, por ejemplo, en el intento de influir sobre los electores en materia de vivienda popular, supngase que se permita a las autoridades locales elegir aquel de los dos tipos de influencia que preferan o que crean iba a resultar ms eficaz en su localidad particular. Es posible, en estas condiciones, que todas o la mayora de las localidades con cierto tipo de autoridades fueran objeto del mtodo indirecto, en tanto que las de otro tipo de dirigentes se veran tratadas por el mtodo directo. Tendramos as una variable incontrolada (el tipo de autoridades), cuyos efectos se confundiran irremediablemente con los de la variable experimental. Concretamente, supngase que el grupo B resultaba tener el porcentaje ms elevado de votos favorables, pero que al propio tiempo dicho grupo tena las autoridades ms democrticas, debido al hecho que stas tendan a favorecer la aplicacin a sus respectivas localidades del mtodo indirecto. Cmo podramos saber si la diferencia en la votacin se deba efectivamente a la superioridad del mtodo B y no, acaso, a las diferencias entre las autoridades de los dos grupos de localidades?

    Podra alegarse que el tipo de autoridades hubo de haberse controlado en el proceso de apareamiento, de modo que dos localidades de uno cualquiera de los pares tuviera el mismo tipo. Sin embargo, es obviamente imposible controlar en el proceso de apareamiento todas las variables operantes, no slo debido a dificultades prcticas, sino a causa de nuestros conocimientos limitados acerca de cules variables son efectivamente las ms importantes. En algn punto habremos de admitir que puede haber variables importantes, muchas de las cuales el investigador no conoce y que no se han controlado en el proceso de apareamiento. Y es precisamente en dicho momento cuando confiamos en la seleccin al azar, o sea en las leyes de la probabilidad, esperando que los efectos de las variables incontroladas se habrn neutralizado mutuamente. As, por ejemplo, con una N mayscula, esperarnos que, en nmeros redondos, la mitad de las localidades de autoridades ms democrticas habrn quedado en el grupo A, y la otra mitad en el grupo B. Y lo mismo acontecer con otras variables incontroladas.

    En los esquemas experimentales ex post facto, en las que el investigador slo entra en funcin despus de haberse efectuado el experimento y en las que, por lo tanto, no ha tenido oportunidad de efectuar tales asignaciones al azar, la posibilidad de autoseleccin nunca puede descartarse. Ni nos ayudan las leyes de las probabilidades a apreciar los efectos de la variable experimental en comparacin con los efectos

    18

  • posibles de variables respecto de las cuales los grupos no se han apareado. Una de las mayores ventajas de los experimentos de laboratorio sobre los llamados naturales, o ex post facto, est precisamente en ese control al azar de la autoseleccin posible.

    Sugirense a menudo otros mtodos de asociacin de muestras, a ttulo de alternativas del mtodo por pares. Por lo regular, tales mtodos alternativos presentan la ventaja de' atenuar la reduccin de los casos, pero conducen a dificultades cuando se llega al anlisis estadstico. Uno de dichos mtodos comporta la asociacin por distribuciones de frecuencia. As, por ejemplo, puede ponerse atencin en que los dos grupos sean similares en relacin con el ingreso medio, la edad media, la distribucin general del ingreso, etctera. En esta forma, los grupos resultan comparables en relacin con dichas medidas de resumen, aunque algn individuo no tenga en el otro grupo contrapartida exacta alguna con la que se lo pueda aparear. En ese tipo de esquema violamos claramente una vez ms el supuesto de independencia; pero, que el autor sepa, no existe modo simple alguno de servirse de una prueba estadstica que sea a la vez eficaz y no comparte algn supuesto en entredicho. Se podran aparear casos lo mejor posible y proceder como acaba de indicarse, pero el apareamiento conducir indudablemente a un esquema inoperante. Sin duda, no sera legtimo servirse de una prueba de diferencia de medias de Nl + N2 2 grados de libertad.

    Pruebas de significacin y generalizaciones a poblaciones. Se ha suscitado un amplio debate en la

    bibliografa sociolgica en relacin con la adecuacin de las pruebas de significacin en aquellas ocasiones en que uno trata con la poblacin ntegra. (Ver especialmente [3], [7], [9] y [10].) Puede, por ejemplo, contarse con datos correspondientes a todos los condados o estados de los Estados Unidos o de una regin en particular. Si as ocurre, no habr una poblacin ms extensa en relacin con la cual se desee generalizar, pudiendo ser difcil concebir el proceso de generalizacin involucrando una extrapolacin a un universo ms amplio de probabilidades, o a estos mismos casos bajo circunstancias anlogas. En este caso resultaran inadecuadas las pruebas de significacin, ya que no habra mplicito ningn error en el muestreo.

    La actitud que uno adopte en esta cuestin depende en primer lugar de si est satisfecho con generalizaciones a poblaciones fijas, o si desea sacar conclusiones acerca del proceso causal que pueden haber generado los datos de poblacin. En este texto hemos conceptualizado el problema como si nuestro nico objetivo fuese el de deducir partiendo de poblaciones fijas, pero es evidente que cuando deseamos relacionar nuestros hallazgos con anlisis tericos nuestros objetivos no son nunca tan sencillos. El problema de sacar deducciones causales pariendo de datos no experimentales, basadas bien sea en muestreos o en la totalidad de las poblaciones, es demasiado complicado para su examen en un texto elemental como ste. Sin embargo, hay un procedimiento para obtener las pruebas de significacin mucho ms compatible con las explicaciones tericas en lo que se refiere a por qu se ha hallado una relacin particular.

    Supongamos, por ejemplo, que, habiendo usado la totalidad de los 50 estados, hemos hallado una diferencia entre los del norte y los del sur, o bien entre los que tienen gobernadores republicanos o demcratas. Normalmente no nos conformaramos con hacer una simple descripcin de tales diferencias, sino que querramos ofrecer una explicacin, relacionada tal vez con las diferencias regionales o polticas. Admitamos que hemos advertido que los estados del sur gastan una proporcin relativamente mayor de sus presupuestos en supercarreteras, pero menor en educacin superior. Antes de que podamos hacer declaraciones acerca de que nuestra explicacin deber orientarse a buscar factores causales determinantes de esta diferencia regional, habremos de pensar en un escptico hipottico que establezca el planteamiento de una sencilla explicacin alternativa de nuestro hallazgo, a saber: la causalidad.

    Podra, en efecto, decirnos: Afirma usted que ha encontrado una diferencia achacable a caractersticas regionales. Yo podra haber utilizado una tabla de nmeros al azar para dividir los 50 estados. O bien, podra haberlos ordenado alfabticamente con base en la tercera letra de sus nombres. Si yo pudiese probar que tal proceso, basado o casi basado en el azar, hubiera producido una diferencia tan grande o mayor que la suya, resultara que su explicacin no era ms plausible que la ma.

    Obsrvese que aqu no se habla de una generalizacin a una poblacin mayor que la total de los 50 estados. El argumento gira alrededor de los procesos que pueden haber generado diferencias entre subpoblaciones ordenadas de distintas maneras. Es evidente que si hubiese sido posible obtener diferencias tan grandes como las diferencias regionales al hacer uso de una tabla de nmeros elegidos al azar, y siendo la teora del escptico mucho ms simple que la nuestra, no tendra objeto adentrarse ms en los datos. Si adoptamos este punto de vista en relacin con el proceso, de la generalizacin, tiene sentido el hacer pruebas de significacin, incluso cuando se cuente con datos correspondientes a la totalidad de la poblacin. Parecera como si la mayora de los socilogos tuviera presente este ms amplio objetivo, orientndose a decir algo acerca de los procesos causales, y por ello plantearan pruebas dirigidas a eliminar la alternativa del simple proceso casual. Sin embargo, debe insistirse que la prueba de significacin no excluye muchas otras

    19

  • clases de explicaciones alternativas, tal como la que, por ejemplo, introduce variables adicionales como causas comunes de las dos variables bajo estudio. En el captulo XIX volveremos a este, ms dificultoso, problema.

    EJERCICIOS

    1. Se seleccionan al azar 50 distritos electorales en una ciudad. Se encuentra que 20 de ellos estn

    atendidos por centros de la localidad, en tanto que los restantes no lo estn. Se comparan los porcentajes de delincuencia en esos dos tipos de distritos y se obtienen los siguientes datos (que se indican en el nmero de delincuentes por 1000 adolescentes):

    Medida Con centro Sin centro

    Magnitud de la muestra 20 30 Media 27 31

    Desviacin estndar(es) 6 8 Efectese una prueba de significacin de la diferencia entre los dos tipos de distritos (nivel de .01),

    sirvindose a) del modelo 1, y b) del modelo 2. Cmo se presentan unos respecto de otros los resultados? Respuesta, a) t = 1.87; no rechazo.

    2. Una muestra al azar de mujeres casadas que siguen viviendo con sus maridos ha sido objeto de seleccin, clasificndose a las mujeres en satisfechas o insatisfechas con sus respectivas vidas maritales. Se comparan luego los dos grupos de mujeres en relacin con el tiempo de sus matrimonios, con los siguientes resultados:

    Tiempo del matrimonio (redondeado al ao)

    Satisfechas fl

    Insatisfechas f2

    0-2 34 10 3-4 41 16 5-9 50 23

    10-14 39 25 15-19 18 14 20-39 15 16

    Total 197 104 Existe alguna diferencia significativa entre estos dos grupos al nivel de .01? 3. Supngase que se espera encontrar que la diferencia entre los ingresos medios anuales de muestras

    de mdicos y dentistas sea de unos $ 500 (esto es, ( )XX 21 = 500). Se aprecia que las desviaciones estndar son respectivamente de $1900 y $ 1600. Se planea seleccionar en la muestra total el mismo nmero de mdicos que de dentistas. Cuntos casos se necesitarn para establecer significacin entre los ingresos medios de doctores y dentistas al nivel de .05? Supngase que se quiere tomar un nmero doble de mdicos que de dentistas. Cuntos casos se necesitarn en este ltimo supuesto? Respuesta, .95 de cada uno.

    4. Se ha clasificado una muestra aleatoria de estudiantes universitarios como dirigidos por otros y

    dirigidos por s mismos. Se encuentra que el 58 por ciento de los alumnos avanzados son dirigidos por otros, en tanto que pertenece a esta categora el 73 por ciento de los alumnos novatos. En la muestra total figuran 117 alumnos avanzados y 171 alumnos novatos. Es esta diferencia significativa al nivel de .001?

    * 5. Supngase que se ha dispuesto un experimento de antes y despus con grupo de control. En

    otros trminos: se han relacionado dos grupos por pares y se han tomado medidas de ambos grupos antes y despus del experimento. Emplese la prueba t en relacin con la efectividad de la variable experimental: a) sirvindose solamente de las marcas de despus e ignorando las de antes; b) empleando las marcas antes y despus en el grupo experimental nicamente, y c) utilizando los cuatro juegos de marcas. (Indicacin: Cmo pueden emplearse las cuatro marcas para descartar los efectos sobre la variable experimental de factores ajenos susceptibles de haber afectado ambos grupos? Comprense las ventajas y los

    20

  • inconvenientes de los mtodos a) y b). Cules son las ventajas de c) respecto de a) y b)? Respuesta, a) t = 1.25, sin rechazo.

    Grupo de control Grupo experimental Par

    Antes Despus Antes Despus A 72 75 66 77 B 61 60 61 65 C 48 37 43 49 D 55 64 55 53 E 81 76 76 91 F 50 59 52 68 G 42 49 40 51 H 64 55 65 74 I 77 75 67 79 J 69 78 64 63

    * 6. En el cuadro XV.4 del captulo XV se encontrarn algunos datos relacionando las puntuaciones

    que los nios reciben por su habilidad, esfuerzo y clase social. a) Teniendo en cuenta tan slo la clase media, hgase una prueba para ver si la relacin entre

    esfuerzo y grado vara segn el nivel de habilidad del estudiante. b) Amplese esta prueba para ver si la interaccin probada mediante a) difiere segn sea la clase

    social del estudiante. Nota: En realidad, en b) se estar buscando una interaccin de una interaccin, o lo que se denomina

    una interaccin de segundo orden.

    21

  • BIBLIOGRAFA 1. Alder, H. L., y E. B. Roessler: Introduction to Probability and Statistics, 4 ed., W. H. Freeman and

    Company, San Francisco, 1968, caps. 8 y 10. 2. Downie, N. M., y R. W. Heath: Basic Statistical Methods, 2a ed., Harper and Row, PubIishers,

    Incorporated, Nueva York, 1965, caps. 11 y 12. 3. Gold, David: Statistical Tests and Substantive Significante, American Sociologist, Vol. 4 pp. 42-46,

    1969. 4. Goodman, L. A.: Modifications of the Dorn-Stouffer-Tibbetts Methods for `Testing the Significance of

    Comparisons in Sociological Data' , American Journal of Sociology, Vol. 66, pp. 355-359, 1961. 5. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry Holt and Company, Inc., Nueva York,

    1952, cap. 19. 6. Hays, W. L.: Statistics, Holt, Rinehart and Winston, Inc., Nueva York, 1963, cap. 10. 7. Kish, Leslie: Some Statistical Problems in Research Design, American Sociological Review, Vol. 24, pp.

    328-338, 1959. 8. Selltiz, C., M. Jalhoda, M. Deutsch y S. W. Cook: Research Methods in Social Relations, Henry Holt and

    Company, Inc., Nueva York, 1959, cap. 4. 9. Selvin, H. C., A Critique of Tests of Significance in Survey Research, American Sociological Review,

    Vol. 22, pp. 519-527, 1957. 10. Winch, R. F., y D. T. Campbell: Proof? No. Evidente? Yes. The Significance of Tests of Significance,

    American Sociologist, Vol. 4, pp. 140-143, 1969.

    22