INFERENCIA ESTADÍSTICA, NIVELES DE PRECISIÓN Y · PDF fileTeoría y ejercicios, Madrid ... existe la probabilidad del 1-0,955, ... Probabilidad y errores de muestreo Probabilidad

  • Upload
    vukiet

  • View
    219

  • Download
    1

Embed Size (px)

Citation preview

  • INFERENCIA ESTADSTICA, NIVELESDE PRECISIN Y DISEO MUESTRAL

    Jacinto Rodrguez Osuna, Mara Luisa Ferrerasy Adoracin Nez

    Centro de Investigaciones Sociolgicas

    1. INTRODUCCIN

    En el campo de la investigacin emprica es frecuente el recurso a laencuesta muestral cuando no se dispone de fuentes secundarias fiablesreferentes al tema que interesa estudiar. En estos casos la encuesta sepresenta, casi siempre, como la nica alternativa posible, ya que la realiza-cin de un censo resultara inviable no slo por sus elevados costes, sinotambin por lo prolongado del proceso de recogida y tratamiento de lainformacin referida a todo el universo.

    Por otra parte, con la encuesta se puede obtener mayor exactitud quecon el censo y, adems, los niveles de precisin que sean necesarios paralos fines de la investigacin.

    La mayor exactitud1 suele provenir del empleo de personal ms cualifi-cado en la recogida de la informacin mediante encuesta, debido a que serequiere un nmero muy inferior de agentes entrevistadores que de agentes

    1 Un ejemplo de lo que se viene diciendo es la Encuesta de Poblacin Activa, cuyasestimaciones sobre actividad, ocupacin y desempleo son ms exactas y precisas que las quese derivan del censo. Esto es as porque la recogida de la informacin se hace por personalcualificado, hecho posible cuando el nmero de sujetos a entrevistar es limitado.

    Respp. 139-162

  • JACINTO RODRGUEZ OSUNA, M.a LUISA FERRERAS Y ADORACIN NUEZ

    censales y, en consecuencia, se puede controlar ms el proceso y seleccio-nar y preparar mejor al personal. Los niveles de precisin requeridos estnen funcin de los fines de la investigacin, y su consecucin es un proble-ma tcnico que se traduce en la aplicacin del diseo muestral adecuado acada universo objeto de investigacin.

    Para poder garantizar la precisin de las estimaciones que han de darpaso a la inferencia estadstica, la muestra ha de constar de un nme-ro suficiente de elementos, elegidos al azar, tal que proporcione una segu-ridad estadstica de que los resultados que se obtengan de ella puedan,dentro de los lmites estimados, representar realmente al universo2.Quiere esto decir que para que se pueda hacer inferencia estadstica esnecesario que se trate de mustreos aleatorios, adecuadamente dimensio-nados.

    Se ha de trabajar con mustreos aleatorios porque son los nicos en losque se puede fijar el nivel de confianza y calcular los errores de muestreo3.El nivel de confianza expresa la probabilidad de acertar en la estimacin, ylos errores de muestreo indican la bondad de la misma. Cuando se trabajacon datos que provienen de encuesta, porcentajes, medias, totales, etc., nobasta con ofrecer los resultados, sino que, adems, es imprescindible cono-cer el nivel de confianza con que se est operando y la precisin de lasestimaciones. Estos clculos son posibles cuando se realizan mustreosaleatorios, a los que se aplica la teora de probabilidades.

    Las muestras han de estar adecuadamente dimensionadas porque elnivel de confianza y la precisin de las estimaciones guardan estrecharelacin con el tamao muestral. Un mayor nivel de confianza garantizauna mayor probabilidad de acertar, pero slo se consigue aumentando elnmero de elementos de la muestra. Por su parte, la precisin de lasestimaciones guarda relacin inversa con el error muestral. Cuanto menorsea ste, menor es la dispersin de la distribucin del estimador y,consiguientemente, la precisin es mayor.

    Para conseguir esta menor dispersin es necesario aumentar conve-nientemente el nmero de elementos de la muestra hasta obtener los nive-les de precisin requeridos. Cul es este nivel y cul el nivel de confianzacon que se debe trabajar? Son preguntas a las que se intentar responderconforme se aborden los correspondientes epgrafes.

    Independientemente de lo anterior, hay otra serie de factores queafectan al diseo muestral y que inciden en el tamao de la muestra. Sehace referencia a la estructura del universo y a los niveles de desagregacinde las estimaciones. La estructura del universo, en la medida en que sea

    2 Restituto SIERRA BRAVO, Tcnicas de Investigacin Social. Teora y ejercicios, Madrid,Paraninfo, 1985, p. 181.

    3 Existen mustreos no aleatorios cuyos resultados, en la prctica, son muy aceptables.Sin embargo, estadsticamente, no se puede calcular la precisin de sus estimaciones.

    140

  • INFERENCIA ESTADSTICA, NIVELES DE PRECISIN Y DISEO MUESTRAL

    conocida, puede permitir aproximarse a la varianza de las variables que sepretende estimar y a la composicin del mismo. As se podr afinar ms enel clculo del tamao de la muestra y utilizar el tipo de diseo ms adecua-do. Por su parte, los niveles de desagregacin de los resultados obligarn adimensionar la muestra de forma que las estimaciones sean vlidas no sloa nivel global, sino tambin para determinadas subpoblaciones que intere-sa investigar.

    El trabajo que se presenta a continuacin aborda estas cuestiones en unintento de explicar cmo afecta cada una de ellas al diseo muestral y a laprecisin de las estimaciones. Para mayor claridad, las explicaciones teri-cas irn acompaadas de un ejemplo: el diseo de una hipottica muestra afuncionarios civiles en el que se introducirn sucesivamente los distintosfactores que se analizan en el texto.

    2. NIVEL DE CONFIANZA

    El nivel de confianza y el nivel de precisin son conceptos estrecha-mente relacionados que acotan la validez de la estimacin. El primero hacereferencia a la probabilidad de acertar, y el segundo refleja los errores demuestreo, es decir, la distribucin del estimador. Dicho de otra forma, elprimero indica la probabilidad de que el segundo, los errores de muestreo,no rebasen determinados lmites. Cuando se dice, por ejemplo, que para unnivel de confianza del 95,5 por 100 el error de muestreo es de 2 por 100,lo que se est expresando es que hay una probabilidad del 95,5 por 100 deque el valor real que se trata de estimar se encuentre dentro de los lmitesdefinidos por la estimacin y el error de muestreo4. Indica tambin queexiste la probabilidad del 1-0,955, es decir, del 4,5 por 100, de que laestimacin rebase el error sealado.

    Aunque la precisin de las estimaciones ser objeto del siguiente ep-grafe, se la menciona aqu por su relacin con el nivel de confianza yporque el fundamento de uno y otro concepto hay que buscarlo en la teorade probabilidades y, ms en concreto, en la funcin de probabilidades quesigue una distribucin normal5, que se define por su media y su desviacinestndar, cuya representacin grfica aparece en la pgina siguiente:

    En el eje de abcisas se encuentra cada uno de los valores de la distribu-cin, y en el de ordenadas, la probabilidad de obtenerlos. El rea de lacurva es igual a la unidad, ya que en la curva se encuentran el cien por cien

    4 Los lmites de la estimacin se delimitan aadiendo a la misma el error de muestreomultiplicado por el nmero de desviaciones estndar que se toma y que indica el nivel deconfianza con que se est operando (vase cuadro 1).

    5 La distribucin normal no es la nica posible pero s la ms frecuente. Por eso aquslo se habla de este tipo de distribucin de frecuencias.

    141

  • JACINTO RODRGUEZ OSUNA, M.a LUISA FERRERAS Y ADORACIN NUEZ

    Y.40-

    .30-Media = 0

    .20--

    .10-

    0 -

    Desviacin estndar = 1

    -2 -1 0

    de los casos. Por otra parte, al ser simtrica respecto a la media, cada unade las reas a la derecha o a la izquierda de la misma vale 0,5.

    Tal como se observa en el grfico, en la distribucin normal la mayorprobabilidad se agrupa en torno a la media, de tal forma que entre sta y una desviacin estndar se da el 0,6826 de probabilidad; entre la media y dos desviaciones estndar, el 0,9544, etc. Ms en concreto, con la ayuda detablas se puede calcular el rea de la curva desde la media hasta la desvia-cin estndar. Los resultados para diferentes valores se reflejan en elcuadro 1. Traducido al campo que nos ocupa, quiere decir que si se acotala probabilidad en 0,5 desviaciones, hay un 38,30 por 100 de garanta deque el error absoluto no sea superior al 0,5xerror de muestreo6.

    CUADRO 1

    Probabilidad y errores de muestreo

    Probabilidad Error totalDesviacin derecha media (dcha.-izqda.) Absoluto

    0,5 0,1915 0,3830 0,5 x e1,0 0,3413 0,6826 1,0 x e1,5 0,4332 0,8664 1,5 x e2,0 0,4772 0,9544 2,0 x e2,5 0,4938 0,9876 2,5 x e3,0 0,4987 0,9974 3,0 x e

    Probabilidadderecha media

    0,19150,34130,43320,47720,49380,4987

    Error total(dcha.-izqda.)

    0,38300,68260,86640,95440,98760,9974

    FUENTE: Elaboracin propia.NOTA: Por e se designa el error de muestreo.

    6 El clculo del error de muestreo es muy sencillo si se parte del muestreo aleatoriosimple. En este caso, tratndose de universos grandes, el error de las proporciones se

    . , i r* i / P (1-P)calcula con la formula e = \

    \ n

    142

  • INFERENCIA ESTADSTICA, NIVELES DE PRECISIN Y DISEO MUESTRAL

    Tambin quiere decir que hay un (1-0,3830=0,6170) 61,70 por 100 deprobabilidad de que el error supere el clculo anterior. Dado que el riesgode equivocarse es elevadsimo, generalmente se opera en Ciencias Socialescon un nivel de confianza igual a dos desviaciones, lo que corresponde auna probabilidad del 95,44 por 100. Esto significa que de 100 muestras quese disearan adecuadamente, la probabilidad de que la estimacin no tengaun error absoluto superior a 2xerror de muestreo es del 95,44 por 100.

    Antes de seguir adelante se quiere sealar que la teora anterior, basadaen la distribucin normal, es aplicable a las muestras en general, bienporque el universo del que se extraen se distribuye normalmente, bienporque, segn el teorema del lmite central, a medida que aumenta eltamao de la muestra, la distribucin de la media de una muestra aleatoria,extrada prcticamente de cualquier poblacin, tiene una distribucin aproxi-mada