21
Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Distribuciones Muestrales http://www.cuautitlan.unam.mx La inferencia estadística estudia los métodos para poder obtener información acerca de una población a partir del estudio de una muestra. Sus métodos y procedimientos son inductivos, es decir, generan el conocimiento transitando de lo particular a lo general. ¿Qué se entiende por población? Una población es el conjunto de todos los elementos que estamos estudiando, acerca de los cuales deseamos obtener información. ¿Cómo se puede obtener información acerca de alguna característica de la población? Evaluando la característica en todos y cada uno de los elementos de la población. Por ejemplo, si deseas conocer el promedio de calificaciones de los estudiantes de la licenciatura en Administración en una determinada Facultad, deberás acudir a la Sección Escolar y solicitar los registros de calificaciones de todos y cada uno de los estudiantes inscritos en esta carrera. Con los datos obtenidos es fácil obtener el promedio de todos los estudiantes. ¿Con qué nombre se conoce al procedimiento descrito anteriormente? El estudio de la característica objetivo en todos y cada uno de los elementos de la población, se conoce como Censo. He oído que el censo presenta algunos inconvenientes, ¿cuáles son éstos? El estudio de cada elemento representa un costo. La medición de alguna característica de la población, puede ser desde un proceso muy sencillo hasta uno muy sofisticado. DISTRIBUCIONES MUESTRALES

Un editor de un diario a nivel nacional esta interesado …asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica... · Por ejemplo, medir la estatura de los estudiantes es

Embed Size (px)

Citation preview

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La inferencia estadística estudia los métodos para poder obtener información acerca de una población a partir del estudio de una muestra. Sus métodos y procedimientos son inductivos, es decir, generan el conocimiento transitando de lo particular a lo general. ¿Qué se entiende por población? Una población es el conjunto de todos los elementos que estamos estudiando, acerca de los cuales deseamos obtener información. ¿Cómo se puede obtener información acerca de alguna característica de la población?

Evaluando la característica en todos y cada uno de los elementos de la población. Por ejemplo, si deseas conocer el promedio de calificaciones de los estudiantes de la licenciatura en Administración en una determinada Facultad, deberás acudir a la Sección Escolar y solicitar los registros de calificaciones de todos y cada uno de los estudiantes inscritos en esta carrera. Con los datos obtenidos es fácil obtener el promedio de todos los estudiantes.

¿Con qué nombre se conoce al procedimiento descrito anteriormente? El estudio de la característica objetivo en todos y cada uno de los elementos de la población, se conoce como Censo. He oído que el censo presenta algunos inconvenientes, ¿cuáles son éstos? El estudio de cada elemento representa un costo. La medición de alguna característica de la población, puede ser desde un proceso muy sencillo hasta uno muy sofisticado.

DISTRIBUCIONES MUESTRALES

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Por ejemplo, medir la estatura de los estudiantes es un proceso trivial, en cambio auditar un proceso contable, requiere de una preparación especializada; entonces el querer revisar todos y cada uno de los elementos que conforman ese proceso contable, requerirá contratar tanto personal capacitado como sea necesario y por lo tanto la auditoría resultará muy costosa. Además, si la población está conformada por muchos elementos o si el proceso de medida es lento, el censo resultará muy tardado. Ahora bien, si el proceso de medida es destructivo, es imposible realizar el censo, ya que cada medición implica la destrucción o la eliminación del elemento de la población donde se está midiendo la característica de interés. Supón que trabajas en el departamento de Calidad de una fábrica de cerillos y que para asegurarte que los cerillos “prenden”, decides realizar un censo, es decir, prender todos y cada uno de los cerillos; al final aunque tu producción haya sido muy buena, ya no tienes cerillos que vender. En resumen, los inconvenientes del censo son: el costo, lo tardado y que es imposible llevarlo a cabo cuando la prueba es destructiva. Entonces, ¿qué procedimiento alternativo al censo, se puede utilizar? El procedimiento alternativo al censo se conoce como muestreo; consiste en seleccionar mediante algún procedimiento, algunos elementos de la población y estudiar en ellos la característica objetivo. Estos elementos seleccionados de la población conforman lo que se denomina muestra. A partir del siguiente problema, ¿qué elementos importantes podemos distinguir? Un editor de un diario a nivel nacional está interesado en conocer la opinión que tienen los lectores, acerca de cómo aborda el periódico las noticias sobre la criminalidad en el país.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Con este propósito, selecciona una muestra de 100 personas que leen habitualmente el diario y les pide que contesten una encuesta. Con los datos obtenidos, el editor tomará la decisión de mantener o modificar la línea editorial. Los elementos que podemos distinguir son los siguientes:

Población: Son todos los lectores del diario en el país. Muestra: Son las 100 personas encuestadas. Inferencia estadística: son los métodos empleados que le permiten al editor hacer o realizar afirmaciones acerca de la población, a partir del estudio de las 100 encuestas, lo cual le permitirá poder tomar una decisión. ¿Qué tipos de procedimientos se utilizan para seleccionar una muestra de la población? Las muestras se seleccionan utilizando alguna técnica o diseño de muestreo. Las técnicas de muestreo utilizadas son: muestreo aleatorio simple o irrestricto, muestreo estratificado, muestreo por conglomerados, muestreo sistemático. ¿En qué consiste el muestreo aleatorio irrestricto o aleatorio simple? Un muestreo aleatorio simple, es aquel en el cual cada individuo o elemento de una población tiene la misma probabilidad de ser seleccionado. Además, cada muestra de un tamaño n, tiene la misma probabilidad de ser elegida que cualquier otra muestra del mismo tamaño. El muestreo aleatorio simple es la técnica de muestreo aleatorio más elemental y constituye la base de las otras técnicas.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

¿Cómo se puede seleccionar una muestra aleatoria simple o irrestricta?

El procedimiento consiste en numerar a los elementos de la población y luego por sorteo, ir seleccionando los elementos que conforman la muestra. Es decir, cada elemento tendrá un número y en una urna se depositarán boletos, bolas, canicas, etc. con cada número; se revuelven en la urna o en el medio que las contenga, por ejemplo, la lotería nacional usa tambores giratorios, y se van extrayendo tantos boletos,

bolas, canicas, etc. como sean necesarios hasta conformar la muestra deseada. Con el fin de sustituir este procedimiento laborioso, se pueden usar las tablas de números aleatorios. ¿Qué son las tablas de números aleatorios? Las tablas de números aleatorios son tablas de dígitos generados por computadora. Su aleatoriedad está probada estadísticamente; son dígitos aleatorios porque la probabilidad de ocurrencia es la misma para cada uno de ellos. ¿Cómo se utilizan las tablas de números aleatorios para seleccionar una muestra? Primero se debe numerar a los elementos de la población, utilizando el número de dígitos adecuados. Por ejemplo, si quieres obtener una muestra de una población de 135 sucursales bancarias, para realizar un estudio de la calidad en el servicio, deberás numerar a las sucursales del 000 al 134. Enseguida eliges un punto de partida en la tabla; el punto de partida es totalmente arbitrario, es decir, el que tú decidas. Puedes desplazarte en cualquier dirección, de arriba hacia abajo, de abajo hacia arriba, de izquierda a derecha, de derecha a izquierda, en diagonal ascendente y en diagonal descendente, con la única limitación de que una vez que seleccionas una dirección, debes usar ésta. Hoy en día, las calculadoras de bolsillo y software especializado generan números aleatorios. Siempre he escuchado que hay que obtener una muestra que sea representativa de la población; ¿las muestras obtenidas mediante un muestreo aleatorio simple son representativas de la población?

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Si la población está conformada por diferentes grupos y se desea que todos los grupos estén representados en la muestra, el muestreo aleatorio simple no garantiza que la muestra sea representativa de la población, ya que el mismo procedimiento aleatorio de obtener la muestra puede excluir a un grupo sobre todo si la muestra es pequeña.

Supón que la población son los estudiantes de una Facultad y quieres obtener una muestra para darte una idea del peso promedio de toda esa población. Planteado así, si puedes decir que una muestra aleatoria representa a la población. Pero si a los estudiantes se les clasifica en diferentes grupos o estratos: obesos, gordos, peso normal y flacos, y lo que deseas es obtener

una muestra que represente a estos grupos, una muestra aleatoria simple no lo asegura. Supón que los estudiantes obesos son muy pocos, es muy probable que una muestra dada no incluya a ninguno de ellos. Entonces, ¿cómo puedo estar seguro, en el caso de que la población esté clasificada en grupos, que todos éstos queden representados en la muestra? Utilizando un muestreo estratificado. ¿En qué consiste el muestreo estratificado? La población se divide de acuerdo a la característica objetivo, en grupos mutuamente excluyentes conocidos como estratos; los elementos de la población dentro de cada estrato deben ser lo más homogéneo posible y los estratos deben ser muy bien diferenciados; una vez obtenidos los estratos se selecciona una muestra aleatoria simple de cada uno de ellos. En el ejemplo del estudio del peso de los estudiantes, la población se divide en obesos, gordos, peso normal y flacos; cada uno de estos grupos es un estrato perfectamente bien diferenciado, y los estudiantes dentro de cada estrato, son homogéneos con respecto a la característica del peso

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

¿En qué consiste el muestreo por conglomerados?

La población se divide en grupos mutuamente excluyentes llamados conglomerados; la diferencia con los estratos, es que no se dividen de acuerdo a la característica objetivo, lo que implica que tampoco los elementos dentro de cada conglomerado deben ser homogéneos. Una vez obtenidos los conglomerados, se selecciona aleatoriamente una muestra de ellos y luego se selecciona una muestra

aleatoria de cada uno de ellos. Por ejemplo, supón que deseas realizar un estudio de opinión sobre la preferencia electoral, y la población la divides de acuerdo a la división política del territorio nacional, es decir, cada conglomerado es un estado de la república. Observa que los habitantes en edad de votar en cada estado no son homogéneos con respecto a su preferencia electoral, que es la característica objetivo. Debes seleccionar en forma aleatoria algunos estados y luego obtener una muestra aleatoria de ciudadanos de cada uno de los estados elegidos. Algunas veces, a este tipo de muestreo se le conoce con el nombre de muestreo geográfico. ¿En qué consiste el muestreo sistemático? El muestreo sistemático genera lo que se conoce como muestras aleatorias sistemáticas. Para seleccionar una muestra sistemática al azar, debes numerar los elementos de la población de 1 a n y determinar lo que se conoce como intervalo de muestreo, k= N/n. Seleccionas aleatoriamente un punto de inicio y luego eliges cada k-ésimo elemento de la población. Supón que se tiene la oportunidad de otorgar 10 préstamos hipotecarios con condiciones blandas a los empleados de una compañía; el problema es el de siempre, sólo se cuenta con 10 préstamos y se tienen 140 empleados deseosos de obtener un préstamo.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Piensas que para otorgar los préstamos, es adecuado seleccionar una muestra sistemática. Para tal efecto, elaboras una lista alfabética con los nombres de los 140 empleados, numerados del 1 al 140; el intervalo de muestreo será k=140/10=14; primero seleccionas aleatoriamente un empleado de los 14 primeros, por ejemplo el número 8; enseguida seleccionas a los 9 empleados restantes cada intervalo de muestreo, es decir, cada 14 elementos, lo que daría el otorgamiento de los préstamos a los empleados listados con los siguientes números: 8, 22, 36, 50, 64, 78, 92, 106, 120 y 134. ¿Cómo se pueden describir las poblaciones y las muestras? Tanto las poblaciones como las muestras se pueden describir mediante valores numéricos. Las medidas descriptivas más importantes son las de tendencia central y variabilidad. Las medidas descriptivas que se refieren a la población se conocen como parámetros y las que se refieren a la muestra como estadísticos. Es muy importante también la forma de la distribución, como una representación descriptiva sobre todo de las poblaciones. ¿Cuál es la diferencia entre un parámetro y un estadístico? En el ejemplo de la opinión sobre la criminalidad de los lectores del diario, supón que la encuesta la calificas de 0 a 10 puntos. Si conocieras la opinión de todos los lectores, es decir, de toda la población, podrías calcular el promedio de la calificación. Nota que si ya tienes las calificaciones de todas las encuestas, y calculas el promedio una segunda vez, una tercera vez, etc. obtienes el mismo resultado. Luego el valor del promedio de la población es un valor fijo. A los descriptores de la población que son valores fijos les llamamos parámetros.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

El editor obtuvo una muestra de 100 personas y con las calificaciones de las encuestas puede calcular la media de esta muestra. Ahora bien, el editor le pide al jefe de redacción seleccionar una segunda muestra de 100 personas, seguramente éstas no serán las mismas personas que las que el editor seleccionó, luego el promedio de calificaciones será diferente. Si realizamos muestreo repetitivo, es decir muchas muestras de tamaño 100, cada muestra generará algunas medias diferentes, otras iguales, pero no tomarán un valor fijo. En contraste, con las medidas descriptivas calculadas con los valores de una población, las medidas a partir de una muestra son variables y se les conoce como estadísticos o estimadores. Los estadísticos son variables aleatorias y por lo tanto tienen distribución de probabilidad. ¿Cómo se puede obtener la distribución de probabilidad de un estadístico? Si se realiza un muestreo repetitivo y se obtiene la distribución de frecuencias relativas para un estadístico en particular, esta será una buena aproximación de la distribución de probabilidad del estadístico. ¿A que se conoce como distribución de muestreo o muestral de un estadístico? Se conoce como distribución de muestreo o muestral de un estadístico, a su distribución de probabilidad Si nos dan el valor de una media, ¿cómo podemos saber si se refiere a la media de la población o a la media de la muestra? Convencionalmente se utilizan letras griegas para referirse a los parámetros y letras latinas para los estadísticos.

Medida descriptiva Población Muestra

Media aritmética Varianza

Desviación estándar Proporción

Tabla 1. Parámetros y Estadísticos

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Si suponemos una población que consiste en los números 1, 2, 3 y 4, ¿cómo se puede obtener la distribución muestral de la media? Como se conoce la población, es conveniente describir su distribución para después compararla con la distribución muestral. En la tabla 2, se muestra cada valor de la población asociado a su correspondiente valor de probabilidad. En este caso cada valor 1, 2, 3 y 4 ocurren una sola vez, es decir, su probabilidad es igual a 1/4.

ix ( )iP x

1 ¼ 2 ¼ 3 ¼ 4 ¼

( )iP x =∑ 1.0

Tabla 2. Valores de probabilidad para cada valor de la población

En la figura 1, se muestra la gráfica de la distribución de probabilidad para la población; observa que es una distribución uniforme

Figura 1. Gráfica de distribución de probabilidad para la población

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La media de la población es igual a:

y la varianza de la población viene dada por:

y por tanto, su desviación estándar es:

Ahora obtengamos la distribución muestral del estadístico seleccionado, es decir de la media de la muestra . Para obtener la distribución muestral de definamos un tamaño de muestra, por ejemplo, y obtengamos todas las muestras posibles con reposición. En la tabla3, se resumen las muestras posibles y sus correspondientes medias, Los números entre paréntesis indican la probabilidad para cada valor de la población y el número subrayado indica la media, de cada muestra

1 (0.25) 2 (0.25) 3 (0.25) 4 (0.25) 1 (0.25) 1.0 1.5 2.0 2.5 2(0.25) 1.5 2.0 2.5 3.0 3(0.25) 2.0 2.5 3.0 3.5 4(0.25) 2.5 3.0 3.5 4.0

Tabla 3. Cada valor de la población asociada a su probabilidad

En la tabla4, se resume el valor de las con sus correspondientes probabilidades.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

1.0 1 0.0625 1.5 2 0.1250 2.0 3 0.1875 2.5 4 0.2500 3.0 3 0.1875 3.5 2 0.1250 4.0 1 0.0625

Tabla 4. Resumen del valor de las medias con sus probabilidades

En la figura 2, se muestra la gráfica de cada valor de y su correspondiente valor de probabilidad. Observa que la distribución muestral de es normal en contraste con la distribución de la población que era uniforme.

Figura 2. Grafica de cada valor de y su probabilidad

La media de esta distribución, es decir, la media de las medias, , la calculamos como sigue:

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

o bien

Observa que el valor de La varianza de la distribución de las , se calcula como sigue:

o bien:

Observa que este valor es igual a la varianza de la población dividida entre el tamaño de la muestra

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Nota que el tamaño de la muestra es , ya que cada muestra que generó una fue de este tamaño. No confundas el tamaño de la muestra con el número de muestras que en nuestro caso son 16. La desviación estándar de la distribución muestral de la media, la cual se conoce como error estándar, es igual a:

y es igual . La distribución muestral de las , obtenida mediante este procedimiento, se conoce como distribución empírica. ¿Se pueden generalizar los resultados obtenidos en el anterior ejemplo o sólo fue un caso especial? Si, si se pueden generalizar los resultados del ejemplo anterior; son consecuencia del teorema del límite central. ¿Que establece el teorema del límite central? El enunciado del teorema del límite central es el siguiente: Dada una población con una media finita y una varianza finita, la distribución muestral de , obtenida a partir de muestras de tamaño

de dicha población, será aproximadamente normal con media y varianza . Las consecuencias más importantes de este teorema son las siguientes:

1. Cualquiera que sea la forma de la distribución de la población, la distribución muestral de se aproxima a una distribución normal, cuando es suficientemente grande.

2. La media de la distribución muestral de será siempre igual a la

media de la población.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

3. La varianza de la distribución de las es igual a , siempre y cuando se realice muestreo con reemplazo de una población finita o con o sin reemplazo de una población infinita.

4. Cuando se muestrea sin reemplazo una población finita La varianza de la distribución de las es igual a

5. La varianza de la distribución muestral disminuye cuando el

tamaño de la muestra aumenta y siempre será menor de la varianza de la población

Se mencionó que la distribución muestral se aproxima a una distribución normal cuando es suficientemente grande, ¿a partir de que tamaño se considera que una muestra es suficientemente grande? No existe una respuesta exacta debido a que el tamaño de la muestra que permita que la distribución muestral de , se aproxime a una distribución normal depende de la condición de no normalidad de la población. Sin embargo, para la mayoría de las situaciones prácticas una muestra de 30 o más observaciones se considera suficiente. Lo que no se debe de perder de vista es que la aproximación de la distribución muestral de a una normal es mejor si aumenta el tamaño de la muestra. ¿Sí la población estuviera distribuida normalmente, la distribución muestral de se aproximaría a una distribución normal con tamaños de muestra menores? Cuando la población se distribuye normalmente, la distribución muestral de las será exactamente normal sea cual sea el tamaño de la muestra. Cuando se muestrea una población finita sin reemplazo, se multiplicó a la varianza de la distribución muestral por un factor igual a ¿siempre se tiene que usar este factor o en algunos casos se puede omitir?

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Al factor , se le conoce como factor de corrección por población finita y se le puede omitir cuando la población es mucho mayor que la muestra. Por ejemplo, si el tamaño de la población es de un 1,000,000 y el tamaño de la muestra , entonces el factor de corrección es:

En este caso, el factor de corrección por población finita es aproximadamente igual a 1 y se puede omitir sin ningún remordimiento de conciencia. En general, esta corrección se omite cuando En general, ¿cómo se obtiene una distribución muestral? Las distribuciones muestrales pueden construirse empíricamente mediante muestreo de poblaciones finitas y discretas de la siguiente manera: de una población finita se seleccionan aleatoriamente todas las muestras posibles de un tamaño determinado; para cada muestra se calcula el estadístico de interés y por último se grafican los distintos valores que toma el estadístico contra su frecuencia relativa. ¿Se puede elaborar la distribución muestral para la proporción de éxitos en una muestra? La distribución muestral para la proporción de éxitos en una muestra se genera a partir de la distribución binomial. Una población binomial es cualquier conjunto de elementos donde cada uno se puede clasificar como un éxito o un fracaso. El tamaño de la población, es decir el número de elementos, se representa con . En la población hay éxitos y – fracasos y la proporción de éxitos en la población, que se representa con la letra , es igual a .

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Para muestras de tamaño con reemplazo de una población finita,

representa el número de éxitos en cada muestra. Como se puede observar el número de éxitos cambiara de muestra en muestra, por lo que es una variable aleatoria La proporción de éxitos en la muestra es el estadístico de interés.

Supongamos que el 60% de los estudiantes de tu facultad usan el Ipod. Entonces el experimento aleatorio consiste en preguntarle a cada estudiante si usa o no usa el Ipod. Con el fin de elaborar la distribución muestral de la proporción de estudiantes que usan Ipod, definamos el éxito:

La probabilidad de que un estudiante use el IPOD en la población, es decir la probabilidad de que suceda un éxito es:

y la probabilidad de que un estudiante no use el IPOD en la población es:

Ahora se define a la variable aleatoria como:

Elaboremos la distribución muestral de , seleccionando muestras aleatorias de tamaño Entonces las posibilidades son: que ninguno de los dos estudiantes entrevistados en cada muestra use el gadget o uno lo use o los dos lo usen.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Es decir:

Sí queremos calcular la probabilidad de que los dos estudiantes seleccionados usen el IPOD, tenemos:

Suponiendo independencia:

La selección de las muestras de dos estudiantes se esquematizan en la tabla 5; las probabilidades de obtener cada muestra, es decir las probabilidades de cada celda, se calculan simplemente multiplicando la probabilidad del renglón por la probabilidad de la columna correspondiente.

1er estudiante seleccionado

No. de éxitos

0 (0.4)

1 (0.6)

2 estudiante seleccionado

0 (0.4) 0.16 0.24

1 (0.6) 0.24 0.36

Tabla 5. Selección de muestras de 2 estudiantes

En la tabla 6, se muestran los valores que puede tomar la variable , la proporción de personas que usan el Ipod en la muestra, es decir y la probabilidad asociada con ellos. En la figura 3 se puede observar su gráfica.

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

0 0/2 = 0 0.16 1 ½ = 0.5 0.24 + 0.24 = 0.48 2 2/2 = 1.0 0.36

Tabla 6. Valores de la variable x

Figura 3. Distribución muestral para la variable x

La media de las proporciones en esta distribución se calcula como sigue:

Como se puede observar la media de la distribución muestral de es igual a la proporción poblacional .

La varianza de las proporciones muestrales se calcula como sigue:

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La varianza de la distribución muestral , también es igual a:

Si las muestras fueran de tamaño mayor a 2, ¿también se puede obtener la distribución muestral empíricamente? Si, veamos el procedimiento para , el cual puede generalizarse para cualquier tamaño de muestra. En este caso las posibilidades son: que ninguno de los tres estudiantes entrevistados en cada muestra use el gadget o uno lo use o dos lo usen o tres lo usen, es decir:

Entonces la selección de las muestras de tres estudiantes, se esquematizan en la tabla 7, de la siguiente manera: En las columnas anotamos los resultados obtenidos anteriormente que se muestran en la tabla 8 y que se refieren a las probabilidades para los resultados posibles en la selección de dos estudiantes, en la figura 4 se muestra la gráfica de la distribución. En los renglones anotamos al tercer estudiante seleccionado que solo puede contestar usa o no usa.

Los 2 primeros estudiantes seleccionados

No de éxitos

0 (0.16)

1 (0.48)

2 (0.36)

3er. estudiante

seleccionado

0 (0.4) 0.064 0.192 0.144

1 (0.6) 0.096 0.288 0.216

Tabla 7. Selección de muestras de 3 estudiantes

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Si queremos calcular la probabilidad de que ninguno de los tres estudiantes seleccionados usen el IPOD, tenemos:

Suponiendo independencia:

En general, las probabilidades de las celdas se obtienen simplemente multiplicando la probabilidad del renglón por la probabilidad de la columna correspondiente

0 0/3 = 0 0.0624 1 1/3 = 0.333 0.288 2 2/3 = 0.666 0.432 3 3/3 = 1 0.216

Tabla 8. Resultados de las probabilidades de x

Figura 4. Gráfica cuando n=3

Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La media de las proporciones en esta distribución sigue siendo:

Observa que nuevamente la media de la distribución muestral de p, es igual a la proporción poblacional .

La varianza de las proporciones muestrales es igual a:

La varianza de la distribución muestral , sigue siendo igual a:

Observa que la varianza de la distribución muestral se redujo de 0.12 a 0.08 al aumentar el tamaño de la muestra de