46
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Universitaria Universidad Nor Oriental Privada Gran Mariscal de Ayacucho Facultad de Ciencias Económicas y Sociales Escuela de Administración Catedra: Estadística Aplicada Profesor: Integrante: Hamlet Mata Br. Ravelo, Antonio C.I 26.295.453 El Tigre, 31/10/2016

República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Embed Size (px)

Citation preview

Page 1: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación Universitaria

Universidad Nor Oriental Privada Gran Mariscal de Ayacucho

Facultad de Ciencias Económicas y Sociales

Escuela de Administración

Catedra: Estadística Aplicada

Profesor: Integrante:

Hamlet Mata Br. Ravelo, Antonio

C.I 26.295.453

El Tigre, 31/10/2016

Page 2: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Indice

INTRODUCCION

MUESTREO ESTADISTICO

TIPOS DE MUESTREO

Aleatorio simple

Sistemático

Estratificado

Conglomerado

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL

DISTRIBUCIÓN DE LA DIFERENCIAS DE MEDIA

DISTRIBUCIÓN DE LA DIFERENCIA DE PROPORCIONES

TEOREMA DEL LÍMITE CENTRAL

ESTIMACIÓN PUNTUAL

CARACTERÍSTICAS DE UN BUEN ESTIMADOR

ESTIMACIÓN POR INTERVALO

Intervalo de confianza para la media

Intervalo de confianza para la proporción

Intervalo para la diferencia de la media

Page 3: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Intervalo para la diferencia de proporciones.

CÁLCULO DEL TAMAÑO DE MUESTRA

CONCLUSION

BIBLIOGRAFÍA

Page 4: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Introducción

A menudo necesitamos estudiar las propiedades de una determinada población, pero nos

encontramos con el inconveniente de que ésta es demasiado numerosa como para analizar a

todos los individuos que la componen. Por tal motivo, recurrimos a extraer una muestra de

la misma y a utilizar la información obtenida para hacer inferencias sobre toda la población.

Estas estimaciones serán válidas sólo si la muestra tomada es “representativa” de la

población. Así, el muestreo es una técnica que utilizaremos para inferir algo respecto de

una población mediante la selección de una muestra de esa población. En este trabajo

veremos, entre otras cosas, cómo es posible estimar la media de la población a partir de la

distribución que siguen las medias de las diferentes muestras obtenidas.

En muchos casos, el muestreo es la única manera de poder obtener alguna conclusión de

una población, entre otras causas, por el coste económico y el tiempo empleado que

supondría estudiar a todos los miembros de una población.

Page 5: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Muestreo Estadístico:

En la referencia estadística se conoce como muestreo a la técnica para la selección de

una muestra a partir de una población estadística.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables

a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados

parecidos a los que se alcanzarían si se realizase un estudio de toda la población. En las

investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente

en recoger información sobre poblaciones.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio

adecuado (que consienta no solo hacer estimaciones de la población sino estimar también

los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos

requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra

representativa, pero sí podemos actuar de manera que esta condición se alcance con una

probabilidad alta.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población,

se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que

se pueden obtener de la población se denomina espacio muestral. La variable que asocia a

cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los

elementos de una población), se selecciona una muestra, entendiendo por tal una parte

representativa de la población. El muestreo es por lo tanto una herramienta de la

investigación científica, cuya función básica es determinar que parte de una población debe

examinarse, con la finalidad de hacer inferencias sobre dicha población. La muestra debe

lograr una representación adecuada de la población, en la que se reproduzca de la mejor

manera los rasgos esenciales de dicha población que son importantes para la investigación.

Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes

y diferencias encontradas en la población, es decir ejemplificar las características de ésta.

Los errores más comunes que se pueden cometer son:

1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la

Población, se denomina error de muestreo.

2.- Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se

tomó la muestra. Error de Inferencia. En la estadística se usa la palabra población para

referirse no sólo a personas sino a todos los elementos que han sido escogidos para su

estudio y el término muestra se usa para describir una porción escogida de la población.

El muestreo es importante porque:

1) Por lo general no se pueden estudiar a las poblaciones en su totalidad, entonces

estaremos obligados a hacer el muestreo.

2) Es más rápido y económico para conocer los parámetros (características) de interés de la

Page 6: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

población.

3) Existe metodología clara y confiable para el muestreo (y tamaño de muestra).

La inferencia estadística y su importancia en la administración:

Hoy un empresario necesita predecir a tiempo los niveles de demanda de sus productos,

necesita reconocer a tiempo los cambios de tendencia, debe no sólo saber en qué se gastó,

sino como se gastó en el tiempo y en qué conceptos.

Para negociar, para tomar decisiones, para corregir problemas de calidad, para aumentar la

productividad, para fijar precios, para mejorar el mantenimiento y disponibilidad de las

máquinas e instalaciones, para mejorar la concesión y cobranza de los créditos se requiere

sí o sí contar con datos estadísticos.

Si no se cuenta con estos datos, cómo se hace para:

Adoptar a tiempo las medidas correctivas;

Confeccionar un presupuesto viable y efectivo;

Administrar eficazmente su flujo de fondos;

¿Por qué se aplican tan poco?

En parte por una cuestión cultural de parte de los empresarios, pero en mayor medida a la

falta de preparación de los profesionales, en materia estadística, sobre todo de aquellos que

asesoran en cuanto a la gestión de las empresas.

Sin lugar a dudas la cuestión no es disponer de datos estadísticos, si los mismos no son

debidamente interpretados, o ni siquiera son tenidos en consideración. Por lo tanto es

menester concientizar y formar a los directivos y empleados acerca de la fundamental y

trascendental importancia de la información estadística a la hora de planificar, dirigir y

controlar la marcha de la empresa.

¿Por qué muestrear?

La imposibilidad física de revisar todos los integrantes de la población

El costo de estudiar a toda la población es a menudo prohibitivo.

Lo adecuado de los resultados de una muestra

¿Qué tamaño debe tener una muestra?

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la

muestra hacia la población total.

2. El porcentaje de error que se pretende aceptar al momento de hacer la

generalización.

3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

Page 7: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Tipos de Muestreo:

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en

general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y

métodos de muestreo no probabilísticos.

I. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos

que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los

individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,

consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad

de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la

representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de

los métodos de muestreo probabilísticos encontramos los siguientes tipos:

1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente:

1) se asigna un número a cada individuo de la población y 2) a través de algún

medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números

aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos

como sea necesario para completar el tamaño de muestra requerido. Este

procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando

la población que estamos manejando es muy grande.

2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el

anterior, numerar todos los elementos de la población, pero en lugar de extraer n

números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un

número elegido al azar, y los elementos que integran la muestra son los que ocupa

los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,

siendo k el resultado de dividir el tamaño de la población entre el tamaño de la

muestra: k= N/n. El número i que empleamos como punto de partida será un número

al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan

periodicidades en la población ya que al elegir a los miembros de la muestra con

una periodicidad constante (k) podemos introducir una homogeneidad que no se da

en la población. Imaginemos que estamos seleccionando una muestra sobre listas de

10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si

empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o

sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que

presentan los anteriores ya que simplifican los procesos y suelen reducir el error

muestral para un tamaño dado de la muestra. Consiste en considerar categorías

típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a

alguna característica (se puede estratificar, por ejemplo, según la profesión, el

Page 8: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este

tipo de muestreo es asegurarse de que todos los estratos de interés estarán

representados adecuadamente en la muestra. Cada estrato funciona

independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple

o el estratificado para elegir los elementos concretos que formarán parte de la

muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues

exige un conocimiento detallado de la población. (Tamaño geográfico, sexos,

edades,...). La distribución de la muestra en función de los diferentes estratos se

denomina afijación, y puede ser de diferentes tipos: Afijación Simple: A cada

estrato le corresponde igual número de elementos muéstrales. Afijación

Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la

población en cada estrato. Afijación Óptima: Se tiene en cuenta la previsible

dispersión de los resultados, de modo que se considera la proporción y la desviación

típica. Tiene poca aplicación ya que no se suele conocer la desviación.

4.- Muestreo aleatorio por conglomerados: Los métodos presentados

hasta ahora están pensados para seleccionar directamente los elementos de la

población, es decir, que las unidades muéstrales son los elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de

la población que forman una unidad, a la que llamamos conglomerado. Las

unidades hospitalarias, los departamentos universitarios, una caja de determinado

producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar

conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los

conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto

número de conglomerados (el necesario para alcanzar el tamaño muestral

establecido) y en investigar después todos los elementos pertenecientes a los

conglomerados elegidos.

Términos usuales en un estudio estadístico

Población: conjunto de todos los individuos que son objeto del estudio.

Muestra: parte de la población en la que miden las características estudiadas.

Muestreo: proceso seguido para la extracción de una muestra.

Encuesta: proceso de obtener información de la muestra

Distribución muestral de medias

Si tenemos una muestra aleatoria de una población N(m,s ), se sabe (Teorema del límite central) que la fdp de la media

muestral es también normal con media m y varianza s2/n. Esto es exacto para poblaciones normales y aproximado

Page 9: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

(buena aproximación con n>30) para poblaciones cualesquiera. Es decir es el error típico, o error estándar de

la media.

¿Cómo usamos esto en nuestro problema de estimación?

1º problema: No hay tablas para cualquier normal, sólo para la normalm=0 y s=1 (la llamada z); pero haciendo la

transformación (llamada tipificación)

una normal de media m y desviación s se transforma en una z.

Llamando za al valor de una variable normal tipificada

que deja a su derecha un área bajo la curva dea, es decir,

que la probabilidad que la variable sea mayor que ese

valor es a(estos son los valores que ofrece la tabla de la

normal)

podremos construir intervalos de la forma

para los que la probabilidad es 1 - a.

Teniendo en cuenta la simetría de la normal y manipulando algebraícamente

que también se puede escribir

Page 10: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

o, haciendo énfasis en que es el error estándar de la media,

Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un intervalo de este tipo se le

denomina intervalo de confianza con un nivel de confianza del 100(1 - a)%, o nivel de significación de 100a%. El nivel

de confianza habitual es el 95%, en cuyo caso a=0,05 y za /2=1,96. Al valor se le denomina estimación puntual y se

dice que es un estimador de m.

Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de tamaño 20 en la que se

calcula se puede decir que m tiene una probabilidad de 0,95 de estar comprendida en el intervalo

que sería el intervalo de confianza al 95% para m

En general esto es poco útil, en los casos en que no se conoce m tampoco suele conocerse s2; en el caso más realista

de s2 desconocida los intervalos de confianza se construyen con la t de Student (otra fdpcontinua para la que hay tablas)

en lugar de la z.

o, haciendo énfasis en que es el error estándar estimado de la media,

Este manera de construir los intervalos de confianza sólo es válido si la variable es normal. Cuando n es grande (>30)

se puede sustituir t por zsin mucho error.

Distribución muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la

proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de

proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la

distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico

proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en

lugar del estadísitico media.

Page 11: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población

binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las

posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como

consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse

usando la aproximación normal a la binomial, siempre que np 5 y

n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de

intentos.

Generación de la Distribución Muestral de Proporciones

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a seleccionar 5 artículos

al azar de ese lote sin reemplazo. Genere la distribución muestral de proporciones para el número de piezas

defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta población es 4/12=1/3. Por lo

que podemos decir que el 33% de las piezas de este lote están defectuosas.

El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es 12C5=792, las cuales se

pueden desglosar de la siguiente manera:

Artículos

Buenos

Artículos

Malos

Proporción de

artículos

defectuoso

Número de

maneras en las

que se puede

obtener la

muestra

1 4 4/5=0.8 8C1*4C4=8

2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Page 12: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que hacer la sumatoria de la frecuencia

por el valor de la proporción muestral y dividirla entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es igual a la Proporción de la población.

p = P

También se puede calcular la desviación estándar de la distribución muestral de proporciones:

La varianza de la

distribución binomial es 2= npq, por lo que la varianza de la distribución muestral de proporciones es 2p =(Pq)/n.

Si se sustituten los valores en esta fórmula tenemos que:

, este valor no coincide con el de 0.1681, ya que nos falta agregar el

factor de corrección para una población finita y un muestreo sin reemplazo:

Page 13: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de proporciones está basada en

la aproximación de la distribución normal a la binomial . Esta fórmula nos servirá para calcular la probabilidad del

comportamiento de la proporción en la muestra.

A esta fórmula se le puede agregar el factor de corrección de si se cumple con las condiciones

necesarias.

Ejemplo:

Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra

aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma

cigarrillos sea menor que 0.55.

Solución:

Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de la distribución

normal a la binomial y el segundo utilizando la fórmula de la distribución muestral de proporciones.

Aproximación de la distribución normal a la binomial:

Datos:

n=800 estudiantes

p=0.60

Page 14: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

x= (.55)(800) = 440 estudiantes

p(x< 440) = ?

Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800

estudiantes, menos de 440 fuman cigarrillos.

Distribución Muestral de Proporciones

Datos:

n=800 estudiantes

P=0.60

p= 0.55

p(p< 0.55) = ?

Page 15: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Observe que este valor es igual al obtenido en el método de la aproximación de

la distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de

0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo entre el tamaño de la

muestra, ya que estamos hablando de una proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que diríamos

que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporción de

estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.

Ejemplo:

Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción

adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de

150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra

de los usuarios que realmente presentan una reacción adversa, exceda el 4%.

a. Resolverlo mediante la aproximación de la normal a la binomial

b. Resolverlo con la distribución muestral de proporciones

a. Aproximación de la distribución normal a la binomial:

Datos:

n=150 personas

p=0.03

x= (0.04)(150) = 6 personas

p(x>6) = ?

Media = np= (150)(0.03)= 4.5

Page 16: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150

personas, mas de 6 presentarán una reacción adversa.

b. Distribución Muestral de Proporciones

Datos:

n=150 personas

P=0.03

p= 0.04

p(p>0.04) = ?

Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de que al tomar una

muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa.

Ejemplo:

Page 17: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la

probabilidad de que una muestra aleatoria de tamaño 60 tenga:

a. Menos del 3% de los componentes defectuosos.

b. Más del 1% pero menos del 5% de partes defectuosas.

Solución:

a. Datos:

n= 60 artículos

P=0.04

p= 0.03

p(p<0.03) = ?

La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03 artículos

defectuosos es de 0.2327.

b. Datos:

n= 60 artículos

Page 18: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

P=0.04

p= 0.01 y 0.05

p(0.01<p<0.05) = ?

Distribución Muestral de Diferencia de Medias

Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación estándar 1, y la segunda con

media 2 y desviación estándar 2. Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y

una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada

muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama distribución muestral de

las diferencias entre medias o la distribución muestral del estadístico

Page 19: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

La distribución es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales, entonces la

distribución muestral de medias es normal sin importar los tamaños de las muestras.

En ejercicios anteriores se había demostrado que y que , por lo que no es difícil deducir

que y que .

La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de medias es:

Ejemplo:

En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se usará una

muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una

distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su

desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa

escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si representa el promedio de los pesos de 20

niños y es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los

pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.

Solución:

Datos:

1 = 100 libras

2 = 85 libras

1 = 14.142 libras

2 = 12.247 libras

n1 = 20 niños

n2 = 25 niñas

Page 20: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

= ?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande

que el de la muestra de las niñas es 0.1056.

Ejemplo:

Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los tubos de la

compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B

tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra

aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra

aleatoria de 40 tubos de la compañía B.

Solución:

Datos:

A = 7.2 años

B = 6.7 años

A = 0.8 años

B = 0.7 años

nA = 34 tubos

nB = 40 tubos

= ?

Page 21: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Ejemplo:

Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de 1.23km/L para la

primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35

autos y la segunda en 42 autos.

a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la

segunda gasolina?

b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a

favor de la gasolina 1?.

Solución:

En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que se

supondrán que son iguales.

Datos:

1 = 1.23 Km/Lto

2 = 1.37 Km/Lto

n1 = 35 autos

n2 = 42 autos

a. = ?

Page 22: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

b.

?

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto

a favor de la gasolina 1 es de 0.0117.

Distribución Muestral de Diferencia de Proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o

porcentajes. A continuación se citan algunos ejemplos:

Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban

inglés?

Page 23: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que

el de los usuarios del fármaco B que también presentan una reacción de ese tipo?

Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales.

Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A a los que

genera la máquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la

distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n1p1

5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1y p2 tienen distribuciones muestrales aproximadamente normales, así que

su diferencia p1-p2 también tiene una distribución muestral aproximadamente normal.

Cuando se estudió a la distribución muestral de proporciones se comprobó que y que , por lo que no

es difícil deducir que y que .

La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de proporciones es:

Ejemplo:

Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la

promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos

están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos

muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine

la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.

Page 24: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Solución:

Datos:

PH = 0.12

PM = 0.10

nH = 100

nM = 100

p(pH-pM 0.03) = ?

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando

la distribución normal.

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que

el de mujeres es de 0.4562.

Ejemplo:

Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984,

encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra

muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la

probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del

porcentaje obtenido en la encuesta de Boston College, en 5% o más?

Page 25: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Solución:

En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos muestras y se quiere

saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la

distribución muestral de proporciones con P1= P2, ya que es una misma población.

Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores despedidos entre

1979 y 1984 que estuvieron desempleados por un período de por lo menos dos años, sólo se conoce la

p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.

En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita saber las

proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que se utilizará el valor de 0.20

como una estimación puntual de P. En el siguiente tema se abordará el tema de estimación estadística y se

comprenderá el porque estamos utilizando de esa manera el dato.

También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad de que su

porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la

encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de

la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la distribución y al final

sumarlas.

Datos:

p1 = 0.20

n1 = 320 trabajadores

n2 = 320 trabajadores

P1 = P2

Page 26: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos años, difiera del

porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.

Ejemplo:

Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados

por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:

a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en

por lo menos 0.10?

b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en

por lo menos 0.15?

Solución:

Datos:

P1 = 3/6 = 0.5

P2 = 2/5 = 0.4

n1 = 120 objetos

n2 = 120 objetos

a. p(p2-p1 0.10) = ?

Page 27: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a

favor de la máquina 2 es de 0.0011.

b. p(p1-p2

0.15)=?

Page 28: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de

la máquina 1 es de 0.2357.

El teorema del límite central:

Las medias de muestras grandes y aleatorias son aproximadamente normales El teorema del límite central es un

teorema fundamental de probabilidad y estadística. El teorema establece que la distribución de , que es la media

de una muestra aleatoria de una población con varianza finita, tiene una distribución aproximadamente normal

cuando el tamaño de la muestra es grande, independientemente de la forma de la distribución de la población.

Muchos procedimientos estadísticos comunes requieren que los datos sean aproximadamente normales, pero el

teorema del límite central le permite aplicar estos procedimientos útiles a poblaciones que son marcadamente no

normales. El tamaño que debe tener la muestra depende de la forma de la distribución original. Si la distribución

de la población es simétrica, un tamaño de muestra de 5 podría generar una aproximación adecuada; si la

distribución de la población es marcadamente asimétrica, se requiere un tamaño de muestra de 50 o más. Las

siguientes gráficas muestran ejemplos de cómo la distribución afecta el tamaño de la muestra que usted necesita.

Distribución uniforme

Medias de las muestras

Una población que sigue una distribución uniforme es simétrica, pero marcadamente no normal, como lo indica el

primer histograma. Sin embargo, la distribución de 1000 medias de la muestra (n=5) de esta población es

Page 29: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

aproximadamente normal debido al teorema del límite central, como lo demuestra el segundo histograma. Este

histograma de medias de la muestra incluye una curva normal superpuesta para ilustrar esta normalidad.

Distribución exponencial

Medias de las muestras

Una población que sigue una distribución exponencial es asimétrica y no normal, como lo demuestra el primer

histograma. Sin embargo, la distribución de medias de la muestra de 1000 muestras de tamaño 50 de esta población es

aproximadamente normal, debido al teorema del límite central, como lo demuestra el segundo histograma. Este

histograma de medias de la muestra incluye una curva normal superpuesta para ilustrar esta normalidad.

Estimación puntual

La estimación de parámetros tiene por finalidad asignar valores a los parámetros poblacionales a partir de los

estadísticos obtenidos en las muestras. Dicho de otra manera, la finalidad de la estimación de parámetros es

caracterizar las poblaciones a partir de la información de las muestras (por ejemplo, inferir el valor de la Media de la

población a partir de los datos de la muestra).

Características estimadores

1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual al parámetro.

Estimadores insesgados son la Media muestral (estimador de la Media de la población) y la Varianza (estimador de la

Varianza de la población):

Page 30: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo aleatorio (número de

muestras= 10000, tamaño de las muestras= 100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la

media poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana de la población es igual

a 5 y la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la Varianza

en un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual a 9.56 ha resultado igual a 9.12,

esto es, no coinciden. En cambio, al utilizar la Cuasivarianza

la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la Varianza de la población ya que la

Cuasivarianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n (tamaño de la

muestra).

Algunos estimadores consistentes son:

Page 31: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos aleatorios (número de

muestras= 100) con los siguientes resultados:

vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor que la Media de la

población.

3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza de la distribución muestral del

estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la confianza de que el estadístico

obtenido en la muestra aproxime al parámetro poblacional.

Ejemplo

La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras: 1000, n=25) ha

resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12,

(este resultado muestra que la Media es un estimador más eficiente que la Mediana).

Estimación por intervalos

La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable se encuentre el

parámetro. La obtención del intervalo se basa en las siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de ocurrencia de los

estadísticos muestrales.

b) Si conociéramos el valor del parámetro poblacional, podríamosestablecer la probabilidad de que el estimador se

halle dentro de los intervalos de la distribución muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece alrededor del

estimador. Si repetimos el muestreo un gran número de veces y definimos un intervalo alrededor de cada valor del

Page 32: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este

intervalo es denominado "intervalo de confianza".

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son los valores cuya

función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden obtener en las tablas de la distribución

Normal estandarizada o de funciones en aplicaciones informáticas como Excel). Seguidamente generamos una muestra

de la población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral,

el parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la distancia desde m a la

Media muestral es la misma que va de la Media muestral a m. En consecuencia, si hacemos un muestreo con un

número grande de muestras observamos que el 95% de las veces (aproximadamente) el valor de la Media de la

población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El

Page 33: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es

denominado nivel de confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del intervalo sea igual al

99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral en las tablas de la

distribución Normal estandarizada o de funciones en aplicaciones informáticas como Excel), y son los valores cuya

función de probabilidad es igual a 0.995 y 0.005 respectivamente).

Ejemplo

La siguiente imagen muestra la distribución de las Medias muestrales obtenidas de 100000 muestras aleatorias y los

intervalos alrededor de cada una de las Medias obtenidas de diez de las muestras:

donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.

Page 34: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7) incluyen el valor del

parámetro dentro sus límites.

Intervalo de confianza para la media de una distribución Normal

Dada una variable aleatoria con distribución Normal N(μ, σ), el objetivo es la construcción de un intervalo de

confianza para el parámetro μ, basado en una muestra de tamaño n de la variable.

Desde el punto de vista didáctico hemos de considerar dos posibilidades sobre la desviación típica de la variable: que

sea conocida o que sea desconocida y tengamos que estimarla a partir de la muestra. El caso de σ conocida, ya

comentado anteriormente, no pasa de ser un caso académico con poca aplicación en la práctica, sin embargo es útil

desde del punto de vista didáctico.

Caso de varianza conocida

Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una Normal estándar. Por tanto, aplicando el método del pivote podemos construir la expresión

donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2, de la que se

deduce el intervalo de confianza

Puede repasarse la construcción más detallada.

Caso de varianza desconocida

Dada una muestra X1, ..., Xn, el estadístico

Page 35: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y siguiendo pasos similares a los del

apartado anterior, el intervalo de confianza resultante es

donde tα/2 es el valor de una distribución t de Student con n − 1 grados de libertad que deja a su derecha una

probabilidad deα/2.

Con el programa siguiente podemos calcular el intervalo de confianza para la media de una distribución Normal con

desviación típica desconocida.

1) Podemos seleccionar la muestra por defecto (992, 995, 998, 1.000 y 1.005) o bien

2) podemos introducir una muestra arbitraria clicando sobre la regla de datos.

3) Podemos modificar los límites de la regla utilizando las barras de desplazamiento correspondientes.

4) Podemos borrar datos entrados en la regla clicando nuevamente sobre ellos.

Intervalo de confianza para una proporción

Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la construcción de un intervalo de

confianza para el parámetro p, basada en una observación de la variable que ha dado como valor x. El mismo caso se

aplica si estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre el suceso que define la

variable al repetir el experimento n veces en condiciones de independencia.

Existen dos alternativas a la hora de construir un intervalo de confianza para p:

Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal.

Utilizar un método exacto.

Aproximación asintótica

Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de

estadística. Se basa en la aproximación

Page 36: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

que, trasladada a la frecuencia relativa, resulta

Tomando como estadístico pivote

que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una variable discreta a

una continua, se obtiene el intervalo de confianza asintótico:

donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2 para un

intervalo de confianza de (1 − α) · 100 %. Las condiciones generalmente aceptadas para considerar válida la

aproximación asintótica anterior son:

El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la validez de la aproximación utilizada. Una

información más general sobre los intervalos de confianza asintóticos puede encontrase aquí.

Intervalo exacto

Aun cuando las condiciones anteriores no se verifiquen, es posible la construcción de un intervalo exacto, válido

siempre pero algo más complicado en los cálculos. Es posible demostrar que un intervalo exacto para el

parámetro p viene dado por los valores siguientes:

Page 37: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

donde Fα/2,a,b es el valor de una distribución F de Fisher-Snedecor con a y b grados de libertad que deja a su derecha

una probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %.

Una justificación de los intervalos de confianza exactos para distribuciones discretas puede encontrarse aquí.

En el programa siguiente se pueden calcular los intervalos de confianza asintótico y, si n es menor de 100, también el

exacto para una proporción.

1) Introducir el valor de X (número de veces que se presenta un suceso) y el valor de n(número total de intentos).

2) Seleccionar el nivel de confianza que se desee para el intervalo.

3) El programa presenta la estimación puntual del parámetro p y los intervalos de confianza exacto (si n < 100) y

asintótico.

4) Repetir el cálculo varias veces comparando los resultados exacto y asintótico al variar las condiciones del

experimento.

DIFERENCIA DE MEDIAS POBLACIONALES

En ocasiones interesa definir un intervalo de valores tal que permita establecer cuales son los valores mínimo y máximo

aceptables para la diferencia entre las medias de dos poblaciones. Pueden darse dos situaciones según las muestras sean

o no independientes; siendo en ambos casos condición necesaria que las poblaciones de origen sean normales o

aproximadamente normales:

MUESTRAS INDEPENDIENTES

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza para la diferencia de

medias poblacionales está centrado en la diferencia de las medias muestrales, siendo sus límites superior e inferior:

t /2 es el valor crítico correspondiente al grado de confianza 1- de la distribución t de Student con n1+ n2-2 grados de

libertad y es una estimación de la desviación típica común a ambas poblaciones obtenida

a partir de las varianzas de las dos muestras. En la práctica si n1 y n2 son moderadamente grandes, el valor crítico

t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribución normal.

Si las varianzas poblacionales no pueden suponerse iguales los límites del intervalo de confianza son:

Page 38: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

El valor crítico t /2 corresponde a una distribución t cuyos grados de libertad se calculan en base a ambos tamaños

muestrales y a las desviaciones típicas de cada grupo según la corrección propuesta por Dixon y Massey:

Para obtener el intervalo de confianza en ambos casos la secuencia es:

Analizar

Comparar medias

Prueba T para muestras independientes

Ejemplo 1

Con los datos de la encuesta Enctran.sav obtener la estimación puntual y los intervalos de confianza del 95 y del 99%

para la media de la población de la variable Coste.

En el cuadro de diálogo Explorar, que se obtiene con la secuencia Analizar > Estadísticos descriptivos > Explorar, se

selecciona como variable dependiente la variable Coste. En Estadísticos comprobamos que está activada la

opción Descriptivos y que el intervalo para la media definido es el del 95%.

Al aceptar se obtiene el siguiente cuadro de resultados:

Page 39: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

La estimación puntual del valor esperado del coste es 5236,40 Pta. Esta estimación tiene un error típico de 365,97. Los

límites inferior y superior del intervalo de confianza del 95% son 4511,34 y 5951,46, respectivamente. Este resultado se

interpreta como que de los intervalos obtenidos con este método el 95% contendrán el verdadero valor esperado del

coste. Una medida del grado de precisión con el que se está estimando el valor esperado es la amplitud del intervalo, que

en este caso es igual a 1450,12 y la mitad de la amplitud, que es 725,06, es el error máximo de estimación que puede

garantizarse con una probabilidad de 0,95. Este error máximo es igual a donde t /2 , es el valor crítico para

=0,05 de la distribución t e Student, en este caso con 113 grados de libertad, y es el error típico de la estimación.

Para obtener el intervalo del 99% de confianza modificamos el valor del grado de confianza en el cuadro

Explorar:Estadísticos

fijándolo en el 99%.

Los límites del intervalo de confianza del 99% son 4277,54 y 6195,27; la confianza de que este intervalo contenga el

verdadero valor esperado del coste es 0,99. La amplitud de este intervalo es 2217,73 que es mayor que la amplitud del

intervalo del 95%, por lo tanto, 1108,865, es el error máximo de estimación que puede garantizarse con una probabilidad

de

0,99. Como puede verse, a medida que aumenta el grado de confianza del intervalo disminuye la precisión de la

estimación.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES

Sea X1, X2,..., Xn1 una muestra aleatoria extraída de una población Bernoulli. Sea X la variable Binomial definida

como el número de éxitos en esta muestra y con parámetro π1, proporción poblacional de éxitos.

Page 40: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Sea Y1, Y2,..., Yn2 una muestra aleatoria extraída de una población Bernoulli. Sea Y la variable Binomial definida

como el número de éxitos en esta muestra y tomemos a π2 como la proporción de éxitos en esta otra población.

Supongamos que ambas muestras son independientes.

Si p1 y p2 son los estadísticos muestrales y definimos a = p1-p2 como el estimador de la diferencia de

proporciones poblacionales θ = π1-π2 entonces se debe cumplir que

Nota:

Si n1 y n2 son bastante grandes el radical se calcula usando los estadísticos de la muestra; es decir, las proporciones

muestrales.

Ejemplo

MillWard Brown, empresa investigadora de mercado es requerida para hacer un estudio sobre la preferencia de un

producto. Se le pide que estime la proporción de hombres y mujeres que conocen el producto que está siendo

promocionado en toda la ciudad.

En una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60 mujeres están

familiarizados con el producto indicado. Construya un intervalo de confianza del 95% para la diferencia de

proporciones de hombres y mujeres que conocen el producto. En base a estos resultados, ¿se estaría inclinado a

concluir que existe una diferencia significativa entre las dos proporciones?

Solución

Sea π1 la proporción de mujeres que prefieren el producto.

Sea π2 la proporción de hombres que prefieren el producto.

Según los datos: Se trata de un problema de diferencia de proporciones. Los datos son:

Page 41: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Luego el intervalo de confianza del 95% será -0.0009 ≤ π1 – π2 ≤ 0.2009.

Según esto, existe diferencia significativa? . No hay diferencia significativa porque no se puede saber cuál de las

proporciones es mayor.

Cálculo del tamaño de muestra

Muestra.- La muestra es un subconjunto de la población. Ejemplo: Estudiantes de 2do Semestre de la Universidad

UGMA.

Sus principales características son:

Representativa.- Se refiere a que todos y cada uno de los elementos de la población tengan la misma oportunidad de

ser tomados en cuenta para formar dicha muestra.

Adecuada y válida.- Se refiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de

error posible respecto de la población.

Para que una muestra sea fiable, es necesario que su tamaño sea obtenido mediante procesos matemáticos que eliminen

la incidencia del error.

ELEMENTO O INDIVIDUO Unidad mínima que compone una población. El elemento puede ser una entidad simple (una persona) o una entidad

compleja (una familia), y se denomina unidad investigativa.

FÓRMULA PARA CALCULAR EL TAMAÑO DE LA MUESTRA

Para calcular el tamaño de la muestra suele utilizarse la siguiente fórmula:

Donde:

n = el tamaño de la muestra.

Page 42: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

N = tamaño de la población.

Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse un valor

constante de 0,5.

Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en

relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor

que queda a criterio del investigador.

e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que

varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.

La fórmula del tamaño de la muestra se obtiene de la fórmula para calcular la estimación del intervalo de confianza

para la media, la cual es:

De donde el error es:

De esta fórmula del error de la estimación del intervalo de confianza para la media se despeja la n, para lo cual se sigue

el siguiente proceso:

Elevando al cuadrado a ambos miembros de la fórmula se obtiene:

Multiplicando fracciones:

Eliminando denominadores:

Eliminando paréntesis:

Transponiendo n a la izquierda:

Factor común de n:

Page 43: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Despejando n:

Ordenando se obtiene la fórmula para calcular el tamaño de la muestra:

EJEMPLOS

1) Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de confianza del 95%

Solución: Realizando el gráfico que representa el 95% de confianza se obtiene:

Se tiene N=500, para el 95% de confianza Z = 1,96, y como no se tiene los demás valores se tomará y e = 0,05.

Reemplazando valores de la fórmula se tiene:

Page 44: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Los cálculos en Excel se muestran en la siguiente figura:

Page 45: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Conclusión

En el desarrollo de esta investigación se resumen algunas características de las muestras, en este sentido se tiene

que en la práctica se ha venido destacando la necesidad de seleccionar una muestra donde cada elemento de la población

o universo tenga una probabilidad conocida de ser seleccionado, para lograr esto debemos elegir un tipo de muestreo

probabilística con la finalidad que el error del muestreo lo asuma simplemente el azar.

Por otra parte, el objetivo que persigue una muestra es que permite efectuar estimaciones de valores del universo

a partir de medidas obtenidas de la misma, y al mismo tiempo permiten realizar cálculos de la seguridad o confiabilidad

de tales estimaciones de manera más precisas utilizando pruebas estadísticas de hipótesis acerca del universo.

Finalmente, es necesario conocer la teoría del muestreo para decidir la conveniencia de tomar o no muestras de

una población considerando la naturaleza del diseño de investigación y las características peculiares del proyecto para

enfrentar el problema. Así como decidir el tipo de muestra para un proyecto de investigación teniendo en cuenta las

variables que interesa relacionar, el tipo de población y las proporciones de los individuos.

Page 46: República Bolivariana de Venezuela Ministerio del Poder Popular para la ... · investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger

Bibliografía

http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html

Consultado el 25/10/2016 17:30

http://www.hrc.es/bioest/esti_medias.html

Consultado el 25/10/2016 17:38

http://www.uv.es/webgid/Inferencial/4_estimacin_puntual.html

Consultado el 25/10/2016 17:42

http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t8.htm

Consultado el 27/10/2016 08:32

http://www.ub.edu/aplica_infor/spss/cap4-3.htm

Consultado el 27/10/2016 09:02

http://www.monografias.com/trabajos87/calculo-del-tamano-muestra/calculo-del-tamano-

muestra.shtml#ixzz4OFRXGSRb

Consultado el 27/10/2016 10:23