Estimación de Parámetros

Preview:

DESCRIPTION

Estimación de Parámetros de Estadística IIuniversidad continental

Citation preview

1

Estimación e intervalos de confianza

Objetivos: Al terminar este capítulo podrá:

1. Definir una estimación puntual.

2. Interpretar el nivel de confianza.

3. Construir un intervalo de confianza para la media poblacional cuando se conoce la desviación estándar poblacional.

2

Capítulo 9 (Continuación)

4. Construir un intervalo de confianza para la media poblacional cuando no se conoce la desviación estándar poblacional.

5. Construir un intervalo de confianza para la proporción poblacional.

6. Determinar el tamaño de la muestra por atributos y variables.

3

Estimaciones puntuales e intervalos de confianza

Estimación puntual: Estadístico calculado a partir de la información obtenida de la muestra y que se usa para estimar el parámetro poblacional.

Intervalo de confianza: Un conjunto de valores obtenido a partir de los datos muestrales, en el que hay una determinada probabilidad de que se encuentre el parámetro. A esta probabilidad se le conoce como el nivel de confianza.

4

Estimación puntual y estimación por intervalos

Los hechos que determinan la amplitud de un intervalo de confianza son:

1. El tamaño de la muestra, n

2. La variabilidad de la población. normalmente estimada por s.

3. El nivel de confianza deseado.

5

Estimación puntual y estimación por intervalos

Si la desviación estándar de la población es conocida o la muestra es mayor que 30 utilizamos la distribución z.

n

szX

6

Punto e intervalo de estimación

Si la desviación estándar de la población es desconocida y la muestra es menor que 30 utilizamos la distribución t

n

stX

The Critical Value z2

Finding z2 for 95% Degree of Confidence

-z2z2

Critical Values

2 = 2.5% = .025 = 5%

z2 = ± 1.96

Use Table A-2to find a z score of 1.96

= 0.05

Finding z2 for 95% Degree of Confidence

10

Intervalo de estimación

Un intervalo de estimación establece el rango en el cual se encuentra el parámetro de población.

Un intervalo en el cual se espera que ocurra el parámetro de población se llama intervalo de confianza.

Los dos intervalos de confianza que son más utilizados son de 95% y 99%.

11

Intervalo de estimación Para un 95% de intervalo de confianza,

aproximadamente 95% de los intervalos construidos igualmente contendrán el parámetro inicial. También el 95% de la muestra media para un tamaño de muestra específico se encontrará dentro del 1.96 de la desviación estándar de la media de la población.

Para el 99% de intervalo de confianza, 99% de la muestra media para un tamaño de muestra específico se encontrará dentro del 2.58 de la desviación estándar de la media de la población.

12

Error estándar de la media muestral

es el símbolo para el error estándar de la media

muestral. es la desviación estándar de la población. n es la magnitud de la muestra.

x n

x

El error estándar de la media muestral es la desviación estándar de la distribución de las medias muestrales.

Se calcula como:

13

Error estándar de la media muestral

Si σ no es conocido y n >= 30, la desviación estándar de la muestra, designada s, se aproxima a la desviación estándar de la población.

La fórmula para la desviación estándar es:

n

ss x

14

95% y 99% intervalos de confianza para µ El 95% y 99% intervalos de confianza:

95% CI para la media de la población es dada:

n

sX 96.1

Xs

n2 58.

99% CI para la media de la población es dada como:

15

Construyendo intervalos generales de confianza para µ

En general, un intervalo de confianza para la media se calcula como:

n

szX

16

Ejemplo 3 El director de una escuela de negocios quiere

estimar la cantidad media de horas que los estudiantes trabajan por semana. De una muestra de 49 estudiantes mostró una media de 24 horas con una desviación estándar de 4 horas. ¿Cuál es la media de la población?

El valor de la media de la población no es conocida. Nuestra mejor estimación de este valor es la muestra media de 24.0 horas. Este valor es llamado estimación puntual.

17

Ejemplo 3 (Continuación)

Encuentre el intervalo de confianza con el 95% para la media de la población.

El rango límite de confianza es de 22.88 a 25.12.

12.100.24

49

496.100.2496.1

n

sX

Aproximadamente el 95% de los intervalos construidos incluyen el parámetro de población.

18

Intervalo de confianza para la proporción de la población

El intervalo de confianza para la proporción de la población se estima como:

n

ppzp

)1(

19

Ejemplo 4

De una muestra de 500 ejecutivos que tienen casa propia 175 revelaron planear vender sus casas y cambiarse a Arizona. Desarrolle un intervalo de confianza con el 98% para la proporción de ejecutivos que planean vender sus casas y cambiarse a Arizona.

0497.35. 500

)65)(.35(.33.235.

20

Factor de correcciónde la población-finita La población que ha sido establecida en líneas

anteriores se dice que es finita. Para una población finita, donde el número total de

objetos es N y la magnitud de la muestra es n, el siguiente arreglo está hecho para los errores estándar de la media muestral y la proporción:

Error estándar de la media muestral:

x n

N n

N

1

21

Factor de correcciónde la población-finita

Este arreglo es llamado factor de corrección de la población-finita.

Si n/N < 0.05,el factor de corrección de la población-finita se ignora.

1)1(

NnN

npp

p

Error estándar de las proporciones de la muestra:

22

Ejemplo 5 Dada la información: El director de una escuela de negocios

quiere estimar la cantidad media de horas que los estudiantes trabajan por semana. De una muestra de 49 estudiantes mostró una media de 24 horas con una desviación estándar de 4 horas.

Construya un intervalo de confianza del 95% para la cantidad media de horas que los estudiantes trabajan por semana si tan sólo son 500 estudiantes en el campus.

Porque n/N = 49/500 = .098 el cuál es mayor que 0. 05N, utilizamos el factor de corrección de la población-finita

0648.100.24)1500

49500)(

49

4(96.124

23

Ejercicios

Uso de la distribución correcta: 95%; n=12; se desconoce σ, la población distribuida

normalmente. 99%; n=15; se desconoce σ; la población distribuida

normalmente. 99%; n=4, se desconoce σ; la población parece muy

sesgada. 90%; n=200; se conoce σ; la población parece muy

sesgada. 98&; n=18, σ=1.5; población parece muy sesgada.

24

INTERVALOS DE CONFIANZA Peso perdido por una dieta: 95% de confianza;

n=40; media=3.0 kg y s=4.9 kg. Período de vida de una computadora: 99% de

confianza; n=21; media=6.8 años; s=2.4 años.

Interprete cada uno.

25

A continuación se listan las cantidades de plomo medidas en µg/m3 en el aire. La Enviromental Protection Agency estableció un estándar de calidad de l aire para el plomo de 1.5 µg/m3. Las medidas que se presentan a continuación se registraron en el edificio 5 del Worl Trade Center en diferentes días, inmediatamente después de la destrucción causada por ataques terroristas del 11/set/2001. Después del colapso de los edificios hubo una gran preocupación por la calidad del aire. Utilice los valores dados para construir un IC al 95% para la cantidad media de plomo en el aire.

5.4 1.1 0.42 0.73 0.48 1.1

26

La gráfica de tallo y hojas que se presenta incluye la edad de los solicitantes que lograron su ascenso. Suponga que la muestra es aleatoria simple. Construya un IC del 95% para la edad media de estas personas exitosas.

3 3 6 7 8 8 9

4 2 2 3 3 4 4 4 5 5 5 5 5 6 6 7 7 8 8 9 9

5 1 1 2 4

TRABAJO COLABORATIVO: PARA LA PROPORCIÓN (FACULTAD) Y PARA LA MEDIA (EDADES)

27

Elección del tamaño de muestra apropiado

Existen 3 factores que determinan el tamaño de la muestra, ninguno de los cuales tiene relación con el tamaño de la población. Éstos son:El nivel de confianza deseado.El máximo error permisible.La variación en la población.

28

Variación en la población

Donde: E es el error permisible, z es el valor-z correspondiente al nivel de confianza seleccionado, y s es la desviación de la muestra del estudio piloto.

2

E

szn

Para encontrar el tamaño de la muestra para una variable:

29

Ejemplo 6 Un grupo de consumidores quiere estimar la

media del cargo mensual de energía de julio de una casa común dentro de $5 utilizando 99% de nivel de confianza. Basado en estudios similares, la desviación estándar se estima debe ser $20.00. ¿Cuántas muestras son requeridas?

1075

)20)(58.2(2

n

30

Tamaño de la muestrapara proporciones

La fórmula para determinar el tamaño de la muestra en el caso de una proporción es:

n p pZ

E

( )1

2

Donde: p es la proporción estimada, basada en la experiencia anterior o de un estudio piloto, z es valor-z asociado con el grado de confianza seleccionado; E es el máximo error permisible que el investigador tolerará.

31

Ejemplo 7 Un club quiere estimar la proporción de niños

que tiene un perro como mascota. Si el club quisiera estimarlo dentro del 3% de la proporción de la población, ¿cuántos niños necesitarían contactar? Asuma 95% de nivel de confianza y que el club estima que un 30% de los niños tienen un perro como mascota.

89703.

96.1)70)(.30(.

2

n

Copyright © 2004 Pearson Education, Inc.

Estimating a Population Variance

Assumptions

1. The sample is a simple random sample.

2. The population must have normally distributed values (even if the sample is large).

Copyright © 2004 Pearson Education, Inc.

where n = sample size

s 2 = sample variance

2 = population variance

Chi-Square Distribution

2 =2(n – 1)

s 2

Copyright © 2004 Pearson Education, Inc.

Properties of the Distribution of the Chi-Square Statistic

1. The chi-square distribution is not symmetric, unlike the normal and Student t distributions.

Figure 6-8 Chi-Square Distribution Figure 6-9 Chi-Square Distribution for df = 10 and df = 20

As the number of degrees of freedom increases, thedistribution becomes more symmetric. (continued)

Copyright © 2004 Pearson Education, Inc.

2. The values of chi-square can be zero or positive, but they cannot be negative.

3. The chi-square distribution is different for each number of degrees of freedom, which is df = n –

1 in this section. As the number increases, the chi- square distribution approaches a normal distribution.

In Table A-4, each critical value of 2 corresponds to an area given in the top row of the table, and that area represents the total region located to the right of the critical value.

Properties of the Distribution of the Chi-Square Statistic

(continued)

Copyright © 2004 Pearson Education, Inc.

Example: Find the critical values of 2 that determine critical regions containing an area of 0.025 in each tail. Assume that the relevant sample size is 10 so that the number of degrees of freedom is 10 – 1, or 9.

= 0.05/2 = 0.025

1 /2 = 0.975

Copyright © 2004 Pearson Education, Inc.

Critical Values: Table A-4Areas to the right of each tail

Copyright © 2004 Pearson Education, Inc.

Estimators of 2

The sample variance s is the best point estimate of the population

variance 2 .

2

INTERVALO DE CONFIANZA PARA UNA VARIANZA

 Si S2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo de confianza de (1-a)x100% para s2 es:

 

 2

22

2

2 )1()1(

ID

SnSn

Copyright © 2004 Pearson Education, Inc.

Procedure for Constructing a Confidence Interval for or 2

1. Verify that the required assumptions are met.

2. Using n – 1 degrees of freedom, refer to Table A-4 and find the critical values 2

R and 2Lthat

corresponds to the desired confidence level.3. Evaluate the upper and lower confidence interval limits using this format of the confidence interval:

2 (n – 1)s 2

2

R

(n – 1)s 2

2L continued

n = 106x = 98.2o

s = 0.62o

= 0.05/2 = 0.025

1 –/2 = 0.975

Example: A study found the body temperatures of 106 healthy adults. The sample mean was 98.2 degrees and the sample standard deviation was 0.62 degrees. Find the 95% confidence interval for .

2R = 129.561, 2

L = 74.222

(106 – 1)(0.62)2 < 2 < (106 – 1)(0.62)2

129.561 74.222

0.31 < 2 < 0.54

0.56 < < 0.74

We are 95% confident that the limits of 0.56°F and 0.74°F contain the true value of . We are 95% confident that the standard deviation of body temperatures of all healthy people is between 0.56°F and 0.74°F.

Copyright © 2004 Pearson Education, Inc.

Determining Sample Size

Copyright © 2004 Pearson Education, Inc.

Example: We want to estimate , the standard deviation off all body temperatures. We want to be 95% confident that our estimate is within 10% of the true value of . How large should the sample be? Assume that the population is normally distributed.

From Table 6-2, we can see that 95% confidence and an error of 10% for correspond to a sample of size 191.

44

Ejemplo. Un fabricante de baterías para automóviles afirma que sus baterías durarán, en promedio, tres años con una varianza de un año. Si cinco de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, construya un intervalo de confianza del 95% para la varianza real y decida si la afirmación del fabricante de es válida. Suponga que la población de duraciones de las baterías es de forma aproximadamente normal.

45

Problema. Para estimar el tiempo promedio que lleva ensamblar cierto componente de una computadora, el supervisor de una empresa electrónica tomó el tiempo que 20 técnicos tardaban en ejecutar esta tarea, obteniéndose una media de 12.73 minutos y una desviación estándar de 2.06 minutos. Asuma que los tiempos tienen distribución normal. Construya e interprete un intervalo de confianza de 98% para la varianza real que lleva ensamblar el componente de la computadora.

Recommended