Mic sesión 6

Preview:

Citation preview

MÉTODOS DE INVESTIGACIÓN CUANTITATIVA

Sesión 6

DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN

FÁTIMA PONCE 1

FÁTIMA PONCE 2

PUNTOS A TRATAR

Sesión 6:

DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN.

Distribución de Muestreo.Estimación Puntual y Estimación por Intervalo.

Propiedades de los estimadoresEjercicios.

FÁTIMA PONCE 3

ESTADÍSTICA INFERENCIAL: IMPORTANCIA DE LA MUESTRA

La estadística inferencial requiere explicitar el vínculo que hay entre la población y la muestra (usualmente a través de un modelo probabilístico).

Por ejemplo, en el contexto inferencial, la edad promedio de los encuestados (muestra) es una estimación de la edad poblacional. ¿Qué tan confiable será esta estimación?, depende de:1) la cantidad de personas encuestadas (tamaño de la

muestra) 2) Qué tan heterogénea es la población? 3) Características del proceso de estimación

(propiedades del estimador).

FÁTIMA PONCE 4

DISTRIBUCION DE MUESTREO Si se quisiera saber la estatura promedio de los niños

peruanos de 10 años. Se podría tomar varias muestras de “n” niños peruanos

de 10 años y calcular en cada una de ellas su valor medio (Xbarra) y su desviación estándar (s).

Las estadísticas resultantes de cada muestra no necesariamente serían iguales, lo más probable es que varíen de muestra en muestra.

Distribución de muestreo de la media: es una distribución de probabilidad de todas las medias posibles de las muestras.

También se puede tener: Distribución de muestreo de la mediana, de las desviaciones, o de una proporción.

FÁTIMA PONCE 5

DISTRIBUCION DE MUESTREO DE LA MEDIA

POBLACIÓN (N)Variable aleatoria X=Estatura

µ2

 Muestra 1x1

xn

 

.

.

.

 

.

.

.

Distribución de Muestreo de la Media

(tiene una media y una variabilidad)

Es una VariableAleatoria

Es una distribución de probabilidad de las medias de todas las muestras posibles.

Muestra 2x1

xn

Muestra kx1

xn

FÁTIMA PONCE 6

Distribución de la población tiene como parámetros:

(media de la distribución de la población) y, (desviación estándar de la población).

DISTRIBUCIÓN DE MUESTREO DE LA MEDIA

Distribución muestral de la media tiene parámetros: _ = media de la distribución muestral de las medias x _ = error estándar de la media muestral (SE) x

Cada distribución de frecuencia de la muestra tiene: _ su propia media muestral = X y su propia desviación estándar = s

FÁTIMA PONCE 7

Distribución de Muestreode la Media

x1 x2

xkx3

Distribución de las “k” muestrasDistribución de lapoblación

POBLACIÓN Y DISTRIBUCIÓN DE MUESTREO

x

nx

s1 s2

s3 sk

X

FÁTIMA PONCE 8

Cuando la población está distribuida normalmente, la distribución de muestreo de la media también es normal.

1. La media de la distribución de muestreo es igual a la media de la población:

DISTRIBUCION DE MUESTREO (POBLACIÓN NORMAL)

_ = / n X

_ =

X

2. El error estándar de la distribución de muestreo es igual a la desviación estándar de la población entre la raíz cuadrada de n

FÁTIMA PONCE 9

Si la población no tiene distribución normal: Se aplica el Teorema del Límite Central, que muestra una relación entre la forma de la distribución de la población y la forma de la distribución de muestreo:

POBLACIÓN NO NORMAL Y TEOREMA DEL LÍMITE CENTRAL

“La distribución de muestreo de la media se aproxima a la normal al incrementarse el tamaño de la muestra”.

Si n > 30 se emplea la distribución normal.

FÁTIMA PONCE 10

ESTANDARIZACIÓN

Si se quisiera estandarizar la media muestral: _

x - Z = ----------

_ x

_ x -

Z = ------------- / n

_ X N( , 2/n ) para n suficientemente grande

FÁTIMA PONCE 11

1. Distribución Muestral de la media se caracteriza por:

2. Sólo nos basamos en una muestra de la población.3. Pregunta:¿Nuestra media en esa muestra ( ) se encuentra

cerca de la media de la distribución muestral ( )?. Si está cerca tendremos una buena estimación de µ.

RESUMIENDO:

_ = /n

X

_ =

X

xX

4. Para evaluar ello:i) Estimar

ii) Probar hipótesis: - Si la prob. de que nuestra esté cerca a = µ es alta el

investigador podrá generalizar. - Si la prob. de que nuestra esté cerca a = µ es baja dudará

en generalizar.

X

xX

X x

FÁTIMA PONCE 12

ESTIMACIÓN:

“Conjetura educada y en base a datos, acerca de una magnitud desconocida”.

Walter Sosa

FÁTIMA PONCE 13

TIPOS DE ESTIMACIÓN

1. Estimación Puntual: Utiliza un estadístico para obtener Un solo valor puntual

estimado del parámetro a partir de la información de muestreo. _ ^

X ó 2. Estimación por Intervalo o Intervalo de Confianza (IC).

Un IC denota el rango dentro del cual puede encontrarse el parámetro y el nivel de confianza que el intervalo contiene el parámetro. (“Intervalo de confianza de 95% el parámetro tal…”.)

_ _ (LI, LS) = ( X - a , X + a)

FÁTIMA PONCE 14

ESTIMACIÓN PUNTUAL

Parámetro Poblacional

= Media poblacional de X

= Desviación estándar poblacional de X P= proporción poblacional

Estimador Puntual

_ n

X = Media muestral de X = xi / n i=1

_s = Desviación (xi-X)2

estándar = --------- muestral de X (n-1) p = proporción muestral = n1/n

FÁTIMA PONCE 15

PROPIEDADES DE UN BUEN ESTIMADOR

INSESGADEZ: Un estimador es insesgado si la media de su distribución muestral es igual al parámetro correspondiente

EFICIENCIA: Dado un conjunto de estimadores insesgados el estimador más eficiente es el que tiene la menor varianza.

CONSISTENCIA(propiedad cuando n es grande): Para que el estimador sea consistente debe ser insesgado y su varianza debe tender a 0 a medida que n se incrementa.

SUFICIENCIA: Si utiliza tanta información de la muestra que ningún otro estimador puede extraer información adicional acerca del parámetro poblacional que se está estimando.

_ Para la media muestral: E(X) = ^ ^ En general para un estimador : E() =

FÁTIMA PONCE 16

Denota el rango dentro del cual puede encontrarse el parámetro y el nivel de confianza que el intervalo contiene el parámetro poblacional.

ESTIMACIÓN INTERVALO (IC)

_ I.C. para estimar = X margen de error

Estimación puntual

Depende de:i) El nivel de confianza

deseado 100(1-)%, dado por el valor Z, y;

ii) Si conocemos o no .

FÁTIMA PONCE 17

ESTIMACIÓN INTERVALO (IC)

Los IC tienen un Límite Inferior (LI) y un Límite Superior (LS)

_LI= X - margen de error

_ LS= X + margen de error

INTERPRETACIÓN: “Un 100(1-)% de confianza de que la media poblacional desconocida (µ) esté entre el LI y el LS”.

FÁTIMA PONCE 18

_

X Z _

X

IC para estimar

s _ = s /n X

_X Z s _

X

s debe ser estimada

Cuando se conoce : Cuando no se conoce :

_ = /n

X

Z es el valor de la tabla Z al nivel de confianza deseado 100(1-)%,

FÁTIMA PONCE 19

RECORDAR

Nivel de confianza: Probabilidad que asociamos con una estimación de intervalo. 99%

95%

90%

Valores de Z para los niveles de confianza más usados: Nivel de confianza /2 Z/2 90% .10 .05 1.65 95% .05 .025 1.96 99% .01 .005 2.58

FÁTIMA PONCE 20

INTERVALO DE CONFIANZA (resumen)

I.C. de 99% para estimar la media ():Si se conoce _ X 2.58 / n

Si no se conoce _ X 2.58 s/ n

I.C. de 95% para estimar la media ():

Si se conoce _ X 1.96 / n

Si no se conoce _ X 1.96 s/ n

FÁTIMA PONCE 21

Por ejemplo: Se desea calcular un IC para el sueldo anual inicial para graduados de Gestión. No se conoce .

PASOS PARA ESTIMACIÓN IC

_ I.C. para estimar = X Z s _

X

1. Se calcula la media muestral (estimación puntual)2. Como no se conoce se debe calcular la desviación

estándar muestral (s), para obtener s _ = s/n

X

3. Se hace uso de la Regla Empírica para hallar Z.4. Se tiene :

FÁTIMA PONCE 22

EJERCICIOS

FÁTIMA PONCE 23

EJERCICIO 1

Suponga que tiene una muestra aleatoria de 256 gerentes de Lima. Un elemento de interés es su ingreso anual. La media muestral es S/ 45,420 y la desviación estándar muestral es S/ 2,050.

a) ¿Cuál es el ingreso medio estimado de todos los gerentes de Lima?.

b) ¿Cuál es el IC de 95% para la media de la población?.

c) Interprete los resultados.

n=256 media muestral=S/45,420 s=S/ 2,050.

FÁTIMA PONCE 24

a)Ingreso medio estimado de todos los gerentes (la población)? = Es la media muestral =S/ 45,420 = Estimación Puntual para µ.

b) IC de 95% para la media de la población: _ X 1.96 s/ n = 45420 1.96 (2050/ 256 )= 45420 251.125 LI=45168.9 LS=45671.1 Intervalo de Confianza para µ

EJERCICIO 1: Estimación de µ

FÁTIMA PONCE 25

c) Interpretación: Si hubiera tiempo para seleccionar muchas muestras de

tamaño 256 de la población, y calcular sus medias muestrales y los IC, la media poblacional () del ingreso anual se encontraría aprox. en 95 de los 100 IC.

Aprox. 5 de los 100 IC no incluyen a la media poblacional del ingreso anual.

EJERCICIO 1: Estimación de µ

FÁTIMA PONCE 26

Con una muestra de 100 clientes se obtiene un recibo de luz promedio de S/. 80 y una s=10.

a. Hallar IC para la media poblacional al 99% y al 95%.

b. ¿Cuál es más estrecho?

c. ¿Hay alguna relación entre el nivel de confianza y la amplitud del IC?

EJERCICIO 2: Relación entre Nivel de Confianza e IC

FÁTIMA PONCE 27

_

n = 100 clientes, X = 80 y s=10.

Hallar IC para la media poblacional al 99% y al 95%.

EJERCICIO 2: Relación entre Nivel de Confianza e IC

I.C. al 99% para

I.C. al 95% para = 80 1.96 (10/100)

LI LS

El IC del 95% es más estrecho Para > grado de confianza (> exactitud), el margen de error (ancho del IC) debe ser > (se sacrifica precisión en el IC).

77.42 82.58

2.58 (10/100)= 80

78.04 81.96

FÁTIMA PONCE 28

Estimación de una Proporción de la población

A veces se desea estimar una proporción de unidades de una población (P= conteo del número de elementos que poseen la característica de interés con relación al número total) y no necesariamente el parámetro poblacional.

Estimación Puntual: Si el número de éxitos en la muestra es n1 y en la

muestra hay n observaciones Estimación puntual de la proporción de la población (P) es la proporción muestral: p = n1/n

FÁTIMA PONCE 29

I.C. para P = p Z _

p

IC para una Proporción de la población (P)

_ = p(1-p)/n

p

Error estándar de la proporción

p = proporción muestralZ = valor Z que depende de (1-)% elegido.n = tamaño de la muestra.

I.C. para estimar P = p Z p(1-p)/n

FÁTIMA PONCE 30

EJERCICIO 3: Estimación de P

Suponga que el dueño de una gasolinera está interesado en la proporción de mujeres que compran gasolina con tarjeta de crédito. Después de realizar un estudio con 100 mujeres, pudo determinar que 80 de sus clientes pagaban con tarjeta de crédito.

a) ¿Cuál es la proporción estimada puntual de mujeres en la población que pagan sus consumos de gasolina con tarjeta de crédito?

b) Elabore un intervalo de confianza del 95% para la proporción de mujeres que pagan la gasolina con tarjeta de crédito.

FÁTIMA PONCE 31

EJERCICIO 3: Estimación de P

p Z p(1-p)/n

I.C. para estimar P = p Z p(1-p)/n

= 0.8 1.96 (0.8(1-0.8)) / 100

= 0.8 0.0784

LI=0.722 y LS=0.878

b)

a) = 80/100 = 0.8 Estimación Puntual de P.

Estimación por Intervalo o IC para P.

FÁTIMA PONCE 32

CONTROL DEL ANCHO DE UN INTERVALO

Como se ha visto, es preferible un IC más estrecho debido a la precisión que proporciona.

Hay 2 formas para lograr un IC más preciso:i) Reducir el nivel de confianza (1-)% El valor de Z al 99% es 2.58 y el valor de Z al 95% es 1.96.

Por lo que el IC al 95% es más estrecho que al 99%. El costo de mayor precisión del IC es que el nivel de

confianza bajó a 95% (la probab. del error aumentó a 5%).ii) Aumentar el tamaño de la muestra. Al aumentar n se puede reducir el error estándar: /n.

FÁTIMA PONCE 33

PARA MUESTRAS GRANDES

Si n > 30 Se emplea la distribución Normal Estándar: Z

Hay dos casos:

Se conoce

No se conoce , se requiere estimar “s” con los datos de la muestra grande (al menos 30 obs).

_ X - µ Z= --------- s / n

FÁTIMA PONCE 34

PARA MUESTRAS PEQUEÑAS

Si n 30 se emplea la distribución t de Student: t .

En general la t se emplea cuando:

es desconocida. la muestra es pequeña (n 30).

Al utilizar la t suponemos que la distribución poblacional es normal o casi normal.

FÁTIMA PONCE 35

DISTRIBUCIÓN t DE STUDENT

Características:AcampanadaSimétricaMás planaNo se conoce σ

0zt

“t” con 5 grados de

libertad

Normal Estándar

“t” con13 grados de

libertad

FÁTIMA PONCE 36

El estadístico t se calcula como:

_

X - µ s_ x

t =

Estadístico t e IC para muestras pequeñas

IC para estimar la media poblacional () en muestras pequeñas:

_ _I.C. para estimar = X±t(s_) = X ±t/2

(n-1) s/n x

Valor de tabla de la t-student con (n-1) grados de libertad para un nivel de /2.

FÁTIMA PONCE 37

EJERCICIO 4: Estimación IC para µ, con muestra pequeña

Una empresa está considerando un programa asistido por computadora con el fin de capacitar a sus empleados. Para evaluar este programa, el gerente solicita una estimación de la media poblacional del tiempo requerido para que los empleados completen la capacitación. Considere una muestra de 20 empleados que siguen la capacitación.

Halle un IC para la media si tiene la siguiente tabla.Duración de la capacitación, en días (para 20 empleados)

52 59 54 4244 50 42 4855 54 60 5544 62 62 5745 46 43 56

FÁTIMA PONCE 38

EJERCICIO 4: Estimación IC para µ, con muestra pequeña

Datos intermedios: x = 1030

(x- )2 = 889 Media Muestral = 51.5 días. Desv Estándar (s) = 889/19 = 6.84 días. _ _ I.C. para estimar = X ± t0.025 s/n

t/2 con grados de libertad=n-1

= 51.5 2.093 (6.84/20)

= 51.5 3.2

LI = 48.3 y LS = 54.7 días

X

FÁTIMA PONCE 39

Tabla t

2.093

g.De l.

FÁTIMA PONCE 40

BIBLIOGRAFIA

Anderson, D., Sweeney, D. y Williams T. (2008). Cap 7-8.

Levin y Rubin (2010) Cap. 6 y 7.