17
1 DIANA DEL PILAR COBOS DEL ANGEL Estadísticas y distribuciones de muestreo 27/11/2011 Estadísticas Una estadística es cualquier función de las observaciones en una muestra aleatoria que no depende de parámetros desconocidos. Por ejemplo, si X 1 , X 2 ,,X n es una muestra aleatoria de tamaño n, entonces la media de la muestra , la varianza de la muestra S 2 y la desviación estándar S son estadísticas. El proceso de extraer conclusiones en torno a poblaciones con base en datos de muestras utiliza estadísticas en forma considerable. X n X X n i i 1 1 ) ( 1 2 2 n X X S n i i 2 Diana Cobos del Angel 27/11/2011

Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

  • Upload
    vantu

  • View
    221

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

1

D I A N A D E L P I L A R C O B O S D E L A N G E L

Estadísticas y distribuciones de muestreo

27/11/2011

Estadísticas

Una estadística es cualquier función de las observaciones en una

muestra aleatoria que no depende de parámetros desconocidos.

Por ejemplo, si X1, X2,…,Xn es una muestra aleatoria de tamaño

n, entonces la media de la muestra , la varianza de la muestra S2

y la desviación estándar S son estadísticas.

El proceso de extraer conclusiones en torno a poblaciones con

base en datos de muestras utiliza estadísticas en forma

considerable.

X

n

X

X

n

i

i 1

1

)(1

2

2

n

XX

S

n

i

i

2

Diana Cobos del Angel 27/11/2011

Page 2: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

2

Distribuciones muestrales

Supóngase que se toma una muestra aleatoria de tamaño n,

X1, X2, …, Xn de una población con distribución Normal,

N(m,s2).

Cada observación es una v.a. con distribución N(m,s2)

Entonces la media es una v. a. con distribución

N(m,s2/n)

X

3

Diana Cobos del Angel 27/11/2011

Teorema de Límite Central

Si es la media de una muestra aleatoria de tamaño n que se toma

de una población con media m y varianza s2, entonces, el

estadístico

Se aproxima a una distribución Normal estándar cuando n tiende a

infinito.

Observación: esta aproximación será mejor para n ≥ 30 sin

importar la forma de la población. Si n < 30 la aproximación es

buena sólo si la población no difiere mucho de una distribución

Normal.

X

n

XZ

/s

m

4

Diana Cobos del Angel 27/11/2011

Page 3: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

3

Distribución Ji cuadrada c2

Sean Z1, Z2, …, Zn variables aleatorias con distribución normal

estándar, es decir N(0,1). Entonces

Tiene la función de densidad Ji cuadrada con n grados de libertad

222

2

2

1

1

2 ... nn

n

i

i ZZZZY c

5

Diana Cobos del Angel 27/11/2011

Distribución Ji cuadrada c2 6

Diana Cobos del Angel 27/11/2011

Page 4: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

4

Características de Ji cuadrada c2

Asimétrica y asintótica al eje x por la derecha; Su dominio va de 0 a +

Área bajo la curva desde 0 a + =1 Tiene parámetro = n (g.l.) Al aumentar n se aproxima a la normal Representa distribución muestral de varianza. Entre las aplicaciones: Determinación intervalos confianza para varianzas Pruebas de hipótesis para una varianza El ajuste de datos a una distribución dada conocida Las pruebas de independencia.

7

Diana Cobos del Angel 27/11/2011

Gráficas de Ji cuadrada c2 8

Diana Cobos del Angel 27/11/2011

Page 5: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

5

Distribución Ji cuadrada c2 9

Diana Cobos del Angel 27/11/2011

Probabilidad c2 Excel

=DISTR.CHI(x;)

Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución Ji cuadrada de una sola cola con gl.

P(X>c2)

10

Diana Cobos del Angel 27/11/2011

Page 6: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

6

Probabilidad c2 11

Diana Cobos del Angel 27/11/2011

Probabilidad c2 Inversa Excel

=PRUEBA.CHI.INV(P,)

Devuelve el valor de c2 para una probabilidad dada, de una distribución Ji-cuadrada de una sola cola con g.l.

12

Diana Cobos del Angel 27/11/2011

Page 7: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

7

Ejercicios Ji cuadrada c2

a) Calcular la probabilidad de obtener un valor mayor de

23.7 en una distribución c2 con = 14 g.l., es decir

b) Calcular el valor de c2 después del cual se encuentre el 5 % del área en una distribución Ji-cuadrado con 4 g.l., es decir

)7.23( 2

14 cP

05.0)( 22

4 ccP

13

Diana Cobos del Angel 27/11/2011

Distribución “t” de Student

Desarrollada con base en distribuciones de frecuencia

empíricas por el estadístico William Gosset, cuyo

seudónimo era “Student”.

Gosset trabajó en la Cervecería Guiness de Dublín y

tenía dificultades al usar la distribución Normal en

muestras pequeñas

“The probable error of a mean” Biometrika 1908

Fisher fue quien encontró mas aplicaciones para ésta.

14

Diana Cobos del Angel 27/11/2011

Page 8: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

8

Distribución “t” de Student

La distribución muestral de la media de una muestra aleatoria se ajusta muy bien a la distribución Normal si se conoce s. Si n es grande, esto no presenta ningún problema, aún cuando s sea desconocida, por lo que en este caso es razonable sustituirla por s.

Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas muestras, esto no funciona tan bien, y la distribución que mejor se ajusta es la t de Student.

X

15

Diana Cobos del Angel 27/11/2011

Distribución “t” de Student

Sean Z es una v.a. Normal estándar y V es una v.a. Ji con k grados de libertad. Si Z y V son independientes, entonces la v.a.

tiene una distribución t con n grados de libertad, cuya función de densidad es:

kV

ZT

/

16

Diana Cobos del Angel 27/11/2011

Page 9: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

9

Distribución “t” de Student

Definiendo el estadístico t:

Se puede probar que siendo `x la media de una muestra de tamaño n tomada de una población Normal con media m y varianza s2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1.

t =x -

s / n

m

17

Diana Cobos del Angel 27/11/2011

Distribución “t” de Student 18

Diana Cobos del Angel 27/11/2011

Page 10: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

10

Distribución “t” de Student 19

Diana Cobos del Angel 27/11/2011

Características de la distribución “t”

Tiene media igual 0, es asintótica al eje x y su dominio va de - a +;

El área bajo la curva desde - a + es igual a 1

m 0, s2 depende parámetro (grados libertad)

Varianza > 1, pero se aproxima a 1 cuando n

Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación

Entre las aplicaciones:

Estimación de intervalos de confianza para medias a partir de muestras pequeñas

Pruebas de hipótesis basadas en muestras < 30

20

Diana Cobos del Angel 27/11/2011

Page 11: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

11

Distribución “t” de Student 21

Diana Cobos del Angel 27/11/2011

Distribución “t” de Student

Las tablas brindan sólo los puntos porcentuales de la cola

superior

22

Diana Cobos del Angel 27/11/2011

Page 12: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

12

Probabilidad “t” en Excel

=DISTR.T(x,,colas) Devuelve el área a la derecha de x (a)

x= valor de t (solo positivo)

= grados de libertad

Colas = 1 o 2 colas

colas= 1, P( X>t )

colas = 2, P(|X| > t); P(X > t o X < -t).

23

Diana Cobos del Angel 27/11/2011

Probabilidad “t” Inversa en Excel

=DISTR.T.INV(a,)

Devuelve el valor de t de dos colas, después del cual se encuentra el a x 100% del área de la curva.

P(|X| > t) = P(X < -t o X > t).

Para una cola, remplazar a por 2 a.

24

Diana Cobos del Angel 27/11/2011

Page 13: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

13

Ejercicio distribución “t” de Student

a) Calcular la probabilidad de obtener un valor mayor que 2,26 en una distribución t con 9 gdl

b) Calcular la probabilidad de obtener un valor mayor que 2,26 o menor que -2,26 en una distribución t con 9 gdl

c) Calcular el valor de t después del cual se encuentre el 5% del área de la curva con 9 gdl

d) Calcular el valor de t para a= 0,05 con 9 gdl y dos colas

25

Diana Cobos del Angel 27/11/2011

Distribución "F” de Fisher

Sean W y Y v.a. con distribución Ji cuadrada, independientes con

n1 y n2 grados de libertad respectivamente. Entonces el cociente

Sigue la distribución F con n1= u g.l. en el numerador y n2 = v g.l.

en el denominador y su función de densidad es:

2

1

/

/

nY

nWF

26

Diana Cobos del Angel 27/11/2011

Page 14: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

14

Distribución "F” de Fisher

También llamada "F” de Fisher - Schnedecor

Representa la distribución muestral de la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Ji-cuadradas.

Definimos el estadístico F como:

El cual es el valor de una variable aleatoria que tiene distribución F con parámetros n1 y n2

2

2

2

1

s

s=F

27

Diana Cobos del Angel 27/11/2011

Propiedades de distribución F

Asimétrica, y asintótica al eje x por el lado derecho

Su dominio va de 0 a +

Área bajo curva desde 0 a + =1

Tiene parámetros n1 y n2

Entre sus aplicaciones: Pruebas de hipótesis entre 2 varianzas

Análisis de varianza

Análisis de covarianza.

28

Diana Cobos del Angel 27/11/2011

Page 15: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

15

Gráfica de la distribución F 29

Diana Cobos del Angel 27/11/2011

Propiedades de Distribución F

)4()2(

)2(2)(

2)(

2

2

21

21

2

2

2

2

nnn

nnnFV

n

nFE

30

Diana Cobos del Angel 27/11/2011

Page 16: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

16

Gráfica de la distribución F 31

Diana Cobos del Angel 27/11/2011

Probabilidad F Excel

=DISTR.F(x,1, 2)

Devuelve el área a la derecha de un valor en una distribución F con 1 y 2 g.l.

P( F>x )

32

Diana Cobos del Angel 27/11/2011

Page 17: Estadísticas y distribuciones de muestreo - Diana Cobosdianacobos.com/upload/0c0daf_13_Distribuciones t, Ji y F.pdf · Distribuciones muestrales ... Es decir que se obtiene de la

17

Probabilidad F Inversa Excel

=DISTR.F.INV(a, 1, 2)

Devuelve el valor crítico de F(a) para una distribución F con 1, 2 g.l.

33

Diana Cobos del Angel 27/11/2011

Ejercicios sobre la distribución F

a) Determine la probabilidad de tener un valor de F mayor que 9.28 en una distribución F con 1=3 y 2=3 g.l.

b) Halle la el valor crítico de F(0.05) para 1=3 y 2=15 g.l.

34

Diana Cobos del Angel 27/11/2011