37
ENSAYO DE HIPOTESIS ENSAYO DE HIPOTESIS Generalidades Errores tipo I y II Región de rechazo Curva característica/de potencia de un ensayo Relación entre ensayo de hipótesis e IC Relación entre ensayo de hipótesis e IC Otra forma de reportar un ensayo Ejemplos de distintos ensayos Muestras apareadas Teorema de Slutsky Autor Dr. Hernán Rey Ultima actualización: Junio 2010

ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Embed Size (px)

Citation preview

Page 1: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

ENSAYO DE HIPOTESISENSAYO DE HIPOTESIS

Generalidades Errores tipo I y II Región de rechazo Curva característica/de potencia de un ensayo Relación entre ensayo de hipótesis e IC Relación entre ensayo de hipótesis e IC Otra forma de reportar un ensayo Ejemplos de distintos ensayos Muestras apareadas Teorema de Slutsky

AutorDr. Hernán Rey

Ultima actualización: Junio 2010

Page 2: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación hecha sobre el valor de uno o más parámetros poblacionales, sobre la forma específica de la distribución de una determinada característica, sobre la independencia (o correlación) de distintas variables, sobre mejoras introducidas (por ej. en tratamientos o procesos), etc.

GENERALIDADES

En principio se establece una hipótesis nula (H0) y se analiza si la información estadística obtenida es suficiente o no para información estadística obtenida es suficiente o no para rechazarla. Por otro lado, se define la hipótesis alternativa (H1), que sería la afirmación a “aceptar” cuando la H0 es rechazada. El resultado del test puede ser “rechazar H0 en favor de H1” o “no rechazar H0” (también puede “no hacerse nada” y pedir más datos antes de decidir)

A veces también se dice que hayevidencia estadística significativaen contra de H0 o que no la hay.

Page 3: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Rechazar una hipótesis es más fuerte que no hacerlo. Por ello, suele usarse como H0 a la hipótesis que uno desea rechazar. Hay también un compromiso respecto a la simplicidad (por ej. es más simple el cálculo asumiendo que dos cosas son iguales a que son distintas)

El no rechazo de HEl no rechazo de H00 no implica que sea ciertano implica que sea cierta.Simplemente no se cuenta con evidenciasuficiente para rechazarla a favor de H1.

EN UN TEST NO SE HACE UN JUICIO DE VALORLOGICO (VERDADERO O FALSO)

Para tomar la decisión, se utiliza la información de una muestra de la población. Debido a la naturaleza aleatoria de la muestra, es de esperarse que uno pueda cometer errores al tomar la decisión. El test permite cuantificar dichos errores.

Error tipo I

0

0

es V

rechazar HP

H

Error tipo II

0

0

es F

no rechazar HP

H

0

0

rechazar HP

H

0

1

no rechazar HP

H

Si el test es sobre un parámetro de una VA.

NO CONFUNDIRSE CON LA NOTACION ( no es VA)

Page 4: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Dado n, ambos errores tienen una relación inversa (↑ q ↓ )

La “gravedad” de cada error es relativa al problema.

H0: “Cierto producto es bueno”

Si es bueno y no lo compro () quizás no es tan grave como

H0: “Un misil viene hacia nosotros”

Si no disparo y el misil existía () es más grave que si disparo y no quizás no es tan grave como

comprarlo y que sea malo () es más grave que si disparo y no había nada ().

Hay infinitos tests (reglas de decisión) que medan nivel (distintos estadísticos, distintosintervalos para un mismo estadístico, etc),

pero tendrán diferentes niveles . Para un fijo,quisiera el que me da el amás pequeño.

Page 5: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

1) Se presume inocente hasta que se “pruebe” lo contrario

2) Se presenta evidencia

3) Las pruebas deben ser “más allá de una duda razonable”

4) El resultado es “culpable” o “no culpable”

EJEMPLO: SISTEMA LEGAL

5) Los errores que pueden cometerse son:

- Declarar culpable a una persona que es inocente (tipo I)

- Declarar no culpable a una persona que es culpable (tipo II)

Una persona políticamente de derecha no tolera el error tipo II mientras que la de izquierda no tolera el tipo I. Si se analizan las políticas sociales, sucede lo contrario.

Page 6: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Para analizar la muestra y tomar una decisión se utiliza un estadísticoestadístico. Su elección depende de la forma de H0 y de la información sobre la población que se está estudiando. Notar que los pivotes usados para construir intervalos de confianza pueden usarse aquí para testear hipótesis sobre los respectivos parámetros .

En base al estadístico, se puede evaluar los errores cometidos al usar una regla arbitraria, o se construye la región crítica (o de rechazo) para satisfacer cierta condición sobre los errores. La región crítica es un conjunto de valores tales que si el valor del estimador para la muestra tomada pertenece a dicha región, se decide rechazar H0.tomada pertenece a dicha región, se decide rechazar H0.

Dicha región está delimitada por el/los valor/es crítico/s. También puede obtenerse a partir de una optimización de una función que evalúe las consecuencias/costos asociados a la aparición de cada uno de los errores.

La región crítica y la evaluación de los errores son independientesdel resultado de una muestra (forman parte del diseño del test).

En varios casos prácticos, si no se rechaza H0 se rehace el test con una nueva muestra (de ser posible). En general, el aumento del tamaño muestral tiende a mejorar ambos errores.

Page 7: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Las hipótesis a testear pueden ser simples o compuestas. En gral., la hipótesis H0 es que apertenece a A, que es un subconjunto cerrado (contiene a su frontera) de los reales. Si A tiene un sólo elemento 0, entonces la hipótesis es simple. Si no, es compuesta.

En el caso de hipótesis simples, el error tipo I está definido según:

0

0

rechazar HP

Respecto al error , en este caso se obtiene una curva ya que hay una probabilidad de no rechazo para cada valor distinto de 0.

Para calcular Para calcular o o se requiere que la distribución del estadístico se requiere que la distribución del estadístico esté totalmente especificadaesté totalmente especificada. Si la H0 es compuesta, se calculará un distinto para cada uno de los valores de que se incluyen en H0 y un para cada uno de los valores de que se incluyen en H1

Al mayor de todos los se lo llama nivel de significancia (NS) del test y lo notaremos 0. OBSERVAR QUE EN LA BIBLIOGRAFIA TAMBIEN SE USA PARA REPORTAR ESTE VALOR (esto es estrictamente correcto sólo si H0 es una hipótesis simple)

valor distinto de 0.

Page 8: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Si pertenece a H1, pot()=1-()

A la hora de reportar los riesgos de un test se suele presentar la curva de potencia:

0 ( )

rechazar Hpot P

Si pertenece a H0, pot()=()

Si pertenece a H1, CCO()=()

o la curva característica de operación (CCO):

0 ( )

no rechazar HCCO P

Si pertenece a H0, CCO()=1-()

( ) 1 ( )CCO pot ( ) 1 ( )CCO pot

En la práctica, puede que me convenga usar unaregla arbitraria (por ej. porque consigo gratis un

equipo que la ejecuta) si es que los errores que ellaprovoca no son críticos para el problema a resolver.

Un ensayo de “buena calidad” es aquel cuya CCO toma valores altos si H0 (lo ideal sería 1) y bajos si H1 (lo ideal sería 0).

Un ensayo de “buena calidad” es aquel cuya pot toma valores bajos si H0 (lo ideal sería 0) y altos si H1 (lo ideal sería 1).

Page 9: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Típicamente los ensayos son a dos colas (bilaterales). Se realiza a una cola (unilateral) sólo si hay evidencia clara de que los valores a testear aparecen en una semirecta incluida en el espacio paramétrico(por ej. se quiere que una tasa de defectuosos se encuentre por debajo de un cierto valor; allí puedo testear a una cola).

EJEMPLO (media con varianza conocida)0 : 3H b

1 : 3H b

3

/XZ

XM

n

NS = 0.05 n = 10 X = 1

0

3

rechazar 1/ 10 es V

cZ c

Xz

H M zP P P

H H H b b b

0 0 0 es V

P P PH H H

b b b Si X raya es

aprox. normal

0

3

1/ 10 1/ 10c

Xz

PH

b b

b b

Z~N(0,1)

Decrece con b para b>3

0 3 q 0.05 1.64cz zq -4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

z

f Z(z

)

Page 10: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

0.053

1/ 10

cx z

1.64 1/ 10 3 2.48cxq

0 0

1/ 10 1/ 10c

X c

xX

M xP P

H H

bb

b b b

Otra opción XM X

0 3 q

0.8

1

1.2

(x r

aya

)

0.03

0.035

0.04

0.045

0.05

b)

Z~N(0,1)

Decrece con b para b>3

2 2.5 3 3.5 40

0.2

0.4

0.6

x raya

f X r

aya(x

ra

ya

)

Si el valor muestral de MZ es menor a -1.64, rechazo H0 con NS=0.05

Si el valor muestral de MX es menor a 2.48, rechazo H0 con NS=0.05

o

3 3.2 3.4 3.6 3.8 40

0.005

0.01

0.015

0.02

0.025

b

( b

Page 11: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

De la otra forma,

0.05

331/ 10 1/ 10 1

1/ 10

cX

zCCO P z

b bb

b b

s

0

3

no rechazar 1/ 10b b b b

s s

cZ c

Xz

H M zCCO P P P

1/ 10 1/ 10

bb

b b b

s s

c

X c

xX

M xCCO P P 1

1/ 10

bb

cxCCO

1 1.5 2 2.5 3 3.5 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

b

CC

O( b

)

0

Vemos que en este caso, tantola regla como la evaluación

de los errores pueden hacerseen base a un estadístico que

toma valores sobre la Zestándar o la variable X raya

1/ 10 Reemplazando xc raya se llega a la expresión en base a MZ

Page 12: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

a) Definir una región crítica arbitraria, fijar un n y evaluar la pot o CCO.

b) Fijar n y 0, hallar una región crítica que me garantice el nivel 0

y evaluar la pot o CCO.

Diferentes posibilidades en el diseño de un test

c) Fijar 0 y para determinado/s valores de y luego hallar una región crítica y un tamaño muestral n que satisfagan lo pedido y evaluar la pot o CCO.

d) Fijar n y para determinado/s valores de y luego hallar una región crítica que satisfaga lo pedido y evaluar la pot o CCO.

Luego de diseñado el test se toma una muestra y se evalúa el valor del estadístico en la regla de decisión. Si pertenece a la región de rechazo, se rechaza H0 con nivel 0. Si no se rechaza, se deben evaluar los errores para ver qué decisión conviene tomar (si los son muy altos quizás no me conviene aceptar la hipótesis)

región crítica que satisfaga lo pedido y evaluar la pot o CCO.

Cuando se tienen los valores muestrales, estos deben ser examinados en busca de posibles outliers (datos “atípicos”), que pueden aparecer por diferentes procesos presentes durante el muestreo. La alternativa es el uso de estadísticos robustos frente a la presencia de outliers.

Page 13: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Si H0 no puede ser rechazada, tampoco puede concluirse que es cierta. Supongamos que la H0 es b=0, y los datos muestrales son consistentes con la hipótesis. Entonces casi seguro también lo serán con la hipótesis b=0.001 o b=-0.001.

Hay que ser cuidadosos en ensayos de igual contra distintoSi ensayamos b=0 contra b≠0, cuanto más grande sea

el tamaño muestral, si se usa un NS fijo, la región críticaes cada vez más angosta (y centrada respecto a 0).

Si bien el lugar común es que un ensayo “mejora” alSi bien el lugar común es que un ensayo “mejora” al

RELACION ENTRE ENSAYO DE HIPOTESIS E IC

Si el IC con 1-0 de confianza ESTA incluido en la H1, la hipótesis nula PUEDE ser rechazada con NS = 0.

Si el IC con 1-0 de confianza NO está incluido en la H1, la hipótesis nula NO puede ser rechazada con NS = 0.

Si bien el lugar común es que un ensayo “mejora” alSi bien el lugar común es que un ensayo “mejora” alaumentar aumentar nn, esto puede no ser cierto desde un punto, esto puede no ser cierto desde un puntode vista ingenieril (podría rechazar la hipótesis si sede vista ingenieril (podría rechazar la hipótesis si se

desvía sólo un 1% del valor real)desvía sólo un 1% del valor real)

El ensayo e IC deben hacerse de manera congruente (a 1 ó 2 colas)

Page 14: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

OTRA FORMA DE REPORTAR UN ENSAYO DE HIPOTESIS

Una vez que se ha tomado la muestra y evaluado el estadístico (arrojando un valor pico muestral), calcular el valor p, que representa la probabilidad de que la VA pico tome un valor más alejado del valor pico muestral (en la dirección consistente con H1).

Si p aNS, se rechaza H0 y el resultado es estadísticamente

El p valor es entonces el menor para el que se hubiese rechazado H0

(en base a la muestra que se observó). Si el test es bilateral, el p valor surge de plantear que pico supere en módulo a pico muestral.

Si p aNS, se rechaza H0 y el resultado es estadísticamente significativo. Como p es tan chico, ocurrió un suceso muy improbable (con H0 verdadera) o H0 es falsa.

Si p > NS, no se rechaza H0 y el resultado no es estadísticamente significativo. En estos casos puede buscarse nueva evidencia que permita rechazar H0

En general es mejor reportar el p obtenido y no sólo si fue mayor o menor a NS (si NS=0.05, no es lo mismo p=0.049 que p=0.001; cuanto menor sea p es “más difícil” cometer un error tipo I)

Page 15: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Se asume que la población es normal

EJEMPLO (media con varianza desconocida)

0 : 3H b

1 : 3H b

3

/Xt

XM

S n

NS = 0.05 n = 10

0

0 0 0

3

rechazar / 10 es V

ct c X

Xt

H M t SP P P

H H H b b b

Z~N(0,1)

0

0 0t

n X nn X n X n

M

b b bb b b b

N(m,1)

0.051, 0 1.83c nt t

mq

t-student no central de parámetro m

Regla: Si el valor muestral de Mt es menor a -1.83, rechazo H0 con NS=0.05

2

2

1 1

1

tX X X

MS S n S

n

2n-1

01,n

X

n Xt

S

b m

La acumulada hasta t0 decrece cuando crece maes

decir, cuando crece b, Pero si m=0, la t no central es igual a la t “común”

Si se usara como valor crítico a z=0.05= -1.645, el NS sería de 0.067 (34% más)

0n b b

m

Page 16: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

-6 -4 -2 0 20

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

m

CC

O( m

)

0 0.5 1 1.5 2 2.5 30

0.005

0.01

0.015

0.02

0.025

0.03

0.035

0.04

0.045

0.05

m (proporcional a b, con m=0 sii b=b0)

Err

or

tipo

1 (

( m

))

t cM tCCO P

s m m

-6 -4 -2 0 20

m

b H0b H1

3

/ 10c

X

Xt

SP

s

m

0

En este caso, tanto la regla como la evaluación de loserrores DEBE hacerse sólo a partir del estadístico

con distribución t-student. Esto pasa porqueX raya no puede desacoplarse de la VA SX.

Page 17: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Cálculo de n para y dados

4.8X 0 : 30H b

1 : 30H b s

NS = 0.05

(31) = 0.05

0.0530

cX xP NSb

0.9530

1.64494.8 /

cx zn

31 0.0531

cX xP b

0.0531

1.64494.8 /

cx zn

30.5cx 249.3569 250n n q

0.0498 31NS q

Page 18: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

EJEMPLO

El tiempo (en hrs.) T de duración de un tubo de luz es exponencial de parámetro . Debido a la naturaleza destructiva del ensayo, se decide tomar un único valor muestral (n=1). Según las especificaciones, la producción es correcta si 1/40. Como tampoco se puede esperar demasiado tiempo para tomar una decisión, el jefe de planta dice: “Se elige un tubo al azar, se lo enciende y si luego de 1 hora de funcionamiento aun no se rompe, entonces se continua la producción; si no, se para la producción para recalibrar las máquinas. Evaluar las consecuencias de usar esta regla.

0 : 1/ 40 H

1 : 1/ 40 sHtM T

0no rechazar 1 s

tH M

CCO P P e

consecuencias de usar esta regla.

tM Exp

Page 19: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

0 0.5 1 1.5 2 2.5 3

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

CC

O(

)

0.84

0.86

0.88

0.9

0.92

0.94

0.96

0.98

1

CC

O(

)

Vemos que con 1/40, la probabilidad deparar la producción cuando se hallaba dentro

de las especificaciones es muy baja. Sinembargo, hay alta probabilidad de no detenerla

cuando se halla fuera de norma (>1/40)

0 0.05 0.1 0.15 0.20.82

H0 H1

Page 20: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

EJEMPLO

0 : 5H a

1 : 5sH a

XM X

Se tiene una población U[a,a+1]. Se quiere testear si a5 contra su complemento. Se toman n muestras. Elija un estadístico, fije el NS y evalúe la CCO.

Q, 1XM U a aa

q 1n

0.05NS

0

0 0

0 1rechazar

1 1

1

s Ds D c

cX c

c c

c

x aH M x

a P P a x a x aa H a H

x a1D c cx a

Decrece con a para a<5 0 5 q :5 1 0.05 c cx x 5.95q cx

Si el valor muestral de MX es mayor a 5.95, rechazo H0 con NS=0.05

0no rechazar 5.95XH MCCO a P P

a a

l l 4.95 5.95 4.95 5.95a a a 1 1

Page 21: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Si aumento el n, con n>5 puedo aproximar X raya por una normal.

0.5,1/ 12XM N a na

q

0 5 q Z~N(0,1)Crece cuando a disminuye desde 5

0 0

0.5 0.5

1/ 12 1/ 12

c

X c

X a x a

M x n na P Pa H a H

s s

0.955.5

1/ 12

cx zn

1.64 / 12 5.5x nq

0

0.5 0.5

no rechazar 1/ 12 1/ 12

cX a x a

H n nCCO a P Pa a

Si el valor muestral de MX es mayor a xc, rechazo H0 con NS=0.05

1.64 / 12 5.5cx nq

0.5

1/ 12

cx aCCO a

n

q

Page 22: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1C

CO

(a)

MX (n = 1)

MX (n = 10)

MX (n = 100)

El incremento de n mejora loserrores para un mismo NS

4

4.5

5n = 5

a = 4

a = 4.5

a = 5

4.8 5 5.2 5.4 5.6 5.8 60

0.1

a

Si ahora se propone como estadístico el mínimo de los n valores muestrales,

0

s m cM m

a Pa H

minm nM X4 4.5 5 5.5 6

0

0.5

1

1.5

2

2.5

3

3.5

x

f Xm

;a(x

)

l 1

; 1 1m

nM af x n x a a x a

q 1

0 5 q 6

; 5 0.05m

cM amf x dxq

Page 23: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

0no rechazar m cH M mCCO a P P

a a

Si el valor muestral de Mm es mayor a mc, rechazo H0 con NS=0.05

6 0.05n

cmq 1

6 0.05 ncmq

1 1n

ca m

l l 1

1 1 1cm n

c c caa m n x a dx m a m

1 1

0.9

1

Mm

(n = 1)

Mm

(n = 10)

4.8 5 5.2 5.4 5.6 5.8 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

a

CC

O(a

)

Mm

(n = 10)

Mm

(n = 100)

MX (n = 10)

MX (n = 100)

El estadístico delmínimo es similar al deX raya con n moderado

y mejora aun máslos errores

cuando n es grande

Page 24: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

EJEMPLO

0 : 0.5H p

1 : 0.5H p 1

1 np ii

M X Xn

NS = 0.05 n = 50

0

0 0

ˆrechazar es V

p cM pHp P P

H p H

0 0.5 q

0

ˆ50

1 / 50 1

p cM p p p

p p p pp P

p H

Si n es grande tal que

Xi ~ Ber(p)

Z~N(0,1)

0

0.051 1

ˆ 0.38422 50

q cp z

Q

ˆ

ˆ 0,1 , ( ) 0,11

cc

p pp h p p

p p

es una función decreciente de

Teorema:

(derivar h(p) respecto de p y verificar que es negativa)

Por otro lado, como Mp converge a p:

1 21 2

, 1np pM M

p p Pp p

1 2

ˆ ˆp c p cM p M pP P

p p

q

Si n es grande tal que min(np,n(1-p)) >5

Page 25: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

ˆ50

ˆ ˆ1 / 50 150

1

p c

p c c

M p p p

M p p p p p p pCCO p P P

p p p p

s s

EJEMPLO0 : 1/ 3H p

1 : 1/ 3H p 1

n

R ii

M X

NS = 0.05 n = 10

0 1 2

0

rechazar 1

es V 1/ 3RH m M m

p P PH p

0 1/ 3 q

Si bien puede haber varios pares m1,m2, buscaremos m1 como el mayor fractil que acumula a lo sumo 0.025 en una binomial(n,p=1/3) y

Xi ~ Ber(p)

1 0mq

Q 00 7,10 0.037RM H NS , rechazo con Si

1 2; 2 ; 1R R

RM p M p

m M mCCO p P F m F m

p

mayor fractil que acumula a lo sumo 0.025 en una binomial(n,p=1/3) y m2 como el menor que acumula al menos 1-NS+FMR

(m1). ; 1/3 1 0.104

RM pF ; 1/3 0 0.0173RM pF

; 1/3 6 0.9803RM pF ; 1/3 5 0.9234

RM pF 2 6mq

; 1/31 0 0.9673RM pNS F q

Page 26: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

CC

O(p

)

0.25

0.5

0.75

0.9631

Si bien no se nota bien en la figura,para p entre 0.314 y 1/3 hay (ligeramente)menos potencia que en 1/3. Para mejorar

el test, se requiere mayor n o empeorar el

p0 1/6 1/3 1/2 2/3 5/6 10

0.25

Page 27: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Test de diferencia de b’s asumiendo ’s iguales desconocidos

Asumiendo poblaciones normales, se puede usar el estadístico:

1 2 1 2

2

1 2

1 1t

P

X XM

Sn n

b b

2 21 1 2 22

1 2

1 1

2P

n S n SS

n n

1 2 2n n tM t

Test de 2 de una población normal con media desconocida

21n S 22

20

1n S

q 1n Se puede plantear el estadístico S2

Se puede plantear el estadístico

2122

S

S1 1 1n

2 2 1n 1 2

2 21 2

,2 21 2

S SF

q

Test de cociente de de normales independientes

Page 28: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Test de diferencia de “p” de poblaciones independientes

0 1 2: 0H p p 1 1 2: 0H p p

1 2 1 2

1 21 1 2 2

ˆ ˆ0,1

, 1 1

P P p pM Np p p p p p

n n

q

1 2 1 1 2 2

ˆ ˆˆ R R n P n PP

n n n n

1 1 1 1min ; 1 5n p n p

2 2 2 2min ; 1 5n p n p

p =p

1 111

1 1

ˆ 1,p pP

N pp n

2 222

2 2

ˆ 1,p pP

N pp n

1 2n n

1 2 1 2

Pn n n n

Si quisiera testear p1-p2=0.2 hay muchos pares (p1,p2) que lo cumplen y no puedo simplificar a M

1 2

1 2

ˆ ˆ0,1

1 1ˆ ˆ1

P PM N

P Pn n

q

p1=p2

Tampoco puedo plantear una CCO para distintos valores de p1-p2. Sin embargo, definida ya una regla, si podría calcular la probabilidad de aceptar la H0 para dos valores de p1 y p2 particulares.

Con M~N(0,1) puede definirse una regla que tenga el NS deseado

Page 29: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Cuando se comparan medias o proporciones y se obtiene un pvalor muy pequeño esto indica fuerte evidencia de que los parámetros no son iguales, pero no indica qué tan diferentes son. Para ver qué tan diferentes son habría que mirar por ej., el IC.

MUESTRAS APAREADASEn este caso se desea comparar la media de dos poblaciones DEPENDIENTES. En particular, se asume que los valores muestrales se obtienen de a pares y las diferencias entre pares siguen una distribución normal. Luego, puede usarse un estadístico t-student para testear si dichas diferencias son significativas (la idea principal es que si hay covarianza positiva entre los valores del par, la diferencia verá si hay covarianza positiva entre los valores del par, la diferencia verá su varianza disminuida, mejorando la potencia del test)

Si las diferencias no fueran normales, puede usarse el Wilcoxon signed-rank test (test no paramétrico). Hablando de tests no paramétricos, el test de Kolmogorov-Smirnov puede usarse para evaluar si un conjunto de datos proviene de una distribución normal.

Los casos típicos involucran apareamientos temporales (antes vs. después), espaciales (lugar 1 vs. lugar 2). En cada condición se toma un valor muestral “apareado” (si se tomaran más valores, se usa un enfoque del tipo ANOVA (analysis of variance)).

Page 30: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

EJEMPLO

PacienteDroga A

(X)Droga B

(Y)Diferencia (W=X-Y)

1 1.9 0.7 1.2

2 0.8 -1.6 2.4

3 1.1 -0.2 1.3

4 0.1 -1.2 1.3

5 -0.1 -0.1 0.0

Horas adicionales de sueño Se quiere testear (0=0.01) si hay diferencia significativa entre los efectos de ambas drogas.

a) Se asume que los datos de cada columna tienen distribución normal

La ultima columna es entonces una muestra de 10 valores de una 5 -0.1 -0.1 0.0

6 4.4 3.4 1.0

7 5.5 3.7 1.8

8 1.6 0.8 0.8

9 4.6 0.0 4.6

10 3.4 2.0 1.4

2.33x

2.002Xs

0.75y

1.789Ys

1.58w

1.23Ws

de 10 valores de una población normal.

0 : 0b WH

90

4.062/ 10W

wt

s

9 4.062 0.0028P T p s

9,1 /2 0.995 3.25t

Page 31: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Se concluye que hay diferencias significativasentre ambas drogas ya que si fueran iguales, elevento observado es de muy baja probabilidad.

Si se usara un estadístico Z en vez de t, elvalor de p que se obtendría sería 0.00005. Se

ve que se exagera la significanciay la aproximación no es buena con n=10

Page 32: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

EJEMPLO

PacienteDroga A

(X)Droga B

(Y)Diferencia (W=X-Y)

1 1.9 0.7 1.2

2 0.8 -1.6 2.4

3 1.1 -0.2 1.3

4 0.1 -1.2 1.3

Horas adicionales de sueño b) Se toman las columnas X e Y como independientes y normales con igual .

En este caso testeamos si hay diferencia entre bX y bY.

0 : 0X YH b b

0X YT

5 -0.1 -0.1 0.0

6 4.4 3.4 1.0

7 5.5 3.7 1.8

8 1.6 0.8 0.8

9 4.6 0.0 4.6

10 3.4 2.0 1.4

2.33x

2.002Xs

0.75y

1.789Ys

1.58w

1.23Ws

18 2.63t

18 1.861 0.017P T s

182 2

0

20X Y

X YT

S S

18,1 /2 0.995 2.88t

Page 33: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

En este caso, con nivel de significancia 0.01, sedebe concluir que no hay diferencias significativas

entre ambas drogas; al revés que en el caso a).

EN REALIDAD EL ESQUEMA b) NO ESTA BIEN !!EN REALIDAD EL ESQUEMA b) NO ESTA BIEN !!LOS DATOS DE LOS DATOS DE XX E E YY SON DE LOS MISMOSSON DE LOS MISMOS

10 PACIENTES, VIOLANDO SEGURO LA HIPOTESIS10 PACIENTES, VIOLANDO SEGURO LA HIPOTESISDE INDEPENDENCIA. Se trata de un claro casoDE INDEPENDENCIA. Se trata de un claro casoDE INDEPENDENCIA. Se trata de un claro casoDE INDEPENDENCIA. Se trata de un claro caso

de muestras apareadasde muestras apareadas

Si se cumplen las hipótesis de b), se cumplen las de a).Sin embargo, esto no implica que ambos tests arrojensiempre los mismos resultados. Si alguno de ellos da

diferencias significativas, entonces se rechaza H0.

Page 34: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Si la población es normal

EJEMPLO20 : 2H

21 : 2H

21

2

n SM

NS = 0.05 n = 10

2

222 0

2 20 0 0

1rechazar 2

es V

cc

n SMH

P P PH H H

2 21, 0.05 3.33c n q

2

22 22

20

1 2c

n S

PH

decrece para 2>2, entonces 0 se calcula con 2=2

0.1

Si el valor muestral de M

es menor a 3.33, rechazo H0 con NS=0.05

0 5 10 15 20 250

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1

2

f M

( 2)

Page 35: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

2 2

2 2 222 2

1 1 c

s c

n S n s

M sCCO P P

s s

decrece para 2>2, entonces 0 se calcula con 2=2

2 2

2 2 222 2

0 0

1 1 c

s c

n S n s

M sP P

H H

2 21, 0.05

20.74

1

c ns

n

q

2sM SOpción 2

Si el valor muestral de MS es menor a 0.74, rechazo H0 con NS=0.05

1

2 2.5 3 3.5 4 4.5 50

0.005

0.01

0.015

0.02

0.025

0.03

0.035

0.04

0.045

0.05

2

Err

or

tipo

1 (

(

2))

0.5 1 1.5 2 2.5 3 3.5 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

2

CC

O(

2)

Page 36: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Si la VA Si la VA WWnn converge a una VA converge a una VA WW con distribución normal (por TCL), y con distribución normal (por TCL), y la VA la VA YYnn converge en probabilidad a una constante converge en probabilidad a una constante cc, entonces , entonces WWnnYYnn

converge a converge a cWcW y y WWnn//YYnn converge a converge a W/cW/c (esto último, con (esto último, con cc≠0), ambas ≠0), ambas con distribución aproximadamente normal.con distribución aproximadamente normal.

Teorema de SLUTSKY (caso particular)

Este teorema nos interesa porque permite mostrar que la mayoría de los estadísticos que hemos visto aquí tendrán asintóticamente una distribución normal aun cuando la población no sea normal.

Ejemplo: Xi es una VA con cierta distribución, con media bX y desvío Ejemplo: Xi es una VA con cierta distribución, con media bX y desvío estándar X

/X

XnX

MS n

b

1

1 n

n i Xi

W Xn

b

q

XnS

Yn

q Xp

nY cn

0, XDnW W N

n

0,1Dn

nn

WM M N

Yq

converge en distribución

converge en probabilidad

Page 37: ENSAENSAYO YO DE HIPOTEDE HIPOTESISISSmaterias.fi.uba.ar/6109R/clases_teoricas/14-Ensayo_de...Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una afirmación

Clasificación (evaluación de errores con regla fija)

0 0:H

1 1:H

Se conoce la distribución paramétrica de la población X, dependiente del valor desconocido

Si se conoce una regla de decisión, basada en un estadístico del cual se conoce (o deduce) su distribución paramétrica (dependiente del valor de ), pueden entonces evaluarse los errores.

EJEMPLOSe cuenta con una moneda. A dice que es legal. B la sostiene y afirma Se cuenta con una moneda. A dice que es legal. B la sostiene y afirma que la probabilidad de cara debe ser 0.7. Si se decide tirar la moneda 10 veces y darle la razón a B si se observan más de 6 caras, evalúe los errores asociados a dicha regla.

: 0.5AH p

: 0.7BH p

; 0.5darle la razon a B 6 1 6

A tiene razon 0.5 R pRP P F

p

s

; 0.7darle la razon a A 6 6

B tiene razon 0.7 R pRP P F

p