“ Pruebas estadísticas para una muestra” El consumo y producción del pan; Distribución de...

Preview:

Citation preview

“Pruebas estadísticas para una muestra”

 

El consumo y producción del pan; Distribución de fármacos y

placebos

Andrés Cárcamo

Camila López

Tábata Torres

Determinar si la muestra proviene de

una determinada población

Pruebas de bondad de ajuste para una muestra

Prueba Tipo de variable Objetivo

Binomial Cualitativa:

2 valores

Determinar si las diferencias entre las proporciones de cada uno de los 2 valores de la variable y unas determinadas proporciones teóricas son estadísticamente significativas.

Ji- Cuadrdo Cualitativa:

K> 2 valores

Determinar si las diferencias entre las frecuencias de cada uno de los valores de la variable y unas determinadas frecuencias teóricas son estadísticamente significativas.

Datos: Se desea

comprobar el efecto de un medicamento

Muestra de 100 pacientes

80 de ellos son fumadores

Al final solo se obtiene el resultado de 79 de ellos

X= FUMADOR (pacientes fumadores) X1: SI (codificado numéricamente como 1) X2: NO (codificado numéricamente como 2)

Ho: p=p (fumador=1) = 0,8gresarían de la siguiente manera

Utilizando el programa SPSS los datos se ingresarían de la siguiente manera:

Analizar → Pruebas no paramétricas → Binomial (en el cuadro de diálogo)

Contrastar Variables: FUMADORDefinir la dicotomía: Obtener de los datosContrastar proporción: 0,80Aceptar

Y los resultados serían los siguientes

Pacientes Fumadores

Categoría NProporción observada

Prop. De prueba

Sig. Asintot.(bilateral)

Grupo 1 SI 53 0,7 0,80 0,003

Grupo 2 NO 26 0,3

Total 79 1,00

Parámetros de la distribución Binomial:

Hay que comparar el número esperado del primer grupo con el numero observado

Np = 79 x 0,8 = 63,2

Como el p-valor asociado al estadístico de contraste es menor que 0,05 (nivel de significación) se rechazará la hipótesis nula.

Dado que la diferencia entre lo esperado y lo observado es estadísticamente significativo

En este caso no se puede aceptar la muestra, dado que no es representativa de la población objeto.

N= 79

P = pe = 0,8

Datos: Se desea comprobar el

efecto de un tratamiento Muestra de 120 pacientes

que han infarto al miocardio

Pacientes con Infarto con localización anterior o inferior son iguales y el doble de los pacientes con el infarto en localización lateral o posterior

Solo se conoce el resultado de 103 pacientes

X: Infarto (Localización del infarto) X1: Anterior (codificado numéricamente como 1) X2: Inferior (codificado numéricamente como 2) X3: Lateral (codificado numéricamente como 3) X4: Posterior (codificado numéricamente como 4) H0: p1= p (INFARTO =1) = 2/6 p2= p (INFARTO= 2) =2/6 p3= p (INFARTO= 3) = 1/6

p4= p (INFARTO= 4) = 1/6

Y los resultados serían los siguientes:

Localización del infarto de miocardio

Estadísticos de Contraste

Localización del infarto de miocardio

Chi- Cuadrado 0,252

Gl. 3

Sig. Asintot 0,969

N observado N esperado Residual

Anterior 33 34,3 -1,3

Inferior 34 34,3 -0,3

Lateral 17 17,2 -0,2

Posterior 19 17,2 1,8

Total 103

Función de Distribución normal

Función teórica

•D= máx.| Fn (x) – F0(x) |

Interesa probar que no existe diferencia

significativa entre ambas funciones

Contrastes de Normalidad 

•Comprueba

•Verifica

•Hipótesis de normalidad

•Resultados fiables

KGPN

20

Parámetros normales(a,b)

Media6,1450

Desviación típica

1,79428

Diferencias más extremas Absoluta,123

Positiva,123

Negativa-,072

Z de Kolmogorov-Smirnov

,551

Sig. asintót. (bilateral),922

Pruebas no paramétricasPrueba de Kolmogorov-Smirnov para una muestra

a La distribución de contraste es la Normal.b Se han calculado a partir de los datos.

KOLMOGOROV-KOLMOGOROV-SMIRNOV-SMIRNOV-LILLIEFORSLILLIEFORS

KOLMOGOROV-SMIRNOV-LILLIEFORS

Distribución esperada es normal

Conlleva a la obtención de datos mas exactos

Tipificación de datos

Nuevas variables

N Mínimo Máximo Media Desv. típ.KGP

20 3,50 9,70 6,1450 1,79428

LIC

20 1,25 2,27 1,7742 ,29790

N válido (según lista)

20

•Estadísticos descriptivos

Valor observado

10864

Nor

mal

esp

erad

o

2

1

0

-1

-2

Gráfico Q-Q normal de KGP

Valor observado

10864

Des

v. d

e no

rmal

0,4

0,2

0,0

-0,2

-0,4

Gráfico Q-Q normal sin tendencias de KGP

Gráficos de probabilidad normal para la variable ZIC

Valor observado

210-1-2

Nor

mal

esp

erad

o

2

1

0

-1

-2

Gráfico Q-Q normal de Puntua(LIC)

Valor observado

210-1-2

Des

v. d

e no

rmal

0,3

0,2

0,1

0,0

-0,1

-0,2

-0,3

Gráfico Q-Q normal sin tendencias de Puntua(LIC)

Gráficos de probabilidad normal para la variable ZLIC

Pruebas de Rachas

•Pruebas de Autocorrelación

La prueba de rachas sirve para determinar si una muestra de observaciones es o no aleatoria.

O sea si son independientes entre si.

• Por ejemplo : Lanzamos una

moneda

Y resulta

CCCXCCXXXC

•Donde

•CCC X CC XXX C

•Equivalen a 5 rachas

•5•4•3•2•1

En este caso tomamos la producción del pan

Donde se usan las formulas:

•Con un grado de significación del 0,05.

La hipótesis nula de este problema es que la cantidad de pan comprado

posee una distribución

aleatoria de gente que compra más de 5.9 kg de pan semanalmente.

Acá trabajando con la base de datos del número de kilos comprados semanalmente

Se obtiene:

KGPValor de prueba(a)

5,90

Casos < Valor de prueba

10

Casos >= Valor de prueba

10

Casos en total

20

Número de rachas

10

Z

-,230

Sig. asintót. (bilateral)

,818

Para poder contrastar la hipótesis nula se tiene que cumplir con esta condición

α > Sig. Asintot. (bilateral)

•¡LA HIPÓTESIS NO SE PUEDE CONTRASTAR!

La autocorrelación surge cuando los términos de error del modelo no son independientes entre sí

•Por ejemplo: E(uj;ui) ≠ 0 para todo i≠j . Los errores se vincularían entre si.

En este tipo de prueba se trabaja con

Con α = 0.05

• Supóngase que en una panadería se sospecha que el número de

personas que compran pan varía en función a día de semana, por lo que según el día, el n° de kilos de

pan cocinados pueden ser deficientes o excesivos. Con el fin de elaborar un numero de kilos de

pan eficientes, se observa, a lo largo de 2 semanas, el n° de

personas que acuden a comprar el pan, para comprobar si lo que

ocurre es independiente de lo que se haya ocurrido en los días

anteriores se aplicará la prueba de autocorrelación.

• Supongamos que se dispone de una muestra de una población y que, sobre cada individuo de la

muestra, se mide una variable en escala de intervalo o de razón X.

Con una base de datos de: días en cual se compra el pan, y numero de kilos por día comprado se obtiene un grafico así:

panaderia

0

10

20

30

40

50

60

70

Lunes

Marte

s

Mierco

les

Jueves

Viernes

Sabado

Domingo

Dias de semana

Kilo

s de

pan

Primera semana Segunda Semana

Y con el programa SPSS se obtiene el siguiente resultado:

Con un total de 20 casos

Se obtiene un valor De “Auto-Corr. > α”

•¡LA HIPÓTESIS NO SE PUEDE CONTRASTAR!