39
CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Embed Size (px)

Citation preview

Page 1: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

CONTENIDOS

Distribución normal

Teorema del límite central

Nivel de significancia

Taller práctico

Page 2: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿Qué es normal, o qué se aparta de la normalidad?

Para establecer los límites entre lo habitual y lo raro, es necesario conocer la distribución de la variable en estudio, en individuos normales.

Las frecuencias de escalas de intervalos continuos se representan gráficamente con histogramas.

La suma de las superficies de todas las barras equivale al 100% de las observaciones.

Page 3: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

HISTOGRAMA

Eje horizontal: valores hallados para una determinada variable

Eje vertical: número

de casos encontrados para cada valor o frecuencia de aparición

El histograma permite obtener una primera impresión visual sobre la distribución de los datos

Page 4: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Distribución normal

La mayor parte de los fenómenos del comportamiento humano se comportan de la siguiente manera:

La mayoría de las puntuaciones se concentran en el centro de la distribución

Tanto en el extremo inferior como en el superior, encontraremos sólo algunos casos

Ejemplo: Distribución del coeficiente intelectual de las personas: Pocas personas presentan déficit o retardo Pocas personas son genios La mayoría somos personas medianamente inteligentes

Page 5: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico
Page 6: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

•La distancia entre la línea trazada en la media y el punto de La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación estándarinflexión de la curva es igual a una desviación estándar

•La distribución queda completamente definida por el La distribución queda completamente definida por el promedio y la desviación estándar:promedio y la desviación estándar:

El promedio El promedio ± 1 D.E = 68,3% de los casos.± 1 D.E = 68,3% de los casos.El promedio El promedio ± 2 D.E = 95,4% de los casos.± 2 D.E = 95,4% de los casos.El promedio El promedio ± 3 D.E = 99.7% de los casos± 3 D.E = 99.7% de los casos..

Page 7: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Gráfica de una distribución normal y

significado del área bajo la curva.

Page 8: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Valores de tensión arterial sistólica en una muestra

de 1000 pacientes isquémicos ingresados en UCI.

Page 9: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico
Page 10: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Histogramas y gráficos de probabilidad normal de los valores de peso y edad en

dos muestras de pacientes.

Page 11: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

•Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,...

•Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.

•Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.

•Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio,...

•Errores cometidos al medir ciertas magnitudes.

•Valores estadísticos muéstrales, por ejemplo : la media.

•Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...

La importancia de la distribución normal se debe principalmente a que haymuchas variables asociadas a fenómenos naturales que siguen el modelo de la normal

Page 12: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Cálculos de áreas bajo la curva

Page 13: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Probabilidad de Ocurrencia

Supongamos que frente a una determinación de glucosa en la sangre tengamos que definir si este valor es normal o no.

Aceptemos que la glucosa sanguínea tiene una distribución normal con promedio 83 y desviación estándar 4

Supongamos un paciente con glucosa de 90, para determinar si es habitual tener ese valor , o superior, debemos conocer la probabilidad con que esto ocurre

Page 14: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Probabilidad de Ocurrencia

Para calcular el área bajo la curva, lo cual corresponde a la probabilidad de ocurrencia, se han construido tablas de áreas de la normal.

Esta tabla se trabajo, con el concepto de curva normal estandarizada => media = 0 y S = 1

Para poder usar estas tabulaciones es necesario transformar la variable original en que están todos los datos de manera que su promedio y su desviación estándar tengan esos valores.

Page 15: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

• Para calcular probabilidades con variables que siguen una distribución normal se usan tablas

• Pero sería imposible tener una tabla para cada posible distribución normal,

• Solamente tenemos la tabla de la distribución normal estándar.

• Necesitaremos, pues, ser capaces de transformar las variables X "normales" N(µ,s)

• En variables Z que sigan una distribución normal estándar N(0,1).

• Este proceso se llama tipificación o estandarización de la variable.

Estandarización de las variables

Page 16: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Puntaje “z”

La variable transformada se llama variable normal estándar y se símbolizará por “z”

Las puntuaciones “z” son transformaciones que se hacen a los valores observados, con el propósito de analizar su distancia respecto a la media en unidades de desviación estándar.

z = x – promedio D.E.

Page 17: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

z = x – promedio D.E. 90 se encuentra a

z = 90 – 83 = 7 = 1,75 1,75 S del promedio 4 4

Este valor se busca en la Tabla de puntajes “z”, para determinar la probabilidad de encontrar glicemias iguales o superior a 90 mg por 100 ml de sangre.

El valor encontrado en la Tabla es 0,0401, lo que significa que es

probable que haya un 4,01% de individuos sanos con valores iguales o superior a 90 mg por 100 ml de sangre.

Veamos el ejemplo de la glucosa

Page 18: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Veamos otro ejemplo:

Valor observado: 50 Promedio: 60 Desviación estándar: 10

z = 50 – 60 = -10 = -1 10 10

Podemos decir que el valor “50” está localizado a una desviación estándar por debajo de la media de la distribución .

El valor “30” estará a tres desviaciones estándar por debajo de la media.

Page 19: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Tabla 1.  Áreas bajo la curva normal estándar.  Los valores de la tabla que no se muestran en negrita representan la probabilidad de observar un valor menor o igual a z.  La cifra entera y el primer decimal de z se buscan en la primera

columna, y el segundo decimal en la cabecera de la tabla.

Segunda cifra decimal del valor de z

z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359

0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753

0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141

0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517

Page 20: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico
Page 21: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Esquema de procedimiento de la estadística inferencial.

RECOLECCION DE LOS DATOS MEDIANTE UNA MUESTRA

CALCULO DE ESTADIGRAFOS

Inferencia de los parámetrosmediantetécnicasestadísticasapropiadas.

Población o universo

La estadística inferencial puede se utilizada para dos procedimientos:

Probar hipótesis

Para estimar parámetros

Esquema de procedimiento de la estadística inferencial.

RECOLECCION DE LOS DATOS MEDIANTE UNA MUESTRA

Población o universo

Page 22: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

DiagramaDiagrama

Población

Muestra

Parámetros

Estimadores

Page 23: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿Qué es una distribución muestral?

Una distribución muestral es un conjunto de valores sobre una estadística, calculada de todas las muestras posibles de determinado tamaño.

Las distribuciones muestrales de medias, son las más comunes

Si calculáramos la media de todas las medias de las muestras posibles, obtendríamos el valor de la media poblacional.

Es más bien un concepto estadístico para los investigadores; lo que comúnmente se hace es extraer una sola muestra.

Page 24: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico
Page 25: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿En qué consiste la prueba de hipótesis?

Es una proposición respecto a uno o varios parámetros.

Lo que el investigador hace a través de la prueba de hipótesis es determinar si la hipótesis es consistente con los datos obtenidos en la muestra.

Hipótesis consistente => valor aceptable del parámetro

Hipótesis no es consistente => se rechaza H

Page 26: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿CÓMO PODREMOS SABER SÍ LA HIPÓTESIS ES CONSISTENTE O NO LO ES?

¿Al trabajar con una sola muestra , necesitamos saber si el estadísgrafo de esta muestra, está cerca del estadígrafo de la distribución muestral? Para ello , nos es útil es

Teorema del Límite centralTeorema del Límite central

Page 27: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿QUÉ DICE EL T. L. C.?

“ Es una proposición de que aún en muestras de tamaño moderado ( más de 100 casos) , la distribución de las muestras será aproximadamente normal.”

“ Especifica que la distribución muestral tiene una media igual a la de la población , una varianza igual a la varianza de la población dividida por el tamaño de la muestra y se distribuye normalmente, donde la varianza puede estimarse por la desviación estándar de la muestra.”

¿PARA QUE SIRVE?¿PARA QUE SIRVE?

“ “ Para hacer estadística inferencial sobre los valores de una población”

Page 28: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Por lo tanto, podemos decir que el TLC

Cuanto mayor es el tamaño de la muestra , menos es la variabilidad y por lo tanto más similar a la media de la población será la media obtenida de la muestra

Cuanto menor sea el grado de la variabilidad (σ/√n), más ajustada a la media de la población serán las medias que obtengamos de una muestra.

Page 29: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Qué hace el investigador......

El investigador tiene que evaluar si la probabilidad de que la media de la muestra esté cerca de la media de la distribución muestral es grande o es pequeña.

Si es pequeña, el investigador dudará de generalizar a la población y viceversa

Page 30: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿Qué se entiende por nivel de significancia o nivel α ?

El nivel alfa (α) es un nivel de probabilidad de equivocarse y se fija antes de probar hipótesis inferenciales.

¿Y con qué porcentaje tiene confianza el investigador para generalizar? El nivel de significancia del 0,01 El nivel de significancia del 0,05

Por lo tanto; el nivel de significancia es un valor Por lo tanto; el nivel de significancia es un valor de certeza que fija el investigador “a priori”de certeza que fija el investigador “a priori”

Page 31: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿Cómo se relacionan la distribución muestral y el nivel de significancia?

El nivel de significancia se expresa en términos de probabilidad

0,05 0,01

La distribución muestral también se expresa como probabilidad

Área total de esta

1,0

Page 32: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Para ver si tenemos o no confianza al generalizar acudimos a la distribución muestral ; ya que el nivel de significancia lo tomamos como un área bajo la distribución muestral.

EL NIVEL DE SIGNIFICANCIA REPRESENTA EL NIVEL DE SIGNIFICANCIA REPRESENTA AREAS DE RIESGO O CONFIANZA EN LA AREAS DE RIESGO O CONFIANZA EN LA DISTRIBUCIÓN MUESTRALDISTRIBUCIÓN MUESTRAL..

Page 33: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Aplicado el concepto de probabilidad a la distribución muestral podemos tomar el área de ésta como “1”.

Cualquier área comprendida entre dos puntos corresponderá a la probabilidad de la distribución.

Para probar hipótesis inferenciales respecto a la media, el investigador debe evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución muestral.

Si es baja el investigador dudará de generalizar a la población.Si es alta, el investigador podrá hacer generalizaciones.

Es aquí donde entra el nivel de significancia o nivel alfa (α) => nivel de probabilidad de equivocarse.

Page 34: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿Qué hacemos para ver si nuestra hipótesis sobre la media poblacional es aceptada o rechazada?

Debemos recordar que:- La distribución muestral es una distribución normal de

puntuaciones z

- Las puntuaciones z son distancias que indican áreas bajo la distribución normal

- Área de riesgo => área de rechazo de la hipótesis Área de confianza => área de aceptación de la hipótesis

- Se habla de una hipótesis acerca del parámetro

Page 35: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Si nos dieran 95 boletos de 100 para la rifa de un automóvil ¿tendríamos confianza en que el auto será nuestro?....

Lo mismo hace el investigador, obtiene una estadística en una muestra y analiza que porcentaje tiene de confianza en que dicha estadística se acerque al valor de la distribución muestral (universo), busca una probabilidad elevada para inferir con seguridad dicho resultado a la población general.

Page 36: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿y con qué porcentaje tiene confianza el investigador para generalizar?

El nivel de significancia de 0.05, el cual implica que el investigador tiene el 95% de seguridad para generalizar sin equivocarse.

El nivel de significancia de 0.01, el cual implica que el investigador tiene el 99% para generalizar sin temor a equivocarse y 1% en contra.

No se acepta un nivel de 0.06 (94% a favor de la generalización confiable), ya que se busca hacer ciencia y no intuición)

Page 37: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

VEAMOS EL PROCEDIMIENTO

1. Establecer una hipótesis acerca del parámetro poblacional.

2. Definir el nivel de significancia

3. Recolectar los datos en una muestra representativa

4. Estimar la desviación estándar de la distribución muestral de la media

5. Transformar la media de la muestra en una puntuación z

6. En la tabla de áreas bajo la curva normal, buscar valor z

7. Comparo la media de mi muestra transformada a puntuación z con el valor 1,96. ; si es menor acepto la hipótesis y si es mayor la rechazo.

Page 38: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

Es importante recordar:

Recordar que la distribución muestral es una distribución normal de puntuaciones “z”, o unidades de desviación estándar.

Las puntuaciones “z” son distancias que indican áreas bajo la distribución normal. En este caso, áreas de probabilidad.

El área de riesgo es tomada como el área de rechazo de la hipótesis y el área de confianza es tomada como el área de aceptación de la hipótesis.

Page 39: CONTENIDOS Distribución normal Teorema del límite central Nivel de significancia Taller práctico

¿ALGUNA DUDA?

MUCHAS GRACIAS

Y