14
17/02/2011 1 CONCEPTOS BÁSICOS DE INFERENCIA Ciencia encargada de suministrar diferentes técnicas y procedimientos que permitan recolectar, organizar, analizar e interpretar datos. “La estadística es un método empleado en la toma de decisiones frente a la incertidumbre, partiendo de datos estadísticos y calculando riesgos” (Yan Lun Chao)

CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

  • Upload
    voanh

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

1

CONCEPTOS BÁSICOS DE

INFERENCIA

Ciencia encargada de suministrar diferentes técnicas y procedimientos que permitan

recolectar, organizar, analizar e interpretar datos.

“La estadística es un método empleado en la toma de decisiones frente a la incertidumbre, partiendo de datos estadísticos y calculando

riesgos” (Yan Lun Chao)

Page 2: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

2

El estudio de la estadística se divide en dos categorías:

1. ESTADÍSTICA DESCRIPTIVA: Métodos para organizar,resumir y presentar datos de manera informativa. Su fin esúnicamente exploratorio y se limita a describir lo observado enuna población o muestra.

TEORIA DE LA PROBABILIDAD

2. ESTADÍSTICA INFERENCIAL:Proceso inductivo que permite inferir a toda la poblacióncaracterísticas observadas en una muestra.

CONCEPTO DE ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA:

Su objetivo es la exploración sin restricciones de los datos en

busca de regularidades interesantes

Las conclusiones solo se aplican a los individuos y a las

circunstancias para los cuales se obtuvieron los datos.

Las conclusiones son informales, se basan en lo que se observa en

los datos.

ESTADÍSTICA INFERENCIAL:

Su objetivo es responder a preguntas concretas que se

plantearon antes de la obtención de los datos.

Las conclusiones se aplican a un grupo mas amplio de individuos o situaciones.

Las conclusiones son formales y se hace explicito el grado de

confianza que se tienen sobre ellas.

Complementarias

CONCEPTO DE ESTADÍSTICA

Page 3: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

3

Subconjuntos representativode elementos obtenidos de lapoblación de interés.

Su razón de ser es que muchasveces resulta muy costoso o casiimpracticable observar uno auno los elementos de lapoblación.

Muestra (n)Población (N)

INFERENCIA ESTADÍSTICA

Conjunto de elementos de interésen un estudio.

1. El numero de elementos puede serfinito o infinito.

2. No debe asociarse exclusivamentecon población humana.

Característica medible sobre lapoblación.

Característica medible sobrela muestra.

Parámetro Estimador

INFERENCIA ESTADÍSTICA

( )( )

( )

2

Media

Varianza

Proporcion P

µ

σ( )

( )( )

2

Promedio

Varianza

Proporcion

X

S

p

Inferencia

Método que permite generalizar los resultados obtenidos en una muestra al general de la población, apoyándose en

leyes de la probabilidad

Page 4: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

4

Individuo:Son los objetos descritos por un conjunto dedatos. Los individuos pueden ser personas, perotambién pueden ser animales o cosas.

Variable:Es cualquier característica de interés de unindividuo. Una variable puede tomar distintosvalores para distintos individuos. (Edad,Estatura, Peso, etc.)

INDIVIDUOS Y VARIABLES

TIPOS DE VARIABLES

CUALITATIVAS o ATRIBUTOS

ORDINAL

INTERVALO

CUANTITATIVAS o NUMERICAS

ESCALAS DE MEDICIÓN

NOMINAL

TIPO

CONTINUA DISCRETA

ESCALAS DE MEDICIÓN

RAZÓN

Page 5: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

5

VARIABLES

- Si sus valores son numéricos.

- Tiene sentido hacer operacionesalgebraicas con ellos.

CUALITATIVAS

CUANTITATIVAS

- Si sus valores (modalidades) no sepueden asociar naturalmente a unnúmero.

Discretas:Si toma valores enteros.Número de hijos, Número de carros.

Continuas:Si entre dos valores, son posibles infinitosvalores intermedios.Altura, Temperatura, Duración de una batería,Peso(kg).

-No se pueden hacer operacionesalgebraicas con ellas.

ESCALA DE MEDICIÓN

CUALITATIVAS CUANTITATIVAS

1. Escala Nominal:No puede establecer un orden jerárquico entre las opciones de respuesta.

Color de Ojos (Verde, Azul, Gris, Negro, Café).

2. Escala Ordinal:Existe un ordenamiento natural de lasopciones de respuesta.

Calificación de un servicio(Excelente, Bueno, Regular, Malo).

3. Escala de Intervalo:El valor 0 es un valor arbitrario, noimplica la no presencia de unacaracterística.

Temperatura = 0ºC ¿No hay temperatura?

4. Escala de Razón:El valor 0 refleja ausencia de lacaracterística.

Altura = 0 mts

Page 6: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

6

ALGUNAS DISTRIBUCIONES

CONTINUAS ESPECIALES EN

INFERENCIA ESTADÍSTICA

Se dice que una variable aleatoria X es continua si sus valoresconsisten en uno o mas valores de la recta de los reales, es decir,cualquier numero x entre un intervalo A y B es posible.

Entonces una distribución de probabilidad o función de densidad deprobabilidad (fdp) de X es una función f(x) tal que para dos númeroscualesquiera a y b con a ≤ b:

Es decir, la probabilidad de que X tome un valor en el intervalo [a,b] esel área entre este intervalo y bajo la grafica de la función de densidad.La grafica de f(x) se llama curva de densidad.

VARIABLES ALEATORIAS Y DISTRIBUCIONES

CONTINUAS DE PROBABILIDAD

( ) ( )b

a

P a X b f x dx≤ ≤ = ∫

Page 7: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

7

Para que f(x) sea una función de densidad de probabilidad legitima,se deben satisfacer dos condiciones:

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

1. 0 ( ) 1

2. ( ) area bajo la grafica completa de f(x) 1

f x

f x dx∞

−∞

≤ ≤

= =∫

Valor Esperado:El valor esperado o promedio de una variable aleatoria continua Xcon función de densidad f(x) es:

Varianza:

La varianza de una variable aleatoria continua X con función dedensidad f(x) y valor promedio µ es:

La forma mas fácil para calcularσ2 es usar de nuevo una formula abreviada:

donde:

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

( ) * ( )X E X x f x dxµ∞

−∞

= = ∫

( ) ( ) ( )2 22 * ( )X V X E X x f x dxσ µ µ∞

−∞

= = − = − ∫

( )2 2( ) xV X E X µ= −

( )2 2 * ( )E X x f x dx∞

−∞

= ∫

Page 8: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

8

Ejercicio 1:

“Avance del tiempo” en flujo de transito es el tiempo transcurridoentre el tiempo en que un automóvil termina de pasar un punto fijo yel instante en que el siguiente automóvil comienza a pasar ese punto.Sea X = avance entre dos automóviles consecutivos elegidos al azar(seg) en una autopista durante un periodo de flujo intenso.

Suponga que la función de densidad de X es en esencia la indicadapor:

a. Determine el valor de k para el cual f(x) es una función dedensidad legitima. 3

b. Obtenga el valor medio y la desviación estándar del avance.1.5 ; 0.866

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

4 1

( ) 0 1

kx

f x xx

>= ≤

La distribución de alguna variable aleatoria continua porlo general no se deduce mediante argumentosprobabilísticos simples. En vez de eso, se debe hacer unaelección juiciosa de la función de densidad con base en elconocimiento previo y datos disponibles. Por fortuna, hayalgunas familias generales de fdp que se ajustan bien auna amplia variedad de situaciones experimentales.

Algunas de estas distribuciones de probabilidad son laUniforme, Exponencial y la Normal, pero aquí noscentraremos en la distribución Normal y lasdistribuciones que puedan generarse a partir de ellacomo son la t-Student, Chi-Cuadrado y F de Snedecor.

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

Page 9: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

9

Descubierta y publicada por primera vez en 1733 por De Moivre, a lacual llegaron de manera independiente Gauss(1809) y Laplace (1812)en relación a la distribución de los errores en observación astronómicay física respectivamente.

Es una de las distribuciones teóricas mejor estudiadas y masutilizadas en la practica por las diversas aplicaciones que se puedenmodelar a través de ella.

Se dice que una variable aleatoria X tiene una distribución Normal, sisu función de densidad es:

donde µ (media) y σ (desviación) son los parámetros de la distribución.

DISTRIBUCIÓN NORMAL

( )

∞<<∞−>

∞<<∞−=

−−

µσπσ

σµ

; 0

2

12

21

xexfx

La distribución de probabilidad Normal es una distribución continuade probabilidad y tiene las siguientes propiedades:

1. La familia completa de distribuciones normales se diferencia porsu media µ y desviación estándar σ.

2. El punto mas alto de la curva normal es la media, que también esla mediana y la moda de la distribución.

3. La media de la distribución puede ser cualquier valor numérico:negativo, cero, positivo.

4. La distribución normal es simétrica y su forma a la izquierda de lamedia es una imagen especular de la forma a la derecha de lamedia.

5. La desviación estándar (σ) determina el ancho de la curva. Avalores mayores de σ se tienen curvas mas anchas y bajas, quemuestran una mayor dispersión en los datos.

6. Las probabilidades para la variable aleatoria normal están dadaspor áreas bajo la curva. El área total bajo la curva para ladistribución de probabilidad normal es 1.

DISTRIBUCIÓN NORMAL

Page 10: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

10

La media determina el valor central de la curva. A diferentes valoresde µ se tienen curvas que se desplazan a la izquierda o a la derechasegún la media.

( ) 2)( , )( :entonces ; ~ Si σµσµ == XVXENX

Corolario:

Donde Z es una variable aleatoria Normal Estándar.

En consecuencia:

( ) ( )1 ;0 ~ :entonces ; ~ Si ==−= σµσ

µσµ NX

ZNX

( ) ( ) ?6 2 ; 5~ Si =<⇒== XPNX σµ

( ) ( )5.02

566 <=

−<−=< ZPX

PXPσ

µ

Page 11: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

11

La P(Z<0.5) se obtiene mediante su función de densidad:

El anterior valor se puede obtener por herramientas computacionales:

R: pnorm(6,5,2) = pnorm(0.5,0,1) = 0.6914

Excel: DISTR.NORM(6;5;2;1) = DISTR.NORM.ESTAND(0.5) = 0.6914

O a través del uso de tablas para la distribución Normal Estándardonde aparece tabulado la probabilidad para distintos valores de Z.

( )

( ) ∫

∞−

∞−

−−

=<

=<

5.0

21

62

1

2

2

2

15.0

2

16

dzeZP

dxeXP

Z

x

πσ

πσσ

µ

Page 12: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

12

Una maquina despachadora de gaseosa esta ajustada para servir enpromedio 200 mililitros (ml) por vaso. Si la cantidad de gaseosa seasemeja a una distribución normal con una desviación estándar de 15 ml,¿Cuál es la probabilidad de que un vaso contenga entre 190 y 210 ml?

EJEMPLO

X=“Cantidad de gaseosa despachada (ml)”

Page 13: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

13

EJEMPLO

Distribución del llenado de las botellas :

( )15,200~ == σµNX

( )

( )( ) ( )

4908.0

2546.07454.0

0.66ZP0.66ZP

66.066.0

15

200210

15

200190200190

=−=

−<−<=<<−=

−<−<−=<<

ZP

XPXP

σµ

Probabilidad de que este entre 190 y 210:

El 49.08% de los vasos tendrán llenados entre 190 y 210 ml.

EJERCICIOS

2. Si Z es una variable aleatoria Normal Estándar, determine lassiguientes probabilidades:

a. P(z < 1.20)b. P(0 < z < 1.96)c. P(z ≤ -0.71)d. P(z ≥ 1.96)e. P(-1.57 ≤ z ≤ 0)

3. Determine el valor de Z en cada casoa. El área a la derecha de z0 es 0.1314b. El área a la izquierda de z0 es 0.67c. El área entre 0 y z0 es 0.475d. El área entre -1 y z0 es 0.2291

Page 14: CONCEPTOS BÁSICOS DE INFERENCIA - Campus Virtual · PDF fileen una muestra al general de la población, ... Una maquina despachadora de gaseosa esta ajustada para servir en promedio

17/02/2011

14

EJERCICIOS4. Un remache para la industria de la construcción es fabricado para

cumplir con una resistencia al esfuerzo cortante de 2000 libras porpulgada cuadrada (psi). Tenemos la posibilidad de fabricarlos con unade dos maquinas disponibles.

Las características de producción de cada una de las maquinas sepresenta enseguida:

Maquina 1:Produce con una resistencia media de 2300 psi y una desviaciónestándar de 150 psi.

Maquina 2:Produce una resistencia media de 2100 psi y con una desviaciónestándar de 33.3 psi.

Estime el porcentaje de remaches no conformes producidos en cadacaso.Alguien esta recomendando producir los remaches con la maquina 1,pues la resistencia media es mayor que la maquina 2. ¿Usted queopina?

EJERCICIOS

5. La distribución de la resistencia que tienen los resistores eléctricosde cierto tipo es normal, 10% de los resistores tienen unaresistencia mayor a 10.256 ohms y 5% una resistencia menor a9.671 ohms. ¿Cual es la media y la desviación de la distribución deresistencias? 10;0.2

6. Una maquina expendedora de refrescos puede ajustarse para quedespache en promedio µ onzas por vaso. Si el numero de onzasnecesarias para llenar un vaso tiene una distribución normal condesviación estándar de 0.3 onzas, encuentre el valor de µ necesariopara llenar un vaso de 8 onzas, de tal forma que solo se derrame el1% del líquido.

7. La maquina descrita anteriormente tiene una desviación estándarde σ, la cual puede fijarse en ciertos niveles ajustándolacuidadosamente. ¿Cuál es el máximo valor de σ que permite que lacantidad real despachada se encuentre a 0.5 onzas de la media conuna probabilidad de por lo menos 0.95?