Universidad Técnica de Babahoyo
INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA
Ateneo Ruperto P. Bonet Chaple
UTB-Julio 2016
OBJETIVO
Aplicar las técnicas de Muestreo e Inferencia Estadística
• Determinar el tamaño y la calidad de una muestra
• Estimar proporciones
• Estimar medias
• Estimar varianzas
ESTADÍSTICA INFERENCIAL
Al hacer estadística inferencial debemos enfrentarnos con
dos problemas:
Elección de la Muestra (Muestreo)
Extrapolación de los Resultados al resto de la Población
(Inferencia)
Estimación
Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro). • Estimación Puntual: Obtener un pronóstico numérico único sobre
un parámetro de la distribución.
• Estimación por Intervalos de Confianza: Obtener un margen de variación para un parámetro de la distribución.
𝜽 Población, parámetro
• Proporción P
• Media μ
• Varianza σ2
𝜽 Muestra, estimador
• Proporción p
• Media 𝑋
• Varianza 𝑆2
𝑶𝒃𝒋𝒆𝒕𝒊𝒗𝒐: 𝒎𝒊𝒏 𝜽 − 𝜽
Estimación Puntual
Características deseables: • Consistencia: Cuando el tamaño de la muestra crece
arbitrariamente, el valor estimado se aproxima al parámetro desconocido.
• Carencia de sesgo: El valor medio que se obtiene de la estimación para diferentes muestras debe ser el valor del parámetro.
• Eficiencia: Al estimador, al ser v.a., no puede exigírsele que para
una muestra cualquiera se obtenga como estimación el valor exacto del parámetro. Sin embargo podemos pedirle que su dispersión con respecto al valor central (varianza) sea tan pequeña como sea posible.
• Suficiencia: El estimador debería aprovechar toda la información
existente en la muestra.
Estimación por Intervalos de Confianza
Se denomina estimación confidencial o intervalo de confianza para un nivel de confianza 1-α dado, a un intervalo que ha sido construido de tal manera que con frecuencia 1-α realmente contiene al parámetro.
– Obsérvese que la probabilidad de error (no contener al parámetro) es α.
– En el siguiente tema se llamará prob. de error de tipo I o nivel de significación.
– Valores típicos: α=0,10 ; 0,05 ; 0,01
– En general el tamaño del intervalo disminuye con el tamaño muestral y aumenta con 1-α.
– En todo intervalo de confianza hay una noticia buena y otra mala: – La buena: hemos usado una técnica que en % alto de casos acierta.
– La mala: no sabemos si ha acertado en nuestro caso.
Estimación por Intervalos de Confianza
Intervalos de Confianza para la Distribución Normal • Intervalo de Confianza para la Media con Varianza Conocida: No es un
caso práctico ya que es imposible conocer σ2 sin conocer previamente μ. • Intervalo de Confianza para la Media (caso general): Caso con verdadero
interés práctico. Nos permite estimar el intervalo de confianza para μ a partir de los resultados de la muestra.
• Intervalo de Confianza para la Varianza: Otro caso con interés práctico.
Nos permite estimar el intervalo de confianza para σ2 a partir de los resultados de la muestra.
• Intervalo de Confianza para una Proporción: Otro caso de interés práctico. Permite establecer el intervalo de confianza para la proporción a partir de las frecuencias relativas de las observaciones
• Estimación del Tamaño Muestral: Permite decidir el tamaño muestral para
obtener intervalos de confianza para la media y para proporciones con una precisión y significación establecida de antemano.
Intervalo de Confianza para μ con σ2 conocida
Se sabe que el peso de los recién nacidos sigue una distribución normal con una desviación típica de 0,75 kg. Si en una muestra aleatoria simple de 100 de ellos se obtiene una media muestral de 3,00 kg y una desviación típica de 0,50 kg. Calcular un intervalo de confianza para la media poblacional que presente una confianza del 95%.
El intervalo de confianza del 95% se calcula teniendo en cuenta que Z se aproxima a la distribución N(0,1). Dicha distribución presenta un 95% de probabilidad de ocurrir entre sus cuantiles Z0,025 = -1,96 y Z0,975 = 1,96.
Intervalo de Confianza para μ con σ2 conocida
Es decir, con una confianza del 95% tenemos que μ = 3 ± 0,147 kg.
Intervalo de Confianza para μ (caso general)
Se sabe que el peso de los recién nacidos sigue una distribución normal. Si en una muestra aleatoria simple de 100 de ellos se obtiene una media muestral de 3,00 kg y una desviación típica de 0,50 kg. Calcular un intervalo de confianza para la media poblacional que presente una confianza del 95%.
El intervalo de confianza del 95% se calcula teniendo en cuenta que T se aproxima a la distribución tn-1. Dicha distribución presenta un 95% de probabilidad de ocurrir entre sus cuantiles Tn-1;0,025 = -1,98 y Tn-1;0,975 = 1,98.
Intervalo de Confianza para μ (caso general)
Es decir, con una confianza del 95% tenemos que μ = 3 ± 0,1 kg.
Intervalo de Confianza para σ2
Se estudia la altura de los individuos de una ciudad, obteniéndose en una muestra de tamaño 25 los siguientes resultados:
Calcular un intervalo de confianza con α = 0,05 para la varianza σ2 de la altura de los individuos de la ciudad.
𝑆 = 10 ⇒ 𝑆 = 𝑆𝑛
𝑛 − 1= 10
25
24= 10,206
Intervalos para una Proporción
Se desea estimar el resultado de un referéndum mediante un sondeo.
Para ello se realiza un muestreo aleatorio simple con n = 100
personas y se obtiene que el 35 % votará a favor y el 65 % votará en
contra (suponemos que no hay indecisos para simplificar el problema
a una variable dicotómica). Calcule un intervalo de confianza para el
verdadero resultado de las elecciones con un nivel de significación del
5%.
Solución:
Dada una persona cualquiera, el resultado de su voto es una variable
dicotómica:
𝑿𝒊 ⇝ 𝑩𝒆𝒓 𝒑
Intervalos para una Proporción
El parámetro a estimar en un intervalo de confianza al 95% (α=0,05)
es p.
𝒑 = 𝒑 ± 𝒁𝟏−𝜶 𝟐
𝒑 𝒒
𝒏
𝒑 =𝟑𝟓
𝟏𝟎𝟎= 𝟎, 𝟑𝟓 → 𝒒 = 𝟏 − 𝒑 = 𝟎, 𝟔𝟓
𝒑 = 𝟎, 𝟑𝟓 ± 𝟏, 𝟗𝟔𝟎, 𝟑𝟓 ∗ 𝟎, 𝟔𝟓
𝟏𝟎𝟎
𝒑 = 𝟎, 𝟑𝟓 ± 𝟎, 𝟎𝟗𝟑𝟓
Estimación del Tamaño Muestral
Antes de realizar un estudio de inferencia estadística sobre una variable, lo primero es decidir el número de elementos, n, a elegir en la muestra aleatoria. Para ello consideraremos que el estudio se basará en una variable de distribución normal, y nos interesa obtener para un nivel de significación α dado, una precisión (error) d. Si n es suficientemente grande, la distribución t de Student se aproxima a la distribución normal. Luego, una manera de obtener la precisión buscada consiste en elegir n con los siguientes criterios:
Estimación del Tamaño Muestral
Calcular, para el ejemplo de la altura de los individuos, el tamaño de debería tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel de significación α = 0,01 (al 99%) y una precisión d = 1 cm.
¿Qué hemos visto?
Introducción a la Inferencia
Estimación
• Estimación Puntual
• Estimación confidencial
• Intervalo de Confianza para la Media
• Intervalo de Confianza para la Varianza
• Intervalo de Confianza para Proporciones
• Cálculo del Tamaño de Muestras
EJERCICIOS
1-Con un nivel de confianza del 95%, estimar la media poblacional a partir de 15 observaciones muestrales en las que se calculó : media = 8'5 ; varianza = 3 . Con los mismos resultados muestrales, estime el valor de la desviación típica de la población con un margen de error del 1%. 2-Por experiencias anteriores se sabe que las estaturas de los soldados tienen una varianza de 64 cm. a) Con un margen de error del 6%, estime la estatura media partiendo de un grupo de 100 soldados, tomados al azar, sabiendo que proporcionó un promedio de 164 cm. b) Manteniendo el mismo intervalo de confianza calculadso anteriormente, qué tamaño muestral debe fijarse para que el margen de error pase a ser α = 0'02 ?. 3-Para analizar la eficacia de la aplicación de un tratamiento , se someten al mismo a 64 pacientes. Finalizado el período de aplicación se observó que remitió la enfermedad en 50 casos. Con un nivel de confianza del 92%, estime el porcentaje de efectividad del tratamiento objeto de estudio
4-Un estudio sobre la proporción de fumadores
estableció que entre el personal de un Hospital sólo
fumaban entre el
20% y el 35%.
a) ¿ Cuál fue el porcentaje muestral observado ?.
b) Si se realizó el estudio partiendo de una muestra de
40 individuos, ¿ con qué margen de error se trabajó ?.
c) Si el análisis se efectuó con un nivel de confianza del
95%, ¿ cuántos individuos integraron la muestra
seleccionada ?.
5-En una muestra de 13 elementos, obtenidos
aleatoriamente de una población normal e infinita,
sabemos que los
límites del intervalo confidencial de estimación de la
media poblacional, con un nivel de riesgo del 5% son,
respectivamente, 1’28 y 18’72. Calcule :
a) la media de la muestra
b) la desviación típica insesgada de la muestra