Upload
armandoscrib
View
41
Download
0
Embed Size (px)
Citation preview
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)
TRABAJO COLABORATIVO 2
INFERENCIA ESTADÍSTICA
Presentado Por:
Tutor: Ing. ÁLVARO ALFONSO BERNAL
Grupo 100403
FACULTAD DE CIENCIAS BÁSICAS E INGENIERÍA
PROGRAMA DE INGENIERÍA INDUSTRIAL
2014
INTRODUCCION
Inferir es, en general, establecer un nuevo conocimiento partiendo de uno ya “dado”. La inferencia estadística va a ser una forma especial de realizar este proceso. Consiste, básicamente, en determinar algunas características desconocidas de una población partiendo de datos muéstrales conocidos. Estas características poblacionales serán “inferidas” utilizando los recursos de la TEORIA MATEMATICA DE LA PROBABILIDAD.
En el presente documento encontrara el desarrollo del trabajo colaborativo número dos en el cual se tratan temas tales como prueba de hipótesis, análisis de varianza y estadísticas no paramétricas a través del desarrollo de una guía la cual cuenta con una serie de ejercicios relacionados con los temas de este primer trabajo colaborativo, al realizar los ejercicios se busca hacerlo paso a paso con el fin de dar a conocer como se llega a dicho resultado de manera correcta. Así mismo lograr afianzar los conocimientos básicos en inferencia estadística y poderlos aplicar en los diferentes ámbitos laborales.
1. OBJETIVOS
1.1 OBJETIVOS GENERALES
Comprender, aplicar y desarrollar la teoría y las técnicas de la inferencia estadística en diversos campos de su saber formativo, y que dicha aplicación se convierta en una herramienta de uso matemático para la toma de decisiones sobre hipótesis cuantitativas de datos, basado en la información extraída de una muestra.
1.2 OBJETIVOS ESPECIFICOS
Conocer los criterios técnicos que hay que tener en cuenta antes de seleccionar un tamaño de muestra.
Identificar el tipo de muestreo de acuerdo a los objetivos del estudio. Diferenciar y analizar las ventajas y desventajas de la
estimación por intervalos de confianza y las pruebas de hipótesis. Determinar la prueba o técnica apropiada a aplicar en las diferentes
pruebas de hipótesis paramétricas y No paramétricas.
2. DESARROLLO DEL TRABAJO
1. Prueba de hipótesis
Fase 1:
Realicen un diagrama con un diseño llamativo en el que se puedan ver los pasos de una prueba de hipótesis. Este diagrama debe ser de su propia autoría y por lo tanto inédito, no puede ser posible que en otro grupo se encuentre un diseño igual al de ustedes.
.
Fase 2:
Sobre el diagrama anterior desarrollen del capítulo 4 de prueba de hipótesis realicen el siguiente ejercicio que esta propuesto en el módulo:
Un fabricante de pastas alimenticias sostiene que el contenido medio de proteínas del producto es de 10.7. Un análisis de una muestra de 8 paquetes dio como resultado un contenido medio de 10% con una desviación de 1. ¿Se puede aceptar como verdadera la afirmación del fabricante a un nivel de 0.01?
Sugerencia: utilizar el siguiente estadístico de prueba:
t= X−μS
√n
Un ensayo unilateral con cola a la izquierda con un nivel significativo de 0.01 el valor crítico con 7 grados de libertad es igual a –3.0
Respuesta:
Nombramos la hipótesis nula y alternativa:H 0 : μ=0.107H 1: μ<0.107Si se puede aceptar como verdadera la afirmación, porque es una muestra pequeña menor de 30 para ese nivel de significancia del 0.01.Para el estadístico de prueba tenemos:
(T= X−μS
√n )(T=10−10.7
1
√8 )T=−1.98
2. Realizar un ANOVA comparando los precios promedios de tres empresas del mismo sector, por ejemplo tres bancos en los periodos 10 Mayo al 30 Mayo de 2013.
Acá la variable independiente (cualitativa) es el tipo de Banco y la variable dependiente (cuantitativa) es el precio de cierre de las acciones.
Fase 1: Realizar un ANOVA
SOLUCION
ANALISIS ANOVA
1. Establecer la hipótesis nula y alternativa
H o : μ1=μ2=μ3
H 1:No todas lasmediasde la poblacion soniguales
2. Establecer el nivel de significancia α de 5%
3. Realizar ANOVA
Davivienda Bancolombia Banco occidente
TOTAL
Precio Cierre Precio Cierre Precio Cierre1 24.480,00 28.320,00 35.600,002 24.780,00 28.500,00 35.820,003 25.000,00 28.400,00 36.180,004 24.520,00 27.900,00 36.540,005 25.080,00 28.300,00 37.040,006 24.800,00 28.200,00 37.100,007 24.200,00 28.220,00 37.500,008 24.480,00 28.340,00 37.680,009 24.440,00 27.920,00 38.000,00
10 24.200,00 28.160,00 38.300,0011 24.300,00 28.480,00 38.560,0012 24.360,00 28.200,00 38.840,0013 24.200,00 27.900,00 39.100,0014 24.300,00 28.040,00 39.340,00
X J24.510,00 28.205,71 37.542,86 30.086,19
S2J 80.557,14 38.424,49 1.373.534,69
SJ283,83 196,02 1171,98
nJ14 14 14 42
∑J=1
n
X iJ
343.140,00 394.880,00 525.600,00 1.263.620,00
La media general es igual a:
X́=∑J=1
n
X iJ
nJ
=24.510+28.205,71+37.542,8642
=30.086,19
Para llevar a cabo la prueba de la igualdad de las medias de la población, se subdivide la variación total en dos mediciones:
a. Diferencia entre los grupos.
b. Diferencia dentro de los grupos.
La varianza de la muestra total se particiona en la varianza dentro de los bancos y la varianza entre los bancos, tal como se indica en el siguiente gráfico:
Variación total (VT)
VT=(24.480−30.086,19)2+…+(39.340−30.086,19 )2=1.284 .142 .790,48
Variación dentro del grupo (VDG)
VDG=(24.480−24.510)2+…+(28.320−28.205,71 )2+…+(35.600−37.542,86 )2=20.895 .228,57
Variación entre grupos (VEG)
VEG=14∗(24.510−30.086,19 )2+14∗(28.205,71−30.086,19 )2+14∗(37.542,86−30.086,19 )2=1.263 .247 .552,2
4. Calcular el valor F o el valor crítico correspondiente al nivel de confianza fijado con los grados de libertad.
Numerador K-1 = 2
Denominador n – K = 39
F0.05=3,238
5. Hallar el estadístico de prueba AB
Variación Suma cuadrados
Grados Libertad
Cuadrado medio
Distribución F
Entre Bancos
1.263.247.552,2 (k-1) = 2 631.623.776 1.178,89
Dentro o error
20.895.228,57 (n-k) = 39 535.775,09
Total 1.284.142.790,48 (n-1) = 41
Para el caso la relación es igual a 1.178,89, mayor que el valor crítico 3,238, entonces se tienen pruebas suficientes para rechazar la hipótesis nula consistente en que las medias de las tres poblaciones son iguales. En otras palabras el análisis de varianza apoya la conclusión que las medias para el precio de cierre de las acciones es diferente en los tres bancos.
Fase 2: Realizar prueba Tukey
Realicen una conclusión donde indique si hay diferencia significativas entre por los menos un par de los bancos y apoyados en la prueba de Tukey cual se espera que tenga los precios de cierre de las acciones más altos.
SOLUCION
DSM=qα, k , glerror=√ 2CM error
n
3. Dada la siguiente tabla en donde X es una variable aleatoria que representa el número de errores por caso al año, que se cometen al tramitar las pensiones en un fondo en Colombia. Además se tiene que en promedio (λ) se cometen 3 errores.
Realicen una prueba Ji cuadrado (prueba no paramétrica) para comprobar si el número de errores se distribuye como una Poisson.
Respuesta:
H 0: Los datos se distribuyen según el modelo de Poisson.
H 1: Los datos no están distribuidos según el modelo de Poisson.
Se realiza el estadístico de prueba
Numero de errores Frecuencias Observadas N° Errores*frecuencias0 18 01 53 532 103 2063 107 3214 82 3285 46 2306 18 1087 13 91
TOTAL 440 1337
λ=1337440
=3
Efectivamente el número de errores en promedio son 3. Se realiza la tabla de distribución de Poisson.
x i Oi f (x¿¿ i)¿ Ei Oi2
E i
0 18 0,0498 21,912 14,791 53 0,1494 65,736 42,732 103 0,2240 98,56 107,643 107 0,2240 98,56 116,164 82 0,1680 73,92 90,965 46 0,1008 44,352 47,716 18 0,0504 22,176 14,107 13 0,0216 9,504 17,78
TOTAL 440 0.988 434,72 0
∑i=1
n Oi2
Ei
−440=451,87−440=11,87
Valor Critico: El valor de la ji-cuadrada teórica para 6 (k-r=7-1) grados de libertad, a un nivel de significancia de 0.05 es 14,067.
El número de errores para tramitar las pensiones en un fondo en Colombia SÍ se distribuye como una Poisson.
CONCLUSIONES
Se logró dejar claro los conceptos básicos de inferencia estadística para esta unidad tales como prueba de hipótesis, análisis de varianza y pruebas no paramétricas para el desarrollo de las diferentes actividades.
El uso de las pruebas no paramétricas facilita y agiliza el cálculo de los diferentes parámetros pero con una gran margen de error, dado que se omiten cálculos.
El manejo de los principios del muestreo, las distribuciones muestrales, los intervalos de confianza, pruebas de hipótesis, análisis de varianza y pruebas no paramétricas son muy útiles en el desarrollo de nuestro futuro rol profesional.
La comprensión de la teoría de las dos colas y teorema del límite central, que en otras palabras no es más que la forma de asegurarse que la distribución de la muestra n datos se aproxima a la normal de la curva de la campana de gauss que en la teoría no es muy aplicable pero que cumple si un papel muy importante para tomar una decisión de una hipótesis siempre y cuando este sea al 30. Esto nos permite usar estadísticas de muestra para hacer deducciones con relación a los parámetros de población sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la muestra.
BIBLIOGRAFIA
Sierra, J.J (2013). Módulo Inferencia Estadística. 1, (2). Universidad Nacional Abierta y a Distancia – UNAD-. Ibagué Aula virtual: Inferencia Estadística.
Inferencia Estadistica, Blog del curso: http://inferencia-e.blogspot.com/
Sierra, J.J. (2013). Inferencia Estadística [Recurso en línea, Blog], ubicado en: http://inferencia-e.blogspot.com/
Introducción a la inferencia estadística (Introducción – Muestreo – Distribuciones muéstrales). Consultado el 24, mayo, 2014 de: file:///C:/Users/FRANCO/Desktop/introinfer.pdf
Estadística descriptiva en los juegos de azar. Consultado el 24 de mayo de 2014 de: http://www.eyeintheskygroup.com/Azar-Ciencia/Analisis-Estadistico-Juegos-de-Azar/Estadistica-Descriptiva-Poblacion-y-Muestra.htm
Explorable. Muestreo aleatorio. Consultado el 24 de mayo de 2014 de: https://explorable.com/es/simple-random-sampling-es