Upload
lc2604
View
151
Download
4
Embed Size (px)
DESCRIPTION
Tenemos en Proyecto la compra de una Fuente de soda en los alrededores de la UIS. Este negocio ya tiene una historia comercial de 11 años atendiendo personas que directamente tienen que ver con la Universidad, es decir, estudiantes, profesores y trabajadores. Esta fuente de soda tiene una sección especializada en Jugos y Frutas naturales gozando de muy buena aceptación dentro de su clientela.
Citation preview
CURSO DE ESTADISTICA II
TRABAJO DE APLICACIÓN DE MUESTREO
Tenemos en Proyecto la compra de una Fuente de soda en los alrededores de la UIS. Este negocio
ya tiene una historia comercial de 11 años atendiendo personas que directamente tienen que ver
con la Universidad, es decir, estudiantes, profesores y trabajadores. Esta fuente de soda tiene una
sección especializada en Jugos y Frutas naturales gozando de muy buena aceptación dentro de su
clientela. Para la sección de frutas, observando sus datos de ventas durante los pasados 11 años
encontramos los siguientes datos:
Año No Clientes Atendidos Volumen Ventas Millones de $
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
10000 11000 11000 11500 11400 12000 12300 13000 14500 15500 16500
9,2 10,3 11,2 12,3 12,5 13,5 14,3 16,2 17 17,5 19,5
Queremos analizar cifras que nos permitan determinar las bondades del proyecto en lo referente
a la sección ya mencionada y para tal efecto estamos pensando en reforzar estrategias de ventas
considerándose conveniente hacer un encuestamiento por muestreo con el ánimo de conocer
expectativas de venta y sus características de comercialización.
Nos interesa especialmente crear el servicio de venta a domicilio. Pensando en conocer la clientela
potencial de este nuevo servicio, se sugiere hacer el encuestamiento por muestreo.
Se pide entonces para esta problemática planteada, lo siguiente:
1. ¿Qué técnica de muestreo recomiendan ustedes y porqué?
Como la proporción de clientes que estarían interesados en dicho servicio, es diferente de un
sector poblacional a otro, entonces, se recomienda el Muestreo Estratificado Aleatorio. Este
muestreo simplifica los procesos y suele reducir el error muestral para un tamaño dado. Consiste
en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad
respecto a alguna característica. Lo que se pretende con este tipo de muestreo es asegurarse de
que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente.
6000N
2
1
2
1
?
L estratos, donde L=3
Entonces n= , donde N Tamaño Estrato
p Proporción de clientes que estarían interesados en nuestro servicio de venta a domicilio
L
i i i
i
iiL
i i i
i
i
n
Con
N p q
w
N D N p q
2
12
#interesados de n
1- p ; Si el muestreo se aplica con afijación proporcional.
n
donde B error, 4
B=0,05 5% ya que Asumimos =5% Z =1
i i
ii i i
ii i i
p
Nq w
N
n nw N
n N
BD
,96 2
2. Aplicando su técnica sugerida, qué tamaño de muestra se debe utilizar? Tenga en cuenta
que el mercado potencial total es de 6000 personas, de las cuales 1000 son profesores y
500 trabajadores de la Universidad, el resto son vecinos del negocio.
Solución:
22 2
3 3 31 1 1 2 2 222 2
3 3 31 1 1 2 2 2 1 2 3
1 2 3
2 2
1 1 1 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3
N p qN p q N p qN p qN p q N p q N N N
w w w N N Nn n
N D N p q N p q N p q N D N p q N p q N p q
Nosotros asumimos un intervalo para cada 𝑝𝑖 , y luego escogimos de los limites el que más se
acercara a 0,5. Entonces:
1
2
3
1
2
1
0,2 0,3
0,3 0,4
0,1 0,2
Luego entonces: 0,3
0, 4
0, 2
p
p
p
p
p
p
1
2
3
45001000500
NNN
11
22
33
4500* *320 240
6000
1000 160* *320 53,3333 53
6000 3
500 80* *320 26,6667 27
6000 3
Nn n
N
Nn n
N
Nn n
N
Entonces reemplazo 1 2, 3, p p p y obtengo:
2 2 2
2
4500 *0,3*0,7 1000 *0,4*0,6 500 *0,2*0,8
4500 1000 500
6000 6000 6000
(6000 *0,000625) (4500*0,3*0,7) (1000*0,4*0,6) (500*0,2*0,8)
4252500 240000 40000
1 10,756 12
n
n
5670000 1440000 480000
22500 945 240 80 23765
7590000319,3772354 320
23765
n
n
después n
3. Con ese tamaño muestral y simulando el encuestamiento referido, sugiera una cantidad
de personas que serían clientes de este nuevo servicio y estime la proporción de clientes
para este servicio. Calcule un intervalo de confianza del 95% para esta proporción (Dele
datos al muestreo recomendado y calcule el intervalo de confianza).
#
ˆ , 1,2,3i
i
veces que dicen siHallamos p para i
n
En este caso, suponemos el número de veces que los encuestados dicen que “si”.
1
2
3
70ˆ 0,291666667 0,2617
240
18ˆ 0,3396226415 0,3396
53
3ˆ 0,1111111111 0,1111
27
p
p
p
- Entonces el Estimador Puntual es 1
ˆ ˆ*st i ip N pN
, indicando cuantos clientes de la
población N podríamos tener.
1 1 2 2 3 3
1ˆ ˆ ˆ ˆ( * ) ( * ) ( * )
6000
1 70 18 3ˆ 4500* 1000* 500*
6000 240 53 27
1 18000 500 1ˆ 1312,5 * 1707,678197 0,2846130328 0,2846
6000 53 9 6000
st
st
st
p N p N p N p
p
p
- La varianza Estimada del Estimador es:
2
ˆ 21
*1ˆ * 1,2,31st
ii i i i
p i
i i
N n p qV N para i
N N n
2 2
ˆ 2
2
70 170 18 35* *
4500 240 1000 53240 240 53 534500 * * 1000 * *4500 240 1 1000 53 1
1ˆ *6000 3 24
*500 27 27 27500 * *
500 27 1
stpV
ˆ 2
4
ˆ
1 1ˆ 16570,99895 4084,467508 898,3855651 21553,852026000 36000000
ˆ 5,987181118*10
st
st
p
p
V
V
- El Intervalo de Confianza (Numero de clientes ± La fluctuación) es ˆˆˆ 2
stst pp V
4
ˆ
ˆ
ˆ
ˆ 5,987181118*10
ˆ 0,024468717
ˆ2* 0,04893743401
st
st
st
p
p
p
V
V
V
Entonces el Intervalo de Confianza es:
ˆ ˆˆ ˆˆ ˆ. . 2 2 0,95
. . 0,2846130328 0,04893743401 0,2846130328 0,04893743401 0,95
. . 0,2356755988 0,3335504668 0,95
st stst p st pI C p V P p V
I C P
I C P
4. De no crearse este servicio de venta a domicilio, cuál sería la proyección de ventas de la
fuente de soda para el 2010? Ajuste una línea de regresión, verifique si es apropiada
para pronosticar. Para esta proyección asuma que en este año 2010 esperamos atender
17000 clientes. Sugerencia: realice un análisis de regresión con los datos mostrados al
comienzo. ESTE ANÁLISIS DE REGRESIÓN HAGALO CON STATGRAPHICS.
Ruta a seguir:
i. Abrir programa STATGRAPHICS PLUS
ii. Analizar datos Existentes o Introducir nuevos datos Aceptar
iii. Deseo introducir nuevos datos Aceptar
iv. Modificar Columna Nombre: Clientes Atendidos Aceptar
v. Modificar Columna Nombre: Volumen Ventas Aceptar Cancelar
vi. Se introducen los datos respectivamente
vii. Dependencia
viii. Regresión Simple
ix. Entrada de datos:
a. X: Clientes Atendidos
b. Y: Volumen Ventas
x. Aceptar
xi. Resultado: Análisis de Regresión – Modelo lineal Y= a+bx
xii. Opciones Tabulares
xiii. Comparación de Modelos Alternativos Aceptar
xiv. Se observa los modelos en orden descendente según el R-cuadrado.
xv. Para cambiar los modelos, seleccione el cuadro de diálogo Opciones de Análisis.
xvi. Dependencia
xvii. Regresión Polinomial
xviii. Entrada de datos:
a. X: Clientes Atendidos
b. Y: Volumen Ventas
xix. Resultado: Análisis de Regresión Polinomial Orden 2
xx. Clic Derecho Opciones de Análisis Orden: 3 Aceptar
xxi. Resultado: Análisis de regresión Polinomial Orden 3
Comparación de Modelos Alternativos
Modelo Correlación R-cuadrado
Inverso-X Logarítmico-X
Curva-S Raíz cuadrada-X
Lineal Multiplicativo
Raíz cuadrada-Y Doble inverso Exponencial
Inverso-Y Logístico
Log Probit
-0,9833 0,976
-0,9735 0,9730 0,9674 0,9607 0,9570 0,9530 0,9439 -0,9102
<sin ajustes> <sin ajustes>
96,68% 95,57% 94,76% 94,68% 93,59% 92,30% 91,58% 90,83% 89,09% 82,84%
<sin ajustes> <sin ajustes>
El STATADVISOR
Esta tabla muestra los resultados de ajuste a los datos de varios modelos curvilíneos. De los
modelos ajustados, el modelo recíproco-X procura el valor de R-cuadrado más alto con 96,6811%.
Este es 3,09138% más alto que el modelo lineal seleccionado inicialmente.
Entonces, si solo realizamos el análisis de Regresión simple obtenemos que el modelo que más
se ajusta sea el que presenta el mayor R-cuadrado por tanto escogemos el Modelo Inverso-X y
obtenemos:
Análisis de Regresión – Modelo Inverso-X: Y= a+ (b/x)
Indicadores:
Coeficiente de correlación = -0,983266
R-cuadrado = 96,6811%
Error estándar de estimación = 0,626296
El STATADVISOR
La ecuación del modelo ajustado es:
262492,0 35,2436
Volumen ventas
Clientes Atendidos
Dado que el P-valor es inferior a 0.01, existe relación estadísticamente significativa entre el
Volumen de Ventas y Clientes Atendidos para un nivel de significancia del 99%.
El estadístico R-cuadrado indica que el modelo explica un 96,6811% de la variabilidad en Volumen
ventas. El coeficiente de correlación es igual a (-0,983266), indicando una relación relativamente
fuerte entre las variables. El error estándar de la estimación muestra la desviación típica de los
residuos que es de 0,626296.
Entonces podemos calcular el volumen de ventas proyectadas teniendo en cuenta el No. De
clientes atendidos que en este caso es de 17.000:
262492,0 (17000) 35,2436
17000
(17000) 19,80289412
Volumen ventas
Volumen ventas
Entonces el volumen de ventas proyectado para el año 2010 si se espera atender 17000 clientes
es de 19,803 millones de pesos aproximadamente.
Ahora si hacemos un nuevo análisis pero esta vez teniendo en cuenta tanto la regresión simple
como la polinomial los resultados serían los siguientes:
- Regresión Polinomial de orden 1 tenemos:
o R-cuadrado = 93,5897%
o Error estándar de estimación = 0,870404
- Regresión Polinomial de orden 2 tenemos:
o R-cuadrado = 96,8882%
o Error estándar de estimación = 0,643223
- Regresión Polinomial de orden 3 tenemos:
o R-cuadrado = 97,0037%
o Error estándar de estimación = 0,674762
En este caso el modelo de regresión que más se ajusta teniendo en cuenta el R-cuadrado más alto
y que más se acerca al 100% es el Modelo Polinomial de Orden 3 entonces su respectivo análisis es
el siguiente:
El STATADVISOR
La ecuación del modelo ajustado es:
7 2 11 3 69,4695 0,0142431* 8,04693 * 1,61738 *
Volumen ventas CA CA CA
donde CA Clientes Atendidos
Dado que el P-valor es inferior a 0.01, hay relación estadísticamente significativa entre el volumen
de Ventas y los clientes atendidos para un nivel de confianza del 99%.
El estadístico R-cuadrado indica que el modelo explica un 97,0037% de la variabilidad en el
volumen de ventas. El error estándar de la estimación muestra la desviación típica de los residuos
que es 0,674762.
Entonces podemos calcular nuevamente el volumen de ventas proyectadas teniendo en cuenta el
No. De clientes atendidos que en este caso es de 17.000 y utilizando el nuevo modelo ajustado:
7 2 11 3
10
10
69,4695 0,0142431*17000 8,04693 *17000 1,61738 *17000
69,4695 242,1327 132,2775915 2.479784899*10
2,479784899*10
Volumen ventas
Volumen ventas
Volumen ventas
Nota: En la determinación de orden apropiado del polinomio, tenga en cuenta que el P-valor del
término de mayor orden del polinomio es igual a 0,619587. Puesto que el P-valor es superior o
igual a 0.10, este término no es estadísticamente significativo para un nivel de confianza del 90% o
superior. Por consiguiente debería considerarse reducir el orden del modelo a 1 utilizando las
opciones de análisis del cuadro de diálogo.
REALIZADO POR:
- LEIDY JOHANNA CÁRDENAS SOLANO 2071978
- KATHERINE JULIETH SIERRA SUÁREZ 2071981
PRESENTADO A: PROF. JOSÉ JOAQUÍN GARCÍA DÍAZ
FECHA: 31 DE AGOSTO DE 2010