Trabajo de Aplicacion de Muestreo

CURSO DE ESTADISTICA II

TRABAJO DE APLICACIÓN DE MUESTREO

Tenemos en Proyecto la compra de una Fuente de soda en los alrededores de la UIS. Este negocio

ya tiene una historia comercial de 11 años atendiendo personas que directamente tienen que ver

con la Universidad, es decir, estudiantes, profesores y trabajadores. Esta fuente de soda tiene una

sección especializada en Jugos y Frutas naturales gozando de muy buena aceptación dentro de su

clientela. Para la sección de frutas, observando sus datos de ventas durante los pasados 11 años

encontramos los siguientes datos:

Año No Clientes Atendidos Volumen Ventas Millones de $

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

10000 11000 11000 11500 11400 12000 12300 13000 14500 15500 16500

9,2 10,3 11,2 12,3 12,5 13,5 14,3 16,2 17 17,5 19,5

Queremos analizar cifras que nos permitan determinar las bondades del proyecto en lo referente

a la sección ya mencionada y para tal efecto estamos pensando en reforzar estrategias de ventas

considerándose conveniente hacer un encuestamiento por muestreo con el ánimo de conocer

expectativas de venta y sus características de comercialización.

Nos interesa especialmente crear el servicio de venta a domicilio. Pensando en conocer la clientela

potencial de este nuevo servicio, se sugiere hacer el encuestamiento por muestreo.

Se pide entonces para esta problemática planteada, lo siguiente:

1. ¿Qué técnica de muestreo recomiendan ustedes y porqué?

Como la proporción de clientes que estarían interesados en dicho servicio, es diferente de un

sector poblacional a otro, entonces, se recomienda el Muestreo Estratificado Aleatorio. Este

muestreo simplifica los procesos y suele reducir el error muestral para un tamaño dado. Consiste

en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad

respecto a alguna característica. Lo que se pretende con este tipo de muestreo es asegurarse de

que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada

estrato funciona independientemente.

6000N

2

1

2

1

?

L estratos, donde L=3

Entonces n= , donde N Tamaño Estrato

p Proporción de clientes que estarían interesados en nuestro servicio de venta a domicilio

L

i i i

i

iiL

i i i

i

i

n

Con

N p q

w

N D N p q

2

12

#interesados de n

1- p ; Si el muestreo se aplica con afijación proporcional.

n

donde B error, 4

B=0,05 5% ya que Asumimos =5% Z =1

i i

ii i i

ii i i

p

Nq w

N

n nw N

n N

BD

,96 2

2. Aplicando su técnica sugerida, qué tamaño de muestra se debe utilizar? Tenga en cuenta

que el mercado potencial total es de 6000 personas, de las cuales 1000 son profesores y

500 trabajadores de la Universidad, el resto son vecinos del negocio.

Solución:

22 2

3 3 31 1 1 2 2 222 2

3 3 31 1 1 2 2 2 1 2 3

1 2 3

2 2

1 1 1 2 2 2 3 3 3 1 1 1 2 2 2 3 3 3

N p qN p q N p qN p qN p q N p q N N N

w w w N N Nn n

N D N p q N p q N p q N D N p q N p q N p q

Nosotros asumimos un intervalo para cada 𝑝𝑖 , y luego escogimos de los limites el que más se

acercara a 0,5. Entonces:

1

2

3

1

2

1

0,2 0,3

0,3 0,4

0,1 0,2

Luego entonces: 0,3

0, 4

0, 2

p

p

p

p

p

p

1

2

3

45001000500

NNN

11

22

33

4500* *320 240

6000

1000 160* *320 53,3333 53

6000 3

500 80* *320 26,6667 27

6000 3

Nn n

N

Nn n

N

Nn n

N

Entonces reemplazo 1 2, 3, p p p y obtengo:

2 2 2

2

4500 *0,3*0,7 1000 *0,4*0,6 500 *0,2*0,8

4500 1000 500

6000 6000 6000

(6000 *0,000625) (4500*0,3*0,7) (1000*0,4*0,6) (500*0,2*0,8)

4252500 240000 40000

1 10,756 12

n

n

5670000 1440000 480000

22500 945 240 80 23765

7590000319,3772354 320

23765

n

n

después n

3. Con ese tamaño muestral y simulando el encuestamiento referido, sugiera una cantidad

de personas que serían clientes de este nuevo servicio y estime la proporción de clientes

para este servicio. Calcule un intervalo de confianza del 95% para esta proporción (Dele

datos al muestreo recomendado y calcule el intervalo de confianza).

#

ˆ , 1,2,3i

i

veces que dicen siHallamos p para i

n

En este caso, suponemos el número de veces que los encuestados dicen que “si”.

1

2

3

70ˆ 0,291666667 0,2617

240

18ˆ 0,3396226415 0,3396

53

3ˆ 0,1111111111 0,1111

27

p

p

p

- Entonces el Estimador Puntual es 1

ˆ ˆ*st i ip N pN

, indicando cuantos clientes de la

población N podríamos tener.

1 1 2 2 3 3

1ˆ ˆ ˆ ˆ( * ) ( * ) ( * )

6000

1 70 18 3ˆ 4500* 1000* 500*

6000 240 53 27

1 18000 500 1ˆ 1312,5 * 1707,678197 0,2846130328 0,2846

6000 53 9 6000

st

st

st

p N p N p N p

p

p

- La varianza Estimada del Estimador es:

2

ˆ 21

*1ˆ * 1,2,31st

ii i i i

p i

i i

N n p qV N para i

N N n

2 2

ˆ 2

2

70 170 18 35* *

4500 240 1000 53240 240 53 534500 * * 1000 * *4500 240 1 1000 53 1

1ˆ *6000 3 24

*500 27 27 27500 * *

500 27 1

stpV

ˆ 2

4

ˆ

1 1ˆ 16570,99895 4084,467508 898,3855651 21553,852026000 36000000

ˆ 5,987181118*10

st

st

p

p

V

V

- El Intervalo de Confianza (Numero de clientes ± La fluctuación) es ˆˆˆ 2

stst pp V

4

ˆ

ˆ

ˆ

ˆ 5,987181118*10

ˆ 0,024468717

ˆ2* 0,04893743401

st

st

st

p

p

p

V

V

V

Entonces el Intervalo de Confianza es:

ˆ ˆˆ ˆˆ ˆ. . 2 2 0,95

. . 0,2846130328 0,04893743401 0,2846130328 0,04893743401 0,95

. . 0,2356755988 0,3335504668 0,95

st stst p st pI C p V P p V

I C P

I C P

4. De no crearse este servicio de venta a domicilio, cuál sería la proyección de ventas de la

fuente de soda para el 2010? Ajuste una línea de regresión, verifique si es apropiada

para pronosticar. Para esta proyección asuma que en este año 2010 esperamos atender

17000 clientes. Sugerencia: realice un análisis de regresión con los datos mostrados al

comienzo. ESTE ANÁLISIS DE REGRESIÓN HAGALO CON STATGRAPHICS.

Ruta a seguir:

i. Abrir programa STATGRAPHICS PLUS

ii. Analizar datos Existentes o Introducir nuevos datos Aceptar

iii. Deseo introducir nuevos datos Aceptar

iv. Modificar Columna Nombre: Clientes Atendidos Aceptar

v. Modificar Columna Nombre: Volumen Ventas Aceptar Cancelar

vi. Se introducen los datos respectivamente

vii. Dependencia

viii. Regresión Simple

ix. Entrada de datos:

a. X: Clientes Atendidos

b. Y: Volumen Ventas

x. Aceptar

xi. Resultado: Análisis de Regresión – Modelo lineal Y= a+bx

xii. Opciones Tabulares

xiii. Comparación de Modelos Alternativos Aceptar

xiv. Se observa los modelos en orden descendente según el R-cuadrado.

xv. Para cambiar los modelos, seleccione el cuadro de diálogo Opciones de Análisis.

xvi. Dependencia

xvii. Regresión Polinomial

xviii. Entrada de datos:

a. X: Clientes Atendidos

b. Y: Volumen Ventas

xix. Resultado: Análisis de Regresión Polinomial Orden 2

xx. Clic Derecho Opciones de Análisis Orden: 3 Aceptar

xxi. Resultado: Análisis de regresión Polinomial Orden 3

Comparación de Modelos Alternativos

Modelo Correlación R-cuadrado

Inverso-X Logarítmico-X

Curva-S Raíz cuadrada-X

Lineal Multiplicativo

Raíz cuadrada-Y Doble inverso Exponencial

Inverso-Y Logístico

Log Probit

-0,9833 0,976

-0,9735 0,9730 0,9674 0,9607 0,9570 0,9530 0,9439 -0,9102

<sin ajustes> <sin ajustes>

96,68% 95,57% 94,76% 94,68% 93,59% 92,30% 91,58% 90,83% 89,09% 82,84%

<sin ajustes> <sin ajustes>

El STATADVISOR

Esta tabla muestra los resultados de ajuste a los datos de varios modelos curvilíneos. De los

modelos ajustados, el modelo recíproco-X procura el valor de R-cuadrado más alto con 96,6811%.

Este es 3,09138% más alto que el modelo lineal seleccionado inicialmente.

Entonces, si solo realizamos el análisis de Regresión simple obtenemos que el modelo que más

se ajusta sea el que presenta el mayor R-cuadrado por tanto escogemos el Modelo Inverso-X y

obtenemos:

Análisis de Regresión – Modelo Inverso-X: Y= a+ (b/x)

Indicadores:

Coeficiente de correlación = -0,983266

R-cuadrado = 96,6811%

Error estándar de estimación = 0,626296

El STATADVISOR

La ecuación del modelo ajustado es:

262492,0 35,2436

Volumen ventas

Clientes Atendidos

Dado que el P-valor es inferior a 0.01, existe relación estadísticamente significativa entre el

Volumen de Ventas y Clientes Atendidos para un nivel de significancia del 99%.

El estadístico R-cuadrado indica que el modelo explica un 96,6811% de la variabilidad en Volumen

ventas. El coeficiente de correlación es igual a (-0,983266), indicando una relación relativamente

fuerte entre las variables. El error estándar de la estimación muestra la desviación típica de los

residuos que es de 0,626296.

Entonces podemos calcular el volumen de ventas proyectadas teniendo en cuenta el No. De

clientes atendidos que en este caso es de 17.000:

262492,0 (17000) 35,2436

17000

(17000) 19,80289412

Volumen ventas

Volumen ventas

Entonces el volumen de ventas proyectado para el año 2010 si se espera atender 17000 clientes

es de 19,803 millones de pesos aproximadamente.

Ahora si hacemos un nuevo análisis pero esta vez teniendo en cuenta tanto la regresión simple

como la polinomial los resultados serían los siguientes:

- Regresión Polinomial de orden 1 tenemos:

o R-cuadrado = 93,5897%

o Error estándar de estimación = 0,870404







En este caso el modelo de regresión que más se ajusta teniendo en cuenta el R-cuadrado más alto

y que más se acerca al 100% es el Modelo Polinomial de Orden 3 entonces su respectivo análisis es

el siguiente:

El STATADVISOR

La ecuación del modelo ajustado es:

7 2 11 3 69,4695 0,0142431* 8,04693 * 1,61738 *

Volumen ventas CA CA CA

donde CA Clientes Atendidos

Dado que el P-valor es inferior a 0.01, hay relación estadísticamente significativa entre el volumen

de Ventas y los clientes atendidos para un nivel de confianza del 99%.

El estadístico R-cuadrado indica que el modelo explica un 97,0037% de la variabilidad en el

volumen de ventas. El error estándar de la estimación muestra la desviación típica de los residuos

que es 0,674762.

Entonces podemos calcular nuevamente el volumen de ventas proyectadas teniendo en cuenta el

No. De clientes atendidos que en este caso es de 17.000 y utilizando el nuevo modelo ajustado:

7 2 11 3

10

10

69,4695 0,0142431*17000 8,04693 *17000 1,61738 *17000

69,4695 242,1327 132,2775915 2.479784899*10

2,479784899*10

Volumen ventas

Volumen ventas

Volumen ventas

Nota: En la determinación de orden apropiado del polinomio, tenga en cuenta que el P-valor del

término de mayor orden del polinomio es igual a 0,619587. Puesto que el P-valor es superior o

igual a 0.10, este término no es estadísticamente significativo para un nivel de confianza del 90% o

superior. Por consiguiente debería considerarse reducir el orden del modelo a 1 utilizando las

opciones de análisis del cuadro de diálogo.

REALIZADO POR:

- LEIDY JOHANNA CÁRDENAS SOLANO 2071978

- KATHERINE JULIETH SIERRA SUÁREZ 2071981

PRESENTADO A: PROF. JOSÉ JOAQUÍN GARCÍA DÍAZ

FECHA: 31 DE AGOSTO DE 2010

Documents

Trabajo de Aplicacion de Muestreo