View
218
Download
1
Category
Preview:
Citation preview
TECNOLOacuteGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MEacuteXICO
DIVISIOacuteN DE CONTADURIacuteA
ELABORACIOacuteN DE CUADERNILLO DE APUNTES
ESTADIacuteSTICA ADMINISTRATIVA II
ELABORADO POR
ING MIRIAM MEDINA DELGADO
LOS REYES LA PAZ ESTADO DE MEacuteXICO AGOSTO 2010
INDICE Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza
11 Anaacutelisis Ji-Cuadrada 1 12 Prueba de independencia 1 13 Prueba de la bondad del ajuste 1 14 Tablas de contingencia 4 141 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con dos renglones 4 142 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con maacutes de dos renglones 6 15 Anaacutelisis de varianza 9 151 Aplicaciones de ANOVA 9 152 Inferencia sobre una varianza de poblacioacuten (Anova) 14 153 Inferencia sobre la varianza de dos poblaciones (Anova) 15
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple 21 Estimacioacuten mediante la liacutenea de regresioacuten 16 211 Diagrama de dispersioacuten 16 212 Meacutetodo de miacutenimos cuadrados 17 213 Interpretacioacuten del error estaacutendar de la estimacioacuten 18 214 Intervalos de prediccioacuten aproximados 19 215 Anaacutelisis de correlacioacuten 22 216 Paquete computacional para la solucioacuten de problemas 22 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten 22 218 Usos de variables ficticias 25 219 Residuales y graacuteficas de residuales 25 Unidad 3 Nuacutemeros iacutendice
31 Elaboracioacuten de iacutendices simples 27 32 Iacutendices agregados de precio 27 33 Relativos eslabonados 28 34 Cambio de periodo base 28 35 Fusioacuten de dos series de nuacutemeros iacutendice 29 36 Iacutendice de precios al consumidor (IPC) 29 37 Deflacioacuten de los valores de series de tiempo 30 38 Iacutendice de precios al productor (IPP) 31 39 Promedios de precios bursaacutetiles de DowJones 31 310 Indice de produccioacuten insustrial 31
Unidad 4 Estadiacutestica no parameacutetrica
41 Escala de medicioacuten 33 42 Meacutetodos estadiacutesticos contra no parameacutetricos 33 43 Prueba de corridas para aleatoriedad 35 431 Concepto de aleatoriedad 35 432 Teoriacutea de corridas 35 4321 Prueba de corridas de una sola muestra 36 4322 Distribucioacuten de muestreo del estadiacutestico r 36 44 Una muestra prueba de signos 38 45 Una muestra prueba de Wilcoxon 40 46 Dos muestras prueba de Mann-Whitney 42 47 Observaciones apareadas prueba de Wilcoxon 45 48 Varias muestras independientes prueba de Krauskal-Wallis 46
INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras
Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica
Estadiacutestica Administrativa II 1
Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder
Estadiacutestica Administrativa II 2
Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis
Calificaciones positivas posibles en las tres
entrevistas
Nuacutemero de candidatos que obtienen cada
calificacioacuten Resultados de las entrevistas de 100 candidatos
0 18 1 47 2 24 3 11 100
Calificaciones positivas posibles en las tres
entrevistas
Probabilidades binomiales para esos resultados
Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000
Calificaciones positivas
posibles en las tres entrevistas
Frecuencia observada de
candidatos que obtienen estas calificaciones
Probabilidades binomiales de
resultados posibles
Nuacutemero de candidatos
entrevistados
Frecuencia esperada de candidatos
que obtienen estas
calificaciones
Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada
0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000
Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
INDICE Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza
11 Anaacutelisis Ji-Cuadrada 1 12 Prueba de independencia 1 13 Prueba de la bondad del ajuste 1 14 Tablas de contingencia 4 141 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con dos renglones 4 142 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con maacutes de dos renglones 6 15 Anaacutelisis de varianza 9 151 Aplicaciones de ANOVA 9 152 Inferencia sobre una varianza de poblacioacuten (Anova) 14 153 Inferencia sobre la varianza de dos poblaciones (Anova) 15
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple 21 Estimacioacuten mediante la liacutenea de regresioacuten 16 211 Diagrama de dispersioacuten 16 212 Meacutetodo de miacutenimos cuadrados 17 213 Interpretacioacuten del error estaacutendar de la estimacioacuten 18 214 Intervalos de prediccioacuten aproximados 19 215 Anaacutelisis de correlacioacuten 22 216 Paquete computacional para la solucioacuten de problemas 22 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten 22 218 Usos de variables ficticias 25 219 Residuales y graacuteficas de residuales 25 Unidad 3 Nuacutemeros iacutendice
31 Elaboracioacuten de iacutendices simples 27 32 Iacutendices agregados de precio 27 33 Relativos eslabonados 28 34 Cambio de periodo base 28 35 Fusioacuten de dos series de nuacutemeros iacutendice 29 36 Iacutendice de precios al consumidor (IPC) 29 37 Deflacioacuten de los valores de series de tiempo 30 38 Iacutendice de precios al productor (IPP) 31 39 Promedios de precios bursaacutetiles de DowJones 31 310 Indice de produccioacuten insustrial 31
Unidad 4 Estadiacutestica no parameacutetrica
41 Escala de medicioacuten 33 42 Meacutetodos estadiacutesticos contra no parameacutetricos 33 43 Prueba de corridas para aleatoriedad 35 431 Concepto de aleatoriedad 35 432 Teoriacutea de corridas 35 4321 Prueba de corridas de una sola muestra 36 4322 Distribucioacuten de muestreo del estadiacutestico r 36 44 Una muestra prueba de signos 38 45 Una muestra prueba de Wilcoxon 40 46 Dos muestras prueba de Mann-Whitney 42 47 Observaciones apareadas prueba de Wilcoxon 45 48 Varias muestras independientes prueba de Krauskal-Wallis 46
INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras
Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica
Estadiacutestica Administrativa II 1
Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder
Estadiacutestica Administrativa II 2
Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis
Calificaciones positivas posibles en las tres
entrevistas
Nuacutemero de candidatos que obtienen cada
calificacioacuten Resultados de las entrevistas de 100 candidatos
0 18 1 47 2 24 3 11 100
Calificaciones positivas posibles en las tres
entrevistas
Probabilidades binomiales para esos resultados
Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000
Calificaciones positivas
posibles en las tres entrevistas
Frecuencia observada de
candidatos que obtienen estas calificaciones
Probabilidades binomiales de
resultados posibles
Nuacutemero de candidatos
entrevistados
Frecuencia esperada de candidatos
que obtienen estas
calificaciones
Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada
0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000
Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Unidad 4 Estadiacutestica no parameacutetrica
41 Escala de medicioacuten 33 42 Meacutetodos estadiacutesticos contra no parameacutetricos 33 43 Prueba de corridas para aleatoriedad 35 431 Concepto de aleatoriedad 35 432 Teoriacutea de corridas 35 4321 Prueba de corridas de una sola muestra 36 4322 Distribucioacuten de muestreo del estadiacutestico r 36 44 Una muestra prueba de signos 38 45 Una muestra prueba de Wilcoxon 40 46 Dos muestras prueba de Mann-Whitney 42 47 Observaciones apareadas prueba de Wilcoxon 45 48 Varias muestras independientes prueba de Krauskal-Wallis 46
INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras
Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica
Estadiacutestica Administrativa II 1
Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder
Estadiacutestica Administrativa II 2
Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis
Calificaciones positivas posibles en las tres
entrevistas
Nuacutemero de candidatos que obtienen cada
calificacioacuten Resultados de las entrevistas de 100 candidatos
0 18 1 47 2 24 3 11 100
Calificaciones positivas posibles en las tres
entrevistas
Probabilidades binomiales para esos resultados
Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000
Calificaciones positivas
posibles en las tres entrevistas
Frecuencia observada de
candidatos que obtienen estas calificaciones
Probabilidades binomiales de
resultados posibles
Nuacutemero de candidatos
entrevistados
Frecuencia esperada de candidatos
que obtienen estas
calificaciones
Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada
0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000
Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras
Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica
Estadiacutestica Administrativa II 1
Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder
Estadiacutestica Administrativa II 2
Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis
Calificaciones positivas posibles en las tres
entrevistas
Nuacutemero de candidatos que obtienen cada
calificacioacuten Resultados de las entrevistas de 100 candidatos
0 18 1 47 2 24 3 11 100
Calificaciones positivas posibles en las tres
entrevistas
Probabilidades binomiales para esos resultados
Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000
Calificaciones positivas
posibles en las tres entrevistas
Frecuencia observada de
candidatos que obtienen estas calificaciones
Probabilidades binomiales de
resultados posibles
Nuacutemero de candidatos
entrevistados
Frecuencia esperada de candidatos
que obtienen estas
calificaciones
Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada
0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000
Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 1
Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder
Estadiacutestica Administrativa II 2
Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis
Calificaciones positivas posibles en las tres
entrevistas
Nuacutemero de candidatos que obtienen cada
calificacioacuten Resultados de las entrevistas de 100 candidatos
0 18 1 47 2 24 3 11 100
Calificaciones positivas posibles en las tres
entrevistas
Probabilidades binomiales para esos resultados
Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000
Calificaciones positivas
posibles en las tres entrevistas
Frecuencia observada de
candidatos que obtienen estas calificaciones
Probabilidades binomiales de
resultados posibles
Nuacutemero de candidatos
entrevistados
Frecuencia esperada de candidatos
que obtienen estas
calificaciones
Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada
0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000
Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 2
Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis
Calificaciones positivas posibles en las tres
entrevistas
Nuacutemero de candidatos que obtienen cada
calificacioacuten Resultados de las entrevistas de 100 candidatos
0 18 1 47 2 24 3 11 100
Calificaciones positivas posibles en las tres
entrevistas
Probabilidades binomiales para esos resultados
Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000
Calificaciones positivas
posibles en las tres entrevistas
Frecuencia observada de
candidatos que obtienen estas calificaciones
Probabilidades binomiales de
resultados posibles
Nuacutemero de candidatos
entrevistados
Frecuencia esperada de candidatos
que obtienen estas
calificaciones
Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada
0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000
Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe
fo= frecuencia observada fe= frecuencia esperada
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 3
Frecuencia observada
fo
Frecuencia esperada
fe
fo-fe (fo-fe)2 (fo-fe)2
fe
Calculo del estadiacutestico x2
18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063
X2=50406
Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas
Grados de libertad = k-1
K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-16 466 11-17 466 11-18 466
Regioacuten de aceptacioacuten
50406
020 del aacuterea
Valor x2
Distribucioacuten x2
4642
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 4
14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa
oeste Total
Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados
Nuacutemero de empleados que prefieren el meacutetodo actual
68 75 57 79 279
Nuacutemero de empleados que prefieren el meacutetodo nuevo
32 45 33 31 141
Total de empleados muestreados en cada regioacuten
100 56 90 110 420
Planteamiento del problema
Hipoacutetesis nula Ho PN=PS=PC=PW
Hipoacutetesis alternativa
Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 5
Frecuencias observadas y esperadas
Noreste Sureste Central Costa oeste
Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual
x 06643 x 06643 x 06643 x 06643
Nuacutemero que se espera prefiera el meacutetodo actual
6643 7972 5979 7307
Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo
x 03357 x 03357 x 03357 x 03357
Nuacutemero que se espera prefiera el meacutetodo nuevo
3357 4028 3021 3693
Noreste Sureste Central Costa
oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados
Frecuencia con que prefieren el meacutetodo actual
68 75 57 79
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
6643 7972 5979 7307
Frecuencia con que prefieren el meacutetodo nuevo
32 45 33 31
Frecuencia observada (real) Frecuencia esperada (teoacuterica)
3357 4028 3021 3693
Estadiacutestico ji- cuadrada
119961120784 = 120622
(119943119952 minus 119943119942)120784119943119942
fo= frecuencia observada fe= frecuencia esperada
Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2
fo fe fo-fe (fo-fe)2 (fo-fe)2
fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733
45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 6
Determinacioacuten de los grados de libertad
Nuacutemero de grados de libertad
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad
Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar
Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de
contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada
x2 = Σ(fo-fe)2
fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones
Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones
Grados de libertad en una prueba ji- cuadrada
= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)
Regioacuten de aceptacioacuten
2764
010 del aacuterea
Valor x2
Distribucioacuten x2
con 3 grados de
libertad
6251
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 7
Tabla de contingencia Nuacutemero de
renglones Nuacutemero de columnas
r-1 c-1 Grados de libertad (r-1)(c-1)
A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40
El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia
Fraccioacuten de costos cubiertos por el seguro
lt25 40 75 65 180 25 -50 30 45 75 150
gt50 40 100 190 330
Total 110 220 330 660
Planteamiento del problema
Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes
Hipoacutetesis alternativa
Hi el tiempo de estancia depende del tipo de seguro
α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda
Calculo de la frecuencia esperada fe= RT X CT n
fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 8
Estadiacutestico ji- cuadrada
fo= frecuencia observada fe= frecuencia esperada
x2 = Σ(fo-fe)2
fe
Rengloacuten Columna fo fe = RT X CT n
fo-fe (fo-fe)2 (fo-fe)2
fe Calculo de las frecuencias esperadas y ji- cuadrada
1 1 40 30 180 X 110 660
10 100 3333
1 2 75 60 180 X 220 660
15 225 3750
1 3 65 90 180 X 330 660
-25 625 6944
2 1 30 25 150 X 110 660
5 25 1000
2 2 45 50 150 X 220 660
-5 25 0500
2 3 75 75 150 X 330 660
0 0 0000
3 1 40 55 330 X 110 660
-15 225 4091
3 2 100 110 330 X 220 660
-10 100 0909
3 3 190 165 330 X 330 660
25 625 3788
X2=24315
Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados
Regioacuten de aceptacioacuten
x2= 24315
010 del aacuterea
Distribucioacuten x2
13277
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 9
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-1 459 11-2 460 11-7 460 11-8 460 11-9 460
11-10 460 11-11 461 11-12 461 11-13 461
15 Anaacutelisis de varianza
El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1
Hipoacutetesis nula tiacutepica
HO= μ1= μ2= μ3
El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias
151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar
1 Mario F Triola Estadiacutestica Pearson Meacutexico2006
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 10
Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F
1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el
numerador y el denominador
Figura 1 Fuente (Triola 2006605) Ejemplo
Muestra 1 15 18 19 22 11
Muestra 2 22 27 18 21 17
Muestra 3 18 24 19 16 22 15
Planteamiento de la hipoacutetesis
Ho μ1= μ2= μ3
H1 μ1 μ2 y μ3 no son todas iguales
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 11
Caacutelculo de la media
Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18
18 27 24 19 18 19 22 21 16 11 17 22
15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de
la muestra 17 21 19 Media
muestral n1=5 n2=5 n3=6
1= 17 2= 21 3= 19
Caacutelculo de la gran media
= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16
Caacutelculo de la varianza entre columnas
σ2b = Σnj ( - )2 = k-1
n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas
5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )
2 =40
σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas
k-1 3-1 2
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 12
Estimacioacuten de la varianza dentro de columnas
Meacutetodo de capacitacioacuten 1 Media muestral =17
Estimacioacuten de la varianza dentro de columnas
- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70
s21= Σ( - )2 = 70 = 175 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 2 Media muestral =21
Estimacioacuten de la varianza dentro de columnas
- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62
s22= Σ( - )2 = 62 = 155 varianza de la muestra
n-1 5-1
Meacutetodo de capacitacioacuten 3 Media muestral =19
Estimacioacuten de la varianza dentro de columnas
- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 13
s23= Σ( - )2 = 60 = 120 varianza de la muestra
n-1 6-1
σ2w = Σ nj - 1 s2
j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13
Estadiacutestico F
F = varianza entre columnas = σ2b
Varianza dentro de columnas σ2w
F= 20 = 1354 cociente F 14769
Determinacioacuten de los grados de libertad
Grados de libertad del numerador
Nuacutemero de grados de libertad en el numerador del cociente F
= (nuacutemero de muestras-1)
Grados de libertad del denominador
Nuacutemero de grados de libertad en el denominador del cociente F
= Σ (nj-1)= nt-k
Graacutefica
Se acepta la hipoacutetesis nula
Regioacuten de aceptacioacuten
F= 1354
005 del aacuterea
Distribucioacuten f
381
Valor de tabla
Regioacuten de rechazo
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 14
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
11-5 479 11-6 479
11-26 480 11-27 480 11-28 480 11-29 480 11-30 480
152 Inferencia sobre una varianza de poblacioacuten (Anova)
Estadiacutestico ji- cuadrada para inferencias sobre una varianza
X2=(n-1)s2 σ2
Intervalo de confianza para σ2
Liacutemite inferior de confianza
σ2L=(n-1)s2 X2
U Liacutemite superior de confianza
σ2U=(n-1)s2 X2
L
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 15
Ejercicio
Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de
confianza del 95
Tiempo x
50 45 27 66 43 96 45 90 69
153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente
Coeficiente F para inferencias acerca de dos varianzas
F=S21
S22
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 16
Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple
21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y
Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas
X
Y
Gastos contra la contaminacioacuten
Emisor de
contaminacioacuten
Pendiente negativa
b) Relacioacuten directa
X
Y
Publicidad
Ventas
Pendiente positiva
a) Relacioacuten directa
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 17
Figura 3 Fuente (Levin 2004503)
212 Meacutetodo de miacutenimos cuadrados
Liacutenea de estimacioacuten
Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente
Pendiente de la recta de regresioacuten de mejor ajuste
b = Σ XY - n X Y Σ X2 - n X2
b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 18
Liacutenea de estimacioacuten
a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente
Error estaacutendar de la estimacioacuten
Se= Σ(Y-Y)2
n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 19
Figura 4 Fuente (Levin 2004529)
Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo
Y= 375 + 075 X Sustituyendo 4 en X
Y= 375 + 075 (4) = 375 + 300
= 675
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 20
Intervalo 1 error 2 errores 3 errores
Y plusmn1 Se
Y plusmn2 Se
Y plusmn3 Se
En donde Se = 8660
Sustitucioacuten
Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40
a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten
Y +1 Se =
675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten
Y +2 Se =
675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten
Y -1 Se =
675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten
Y - 2 Se =
675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 21
X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024
b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
12-2 531 12-3 531
12-13 531 12-14 531 12-15 531
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 22
215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten
Coeficiente de determinacioacuten de la muestra
r2= aΣY+bΣXY-nY2
ΣY2 ndash n Y2
Coeficiente de correlacioacuten de la muestra
r= r2
Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 23
Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables
Y= a + b1 X1 + b2 X2
Ecuacioacuten
na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2
1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2
2 = Σ X2Y
Ejemplo
a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10
Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784
Sumatoria
114 105 85 2463 1590 1435 2367 1571
Matriz
6 105 85 114 105 2367 1435 2463 85 1435 1571 1590
1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25
1 175 14167 19 0 1 -099 884 0 0 361608 21410
361608 b2 = 21410 b2 = 21410 361608 b2 = 059
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 24
1 b1 -099 b2 = 884 1 b1 -099 (059) = 884
-006 884 1b1 = 884 +006 b1 = 890
1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a
= 2589
Y= a + b1 X1 + b2 X2
y=2589+890(28)+059(10)=28099
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 25
218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)
Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad
La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos
Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir
donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria
Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados
Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante
Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 26
Figura 5 Distribucioacuten Homocedaacutestica
Figura 6 Distribucioacuten Heterocedaacutestica
Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten
lineal para hacer estimaciones futuras
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 27
Unidad 3 Nuacutemeros iacutendice
Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se
calcula encontrando el cociente del valor actual entre el valor base luego se
multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje
Tipos de nuacutemeros iacutendice
Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de
cantidad e iacutendice de valor
Iacutendice de precios
Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida
Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo
Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable
El iacutendice de valor combina los cambios de precio y cantidad para presentar un
iacutendice con maacutes informacioacuten
Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos
como indicadores generales de la condicioacuten econoacutemica de un paiacutes
Factores que pueden distorsionar los nuacutemeros iacutendice
bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados
bull Falta de comparacioacuten de iacutendices
bull Ponderacioacuten no apropiada de los factores
bull Seleccioacuten de una base no apropiada
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 28
31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores
Iacutendice de cantidad de agregados no ponderados
ΣQi x 100 ΣQo
Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea
1993 1994 1995
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200
Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado
1993 Qo
1994 Q1
1995 Q2
Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 29
Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra
Iacutendice de precios de agregados ponderados
ΣPiQ x 100 ΣPoQ
Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100
Cambio de periodo base
I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 30
35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos
Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables
Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico
Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios
El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 31
Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica
37 Deflacioacuten de los valores de series de tiempo
Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios
En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea
La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores
Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero
Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes
Los valores expresados en unidades monetarias corrientes se conocen como valores nominales
Los valores expresados en unidades monetarias constantes se conocen como valores reales
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 32
38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor
Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos
39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 33
Siacutembolo Nombre de la compantildeiacutea
AA Alcoa
ALD Allied Signal
AXP American Express
BA Boeing
CAT Caterpillar
CHV Chevron
C CitiGroup
DIS Disney
DD Dupont
EK Eastman Kodak
GE General Electric
GM General Motors
GT Goodyear Tire
HWP Hewlett-Packard
IBM International Business Machines
IP International Paper
JNJ Johnson amp Johnson
JPM JP Morgan Bank
KO Coca Cola
Figura 5 Compantildeiacuteas comprendidas en el Dow Jones
310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos
Praacutectica 2
992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico
elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado
de precios
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 34
Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida
bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)
42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten
Las principales pruebas no parameacutetricas son las siguientes
bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 35
bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon
Caracteriacutesticas de algunas pruebas no parameacutetricas
1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos
2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten
3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal
4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados
5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc
6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica
Prueba Caracteriacutestica
Mann- Whitney 2 muestras independientes
Wilcoxon 2 muestras asociadas
Kruskal-Wallis + de 2 muestras independientes
Friedman + de 2 muestras asociadas
Tabla1 Caracteriacutesticas de pruebas no parameacutetricas
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 36
Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media
Ventajas y desventajas de los meacutetodos parameacutetricos
Desventajas Ventajas bull Ignoran cierta cantidad de
informacioacuten bull No requieren la suposicioacuten de que
una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica
bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas
bull Generalmente es maacutes sencillo realizarlas y entenderlas
bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal
Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo
MHHHHM
1ra 2ra 3ra
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 37
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1
n2= nuacutemero de ocurrencias del tipo 2
r= nuacutemero de corridas
4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue
BABBBAAABBABBBBAAAABABAABBBAABAAAABBA
BBAAAABBABBBBAABBABAABB
Valores de la prueba
n1= 29
n2= 31
r= 29
4322 Distribucioacuten de muestreo del estadiacutestico r
El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba
Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente
Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1
n1+n2
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 38
μr = 2(29)(31) +1
29+31
μr = 1798 +1 60
μr = 2997 +1
μr = 3097
Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)
(n1+n2)2(n1+n2-1)
σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)
σr= (1798) (1738)
(60)2(59)
σr= 1471
σr= 384
Ejercicios Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-24 643 14-25 643 14-26 643 14-27 644 14-28 644
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 39
44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica
Ejemplo
Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado
Miembro del panel Calificacioacuten para
conferencias grandes
Calificacioacuten para
sesiones pequentildeas
Signo de la calificacioacuten
Evaluacioacuten de los dos tipos de
clases
1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -
6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +
La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)
Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 40
Establecimiento de las hipoacutetesis
Ho p = 05
H1 p ne 05
Se consideran la posibilidades solamente de signos + y - (9+6 =15)
p Ho = 05
q H0 = 05
n= 15
p= 0600 (915)
q= 0400 (615)
Prueba de hipoacutetesis de que no hay diferencia
Error estaacutendar del la proporcioacuten
σp= pq n
σp= (05)(05) 15
σp= 0129
0025
0
0475 del aacuterea
Valor criacutetico Z=-196
Regioacuten de aceptacioacuten
0025
0475 del aacuterea
Valor criacutetico Z=196
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 41
45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten
Procedimiento de la prueba de rangos con signo de Wilcoxon
Paso1 Para cada par de datos calcule la diferencia d restando el segundo
valor del primero Guarde los signos pero descarte cualquier par para el que
d=0
Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de
la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango
correspondiente Cuando las diferencias tengan el mismo valor numeacuterico
asiacutegneles la media de los rangos implicados en el empate
Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino
Esto es inserte aquellos signos que se ignoraron e el paso dos
Paso 4 Calcule la suma de los valores absolutos de los rangos negativos
Tambieacuten la suma de los rangos positivos
Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon
en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el
procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos
sumas
Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la
diferencia d no es 0
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 42
Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el
tamantildeo muestral
Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos
muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica
esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico
Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente
2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha
Notacioacuten
T= la maacutes pequentildea de las siguientes dos sumas
1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0
La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 43
46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2
Rango Calificacioacuten Plantel
1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S
10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 44
30 1600 S
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 45
Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
n1= 15 n2= 15 R1= 247 R2= 218
Estadiacutestico U
U = n1n2 + n1(n1 +1) -R1 2
U= (15)(15) + (15)(16) -247 2
U= 225+120-247
U= 98
Media de la distribucioacuten muestral U
μu = n1n2
2
μu = (15)(15)
2
μu =1125
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 46
Estadiacutestico U
σU = n1n2 + (n1n2 +1)
12
σU = (15)(15)(15+15+1)
12
σU = 6975 12
σU = 58125
σU = 241
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2
α= 015
Estandarizacioacuten del estadiacutestico U
z = U-μu
σU
z = 98 - 1125 241
z = -0602
144 -144 0 -0602
Valor estandarizado de
la muestra U
Regioacuten de aceptacioacuten
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 47
Observaciones apareadas prueba de Wilcoxon
La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras
Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular
Prueba de Wilcoxon de los rangos con signo
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande
Prueba de Wilcoxon para contrastar datos pareados
El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 48
49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo
Rango calificaciones Meacutetodo de capacitacioacuten
Calificaciones del examen escrito
1 50 S
2 55 VC 3 57 AC 4 65 AC 5 68 S
6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S
Estadiacutestico K
K = 12 R2j -3 (n+1)
n(n+1) nj
K= 12 (61)2 + (42)2 + (107)2 -3(20+1)
20(20+1) 6 5 9
K = 1143
Σ
[ ]
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 49
Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales
α= 010
Ejercicios
Realizar los siguientes ejercicios del libro
1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall
Nuacutemero Paacutegina
14-14 637 14-55 637 14-16 637 14-17 637 14-18 637
4605
010 de aacuterea
Regioacuten de aceptacioacuten
Valor de la muestra
K= 1143
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
Estadiacutestica Administrativa II 50
Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar
comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
BIBLIOGRAFIA
bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y
economiacutea (7aed) Meacutexico 2004
bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza
En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson
educacioacuten
bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten
bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la
ingenieriacutea Meacutexico Limusa Wiley
Referencias de internet http mathuprm edu ~edgar uprmedu
httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n
httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica
httpwwwestadisticafacilcom
StAta
StAta
Recommended