Webster Allen - Estadistica Aplicada a Los Negocios Y La Economia (1)

  • Upload
    linfe

  • View
    10.389

  • Download
    1.446

Embed Size (px)

Citation preview

  • -

    Tercera edicin

    Disquete de datos Ejerciciosipm~~. por inpr

    ter

  • Estadstica aplicada a los negocios y la economa

    ALLEN L. WEBSTER Bradley University

    Traduccin YELKA MARA GARCA

    Profesional en Lenguas Modernas Especializacin en traduccin Universidad de Los Andes

    Revisin Tcnica CARLOS LESMES LOZANO

    Estadstico Universidad Nacional de Colombia

    Licenciado y magster en Matemtica Universidad Pedaggica Nacional GILBERTO PRIETO MARN

    Profesor de Est~idstica y Matemticas Facultad de Contadura y Administracin

    Universidad Nacional Autnoma de Mxico

    Santa Fe de Bogot Buenos Aires Caracas Guatemala Lisboa Madrid Mxico New York Panam San Juan Santiago de Chile Sao Paulo

    Auckland Hamburgo Londres Miln Montreal Nueva Delhi Pars San Francisco San Luis Sidney Singapur Tokio Toronto

  • Estadstica aplicada a los negocios y la economa, tercera edicin

    No est permitida la reproduccin total o parcial de este libro, ni su tratamiento infomtico, ni la transmisin de ninguna forma o por cualquier medio, ya sea electrnico, mecnico, por fotocopia, por registro u otros mtodos, sin el permiso previo y por escrito de los titulares del Copynght.

    DERECHOS RESERVADOS. Copynght O 2000, por McGRAW-HILL INTERAMERICANA, S.A. Avenida de las Amricas 46-41. Santa Fe de Bogot, Colombia.

    Traducido de la tercera edicin en ingls de APPLIED STATISTICS FOR BUSNESS AND ECONOMICS. An Essentials Version Copyright O MCMXCVIII, por THE McGRAW-HILL COMPANIES, Inc. ISBN: 0-256-22554-0

    Editor: Lily Solano Arvalo

    ISBN: 958-41-0072-6

    Impreso en Colombia Printed in Colombia

    Se iinprimieron 8550 ejeinplares en el ines de inayo de 200 1 Iinpreso por Quebecor World Bogot S.A.

  • A mi adorable esposa Brbara: Por todas las promesas que la vida nos cumple.

  • CONTENIDO

    PREFACIO, XI

    El papel de la estadstica, 2 1.1 Introduccin, 5 1.2 La importancia de la estadstica, 5 1.3 Oportunidades que ofrece la estadstica, 6

    A. La aplicacin universal de la estadstica, 6 B. Gerencia de calidad total, 7 C Necesidad de la formacin en estadstica,

    8 1.4 Algunas definiciones bsicas, 8

    A. Poblaciones y parmetros, 8 B. Muestras y estadsticos, 9 C. Variables, 9

    1.5 La importancia del muestreo, 10 1.6 Las funciones de la estadstica, 11 1.7 Escalas de medida, 12

    Descripcin de los conjuntos de datos, 18 2.1 Introduccin, 20 2.2 Mtodos de agrupacin de datos, 21

    A. Distribuciones de frecuencias, 21 B. Tablas de contingencia, 25

    2.3 Gratos, 27 Problemas resueltos, 30 Lista de frmulas, 33

    Medidas de tendencia central y de dispersin, 38 3.1 Introduccin, 40

    3.2 Medidas de la tendencia central a partir de datos no agrupados, 41 A. La media, 4 1 B. La mediana, 42 C. Lamoda, 42 D. La media ponderada, 43 E. La media geomtrica, 44

    3.3 Comparacin entre media, mediana y moda, 46 3.4 Medidas de dispersin, 47

    A. El rango, 48 B. Varianza y desviacin estndar

    de una poblacin, 48 C. Varianza y desviacin estndar para

    una muestra, 50 3.5 Medidas de tendencia central y de dispersin

    para datos agrupados, 53

  • VI ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    A. La media, 53 B. La mediana, 54 C. Lamoda, 55 D. Varianza y desviacin estndar, 55

    3.6 Otras medidas de dispersin, 57 3.7 Usos frecuentes de la desviacin estndar, 59

    A. Teorema de Chebyshev, 59 B. La distribucin normal y la regla emprica,

    60 C. Sesgo, 62 D. Coeficiente de variacin, 63

    Problemas resueltos, 64 Lista de frmulas, 66

    Principios de probabilidad, 74 4.1 Introduccin, 76 4.2 Experimentos, resultados y conjuntos, 76 4.3 Introduccin a la probabilidad, 77 4.4 Uniones, intersecciones y relaciones entre

    eventos, 80 4.5 Tablas de contingencia y tablas de probabilidad,

    83 4.6 Probabilidad condicional, 84 4.7 Las dos reglas de la probabilidad, 86

    A. Regla de la multiplicacin, 86 B. Regla de la adicin, 87

    4.8 Teorema de Bayes, 90 4.9 Tcnicas de conteo, 93 Problemas resueltos, 96 Lista de frmulas, 97

    CAP~TULO 5 Distribuciones de probabilidad, 102 5.1 Introduccin, 104 5.2 Media y la varianza de las distribuciones

    discretas, 106

    5.3 La distribucin binomial - una distribucin discreta de probabilidad, 108 A. La media y la varianza de una distribucin

    binomial, 1 10 B. Distribuciones binomiales acumuladas, 11 1 C. Usando el computador, 112

    5.4 La distribucin hipergeomtrica, 1 13 A. Uso el computador, 115

    55 La distribucin de Poisson, 115 A. Uso del computador, 1 17

    5.6 La distribucin exponencial, 11 8 A. Usando el computador, 119

    5.7 La distribucin uniforme, 120 A. Usando el computador, 122

    5.8 La distribucin normal, 123 A. Comparacin entre distribuciones

    normales, 124 B. La desviacin normal, 125 C. Clculo de probabilidades

    con la desviacin normal, 126 D. Clculo de un valor X a partir

    de una probabilidad conocida, 130 E. Aproximacin normal a la distribucin

    binomial, 132 Problemas resueltos, 134 Lista de frmulas, 137

    Distribuciones muestrales, 142 6.1 Introduccin, 144 6.2 Distribuciones muestrales, 145

    A. La media de las medias muestrales, 146 B. La varianza y el error estndar de las medias

    muestrales, 147 C. El impacto del tamao de la muestra

    en el error estndar, 149 6.3 Teorema del lmite central, 150 6.4 Uso de la distribucin muestral, 152 6.5 La distribucin de las proporciones muestrales,

    157

  • CONTENIDO VI 1

    6.6 Mtodos de muestreo, 160 A. Muestreo aleatorio simple, 161 B. Muestreo sistemtico, 161 C. Muestreo estratificado, 161 D. Muestreo por conglomerados, 162

    Problemas resueltos, 162 Lista de frmulas, 163

    Estimacin con intervalos de confianza, 1 6 8 7.1 Introduccin, 170

    A. El fundamento de un intervalo de confianza, 17 1

    7.2 Intervalo de confianza para la media poblacional - Muestras grandes, 172 A. Interpretacin de un intervalo de confanza,

    173 B. Intervalo de confianza cuando o es

    desconocida, 174 7.3 Intervalo de confianza para la media en el caso

    de muestras pequeas - la distribucin t, 176 7.4 Intervalo de confianza para la proporcin

    poblacional, 180 7.5 Control del ancho de un intervalo, 182

    A. Reduccin del nivel de confianza, 182 B. Incremento del tamao muestral, 182

    7.6 Determinacin del tamao apropiado de la muestra, 183 A. Tamao de la muestra para estimar p, 183 B. Tamao de la muestra para estimar n, 185

    7.7 Propiedades de un buen estimador, 186 A. Estimador insesgado, 187 B. Estimador eficiente, 188 C. Estimador consistente, 188 D. Estimador suficiente, 189

    Problemas resueltos, 189 Lista de frmulas, 190

    Prueba de hiptesis, 196 8.1 Introduccin, 198 8.2 El concepto de prueba de hiptesis, 199

    A. Valores crticos de Z y zonas de rechazo, m

    B. El nivel de significancia y la probabilidad de error, 20 1

    8.3 Prueba de dos colas para p, 202 8.4 Prueba de una cola para p, 206 8.5 Valores p: Uso e interpretacin, 210

    A. Valor p para una prueba de dos colas, 21 1 8.6 Pruebas para p, muestras pequeas, 213 8.7 Pruebas para n, 2 16 Problema resuelto, 21 9 Lista de frmulas, 222

    Pruebas cuando se tienen dos poblaciones, 2 2 8 9.1 Introduccin, 230 9.2 Estimacin por intervalo en el caso de muestras

    independientes, 23 1 A. Estimacin con muestras grandes, 231 B. Estimacin con muestras pequeas:

    La distribucin t, 234 9.3 Estimacin del intervalo con muestras pareadas,

    238 9.4 Intervalos de confianza para la diferencia entre

    dos proporciones, 243 9.5 Seleccin del tamao apropiado de la muestra,

    245 A. Tamao de la muestra para estimar p, - p,,

    245 B. Tamao de la muestra para estimar n, - n,,

    245 9.6 Pruebas de hiptesis para dos medias con

    muestras independientes, 246

  • Vlll ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOMIA

    A. Pruebas con muestras grandes, 246 11.4 Ejemplo utilizando MCO (mnimos cuadrados B. Pruebas con muestras pequeas: ordinarios), 332

    La distribucin t, 249 11.5 Supuestos del modelo de regresin lineal, 336 9.7 Pruebas de hiptesis con datos por pareados, 11.6 El error estndar de estimacin: Una medida

    250 de bondad de ajuste, 341 9.8 Una prueba para la diferencia entre dos 11.7 Anlisis de correlacin, 345

    proporciones, 251 11.8 Limitaciones del anlisis de reaesin. 349 9.9 Comparacin de la varianza de dos poblaciones

    normales, 253 Problemas resueltos, 255 Lista de,frmulas, 259

    Anlisis de varianza, 270 10.1 Introduccin, 272 10.2 Anlisis de varianza a una va: Diseo

    completamente aleatorizado, 274 A. Fundamentos del ANOVA, 275 B. La suma de cuadrados, 276 C. Cuadrados medios, 278 D. Una tabla de anlisis de varianza, 280

    10.3 Pruebas para la diferencia entre pares de medias, 283 A. Pruebas para diseos balanceados, 283 B. Pruebas para diseos no balanceados, 286

    10.4 ANOVA a dos vas: El diseo aleatorizado en bloques, 289

    10.5 Anlisis factorial, 298 ' 10.6 Diseo en cuadrado latino, 302 Problemas resueltos, 306 Lista de frmulas, 3 1 1

    Regresin simple y correlacin, 322 11.1 Introduccin, 324 11.2 Determinacin del modelo de regresin lineal

    simple, 326 11.3 Mnimos cuadrados ordinarios: La recta

    de mejor ajuste, 328

    w

    11.9 Pruebas para los parmetros poblacionales, 349 A. Pruebas para p,, 350 B. Pruebas para el coeficiente de correlacin

    poblacional p, 351 11.10 Intervalos de confianza en el anlisis

    de regresin, 353 A. La media de Y condicionada a un valor

    deX, 353 B. El intervalo de prediccin para un valor

    nico de Y, 355 C. Factores que influyen el ancho

    del intervalo, 357 11.1 1 Anlisis de varianza en la regresin, 358 Problemas resueltos, 359 Lista de frmulas, 366

    Regresin mltiple y correlacin,

    12.1 Introduccin, 376 122 El modelo de regresin mltiple para Hop

    Scotch Airlines, 377 12.3 Evaluacin del modelo, 379

    A. El error estndar de estimacin, 380 B. Coeficiente de determinacin mltiple, 38 1 C El coeficiente de determinacin corregido,

    382 D. Evaluacin del modelo como un todo, 383 E. Pruebas individuales para los coeficientes

    de regresin parcial, 385 12.4 Presencia de multicolinealidad, 390

    A. Los problemas de la multicolinealidad, 390 B. Deteccin de la multicolinealidad, 391

  • CONTENIDO IX

    C. Corrigiendo la multicolinealidad, 393 12.5 Comparacin de los coeficientes de regresin,

    394 12.6 Regresin paso a paso, 396

    A. Eliminacin hacia atrs, 396 B. Seleccin hacia adelante, 396

    12.7 Variables dumrny, 396 12.8 El caso curvilineal, 401 Lista de frmulas, 405

    Series de tiempo y nmeros ndice, 410 13.1 Introduccin, 412 13.2 Series de tiempo y sus componentes, 413

    A. Tendencia secular, 414 B. El componente estacional, 414 C. Variaciones cclicas, 415 D. Variaciones irregulares, 41 6

    13.3 Modelos de series de tiempo, 416 13.4 Tcnicas de suavizamiento, 416

    A. Promedios mviles, 4 17 B. Suavizarniento exponencial, 420

    13.5 Anlisis de tendencia, 424 13.6 Descomposicin de las series de tiempo, 428

    A. Aislamiento de la componente estacional, 428

    B. Aislamiento de la variacin cclica, 434 C. Variacin irregular, 435

    13.7 El uso de los nmeros ndice, 436 A. ndice de precios simple, 436 B. ndices de precios agregativos, 439 C. ndice de precios agregativos ponderados,

    439 13.8 ndices especficos, 445

    A. ndice de precios al consumidor, 445 B. Otros ndices, 445

    13.9 Usos del IPC (ndice de Precios al Consumidor), 446

    Problemas resueltos, 448 Lista de frmulas, 453

    Prueba chi-cuadrado y otras pruebas no paramtricas, 462 14.1 Introduccin, 464 14.2 Distribucin chi-cuadrado (y), 465

    t A. Pruebas de bondad de ajuste, 465 B. Tablas de contingencia. Una prueba

    de independencia, 472 14.3 Prueba del signo, 477 14.4 La prueba de rachas, 482 14.5 Prueba U de Mann-Whitney, 486

    A. Prueba de dos colas, 489 B. Prueba de una cola, 489

    14.6 Correlacin de rangos de Spearman, 491 14.7 Prueba de Kruskal-Wallis, 496 Problemas resueltos, 500 Lista de frmulas, 505

    Tcnicas de control de calidad, 51 8 15.1 Introduccin, 521 15.2 Breve historia del desarrollo mundial del control

    de calidad, 521 15.3 Cartas de control para variables, 523 15.4 Cartas de control para la media y la dispersin,

    526 A. LacartaX,527 B. La carta R, 529

    15.5 Cartas de control para atributos, 533 A. Cartasp,533 B. Cartasc, 537

    15.6 Interpretacin de las cartas de control, 541 15.7 Muestreo de aceptacin, 543

  • X ESTAD~ST~CA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    A. Diferentes planes de muestreo, 545 B. Curvas caractersticas de operacin, 545

    Problemas resueltos, 546 Lista de frmulas, 550

    Cmo escribir un informe de negocios, 560 A.l Introduccin, 561 A.2 La necesidad de comunicarse, 561 A.3 Las caractersticas del lector, 561 A.4 El propsito de los informes estadsticos, 562

    A. El resumen ejecutivo, 562 B. Introduccin, 562 C. Metodologa, 563 D. Hallazgos, 563 E. Discusin e interpretacin, 563 F. Conclusiones y recomendaciones, 563

    A.5 Ilustraciones y ejemplos, 563 A. El resumen ejecutivo, 564 B. Introduccin, 565 C. Metodologa, 565 D. Hallazgos, 565 E. Discusin e interpretacin, 567 F. Conclusiones y recomendaciones, 567

    Respuestas a problemas seleccionados, 568

    APNDICE III Tablas estadsticas, 580

  • PREFACIO

    De la misma manera que en las ediciones anteriores de este libro, esta tercera edicin contina enfatizando la importancia de aplicar el anlisis estadstico a la solucin de problemas comunes en los negocios. Toda oportunidad se utiliza para demostrar la forma como la estadstica puede, de manera efectiva facilitar muchas decisiones que los gerentes enfrentan casi a diario. Adems, la obra se ha condensado para presentar el material de forma ms concisa y manejable. Varias de las caractersticas pedaggicas descritas a continuacin tambin han sido agregadas para mejorar las ventajas de instruccin expuestas en este texto.

    Esta tercera edicin de Estadstica aplicada a los negocios y la economa, se puede utilizar de manera efectiva en un curso de estadstica. A pesar de que el material ha sido comprimido para permitir una discusin tpica y dinmica de un curso de un semestre, la cobertura de temas sigue siendo suficiente para retar incluso al lector que termin su exposicin inicial al anlisis estadstico en una secuencia de dos semestres.

    A continuacin se presenta una breve descripcin de las caractersticas pedaggicas contenidas en esta edicin.

    Aspectos que se mantuvieron de la edicin anterior Organizacin del captulo

    Cada captulo abre con un diagrama de flujos que muestra los principales temas a tratar y la forma como se relacionan entre s. Esto permite que el lector tenga la oportunidad de organizar el proceso que puede utilizar para dominar el material en dicho captulo.

    Ejemplos con tres partes Cada ejemplo de las herramientas estadsticas disponibles para las personas que toman las decisiones en los negocios, presenta una situacin real que requiere una solucin y son las situaciones tpicas que

  • ESTAD~STICA APLICADA A LOS NEGOClOSY LA ECONOM~A

    se enfrentan al gerenciar una empresa. Estos ejemplos constan de tres partes. La primera es el planteamiento del problema que describe el dilema que debe resolverse. La segunda parte suministra una solucin completa y coherente a dicho problema. Quiz lo ms importante para el lector, pero que se encuentra ausente en muchos otros textos de estadstica, es la interpretacin de dicha solucin. No es bueno para el lector resolver un problema cuya solucin no comprende.

    Un procedimiento para la elaboracin de reportes La comunicacin en los negocios es fundamental. Para que un negocio funcione como una unidad, los individuos que estn dentro de dicho negocio deben poder comunicar sus ideas y pensamientos. El apndice 1 describe e ilustra la forma como se debe preparar un informe para comunicar los propsitos esenciales y las recomendaciones a otros que estn interesados en los resultados. Sin esta importante destreza, quienes toman decisiones estn en gran desventaja en su intento por dirigir un negocio.

    Problemas resueltos Cada captulo concluye con problemas y soluciones elaboradas que refuerzan las herramientas estadsticas que se presentaron en dicho captulo. Esta caracterstica proporciona un resumen conveniente y til de las herramientas cruciales que se espera que el lector domine.

    Lista de frmulas Al final de cada captulo se proporciona una lista manual de todas las frmulas presentadas a travs del captulo y una breve descripcin de su uso.

    Aplicaciones por computador Se proporcionan instrucciones para mostrar cmo pueden utilizarse las herramientas estadsticas en un computador. Se presentan las impresiones de pantallas de computador con nfasis en Minitab y Excel junto con la discusin de sus aspectos importantes.

    Ejercicios por computador El texto viene con un disquete que contiene varios archivos de datos a los que se puede tener acceso en los formatos de Minitab, Excel y ASCII. Algunos captulos proporcionan al lector un problema que debe resolver con base en los datos que aparecen en dichos archivos y con la ayuda de las herramientas estadsticas discutidas en el captulo. Lo anterior ofrece al lector una situacin real que requiere de la aplicacin de las tcnicas estadsticas en el conjunto de datos que hay en el computador.

    Problemas del capitulo Al final de cada captulo existe una amplia gama de problemas con una diversidad de grados de dificultad que brindan al lector la oportunidad de agudizar y refinar sus habilidades estadsticas. De nuevo, estos problemas son de naturaleza aplicada lo que demuestra claramente cmo la estadstica puede ayudar al proceso de toma de decisiones en los negocios.

  • Nuevas caractersticas de la tercera edicin Ejercicios de la seccin

    ,

    Despus de cada seccin, dentro de cada captulo se encuentran varios ejercicios que el lector debe resolver y que refuerzan su comprensin del material expuesto. Esto proporciona una retroalimentacin inmediata sobre si se ha comprendido en forma suficiente el material de dicha seccin antes de proceder a la siguiente.

    Escenario Cada captulo inicia con un recuento corto denominado Escenario que presenta un caso real que se puede tratar mejor utilizando las herramientas estadsticas contenidas en dicho captulo. Se describe la naturaleza del problema que se debe resolver y as se proporciona al lector los fundamentos sobre los cuales debe realizar sus lecturas y el anlisis del material del captulo.

    Puesta en escena Es una corta seccin al cierre de cada captulo que remite al lector a la seccin inicial Escenario. Se proporcionan datos e informacin adicional para resolver la situacin propuesta en la seccin Escenario, utilizando el conocimiento adquirido en el captulo. Este ejercicio combina todo el captulo en un solo "paquete" que mejora la comprensin total sobre el material y ata de manera efectiva los cabos sueltos.

    Del escenario a la vida real El segmento final de cada captulo proporciona sitios Web en intemet que el lector puede consultar para encontrar datos e informacin complementaria, y la cual pueda utilizar para su estudio estadstico adicional. Estos sitios Web se seleccionan especialmente para relacionarlos con los asuntos y problemas planteados en las secciones Escenario y Puesta en escena.

    Allen L. Webster

  • El papel de la estadstica

  • Plan del capitulo Este captulo introduce al concepto de estadstica como un estudio organizado. Se presenta el propsito general del anlisis estadstico y las muchas formas en las cuales la estadstica puede ayudar a encontrar soluciones a problemas que se presentan en la vida profesional.

    El papel de la estadstica u 1 Importa; 1 1 Funciones 1 1 o ~ " " ~ ~ ~ ~ ~ s 1 d:s:!:a 1 y necesidad del muestre0 de la estadstica estadstica

    l . cl c h Estadstica Muestr,,

    y estadsticos 1 De intervalo

    De razn

  • 4 ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    4 m aH!oA J E S C E N A R I O La revista Fortune (diciembre 9, 1996) informa que un lo demuestra el siguiente dagrama, las utilidades de estas frenes en la contratacin ha hecho que se produzca un compaas han respondido de manera favorable, incre- ''mercado laboral de vendedores para nerdi". La bsqueda mentndose mucho ms rpidamente que las utilidades de del talento en el sector de la i n f o d i n en tecnologa ha otras compaas que le estn dando largas a su ingreso a la generado una competencia tan intensa para "aficionados a era de la informacin. El Informe sobre la Industria la cuntica y a los computadores" que quienes buscan Educativa (Education Zndustry Report) de St . Cloud, trabajo, can incluso^ habilidades cuantitativas, estn Minnesota, present un indice de utilidades de 15 Henos de ofertas. El talento es tan escaso y la demanda tan compaas que estn buscando, de manera agresiva, elevada que las compa%as estn contratando a estudiantes empleados que puedan manejar datos y aplicar el de bachillerato y otras compaas estn tratando de pensamiento analtico y estadstico bsico a problemas arrebatrselos. empresariales comunes. Se compar el ndice de Evaluacin

    Pete Davis, un ingeniero senior de sistemas y redes para de Alerta en el Manejo de Datos (Data Mmgement Alert Assessment, DMAA) con el indice de la Asociacin la TUC, proveedor de servicios de intemet en Bedford, Massachusetts, ha recibido por lo menos 15 ofertas de Nacional de Cotizaciones Automatizadas de Agentes de Bolsa (National Associatien of Security Dealers Automated

    desde que su -lo cual no Q~otations, NASDAQ). Los resultados son evidentes. * para algvien que tan &lo l8 ao*. Las rendimientos de las empresas que contratan gen- Quienes estan encargados de la contrataciin de personal posee conocimientos bsicos en estadstica sobrepasan lianian a Davis o le envan por correo electr6nico opciones los de empresas que an no han visto tal luz. El atractivas y ofertas de pago con incrementos lucrativos.

    reconocimiento, por parte de un nmero creciente de Awique de de'todo 'pkol la es wgwios, & la que tienen los gemtes efe&vos para los empleados que e s th capacitados en anlsis de datos. de tener por lo menos conocimientos rudimentarios de

    estadstica ha precipitado -segn los trminos de la revista La estrategia parece valer la pena para negocios que Fortune-, una carrera por el talento, que se asemeja aI

    buscan, de manera agresiva, talento joven que sea capaz de frenes agrario de la tlpoca en la que se persegua la anakar y comprender la informacin cuantitativa Como apropiacin gratuita de la tierra en Oklahoma.

    Porcentaje de incremento en las utilidades

    40

    35

    30

    25

    20 IS

    10

    S

    O 1

  • CAP~TULO 1 El papel de la estadstica

    1.1 Introduccin A medida que aumenta la complejidad de nuestro mundo, se hace cada vez ms difcil tomar decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones deben tomarse con mucho menos que un conocimiento adecuado y experimentando una gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales para nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos recibiendo presiones debido a problemas econmicos angustiosos como una inflacin galopante, el sistema tributario engorroso y oscilaciones excesivas en el ciclo empresarial. Todo nuestro tejido econmico y social est amenazado por la contaminacin ambiental, la deuda pblica onerosa, la tasa de criminalidad que siempre va en aumento y las impredecibles tasas de inters.

    Si estas condiciones parecen ser caractersticas del estilo de vida actual, no debe olvidarse que problemas de esta naturaleza contribuyeron a la cada de la antigua Roma ms que la invasin de las hordas de brbaros provenientes del norte. Un perodo de xito en este planeta, relativamente corto, no es garanta de una supervivencia futura. A menos que puedan encontrarse soluciones viables a estos apremiantes problemas, podramos acompaar en el olvido al dinosaurio y al ave dodo, como ya lo hicieron los antiguos romanos.

    Este captulo aportar una visin general sobre lo que es la estadstica y cmo puede utilizarse. Esta visin general sobre la naturaleza de la estadstica y los beneficios que puede proporcionarnos se efectuar revisando:

    Las definiciones bsicas de las herramientas estadsticas.

    Cmo llevar a cabo el muestre0 para realizar anlisis estadsticos.

    Las funciones que cumple la estadstica.

    Cmo puede ayudar la estadstica en la profesin.

    Comencemos con una breve exposicin del papel significativo que juega la estadstica en el delicado proceso de toma de decisiones.

    1.2 La importancia de la estadstica Virtualmente cada rea de la investigacin cientfica seria puede beneficiarse del anlisis estadstico. Para quien formula las polticas econmicas y para quien asesora al presidente y a otros funcionarios pblicos sobre procedimientos econmicos apropiados, la estadstica ha demostrado ser una herramienta valiosa. Las decisiones sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de manera inteligente tan slo con la ayuda del anlisis estadstico. Los hombres y mujeres de negocios, en su eterna bsqueda de la rentabilidad, consideran que la estadstica es esencial en el proceso de toma de decisiones. Los esfuerzos en control de calidad, minimizacin de costos, combinacin de productos e inventarios, y una gran cantidad de otros asuntos empresariales, pueden manejarse efectivamente a travs del uso de procedimientos estadsticos comprobados.

    Para quienes estn en el rea de la investigacin de mercados, la estadstica es de gran ayuda en el momento de determinar qu tan probable es que un producto nuevo sea exitoso. La estadstica tambin es muy til para evaluar las oportunidades de inversin por parte de asesores financieros. Los contadores, los jefes de personal, y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del anlisis estadstico. Incluso un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento, considera la estadstica una aliada imprescindible.

    Tales aplicaciones y muchas otras se ilustran a lo largo de este texto. Se mostrar cmo utilizar la estadstica en el mejoramiento del desempeo laboral y en muchos otros aspectos de la vida diaria.

  • 6 ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    1.3 Oportunidades que ofrece la estadstica Es factible que en pocos aos abandone la relativa seguridad del ambiente acadmico y est metido de cabeza en el mundo competitivo. Desde el punto de vista prctico, usted debe conocer la manera de utilizar los conocimientos en estadstica despus de graduarse. No existe duda alguna acerca de que una experiencia acadmica, adecuadamente relacionada con unos firmes cimientos ampliar significativamente las oportunidades de encontrar empleo y, posteriormente, le permitir demostrar la competitividad laboral.

    Cuando encuentre ese trabajo anhelado que le ponga en la rpida ruta del xito profesional, su jefe espera que usted haga dos cosas:

    1. Tomar decisiones.

    2. Solucionar problemas.

    Estos dos cometidos pueden lograrse a travs de la aplicacin de procedimientos estadsticos.

    A. La aplicacin universal de la estadstica Al ser capaz de solucionar problemas y tomar decisiones, se obtendr una excelente posicin en la demanda del mercado laboral. Si logra tomar decisiones incisivas cuando se est solucionando los problemas de alguien, dicha persona estar dispuesta a proporcionarle una recompensa generosa. El mundo laboral paga ms a las personas que son capaces de plantear las preguntas correctas para alcanzar los objetivos fundamentales, que a quienes tienen la responsabilidad de resolverlas. Con frecuencia, las respuestas son bastante evidentes una vez que se han planteado las preguntas. El anlisis estadstico probar ser de gran utilidad en la acertada formulacin de estas preguntas esenciales.

    Los empresarios reconocen que los problemas complejos que enfrenta el mundo actual requieren soluciones cuantitativas. Si usted no est en capacidad de aplicar la estadstica y otros mtodos cuantitativos a muchos de los problemas comunes que sin duda se le presentarn, estar en gran desventaja en el mercado laboral.

    Casi todas las reas del saber requieren del pensamiento estadstico. Las disciplinas de estudio que dependen ampliamente del anlisis estadstico, incluyen -pero no se limitan a-, marketing, finanzas, economa e investigacin de operaciones. Los principios aprendidos en contabilidad y gerencia administrativa tambin se basan en la preparacin estadstica.

    Los analistas financieros y econmicos con frecuencia se basan en sus habilidades cuantitativas para proporcionar soluciones a problemas difciles. La comprensin de los principios financieros y econmicos permitir aplicar las tcnicas estadsticas para hallar soluciones viables y tomar decisiones. Quienes aspiran a cargos en el rea contable o administrativa, a ser independientes, o a desempear otra profesin en el sector industrial, descubrirn que comprender la estadstica no slo mejora las oportunidades de obtener un empleo, sino que tambin aumenta la probabilidad de promocin mediante el enriquecimiento en el desempeo laboral.

    Las personas empleadas en tareas cuantitativas que trabajan con procedimientos estadsticos, con frecuencia gozan de salarios ms altos y estn ms protegidos de los trabajos sin futuro. Adems, muy al inicio de sus carreras, generalmente se encuentran en contacto cercano con personas en cargos de alto nivel. La proximidad a la lite ejecutiva es inevitable porque la alta gerencia necesita de la informacin y asistencia que la gente con entrenamiento en estadstica puede proporcionarle. En el mercado laboral actual, los empresarios sencillamente no desean contratar o conservar a quienes no saben estadstica.

    Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el servicio pblico, el gobierno, o hacia alguna otr fuente de retribucin remunerada, la experiencia acadmica ser ms completa si se adquiere t una slida formacin en fundamentos de anlisis estadstico.

  • CAP~TULO 1 El papel de la estadstica 7

    B. Gerencia de calidad total A medida que la competencia mundial se intensifica, surge, de parte de los negocios, un esfuerzo por promover la calidad de sus productos. Este esfuerzo, conocido ampliamente como Gerencia de Calidad Total (Total Quality Management, TQM), tiene como propsito central la promocin de las cualidades del producto que el consumidor considera importantes. Tales atributos van desde la ausencia de defectos hasta el servicio eficiente y la respuesta rpida a las posibles quejas del consumidor. Hoy da, la mayora de los grandes negocios (as como tambin muchos negocios pequeos) tienen departamentos de Control de Calidad (QualiS Control, QC) cuya funcin es recolectar datos sobre el desempeo y solucionar problemas de calidad. As, la TQM representa un rea creciente de oportunidades para quienes tienen conocimientos en estadstica.

    La TQM involucra el uso de equipos administrativos integrados conformados por ingenieros, expertos en marketing, especialistas en diseo, estadsticos, y otros profesionales que pueden contribuir a la satisfaccin del cliente. La formacin de estos equipos, denominada Despliegue de la Funcin de Calidad (Quality Function Deployment, QFD), est diseada para reconocer y agenciar las inquietudes de los consumidores. Los especialistas actan conjuntamente para promover la calidad del producto y para que supla de manera efectiva las necesidades y preferencias del consumidor.

    Otro mtodo comn para mejorar la calidad de un producto es el uso de los crculos de Control de Calidad (Quality Control, QC). Los crculos de control de calidad constan de un grupo pequeo de empleados (generalmente entre 5 y 12) que se renen regularmente para solucionar problemas relacionados con el trabajo. Con frecuencia se conforman tanto con trabajadores en lnea como con representantes de la gerencia; los miembros de estos crculos QC son todos de la misma rea de trabajo y reciben capacitacin formal en control estadstico de calidad y en planeacin de gmpos. A travs de discusiones abiertas y del anlisis estadstico, los crculos QC pueden lograr mejoras significativas en diversas reas que van desde el mejoramiento de la calidad, el diseo del producto, la productividad y los mtodos de produccin, hasta la reduccin de costos y seguridad. Se estima que ms del 90% de las 500 mejores compaas que aparecen en la revista Fortune utilizan de manera efectiva los crculos de control de calidad.

    Uno de los elementos ms importantes del TQM es un conjunto de herramientas y mtodos estadsticos utilizados para promover el Control Estadstico de Calidad (Statistical Quality Control, SQC). Tales herramientas ayudan a organizar y analizar datos para efectos de solucionar problemas. Una de estas herramientas es el diagrama de Pareto, denominado as en honor al economista italiano Vilfredo Pareto. Este diagrama identifica los problemas de calidad que se presentan con mayor frecuencia o que han demostrado ser los ms costosos. La figura 1.1 muestra un diagrama de Pareto de los defectos que afectan la produccin de hornos microondas, comercializados por JC Penney.

    Figura 1.1 Diagrama de Pareto F; 40

    C

    0

    2 30

    Dispositivo Dispositivo Arranque Pulsadores Coccin de descon- de automtico por fases gelacin conservacin

    automtica de la temperatura

    Defecto Fuente: QC Circle, JC Penney, 1993

  • 8 ESTAD~ST~CA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    Los diagramas de Pareto con frecuencia expresan la regla 80120: el 80% de todos los problemas se debe al 20% de las causas. Como lo demuestra la figura 1.1, aproximadamente el 75% de todos los problemas es causado por el dispositivo de descongelacin automtico y por el de conservacin de la temperatura del horno.

    Hablando en trminos generales, el SQC est diseado para asegurar que los productos cumplan con unas normas y especificaciones mnimas de produccin. Este objetivo con frecuencia se promueve a travs del uso del muestreo de aceptacin, el cual es parte integral del SQC. El muestreo de aceptacin implica probar una muestra aleatoria de productos existentes para determinar si se debe aceptar o rechazar todo el envo, o el lote. Esta decisin se basa en parte en un nivel de calidad aceptable (Acceptable Qualiw Level, AQL), o nmero mximo de defectos que una empresa est dispuesta a tolerar.

    En las organizaciones se es cada vez ms consciente de la necesidad de mantener la calidad del producto. Si una firma va a competir de manera exitosa, debe tomar todas las precauciones para garantizar que sus productos cumplan con ciertos estndares bsicos. Por tanto, no es ninguna exageracin insistir en la importancia de la TQM. Los principios inherentes al TQM estn aumentando en popularidad; representan la direccin futura del anlisis estadstico, aplicada al mundo de los negocios. En el captulo 15 se analizar con mayor profundidad la TQM.

    C. Necesidad de la formacin en estadstica Se podra pensar que el tipo de trabajo a que se aspira no necesitar del anlisis estadstico. O quizs podra argumentarse que el personal de estadsticos de la compaa realizar el trabajo estadstico pertinente y que no existe la necesidad de manejar los detalles del anlisis estadstico.

    Este no es el caso. Incluso si los estadsticos profesionales de la organizacin realizan el trabajo estadstico pertinente, es esencial poseer un cierto nivel de formacin en este campo. Para determinar cmo puede ayudar el staff de estadstica al desempeo del trabajo de los otros, se debe conocer qu es la estadstica, qu hacen los estadsticos y cmo lo hacen. Cuando los problemas surgen se debe determinar cmo puede ayudar la estadstica. Para lograrlo, es necesario comprender los procedimientos estadsticos, y poder comunicarse con los estadsticos, en un esfuerzo conjunto para disear soluciones adecuadas y tomar decisiones ptimas. Una vez se ha adquirido esta familiaridad con el anlisis estadstico, se sorprender de las infinitas formas en que la estadstica puede ayudar en la solucin de problemas que surgen con frecuencia en un escenario empresarial.

    1.4 Algunas definiciones bsicas Toda rama de la investigacin cientfica tiene su vocabulario propio y la estadstica no es la excepcin. Esta seccin revisa algunos de los trminos comunes utilizados en el anlisis estadstico. Las definiciones y expresiones que siguen son esenciales para la comprensin de cmo se realizan las pruebas estadsticas.

    A. Poblaciones y parmetros En todo estudio estadstico, el investigador est interesado en una determinada coleccin o conjunto de observaciones denominadas poblacin (o universo). Si los ingresos de los 121 millones de asalariados de los Estados Unidos son de inters para un economista que asesore al Congreso en la formulacin del plan nacional tributario, entonces los 121 millones de ingresos constituyen la poblacin. Si se est considerando un plan tributario para los perceptores de ingresos superiores a US $100,000, entonces tales ingresos superiores a US $100,000 constituyen la poblacin. La poblacin es pues la coleccin completa de todas las observaciones de inters.

    Poblacin Es la recoleccin completa de todas las observaciones de inters para el investigador.

  • CAP~TULO 1 El papel de la estadstica 9

    Si el director ejecutivo (Chief Executive OfJicer, CEO) de una gran empresa manufacturera desea estudiar la produccin de todas las plantas de propiedad de la firma, entonces la produccin de todas estas plantas es la poblacin.

    Un parmetro es toda medida descriptiva de una poblacin. Algunos ejemplos son: el ingreso promedio de todos los asalariados de Estados Unidos, o la produccin total de todas las plantas manufactureras. El punto clave para recordar es que un parmetro describe una poblacin.

    n icwlr

    e % * hrmetro Es una medida descriptiva de la poblacin total de todas las observaciones , + , de inters para el investigador.

    B. Muestras y estadsticos Aunque generalmente los estadsticos se interesan en algn aspecto de toda la poblncin, generalmente descubren que las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Calcular el ingreso promedio de cada uno de los 121 millones de asalariados sera una tarea abrumadora. Por consiguiente, generalmente debe ser suficiente estudiar tan slo una pequea porcin de dicha poblacin. A esta porcin ms pequea y ms manejable se le denomina muestra. Una muestra es un subconjunto de la poblacin seleccionado cientficamente.

    k, 9

    Muestra Es una parte representativa de la poblacin que se selecciona para ser estudiada ya que la poblacin es demasiado grande como para analizarla en su totalidad.

    w

    Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of labor) calcula el ingreso promedio de una muestra de varios miles de asalariados seleccionados entre la poblacin total de 12 1 millones de trabajadores. El promedio de esta muestra se utiliza luego como una estimacin del ingreso promedio para toda la poblacin. Las muestras son necesarias porque estudiar las poblaciones completas resulta muy costoso y consume demasiado tiempo.

    Un estadstico es una medida descriptiva de una muestra. El ingreso promedio de esos varios miles de trabajadores, calculado por el Ministerio de Trabajo, es un estadstico. El estadstico es a la muestra lo que el parmetro es a la poblacin. El estadstico sirve como una estimacin del parmetro. Aunque en realidad el inters se fija en el valor del parmetro de la poblacin, con frecuencia debe haber conformidad con slo calcularlo con un estadstico de la muestra que se ha seleccionado.

    C. Variables Una variable es la caracterstica de la muestra o poblacin que se est observando. Si el asesor estadstico del alcalde de San Francisco est interesado en la distancia que deben recorrer cada maana las personas que viajan diariamente largas distancias hacia el trabajo, la variable es millas recorridas. En un estudio respecto al ingreso de los asalariados en Estados Unidos, la variable es ingreso.

  • 1 0 ESTADISTICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    Variable Es una caracterstica de la poblacin que se esta analizando en un estudio estadstico.

    Una variable puede ser (1) cuantitativa o (2) cualitativa. Si las observaciones pueden expresarse numricamente, entonces es una variable cuantitativa. Los ingresos de todos los asalariados son un ejemplo de una poblacin cuantitativa. Otros ejemplos incluyen la estatura de las personas en las que se est interesado, los puntajes que los estudiantes reciben en un examen final de estadstica, y el nmero de millas que las personas recorren cada maana al ir a su sitio de trabajo en San Francisco. En cada caso, las observaciones se miden numricamente.

    Una variable cualitativa se mide de manera no numrica. El estado civil de quienes solicitan crdito, el sexo de los estudiantes en una clase de estadstica, y la raza, color de cabello, preferencia religiosa de las personas que recorren largas distancias a su trabajo en San Francisco, son ejemplos de variables cualitativas. En cada caso las observaciones se miden de manera no numrica.

    Adems las variables pueden ser (1) continuas o (2) discretas. Una variable continua es aquella que puede tomar cualquier valor dentro de un rango dado. No importa qu tan cerca puedan estar dos observaciones, si el instrumento de medida es lo suficientemente preciso, puede hallarse una tercera observacin que se encuentre entre las dos primeras. Una variable continua generalmente resulta de la medicin.

    Una variable discreta est limitada a ciertos valores, generalmente nmeros enteros. Con frecuencia son el resultado de la enumeracin o del conteo. El nmero de estudiantes de la clase y el nmero de autos vendidos por General Motors son algunos ejemplos. En ningn caso se observarn valores fraccionarios.

    A travs del estudio de la estadstica se har referencia en repetidas ocasiones a estos conceptos y trminos. Se debe ser consciente del papel que juega cada uno de ellos en el proceso de anlisis estadstico. Es de especial importancia poder diferenciar entre una poblacin y sus parmetros, y entre una muestra y sus estadsticos.

    1.5 La importancia del muestreo Gran parte del trabajo de un estadstico se realiza con muestras. Las muestras son necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Es muy costoso y demanda mucho tiempo examinar la poblacin total, por tanto, debe seleccionarse una muestra de la poblacin, calcular el estadstico de la muestra, y utilizarlo para estimar el parmetro correspondiente de la poblacin.

    Este anlisis sobre las muestras implica una distincin entre las dos\principales ramas del anlisis estadstico: (1) la estadstica descriptiva y (2) la estadstica inferencial. La estadstica descriptiva es el proceso de recolectar, agrupar y presentar datos de una manera tal que describa fcil y rpidamente dichos datos. Los captulos 2 y 3 analizan la estadstica descriptiva e ilustran los diversos mtodos y herramientas que pueden utilizarse para presentar y resumir grandes conjuntos de datos.

    La estadstica inferencial involucra la utilizacin de una muestra para sacar alguna inferencia o conclusin sobre la poblacin de la cual hace parte la muestra. Cuando el Ministerio de Trabajo utiliza el ingreso promedio de una muestra de varios miles de trabajadores para calcular el ingreso promedio de los 121 millones de trabajadores, est utilizando una forma simple de estadstica inferencial.

    La exactitud de toda estimacin es de enorme importancia. Esta exactitud depende en gran parte de la forma como se tom la muestra, y del cuidado que se tenga para garantizar que la muestra proporcione una imagen confiable de la poblacin. Sin embargo, con mucha frecuencia se comprueba que la muestra no es del todo representativa de la poblacin y resultar un error de muestreo. El error de muestreo es la diferencia entre el estadstico de la muestra utilizada para calcular el parmetro de la poblacin y el valor real pero desconocido del parmetro.

  • CAP~TULO 1 El papel de la estadstica 1 1

    < S = Error de muestre0 Es la diferencia entre el parmetro desconocido de la poblacin y ,i el estadstico de la muestra utilizado para calcular el parmetro.

    Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo es el azar en el proceso de muestreo. Debido al factor azar en la seleccin de elementos de la muestra, es posible seleccionar sin darse cuenta, elementos atpicos que no representan la poblacin. Por ejemplo, en el esfuerzo por estimar la media poblacional es factible que se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo as una sobreestimacin de la media poblacional. Por otro lado, el azar puede producir un gran nmero de elementos de muestra que sean inusualmente pequeos, produciendo una subestimacin del parmetro. En cualquiera de los dos casos, ha ocurrido un error de muestreo.

    Una forma ms seria de error de muestreo es el sesgo muestral. El sesgo muestra1 ocurre cuando hay alguna tendencia a seleccionar determinados elementos de muestra en lugar de otros. Si el proceso de muestreo se disea de manera incorrecta y tiende a promover la seleccin de demasiadas unidades con una caracterstica en especial, a expensas de las unidades que no tienen dicha caracterstica, se dice que la muestra est sesgada. Por ejemplo, el proceso de muestreo puede favorecer de manera inherente la seleccin de hombres excluyendo a las mujeres, o de personas casadas excluyendo a las solteras.

    Un manejo ms riguroso del sesgo en el muestreo se presenta en un captulo posterior. Aunque el error de muestreo nunca puede medirse debido a que el parmetro permanece desconocido, se debe ser consciente de que existe la probabilidad que esto ocurra.

    1.6 Las funciones de la estadstica En repetidas ocasiones se ha enfatizado la utilidad de la estadstica y la amplia variedad de problemas que puede resolver. Para ilustrar de manera ms completa esta amplia aplicabilidad, es necesario analizar las diversas funciones de la estadstica. La estadstica es la ciencia que tiene que ver con la (1) recoleccin, (2) organizacin, (3) presentacin, (4) anlisis, e (5 ) interpretacin de datos.

    Aunque en todo estudio estadstico el primer paso es la recoleccin de datos, es usual en un curso bsico de estadstica asumir que los datos ya han sido recolectados y que ahora estn disponibles. Por consiguiente, el trabajo comienza con el esfuerzo por organizar y presentar estos datos de manera significativa y descriptiva. Los datos deben colocarse en un orden lgico que revele rpida y fcilmente el mensaje que contienen. Este procedimiento constituye el proceso de la estadstica descriptiva, tal como se define y se discute en los captulos siguientes. Luego de que los datos se han organizado y se han presentado para su revisin, el estadstico debe analizarlos e interpretarlos. Estos procedimientos se basan en la estadstica inferencia1 y constituyen un importante beneficio para el anlisis estadstico, mediante la ayuda en el proceso de toma de decisiones y solucin de problemas.

    Se descubrir que a travs de la aplicacin de procedimientos estadsticos precisos, es posible predecir el futuro con cierto grado de exactitud. Toda empresa que se enfrenta a las presiones competitivas puede beneficiarse considerablemente de la capacidad para anticipar las condiciones del negocio, antes que stas ocurran. Si una empresa sabe cmo van a estar sus ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes

  • 1 2 ESTAD~ST~CA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    ms exactos y efectivos respecto a las operaciones actuales. Si se calculan las ventas futuras con un grado de exactitud confiable, la gerencia puede tomar fcilmente decisiones importantes respecto a los niveles de inventario, pedidos de materia prima, contrataciones de empleados y, virtualmente, sobre cada aspecto de las operaciones del negocio.

    1.7 Escalas de medida Las variables pueden clasificarse con base en su escala de medida. La manera en que se clasifican las variables afecta en gran parte la forma como se utilizan en el anlisis. Las variables pueden ser (1) nominales, (2) ordinales, (3) de intervalo, o (4) de razn.

    Una medida nominal se crea cuando se utilizan nombres para establecer categoras dentro de las cuales las variables pueden registrarse exclusivamente. Por ejemplo, el sexo puede clasificase como "hombre" o "mujer". Se podra codificar tambin con un "1" o un "Y, pero los nmeros serviran tan slo para indicar las categoras y no tendran significado numrico; los clculos matemticos que utilizan estos cdigos no tendran sentido. Las bebidas colas pueden clasificarse como Coca-Cola, Pepsi, 7-Up, o Ale 8. Cada bebida podra registrarse en una de estas categoras excluyendo las otras.

    Mediciones en escala nominales Nombres o clasificaciones que se utilizan para datos en categoras distintas y separadas.

    La tabla 1.1 ilustra la forma como la revista Money clasific diferentes fondos de inversin. Vale la pena destacar que cada fondo est ubicado en una categora en particular, con base en su comportamiento financiero.

    Tabla 1.1 Medidas en escala nominales de los fondos de inversin

    Categora / Nombre del Fondo Crecimiento Agresivo Fondos del Mercado Monetario Twenty Century Growth Alger Portfolio Janus Mariner Government

    Reembolso Total Exento de Impuestos Scudder Kemper Municipals Vanguard Star PaxWorld USAA Cornerstone

    Bonos Strong Short-Term Scudder Short-Term

    Fuente: Money, julio, 1992.

  • CAP~TULO 1 El papel de la estadstica 1 3

    Es importante recordar que una medida en escala nominal no indica ningn orden de preferencia, sino que simplemente establece una disposicin categrica en la cual se puede ubicar cada observacin.

    A diferencia de una medida en escala nominal, una medida en escala ordinal s muestra un ordenamiento o secuencia de los datos. Es decir, que las observaciones se clasifican con base en algunos criterios. Sears Roebuck, uno de los vendedores minoristas ms grandes de Estados Unidos, clasifica muchos de sus productos como "buenos", "mejores" y "los mejores". Las encuestas de opinin con frecuencia utilizan una medida en escala ordinal como "totalmente de acuerdo", "de acuerdo", "sin opinin7', "en desacuerdo", y "en total desacuerdo".

    Al igual que con los datos nominales, los nmeros pueden utilizarse para ordenar los rangos. Y al igual que con los datos nominales, la magnitud de los nmeros no es importante; el rango depende slo del orden de los valores. Sears hubiera podido utilizar los rangos de "l", "2", y "3", o "l", "3,", y "12" para este asunto. Las diferencias aritmticas entre los valores carecen de sentido. Un producto con rango "2" no es dos veces mejor que uno con rango "1".

    Medidas en escala ordinales Son las que clasifican las observaciones en categoras con un orden significativo.

    A.

    El mismo tema que la revista Money mencion anteriormente, present los rangos para las inversiones con base en los niveles de riesgo mostrados en la tabla 1.2. Vale la pena destacar que los rangos de riesgo "Muy alto7', "Alto" , y "Bajo" se hubiera podido basar en los valores "l", "2", y "3", o " A , "Bu, y " C . Pero las diferencias reales en los niveles de riesgo no pueden medirse de manera significativa. Se sabe solamente que una inversin de rango "Alto7' tiene mayor riesgo que una con rango "Bajo".

    Tabla 1.2 Rango ordinal del riesgo de inversin

    Inversin Factor de riesgo

    Oro Muy alto Compaias de poco crecimiento Muy alto Mxima ganancia de capital Al to Internacional Al to Ingreso de opciones Bajo Equilibrado Bajo

    En una escala de intervalo las variables se miden de manera numrica, y al igual que los datos ordinales, llevan inherente un rango u ordenamiento. Sin embargo, a diferencia de los rangos ordinales, la diferencia entre los valores es importante. Por eso, las operaciones aritmticas de suma y resta, son significativas. La escala Fahrenheit para las temperaturas es un ejemplo de una escala de intervalo. 70 grados no es slo una temperatura ms alta que 60 grados, sino que la misma diferencia de 10 grados existe entre 90 y 100 grados Farenheit.

    En una escala de intervalos el valor de cero se selecciona arbitrariamente. No existe nada concreto que haya obligado a fijar la temperatura cero grados, sino que, simplemente, es un punto de referencia arbitrario. Hubiera podido crearse la escala Fahrenheit de manera que cero se hubiera establecido en una temperatura ms caliente (o ms fra). No se da a cero un significado distinto al decir que es 10 grados ms fro que 10 grados Fahrenheit. As, 80 grados no es dos veces ms caliente que 40 grados y la relacin 80140 no tiene significado.

    Medidas en escala de idtervalo Medidas en una escala numrica en la cual el valor de cero es arbitrario pero la diferencia entre valores es importante.

  • De todos los cuatro niveles de medida, slo la escala de razn se basa en un sistema numrico en el cual el cero es significativo. Por tanto, las operaciones de multiplicacin y divisin tambin toman una interpretacin racional. Una escala de razn se utiliza para medir muchos tipos de datos que se encuentran en el anlisis empresarial. Variables tales como costos, rentabilidad y niveles de inventario se expresan como medidas de razn. El valor de cero dlares para medir los ingresos, puede interpretarse de manera lgica para explicar que no ha habido ventas. Adems, una firma con una participacin en el mercado del 40% tiene dos veces ms participacin que una firma con participacin en el mercado del 20%. Las medidas tales como peso, tiempo y distancia tambin se miden en una escala de razn, ya que cero es significativo y un artculo que pesa 100 libras tiene la mitad del peso de un artculo que pesa 200 libras.

    Medidas en escala de razn Medidas numricas en las cuales cero es un valor fi jo en cualquier escala y la diferencia entre valores es importante.

    Vale la pena destacar que las cuatro escalas de medida incrementan en complejidad, progresando desde la medida en escala nominal rudimentaria, a una medida en escala de razn ms refinada. Cada medida ofrece ms informacin sobre la variable que la anterior. Esta distincin entre los diversos grados de refinamiento es importante, debido a que las diferentes tcnicas estadsticas requieren de distintas escalas de medida. A pesar de que la mayora de las pruebas estadsticas requieren medidas en escala de intervalo o de razn, otras pruebas denominadas pruebas no paramtricas (que se analizarn ms tarde en este texto), estn diseadas para utilizar datos ordinales o nominales.

    Ejercicios del captulo 1. La directora de produccin para la planta de Ford Motor Company, en Cleveland, debe informar a su superior

    sobre el nmero de das promedio que los empleados de la planta se ausentan del trabajo. Sin embargo, la planta emplea ms de dos mil trabajadores, y la directora de produccin no tiene tiempo de revisar los registros personales de cada empleado. Como asistente usted debe decidir cmo puede ella obtener la informacin necesaria. Qu consejo podra darle?

    2. Describa en sus propias palabras cmo puede utilizarse la estadstica para solucionar problemas en varias disciplinas y ocupaciones.

    3. Qu ocupacin especfica planea seguir despus de su grado? Si no est seguro, seleccione el rea en la cual est interesado. Utilizando ejemplos especficos analice detalladamente los tipos de problemas que pueden surgir y las decisiones que tendr que tomar cuando el anlisis estadstico pruebe ser de utilidad.

    4. De qu forma utilizar los servicios del estadstico profesional en su organizacin una vez que usted encuentre empleo? Por qu es poco probable escaparse de la necesidad de tener un conocimiento bsico en estadstica?

    5. Describa en sus propios trminos la diferencia entre una poblacin y una muestra; entre un parmetro y un estadstico.

    6. Cul es la diferencia entre una variable cuantitativa y una variable cualitativa? D ejemplos. 7. Diferencie entre una variable continua y una variable discreta. D ejemplos de cada una. 8. Un informe reciente en la revista Fortune revel que los japoneses pronto controlarn hasta un 35% de las

    ventas de autos en los Estados Unidos; comparado con el 28% de finales de los aos 80 est apenas un 8% por encima de lo ocurrido en 1970. Esta informacin contiene estadstica descriptiva, inferencial, o ambas? Explique.

  • CAPITULO 1 El papel de la estadstica 1 5

    9. Cul es la diferencia entre la estadstica descriptiva y la estadstica inferencial? Cul cree usted que constituye una forma ms elevada de anlisis estadstico y por qu?

    10. En qu usos o funciones se puede aplicar la estadstica? Cmo cree usted que pueda utilizarse para solucionar problemas comerciales en el mundo real? D ejemplos de problemas especficos que puedan surgir y explique cmo podra utilizarse la estadstica para desarrollar soluciones y respuestas.

    11. Seleccione una poblacin cualquiera que sea de su inters. Identifique variables cuantitativas y cualitativas de esa poblacin que puedan seleccionarse para ser estudiadas.

    12. Si los estadsticos estn interesados realmente en poblaciones, por qu generalmente trabajan con muestras? 13. Analice si las siguientes variables son discretas o continuas:

    a. Nmero de cursos que los estudiantes de su colegio estn cursando este semestre. b. Nmero de pases atrapados por el beisbolista Tim Brown, receptor de los LA Raiders. c. Peso de los compaeros de equipo de Tim Brown. d. Peso del contenido de las cajas de cereal. e. Nmero de libros que usted ley el ao pasado.

    14. Defina el error de muestre0 y explique qu lo causa.

    15. La revista Forbes (febrero de 1997) report datos sobre las condiciones y estilos de vida en varias ciudades de Estados Unidos. Algunos de esos datos se reproducen aqu.

    Ciudad Poblacin Mediana Mejor Atraccin Tasa en millones del ingreso negocio ms visitada de criminalidad

    por hogar hotelero por cada 100,000

    Atlanta 3.5 US$43,249 Ritz-Carlton Stone Mountain 846.2 Buckhead Park

    Baltimore 2.5 43,291 Harbor Count Harborplace 1,296.5 St. Louis 2.5 39,079 Hyatt Regency Gateway Arch 263.4 Philadelphia 5.0 43,576 Bellevue Liberty Bell 693.1 Raleigh-Durham 1 .O 40,990 Radisson Plaza State Fair 634.9

    a. Identifique las variables cualitativas y cuantitativas. b. Cules variables son discretas y cules continuas? c. Identifique cada variable como nominal, ordinal, o de razn. d. Cules son descriptivas y cules inferenciales?

    16. El presidente de una fraternidad en el campus desea tomar una muestra de las opiniones de 112 miembros respecto a las actividades urgentes para el otoo. a. Cul es la poblacin? b. Cul es la mejor forma como debe tomarse una muestra?

    17. El productor de televisin del programa de drama diurno Al1 My Children va a tomar una muestra entre los televidentes, para saber sus sentimientos sobre los planes de asesinar a un personaje popular. Cules problemas pueden surgir en este esfuerzo? Qu recomendara usted y por qu?

  • ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    18. La General Mills est preocupada con el peso del contenido neto de las cajas de cereal Cheerios que sale de la lnea de produccin de su planta en Detroit. La caja anuncia 36 onzas, y si en realidad hay menos contenido en la caja, a General Mills la podran multar por falsa publicidad. Como miembro del equipo administrativo recin contratado en General Mills usted sugiere que se abra una muestra de las cajas y se pese su contenido. El vicepresidente de la divisin de control de calidad pregunta qu tipo de muestra debera tomarse. Qu le respondera?

    19. Debido a que la produccin se ha reducido en la planta de General Mills, es posible en realidad abrir todas las cajas producidas durante el perodo de produccin ms reciente? Dicho proceso evitara el error de muestreo y producira resultados ms exactos. Ya que la poblacin de todas las cajas no es muy grande, es necesario el muestreo?

    20. Qu nivel de medicin utilizan'a usted en cada uno de los siguientes casos? Explique su respuesta. a. Un sistema para medir las preferencias de los clientes respecto a los vehculos con base en su estilo (como

    convertible, van, camin, sedan, etc.). b. Un sistema para evaluar a los empleados con base en el nmero de das que faltan al trabajo. c. Un sistema para identificar las ciudades de nacimiento de los clientes. d. Un sistema para registrar la poblacin de las ciudades en las cuales viven los clientes.

    21. En cul escala de medida puede expresarse cada una de estas variables? Explique su respuesta. a. Los estudiantes clasifican a su profesor de estadstica sobre una escala de "Temble", "No tan Malo",

    "Bueno", "Maravilloso", y "Dios Griego". b. Los estudiantes en una universidad estn clasificados por profesin, tales como marketing, administracin

    y contadura. c. Los estudiantes estn clasificados por cursos utilizando los valores 1,2 ,3 ,4 , y 5. d. Agrupar mediciones de lquidos en octavo, cuarto y galn. e. Edades de los clientes.

    22. Cite varios ejemplos de comerciales de radio o televisin que utilicen la estadstica para vender sus productos. Utilizan estadstica descriptiva o inferencial? Qu escala de medida utilizan? m ~~~~4 PUESTA EN ESCENA

    El Manual sobre Perspectivas Ocupacionales miles en los aos venideros, tan slo para cargos de (Occupational Outlook Handbook, edicin 1996 - 1997), sustitucin. Se espera que el crecimiento laboral sea el publicado por el Ministerio de Trabajo de Estados Unidos, mas alto hasta el ario 2005. Los analistas gerenciales y se encuentra disponible en varias bibliotecas. Contiene consultores son otro gnipo labor& que requiere de fuertes informaci6n extensa sobre los trabajos en cerca de 250 habilidades cuantitativas. En este grupo se proyecta que categoras ocupacionales que abarcan casi el 90% de los el crecimiento laboral sea superior al promedio. Lo mismo trabajos en la economa de los Estados Unidos. El manual se aplica para 10s economistas y 10s analistas en proporciona descripciones detalladas sobre las investigacin de mercados. responsabilidades laborales, las condiciones de trabajo, la compensacin, la capacitacin y las proyecciones de En el Occupational Outlook Handbook en la crecimiento laboral par? el penodo comprendido entre 1995 universidad o en la biblioteca se buscan trabajos y 2005. en las reas & interes, Cules son las necesidades de

    Se proyecta que las vacantes para especialistas en habilidades cuantitativas para ste? Cules son las informtica y analistas de sistemas sern de cientos de proyecciones de crecimiento laboral?

  • CAP~TULO 1 El papel de la estadstica 1 7

    Del escenario a la vida real Existe una cantidad de informacin laboral y de la carrera que se encuentra disponible en el Intemet. Los dos sitios ider en listados laborales son Monster Board (www.monstercom) y America's Job Bank (www.ajb.dni.us). Utilizando las palabras clave de bsqueda, ensaye su inters ocupacional en las reas de bsqueda de trabajo en estos dos sitios (las palabras clave pueden obtenerse del Occupational Outlook Handbook en la biblioteca). A nivel nacional, o "estatal", cuntas vacantes hay en el campo de su inters? Cmo se distribuyen geogrficamente estos trabajos? Qu informacin sobre salarios se proporciona en los destinos laborales?

    Explore las categoras de "Empleo" y "Trabajos" suministradas por los principales motores de bsqueda como Yahoo! para ponerse al comente con otros servicios de la carrera disponibles en Intemet. En especial, busque los recursos para la planeacin de la carrera, hojas de vida e informacin salarial.

  • Descripcin de los conjuntos de datos

  • Plan del capitulo nta ilustraciones y ejemplos de las mltiples formas en que se puede organizar y manejar un

    e datos para proporcionar una interpretacin visual rpida de la informacin que ste contiene. entas estadsticas permiten describir un conjunto de datos originales de manera concisa y fcil de

  • 4 m ~A!ilRk!! d E S C E N A R I O Los estudiantes de coUege que planean tomar las vacaciones Para empeorar las cosas, para las personas que toman de primavera del &o, se enfrentan con las tarifas de alquiler sus vacaciones este verano, la disponibilidad puede ser un de autos ms altas que se hayan presentado (Newsweek, problema. Las empresas de alquiler de autos hacen que febrero 1997). Una encuesta realizada por Business Travel quienes tienen plan de viajar reserven con anticipacin. News revel que en 1996 las tasas aumentaron 1 1.8%, y se Pobre del estudiante quien, con sueos de pasear por Miami anticipa que el incremento para 1997 estar por encima de en un convertible deportivo, deba conformarse con un dicho porcentaje. Los incrementos en los costos laborales, sedan cuatro puertas! seguros y costos de parqueo, se mencionan como las Sin embargo, muchas empresas que alquilan autos principales causas de estos incrementos Poco COn~unes en pretenden multar con un jugoso incremento en las tarjetas los gastos para viajes. de crdito a quienes han reservado un carro pero no se

    Lo ms alarmante para los estudiantes que desean presentan a recogerlo a la hora acordada. escaparse de los rigores de la academiaes el hecho de que se

    ~1 preparar las tan esperadas y bien merecidas esperan incrementos mucho mayores en las tasas, en las vacaciones de primavera se sugiere contactar a varias ciudades que parecen ser 10s lugares favoritos Para Pasar compaas que alquilen autos y recolectar informacin vacaciones, incluyendo Miami, Houston, Phoenix, las sobre las tarifas y tipo de autos. Para ayudar a tomar esta ciudades de California del sur, y otros lugares con clima importante decisin respecto a qu tip de auto alquilar, clido. Como lo muestra el diagrama circular, estas reas , debe preparar un resumen de estos detalles importantes populares Ya exceden el promedio nacional en un monto para que 10s compaeros de viaje complementen con substancial. Mientras que los viajeros de toda la nacin mcos y otros medios de descripcin de conjuntos de pagan un promedio de aproximadamente $33 dlares por datos analizados en este capitulo. da, las tasas en estas reas de mayor preferencia se aproximan a $80 dlares,

    Tarifas diarias de alquiler de autos

    medio nacional

    2.1 Introduccin Casi todos los trabajos que se hacen en estadstica comienzan con el proceso de recoleccin de datos necesarios para formar con ellos un conjunto que se utilizar en el estudio. Para propsitos generales, se adoptar la

  • CAPITULO 2 Descripcin de los conjuntos de datos 2 1

    suposicin conveniente de que esta labor, con frecuencia tediosa, ya ha sido realizada y que los datos estn disponibles.

    Esta recoleccin de datos originales revela muy poco por s sola. Es extremadamente difcil determinar el verdadero significado de un grupo de nmeros que simplemente se han registrado en un papel. Nuestra labor es organizar y describir tales datos de manera concisa y significativa. Para determinar su significancia, los datos se organizan de manera que, con un simple vistazo, se pueda tener una idea de lo que pueden decirnos.

    Entre las herramientas estadsticas que resultan de particular utilidad para organizar los datos se incluyen:

    * Tablas de frecuencia que colocan todos los datos en clases especficas. Diversos grficos que pueden proporcionar una representacin visual de los datos. Tablas de contingencia y diagramas de "tallo y hoja", los cuales tambin permiten la presentacin de un conjunto grande de datos de manera concisa y discernible.

    2.2 Mtodos de agrupacin de datos Pueden utilizarse varias herramientas bsicas para describir y resumir un conjunto grande de datos. La manera ms simple, pero quizs la ms significativa, es la serie ordenada. Se asume que los puntajes de CI de cinco recin graduados de la Universidad de Podunk son 75,73,91, 83 y 80. Una serie ordenada simplemente enumera tales observaciones en orden ascendente o descendente. Los cinco valores pueden aparecer como 73,75,80,83,91. La serie ordenada proporciona alguna agrupacin al conjunto de datos; por ejemplo, se puede ver de inmediato que los dos valores extremos son 73 y 91. Sin embargo, la utilidad de una serie ordenada es limitado. Se necesitan mejores tcnicas para describir nuestro conjunto de datos. El resto de esta seccin analiza algunos mtodos comunes para agrupar una recoleccin de datos amplia, facilitando as la comprensin total de la informacin que contienen.

    A. Distribucin de frecuencias Como estadstico residente de Pigs and People (P&P) Airlines, el director de la divisin de anlisis estadstico le pide recolectar y agrupar los datos sobre el nmero de pasajeros que han decidido viajar con P&P. Tales datos correspondientes a los ltimos 50 das aparecen en la tabla 2.1. Sin embargo, con estos datos en bruto, es improbable que el director pueda obtener informacin til y significativa respecto a las operaciones de vuelo. Los datos no estn organizados y es difcil llegar a una conclusin significativa simplemente revisando una serie de nmeros anotados en un papel. Es preciso agrupar y presentar los datos de manera concisa y reveladora para facilitar el acceso a la informacin que contienen. Primero se analizar cmo puede utilizarse una distribucin de frecuencia para organizar el conjunto de datos.

    Tabla 2.1 Datos brutos sobre el numero de pasajeros de P&P Airl ines

  • 22 ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    Una distribucin de frecuencias (o tabla de frecuencias) ordenar los datos si estos se dividen en clases y se registrar el nmero de observaciones en cada clase, tal y como se muestra en la tabla 2.2. Por ejemplo, ahora se puede ver fcilmente, que en 18 de los 50 das, entre 70 y 79 pasajeros volaron en P&P. En ningn momento la lista de pasajeros diarios excedi de 109. La aerolnea rara vez transport menos de 60 pasajeros. El director puede ahora detectar caractersticas que no eran evidentes en el anlisis de datos en bruto de la tabla 2.1. Estas caractersticas son tiles para la toma de decisiones inteligentes y bien informadas respecto a las operaciones de vuelo.

    Tabla 2.2 Distribucin de frecuencia para pasajeros de aerolneas P&P

    Clase (pasajeros) Cuenta Frecuencia (das] Punto medio (M) 50 a 59 1 1 1 3 54.5 60 a 69 I I I I I 1 1 7 64.5 70 a 79 I I I I I I I I I I I I I I I 1 1 1 18 74.5 80 a 89 I I I I I I I I I I 1 1 12 84.5 90 a 99 I I I I I ( 1 1 8 94.5

    100 a 109 I I 2 104.5 -

    50

    Observe que cada clase tiene un lmite inferior y un lmite superior. Los valores exactos de estos lmites son muy importantes. Si los datos en una tabla de frecuencias son continuos, es necesario permitir valores fraccionarios. Nuestros lmites de clase apareceran como:

    50 y menos de 60

    60 y menos de 70

    70 y menos de 80

    Claro que P&P no puede transportar una fraccin de pasajero, de manera que la naturaleza discreta del conjunto de datos reales permite el uso de los lmites vistos en la tabla 2.2. El nmero de clases en una tabla de frecuencias es algo arbitrario. En general, la tabla debera tener entre 5 y 20 clases. Muy pocas clases no revelaran ningn detalle sobre los datos y demasiadas clases sera tan confuso como la misma lista de datos originales.

    Se puede seguir una regla simple para aproximar el nmero de clases a utilizar, c, es:

    Determina el nmero 2' 2 n [2.11 de clases

    en donde n es el nmero de observaciones. El nmero de clases es la menor potencia a la cual se eleva 2, de manera que el resultado sea igual a o mayor que el nmero de observaciones. En el ejemplo de P&P, se tiene que n = 50 observaciones. As,

  • CAP~TULO 2 Descripcin de los conjuntos de datos 23

    Despejando c, lo cual puede hacerse fcilmente con una calculadora manual, se encuentra que 26 = 64. Esta regla sugiere que debera haber seis clases en la tabla de frecuencias. Por razones de conveniencia, puede utilizarse un nmero mayor o menor de clases.

    El punto medio de la clase, M, se calcula como promedio de los lmites superior e inferior de dicha clase. El punto medio para la primera clase en la tabla 2.2 es 50 + 5912 = 54.5.

    Elintervalo de clase es el rango de valores encontrados dentro de una clase. Se determina restando el lmite superior (o inferior) de una clase del lmite inferior (o superior) de la clase siguiente. El intervalo para la primera clase en la tabla 2.2 es (60 - 50) = 10. Es deseable que todos los intervalos de clase sean de igual tamao, ya que facilita las interpretaciones estadsticas en usos subsiguientes. Sin embargo, puede ser conveniente utilizar intervalos abiertos que no mencionan un lmite inferior para la primera clase o un lmite superior para la ltima clase. La ltima clase en la tabla 2.2 puede leerse "100 y ms".

    En la construccin original de una tabla de frecuencia, el intervalo de clase puede determinarse como:

    Intervalo de clase para una tabla de frecuencia

    Valor m s grande - valor m s pequeo 1C =

    Nmero deseado de clases

    Ya que se deciden seis clases para la tabla de frecuencia, el intervalo de clase se convierte en:

    Debido a que 8.7 es un nmero poco prctico, el intervalo puede ajustarse levemente hacia arriba o hacia abajo. Por razones de conveniencia, se seleccion el intervalo de 10 para formar la tabla 2.2.

    Con frecuencia se desea determinar el nmero de observaciones que son "mayor que" o "menor que" alguna cantidad. Esto puede lograrse con una distribucin de frecuencia acumulada "ms de" o una distribucin de f'recuencia acumulada "menor que". Una distribucin de frecuencias acumuladas "ms de" se forma restando las frecuencias de las clases anteriores tal como se observa en la tabla 2.3. En los 50 das, por lo menos 50 pasajeros abordaron P&P Airlines. Por tanto, la frecuencia acumulada para la primera clase de la tabla 2.3 es 50. En tres de esos das, menos de 60 pasajeros compraron pasajes. Por tanto, la frecuencia acumulada de la segunda clase es 47 (50 - 3). Debido a que el nmero de pasajeros fue menor de 70 en 10 das, la frecuencia acumulada para la tercera clase es 40 (50 - 10). Las frecuencias acumuladas para las clases restantes se determinan de forma similar.

    Tabla 2.3 Distribucin de frecuencias acumuladas "mas de" del nmero de pasajeros

    Clase Frecuencia Frecuencia acumulativa (pasajeros) (das) (das) 50 o ms 3 60 o mas 7 70 o mas 18 80 o ms 12 90 o ms 8 100 o ms 2 110 o ms O

    Una distribucin de frecuencia acumulada "menor que" se construye sumando las frecuencias de cada clase. La tabla 2.4 muestra que en ningn momento volaron menos de 50 pasajeros en P&P. La frecuencia acumulada de la pnmeraclase por tanto es cero. En tres das, menos de 60 pasajeros abordaron vuelos. La frecuencia acumulada

  • de la segunda clase es tres. Debido a que hubo 10 das en los cuales menos de 70 pasajeros volaron, la tabla 2.4 muestra que la frecuencia acumulada de la tercera clase es 3 + 7 = 10. De nuevo las frecuencias acumuladas de las clases restantes se determinan de manera similar.

    Tabla 2.4 Distribucin de frecuencia acumulada "menor que" para el nmero de pasajeros

    Clase (pasajeros)

    Menos de 50 Menos de 60 Menos de 70 Menos de 80 Menos de 90 Menos de 100 Menos de 110

    Frecuencia acumulada Frecuencia (das) (das)

    Finalmente, una distribucin de frecuencia relativa expresa la frecuencia dentro de una clase como un porcentaje del nmero total de observaciones. En nuestro caso actual, la frecuencia relativa de una clase se determina como la frecuencia de dicha clase dividida por 50. Por ejemplo, la tabla 2.5 muestra que la frecuencia relativa de la tercera clase es 18/50 = 36%. Esto permite sacar conclusiones sobre el nmero de observaciones en una clase respecto a toda la muestra.

    Tabla 2.5 Distribucin de frecuencia relativa para pasajeros

    Clase Frecuencia Frecuencia (pasajeros) (das) relativa

    50-59 3 3 50 = 6% 60-69 7 7 + 50 = 14% 70-79 18 18+50 = 36% 80-89 12 12 + 50 = 24% 90-99 8 8 + 50 = 16%

    Casi todo el trabajo estadstico que se encuentra puede realizarse fcil y rpidamente con la ayuda de los computadores modernos. La pantalla 2.1 contiene la tabla de frecuencias para los datos de los pasajeros de P&P, creado en Microsoft Excel. Se puede especificar el lmite superior de cada clase. Despus, las observaciones se colocan en las clases correspondientes. La mayora de los paquetes de computador crearn un resultado similar.

    Pantalla 2.1 Tabla de frecuencias para datos de pasajeros de P&P

    BIN FREQUENCY CUMULATIVE %

    59 3 6.00% 69 7 20.00% BIN = Lmite superior 7 9 18 56.00% FREQUENCY = Frecuencia 89 12 80.00% CUMULATIVE = Acumulado

    9 9 8 96.00% 109 2 100.00%

  • CAP~TULO 2 Descripcin de los conjuntos de datos 25

    B. Tablas de contingencia Las tablas de frecuencia pueden organizar datos de slo una variable a la vez. Si se desea examinar o comparar dos variables, una tabla de contingencia resulta de mucha utilidad.

    Se supone que adems de recolectar informacin sobre el nmero de pasajeros de P&P, tambin se obtuvieron datos sobre las edades de los pasajeros y el nmero de vuelos en los que se registraron cada ao. Ambas variables pueden verse en detalle mediante una tabla de contingencia que enumera el nmero de vuelos en la parte superior y las edades debajo, tal como se muestra en la tabla 2.6. Al dividir la edad en cuatro categoras y los vuelos en tres categoras, se han creado 12 celdas en la tabla. Ahora se puede determinar si estas dos caractersticas estn relacionadas. Por ejemplo, en la ltima columna se puede ver que el nmero ms grande de pasajeros, 15 o 30%, est en la categora de edad comprendida entre los 40 y los 65 aos y vuelan ms de cinco veces al ao. El nmero ms pequeo de pasajeros, tan slo 4 personas, son menores de 25 aos o tienen 65 aos o ms. Una mayora, 28 personas, toma de forma tpica ms de 5 vuelos cada ao.

    Tabla 2.6 Nmero de vuelos por ao

    Tabla de contingencia para P&P Airlines Edad 1-2 3-5 Mayor de 5 Total

    Menor de 25 1 (0.02) 1 (0.02) 2 (0.04) 4 (0.08) 25-40 2 (0.04) 8 (O. 16) 1 O (0.20) 20 (0.40) 40-65 1 (0.02) 6 (O. 12) 15 (0.30) 22 (0.44) 65 y ms 1 (0.02) 2 (0.04) 1 (0.02) 4 (0.08) Total 5 (0.1 O) 17 (0.34) 28 (0.56) 50 (1 .OO)

    Tambin se podra mostrar la informacin en cada celda segn el gnero. De las 15 personas en el nivel de edad entre los 40 y los 65 aos, que vuelan ms de 5 veces al ao, ocho pueden ser hombres y siete mujeres. Entonces la entrada en dicha celda podra aparecer como 8,7 (0.30). Todas las otras caractersticas relevantes de los pasajeros tambin podran incorporarse en la tabla. Es fcil imaginar que dicho perfil descriptivo podra ser muy til en la identificacin del pasajero tpico y en el establecimiento de polticas de marketing efectivas.

    1. Un conjunto de datos contiene 100 observaciones; la ms grande es 315 y la ms pequea es 56. a. Cuntas clases debera tener la tabla de frecuencias? b. Cul es el intervalo de clase? c. Cules son los lmites y puntos medios de cada clase?

    2. En un estudio reciente sobre 500 graduados en administracin de negocios, el salario inicial ms alto que se report fue de $27,500 dlares y el ms bajo fue de $1 9,900 dlares. Usted desea crear la tabla de frecuencias para analizar y comparar estos datos con las ofertas de trabajo que usted ha recibido. a. Cuntas clases pondr en su tabla de frecuencia? b. Cul es el intervalo de clase? c. Cules son los lmites y puntos medios de cada clase?

    3. Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas de Estados Unidos. Los datos estn expresados en miles de dlares.

  • 2 6 ESTAD~STICA APLICADA A LOS NEGOCIOS Y LA ECONOM~A

    a. Construya una tabla de frecuencia para los datos. Tenga mucho cuidado en la seleccin de sus intervalos de clase. Muestre las frecuencias acumulativas y relativas para cada clase. Qu conclusin puede sacar de la tabla?

    b. Presente y explique una distribucin de frecuencia acumulada "ms que" y una distribucin de frecuencia acumulada "menor que".

    4. De los datos que se presentan a continuacin, prepare una tabla de contingencia para evaluar a 45 empleados respecto a su nivel de educacin expresado en aos y el nivel administrativo que poseen actualmente. Divida la educacin en tres grupos: el grupo 1 entre los 10 y los 12 aos de educacin, el grupo 2 entre los 13 y los 15 aos, y el grupo 3 para 16 aos y ms. Qu patrones, si los hay, observa y a qu conclusiones puede llegar?

    Nivel gerencia1 Aos de educacin Nivel gerencia1 Aos de educacin

    1 14 4 16 2 13 4 18 3 16 4 14 2 16 2 15 1 12 3 17 4 16 2 12 1 12 1 12 2 12 2 15 3 14 3 16 3 14 1 10 1 13 2 14 2 12 4 16 3 20 2 14 4 17 4 16 2 14 1 1 O 1 13 1 12 3 16 4 13 2 11 1 1 o 4 16 2 13 4 16 4 17 2 1 O 2 15 3 11 3 14 1 14

    5. Un proceso para produccin de materiales de construccin est diseado para generar contenedores de tres pesos diferentes: 10 libras, 1 1 libras y 12 libras. Un examen de 40 de los contenedores registra sus pesos reales y sus pesos deseados. Se considera que un contenedor es "defectuoso" si su peso real difiere en ms de 0.5

  • CAP~TULO 2 Descripcin de los conjuntos de datos 27

    libras de su peso deseado. Realice una tabla de contingencia con estos datos en la cual indique cuntos contenedores, en cada uno de los tres grupos, estn dentro de la diferencia permisible. Registre las observaciones como "1" si es defectuoso y "2" si no es defectuoso. Puede detectar algn patrn? Parece que un grupo de peso tiene una mayor proporcin de defectos?

    Peso real Peso deseado Peso real Peso deseado

    Grficos Los grficos tambin son mtodos tiles para describir conjuntos de datos. Un histograma coloca las clases de una distribucin de frecuencia en el eje horizontal y las frecuencias en el eje vertical. La figura 2.1 muestra el histograma para la distribucin de frecuencias de la tabla 2.2. Revela detalles y patrones que no se pueden discernir fcilmente de los datos originales. La frecuencia absoluta, as como las frecuencias relativas de cada clase, estn ilustradas claramente.

    Figura 2.1 Histograma para los pasajeros de P&P

    Pasajeros

  • Parecido a un histograma, el diagrama de barras puede mostrar cantidades o porcentajes para dos o ms valores sobre el eje vertical. La figura.2.2 demuestra los costos e ingresos para P&P Airlines. Figura 2.2 m YO ~ngresos Desempeo de P&P $ 3 80 I costos

    70 ' 60 g g 50 1 40

    30 g 20

    10 O

    Aos

    Un diagrama circular es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. Se crea marcando una porcin del crculo correspondiente a cada categora de la variable. La figura 2.3 muestra en porcentajes con qu frecuencia los empleados llevan trabajo de la oficina a la casa.

    Figura 2.3 Con qu frecuencia los trabajadores llevan trabajo para hacer en la casa Diagrama circular

    48%

    Menos de una vez al mes Una vez al mes Dos veces a la semana

    8% ' 9% 3-4 veces a la semana Fuente: USA Todav. Todos los das

    Los datos financieros con frecuencia estn contenidos en un grfico de mximos - mnimos y al cierre. Como su nombre lo indica, muestra el valor ms alto, el valor ms bajo y el valor al cierre de los instrumentos financieros como por ejemplo las acciones. La figura 2.4 es un grfico basado en los datos tomados de The Wall Street

    Figura 2.4 a m Grfico de mximos- 2 g 181

    o mnimos y cierre para g .G 15 acciones a 3 e> 180

    u -

    9 10 11 12 13 Da seleccionado en junio

    Fuente: The Wall Street Journal.

  • CAP~TULO 2 Descripcin de los conjuntos de datos 29

    Journal para el ndice Dow Jones respecto a 15 acciones durante un perodo de cinco das con base en los siguientes datos:

    Mximos Mnimos Cierre S Junio 9 181.07 178.1 7 178.88

    10 180.65 178.28 179.11 11 180.24 178.17 179.35 12 182.79 179.82 181.37 13 182.14 179.53 181.31

    Algunas veces se denominan mximos y mnimos al extremo superior de la recta vertical, o mximo, que marca el valor ms alto que alcanz el ndice en ese da; el extremo inferior indica el valor ms bajo que alcanz ese da. El valor de cierre se muestra mediante la lnea pequea que se encuentra entre las dos anteriores. Podran hacerse p~esentaciones similires para productos y monedas tramadas en las bolsas organizadas del mundo.

    John Tukey, un estadstico notable, cre el diagrama de tallo y hoja como una alternativa para que el histograrna proporcionara una impresin visual rpida sobre el nmero de observaciones en cada clase. Cada observacin se divide en dos partes: un tallo y una hoja, separadas por una recta vertical. El diseo preciso puede adaptarse para que se ajuste a cualquier conjunto de datos, identificando un punto conveniente en el cual las observaciones puedan separarse de tal manera que formen un tallo y una hoja. Los valores fraccionarios tales como 34.5, 34.6, 45.7,45.8 y 56.2 pueden separarse en el punto decimal produciendo un tallo y una hoja de la siguiente manera:

    Tallo Hoja 34 5.6

    Vale la pena destacar que el tallo y la hoja estn colocados en series ordenadas. Si un tallo nico contiene un gran nmero de observaciones en su hoja, es comn dividirlo en dos tallos

    independientes, exactamente en el punto medio. La pantalla 2.2 muestra un diagrama de tallo y hoja para nuestros datos sobre pasajeros, proporcionado por Minitab. La pantalla contiene tres columnas. La segunda y la tercera muestran el tallo y la hoja, respectivamente. Hay tres observaciones en los cincuentas: 50, 57 y 59. La primera columna muestra las profundidades, indicando la suma total de observaciones desde la parte superior de la distribucin, para los valores menores que la mediana (lo cual se discutir ms adelante en este captulo) o hasta la parte inferior de las distribuciones, para valores mayores que la mediana. La profundidad en parntesis, (9), muestra el nmero de observaciones en el tallo que contiene la mediana. Por ejemplo, hay 19 observaciones desde 50 hasta 74, y 22 observaciones desde 80 hasta la observacin mxima de 102. Se nota que hay dos tallos para los setentas separando las observaciones en el punto medio entre 74 y 75.

    Pantalla 2.2 Stem-and-leaf display (Tallo y hoja para P&P) Character Stem-and-Leaf Display Character Stem-and-Leaf Display = Visualizacin Stem-and-leaf of pass N = 50 de caracteres Leaf Unit = 1.0 1 5 : o 3 5 7 9

    Stem-and-lea o pass = Tallo y hoja de pasajeros

    Leaf Unit = Unidad de hoja

  • 30 ESTAD~STICAAPLICADAA LOS NEGOCIOSY LA ECONOM~A

    La unidad de hoja expresa en dnde colocar el punto decimal. Con la unidad de hoja =1 .O, la primera observacin es 50. La unidad de hoja = 0.1 significara que la primera observacin es 5.0 y la unidad de hoja = 10 significaria que la primera observacin es 500.

    6. Construya un diagrama de tallo y hoja sobre las tasas de desempleo en 15 pases industrializados: 5.4%, 4.2%, 4.7%, 5.5%, 3.2%,4.6%, 5.5%, 6.9%,6.7%, 3.7%,4.7%, 6.8%, 6.2%, 3.6% y 4.8%.

    7. Desarrolle e interprete un histograma de la tabla de frecuencias que usted construy para el ejercicio 3. 8. Investor S Report (julio de 1996) a f i que el mes anterior la gente haba invertido, en millones de dlares, las

    siguientes cantidades, en tipos de fondos mutuos: 16.7 en fondos de desarrollo, 12.5 en fondos de ingreso, 28.2 en fondos internacionales, 15.9 en mercado monetario, y 13.9 en "otros". Haga un diagrama circular que represente estos datos, complete con los porcentajes correspondientes.

    9. Los cambios del mes anterior para las inversiones hechas en cada uno de los fondos del problema anterior, fueron respectivamente, 2.3, 1.5, -3.6,4.5 y 2.9. Haga un diagrama de barras que refleje estos cambios.

    Problemas resueltos 1. Una organizacin estudiantil est por revisar el monto que los estudiantes invierten en textos cada semestre.

    Cincuenta estudiantes reportaron las siguientes cantidades, aproximadas al dlar ms prximo.

    a. Debido a que 2' 50 produce seis clases, el intervalo para la distribucin de frecuencias se encuentra como (ms alto - ms bajo