10
UNIVERSIDAD AUTÓNOMA DE CAMPECHE IIP. MANUEL JESÚS GONZÁLEZ GARCÍA, MEAP. Página 1 DISTRIBUCIONES DE FRECUENCIA Una forma común y muy útil para resumir un conjunto de datos es la distribución de frecuencias que consiste en dividir los datos en categorías o clases y contar la frecuencia con que se presenta cada clase. No se le puede clasificar exactamente como un método gráfico pero constituye la base de algunos, muestra el número de observaciones del conjunto de datos que caen en cada una de las clases. Una distribución de frecuencias es una lista de clases o categorías de datos junto con la cantidad de valores que caen dentro de cada clase.Los datos pueden ser variables cualitativas o cuantitativas. Veamos un ejemplo de construcción de una distribución de frecuencias y una posible metodología. Ejemplo 2 El costo unitario de cierto producto ha fluctuado en los últimos 80 días, registrándose los siguientes valores diarios: 84 82 90 88 93 68 75 68 62 76 79 73 93 59 75 73 88 60 71 85 65 87 62 78 72 61 75 74 95 63 78 75 77 74 60 66 82 94 69 68 78 61 95 79 71 96 89 75 60 83 62 97 85 65 75 79 67 78 76 71 80 57 78 76 74 65 73 88 62 53 77 85 75 76 63 72 81 73 67 86 1. Se determina X max y X min el recorrido (97, 53 y 97 - 53 = 44) , ordenando en forma ascendente. 2. Se establece el número de clases y el tamaño del intervalo. Para el establecimiento del número de clases porque pierde su caráracter de resumen, los autores coinciden en que no son recomendables más de 20 clases. Tampoco deben ser demasiado pocas porque pueden ocultar mucha información. Además, la determinación del número de clases debe tener en cuenta el tamaño del intervalo. Se recomienda usar entre 5 y 10 clases., algunos proponen Número de clases= Se calcula el tamaño del intervalo de clase = = En este caso, en que el recorrido o rango 97-53 es 44; los intervalos de 5 o 10 facilitarían la lectura. Si tomamos 10 tendríamos 5 el tamaño de la clase (4.4), mientras que si tomamos 5 tendríamos 9 el tamaño de clase (8.8). Para 80 valores podemos utilizar 10 clases. Si fueran pocos valores sería más recomendable utilizar 5 clases, sin embargo en ocasiones se ajusta el número de intervalos al ancho de la clase que se pretende tener. 3. Se calcula la frecuencia absoluta de cada intervalo. DISTRIBUCIÓN DE FRECUENCIAS X f 50 - 54 / 55 - 59 // 60 - 64 //// //// / 65 - 69 //// //// 70 - 74 //// //// // 75 - 79 //// //// //// //// / 80 - 84 //// / 85 - 89 //// //// 90 - 94 //// 95 - 99 //// 1 2 11 10 12 21 6 9 4 4 f a f r f ra x i 1 3 14 24 36 57 63 72 76 80 1.25 2.50 13.75 12.50 15.00 26.25 7.50 11.25 5.00 5.00 1.25 3.75 17.60 30.00 45.00 71.25 78.75 90.00 95.00 100.00 52 57 62 67 72 77 82 87 92 97

Distribuciones de Frecuencia

Embed Size (px)

DESCRIPTION

trabajo original :3 espero les sirva

Citation preview

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 1

    DISTRIBUCIONES DE FRECUENCIA

    Una forma comn y muy til para resumir un conjunto de datos es la distribucin de frecuencias

    que consiste en dividir los datos en categoras o clases y contar la frecuencia con que se presenta cada clase. No se le puede clasificar exactamente como un mtodo grfico pero constituye la base de algunos, muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. Una distribucin de frecuencias es una lista de clases o categoras de datos junto con

    la cantidad de valores que caen dentro de cada clase.Los datos pueden ser variables cualitativas o cuantitativas. Veamos un ejemplo de construccin de una distribucin de frecuencias y una posible metodologa.

    Ejemplo 2 El costo unitario de cierto producto ha fluctuado en los ltimos 80 das, registrndose los siguientes valores diarios:

    84 82 90 88 93 68 75 68 62 76 79 73 93 59 75 73 88 60 71 85

    65 87 62 78 72 61 75 74 95 63 78 75 77 74 60 66 82 94 69 68

    78 61 95 79 71 96 89 75 60 83 62 97 85 65 75 79 67 78 76 71

    80 57 78 76 74 65 73 88 62 53 77 85 75 76 63 72 81 73 67 86

    1. Se determina Xmax y Xmin el recorrido (97, 53 y 97 - 53 = 44) , ordenando en forma ascendente.

    2. Se establece el nmero de clases y el tamao del intervalo. Para el establecimiento del nmero de clases porque pierde su carracter de resumen, los autores coinciden en que no son recomendables ms de 20 clases. Tampoco deben ser demasiado pocas porque pueden ocultar mucha informacin. Adems, la determinacin del nmero de clases debe tener en cuenta el tamao del intervalo. Se recomienda usar entre 5 y 10 clases., algunos proponen Nmero de

    clases= Se calcula el tamao del intervalo de clase =

    =

    En este caso, en que el recorrido o rango 97-53 es 44; los intervalos de 5 o 10 facilitaran la lectura. Si tomamos 10 tendramos 5 el tamao de la clase (4.4), mientras que si tomamos 5 tendramos 9 el tamao de clase (8.8). Para 80 valores podemos utilizar 10 clases. Si fueran pocos valores sera ms recomendable utilizar 5 clases, sin embargo en ocasiones se ajusta el nmero de intervalos al ancho de la clase que se pretende tener.

    3. Se calcula la frecuencia absoluta de cada intervalo.

    DISTRIBUCIN DE FRECUENCIAS

    X

    f

    50 - 54 / 55 - 59 // 60 - 64 //// //// / 65 - 69 //// //// 70 - 74 //// //// // 75 - 79 //// //// //// //// / 80 - 84 //// / 85 - 89 //// //// 90 - 94 //// 95 - 99 ////

    1 2 11 10 12 21 6 9 4 4

    fa

    fr

    fra

    xi

    1 3

    14 24 36 57 63 72 76 80

    1.25 2.50

    13.75 12.50 15.00 26.25 7.50

    11.25 5.00 5.00

    1.25 3.75

    17.60 30.00 45.00 71.25 78.75 90.00 95.00

    100.00

    52 57 62 67 72 77 82 87 92 97

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 2

    La distribucin de frecuencias est constituida solamente por las columnas que se reflejan las clases (x) y las frecuencias absolutas (f). Se obtiene identificando de los datos brutos los valores o nmeros que se encuentren en cada uno de los intervalos. Se han aadido otras columnas tiles para el anlisis y tambin para la representacin grfica.

    Clase o intervalo de clase: Partes en que se divide la variacin total de los datos. Debe

    establecerse de forma tal que no haya dudas acerca de dnde clasificar cada dato.

    Marca de clase de un intervalo (xi): Valor del punto medio del intervalo (lmite inferior + lmite

    superior) / 2

    Frecuencia absoluta ( f): Nmero de datos que se ubican en dicho intervalo, se cuenta el nmero

    de datos que cae dentro de cada clase.

    Frecuencia relativa ( fr ): Resultado de dividir la frecuencia absoluta de dicho intervalo por el

    nmero total de datos del experimento. Indica la proporcin de datos que hay en dicho intervalo en relacin al total de datos. Puede expresarse en % multiplicando por 100.

    Pueden construirse distribuciones de frecuencia acumuladas si se sustituye la frecuencia del intervalo por el nmero que se suma al valor anterior acumulado . En la tabla, se sustituira la columna de (f) por fa o fra que son las frecuencias acumuladas absolutas y relativas.

    Ejemplo 3

    Las reacciones de 86 compradores de una tienda ante la afirmacin de que la misma venda ropa de alta calidad fue la siguiente:

    Reaccin

    Frecuencia

    Completamente de acuerdo De acuerdo Neutral o no opina En desacuerdo Completamente en desacuerdo

    12 35 27 10 2

    86

    Conceptualmente este ejemplo 3 no difiere del 2 salvo en que se trata de una variable cualitativa en cuyo caso no es necesario realizar todo el anlisis que se hizo para determinar el nmero de clases ya que el nmero de valores de la variable es el nmero de clases.

    Representaciones Grficas

    Existen numerosos mtodos grficos a travs de los cuales es posible analizar un conjunto de datos. Los diagramas y grficos ms sencillos estn diseados para datos nominales u ordinales. Como los datos constituyen categoras, las clases son obvias y es fcil describirlas en un grfico. Se relacionarn las ms comunes y se definirn algunas:

    Diagrama de pastel Diagrama de barras Histogramas Polgono de frecuencias y Ojiva

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 3

    Diagrama de Pastel

    Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Este tipo de diagrama es particularmente til si se quiere hacer hincapi en los tamaos relativos de las componentes de los datos. Los presupuestos y la informacin econmica se describen con frecuencia mediante un diagrama de pastel. Un crculo completo, 360 representa el nmero total de observaciones. El tamao de las porciones es proporcional a la frecuencia relativa de cada categora.

    Diagrama de Barras

    Cada barra representa la frecuencia de una categora. La altura de la barra es proporcional al nmero de elementos en esa categora. En general, las barras se ponen en posicin vertical con la base en el eje horizontal. Las barras se separan y por ello se utiliza con frecuencia para datos nominales y ordinales: la separacin muestra que se estn dibujando frecuencias de categoras distintas. En las figuras se muestran algunos ejemplos de grficos de pastel y de barras.

    Diagrama de Pastel: Colores favoritos de 32 personas

    .

    Diagrama de Pastel que muestra los ingresos por operaciones de Washington Water Power

    Fuente: Washington Water Power Co., Informe Anual, 1991

    Diagrama de Pastel: Gastos de la compaia Itrex

    Diagrama de Barras: Colores favoritos de 32 personas

    Diagrama de Barras: Produccin de Acero, 1989-92

    (en millones de toneladas)

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 4

    Fuente: The Wall Street Journal,

    27 de Abril de 1992, p.1

    Histograma

    En este mtodo, se dibujan las categoras o clases a lo largo del eje horizontal del grfico y la frecuencia de cada clase se representa por barras verticales. Es decir, un histograma se parece a un diagrama de barras, slo que no hay espacio entre las barras, sta es la razn por la que el histograma se usa con frecuencia para datos con escalas de intervalos o de razn. Para construir el histograma, parte de la realizacin previa de la distribucin de frecuencias, consiste en dibujar una serie de rectngulos, cuyo ancho es proporcional al rango de los valores que se encuentra dentro de una clase, y cuya altura es proporcional al nmero de elementos que caen dentro de la clase. Si las clases empleadas en la distribucin de frecuencia son del mismo ancho, entonces las barras verticales del histograma tambin tienen el mismo ancho. La altura de la barra correspondiente a cada clase representa el nmero de observaciones de la clase. Tambin los histogramas se pueden hacer con las frecuencias relativas en el eje vertical.

    El histograma ayuda a observar fundamentalmente la forma en que distribuyen los datos, aunque tambin resulta til para formarnos una idea de su valor medio y de su dispersin. La observacin de su forma puede dar informacin til acerca de los datos. Algunas formas se mostrarn en las distribuciones de frecuencia.

    Debe prestarse mucha atencin a la toma de datos puesto que ella puede llevarnos a error. Enseguida se muestra un ejemplo de cmo un grupo de datos llevados a un diagrama de correlacin puede conducir a un error.

    Distribuciones de Frecuencia Tpicas

    Forma de Campana.

    Simtrica, con el pico en el centro del rango de datos. Es la distribucin habitual de datos de un proceso.

    .

    Doble pico. Tiene un valle en el centro del rango de los datos con dos pisos en ambos lados. sta es en general una combinacin de dos distribuciones normales (campana) y sugiere la existencia a la vez de dos procesos diferentes.

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 5

    Meseta. La punta

    es plana y no existe ningn pico claramente diferenciado. Sugiere la existencia de muchos procesos diferentes a la vez, con distribuciones normales centradas a lo largo de todo el rango de datos.

    Peine. Alternan

    valores altos y bajos de forma regular. Refleja normalmente errores de medida.

    .

    .

    Sesgada. Es de

    forma asimtrica, con el pico descentrado respecto al rango de datos; la curva termina bruscamente en un lado y suavemente en el otro. Puede ser debida a un proceso que se ha ajustado demasiado a uno de los extremos del rango permitido.

    Truncada. De

    forma asimtrica, en la que el pico est en el extremo del rango de datos. Normalmente se refiere a procesos con distribucin normal, donde parte de la distribucin se ha eliminado, por ejemplo, mediante una inspeccin 100%.

    Pico aislado. Con

    un grupo de datos pequeo separado de la distribucin normal. Este pequeo grupo indica alguna anormalidad del proceso, algo que no ocurre de forma regular.

    .

    Pico extremo.

    Tiene un gran pico unido a una distribucin normal. Indica normalmente un registro incorrecto de datos; por ejemplo, se han registrado valores fuera del rango aceptable como si estuvieran justo en el lmite aceptable de la especificacin.

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 6

    Es importante recordar que la interpretacin de los histogramas es una mera teora que se debe confirmar, mediante la toma adicional de muestras y la observacin en detalle del proceso; por ello, la primera conclusin no siempre es la correcta.

    Polgono de Frecuencia

    Aunque se utilizan menos, los polgonos de frecuencia son otra forma de presentar grficamente distribuciones tanto de frecuencia absolutas como relativas. Para construir un polgono de frecuencia sealamos stas en el eje vertical y los valores de la variable que estamos midiendo en el eje horizontal, del mismo modo que se hizo con el histograma. A continuacin, graficamos cada frecuencia de clase trazando un punto sobre su punto medio y conectamos los puntos sucesivos resultantes con una lnea recta para formar un polgono. Es slo una lnea que conecta los puntos medios de todas las barras del histograma.

    Los histogramas y los polgonos de frecuencia son similares. Por qu necesitamos ambos? Las ventajas del histograma son:

    1.- Los rectngulos muestran cada clase de la distribucin por separado.

    2.- El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmero total de observaciones que se encuentra en esa clase.

    Los polgonos por su parte, tambin poseen ciertas ventajas.

    1.- El polgono de frecuencia es ms sencillo que su histograma correspondiente.

    2.- Bosqueja con ms claridad un perfil del patrn de los datos.

    3.-El polgono se vuelve cada vez ms suave y parecido a una curva conforme aumentamos el nmero de clases y el nmero de observaciones.

    http://www.google.com/url?sa=i&source=images&cd=&cad=rja&docid=pe2QYohDGDKk_M&tbnid=LprmpaffZXILkM:&ved=0CAgQjRwwAA&url=http://www.monografias.com/trabajos72/distribucion-frecuencias/distribucion-frecuencias2.shtml&ei=0LeaUdjrO-HU0gHP24CYCw&psig=AFQjCNFZXuKlCY9EflbbZJdlpM7rHC3QbA&ust=1369180497034039

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 7

    Ojiva

    La grfica de una distribucin de frecuencia acumulada se conoce como Ojiva. Nos permite ver cuntas observaciones estn por encima de ciertos valores, en lugar de hacer un mero registro del nmero de elementos que hay dentro de los intervalos. Cuando la informacin que utilizamos se presenta en trminos de frecuencia acumulada menor que, la curva tendra una inclinacin hacia arriba y a la derecha, y lo contrario mayor que, tendra una inclinacin hacia abajo y a la derecha. La construccin de la grafica debe considerarse la frecuencia relativa en el eje vertical y las clases en el eje horizontal.

    MENOR QUE

    MAYOR QUE

    http://www.google.com/imgres?imgurl=http://www.fao.org/docrep/006/X8498S/x8498snx.gif&imgrefurl=http://www.fao.org/docrep/006/X8498S/x8498s09.htm&h=204&w=281&sz=3&tbnid=TKasS3lL5y5_iM:&tbnh=89&tbnw=122&prev=/search?q=imagen+de+ojiva&tbm=isch&tbo=u&zoom=1&q=imagen+de+ojiva&usg=__wJVVSdJk-pb08xtwlYWZCJne6p8=&docid=IfOt2pm-FIEAFM&hl=es-419&sa=X&ei=yLuaUbrwPJCy8ASbnYDAAQ&ved=0CEsQ9QEwCQ&dur=11680http://www.google.com/url?sa=i&source=images&cd=&cad=rja&docid=yFwT9MsXjXacyM&tbnid=Ddt9YUKSRv511M:&ved=0CAgQjRwwAA&url=http://bailamirumba.blogspot.com/2013/04/grafica-de-ojiva.html&ei=JryaUeinG42B0QHQvYGQDg&psig=AFQjCNHmki0XD0I15Ljc_ajdLm8paspvjg&ust=1369181606495259

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 8

    A continuacin se presentan ejemplos resueltos del libro de Levin R.(2004) Estadstica para Administracin y Economa, capitulo 2, para su revisin y estudio.

    Ejemplo 4 La compaa High Performance Bicycle Products de Chapel Hill, Carolina del Norte, hizo un muestreo de sus

    registros de embarque para cierto da con los siguientes resultados:

    Tiempo entre la recepcin de una orden y su entrega (en das) 4 12 8 14 11 6 7 13 13 11 11 20 5 19 10 15 24 7 29 6

    Construya una distribucin de frecuencias para estos datos y una distribucin de frecuencias relativas y acumuladas. Use intervalos de 6 das.

    a) Qu puede asegurar acerca de la efectividad del procesamiento de pedidos a partir de la distribucin de

    frecuencias?

    b) Si la compaa desea asegurar que la mitad de sus entregas se hagan en 10 das o menos, puede determinar, a partir de la distribucin de frecuencias, si han logrado esta meta?

    c) Qu puede hacer con los datos si tiene una distribucin de frecuencias relativas, que es difcil lograr con slo

    una distribucin de frecuencias?

    RESPUESTA

    Clase Frecuencia F. Relativa F. Acumulada F.R. Acumulada

    1-6 4 0.20 4 0.20

    7-12 8 0.40 12 0.60

    13-18 4 0.20 16 0.80

    19-24 3 0.15 19 0.95

    25-30 1 0.05 20 1.00

    a) Suponiendo que la compaa abre 6 das a la semana, se ve que 80% de las rdenes se entregan en 3 semanas o menos.

    b) Se puede decir que slo entre 20 % y 60% de las entregas se hacen en 10 das o menos, de manera que la

    distribucin genera suficiente informacin para determinar que la meta se cumple.

    c) Una distribucin de frecuencias relativas permite presentar frecuencias como fracciones o porcentajes.

    Ejemplo 5

    Se presenta una distribucin de frecuencias del peso de 150 personas que usaron las canastillas para subir a esquiar cierto da. Construya un histograma con estos datos.

    Clase Frecuencia Clase Frecuencia

    75- 89 10 150-164 23 90-104 11 165-179 9 105-119 23 180-194 9 120-134 26 195-209 6 135-149 31 210-224 2

    a) Qu puede observar en este histograma acerca de los datos que no era aparente en la tabla de distribucin de frecuencias?

    b) Si la capacidad de cada canastilla es dos personas y no ms de 400 libras de peso total seguro, qu puede hacer

    el operador para maximizar la capacidad de personas en las canastillas sin exceder la capacidad de peso seguro de una canastilla? Los datos apoyan su propuesta?

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 9

    RESPUESTA

    a) La cola inferior de la distribucin es ms ancha (tiene ms observaciones) que la cola superior. b) Debido a que existen tan pocas personas que pesan 180 libras o ms, el operador puede formar parejas de cada

    persona que se ve corpulenta con una persona delgada. Esto se puede hacer prcticamente sin retrasar los turnos

    individuales para subir a las canastillas

    Ejemplo 6 El Central Carolina Hospital tiene los siguientes datos que representan el peso en libras de 200 bebs prematuros al

    momento de su nacimiento. Clase Frecuencia Clase Frecuencia

    0.5-0.9 10 2.5-2.9 29 1.0-1.4 19 3.0-3.4 34 1.5-1.9 24 3.5-3.9 40 2.0-2.4 27 4.0-4.4 17

    Construya una ojiva que le ayude a responder las siguientes preguntas:

    a) Cul es el valor medio aproximado en el conjunto de datos original?

    b) Si los bebs prematuros de menos de 3.0 libras se mantienen en una incubadora durante varios das como

    precaucin, cul es el porcentaje aproximado de bebs prematuros en el Carolina que necesitarn una incubadora?

    RESPUESTA

    a) El valor medio es alrededor de 2.8 libras.

    b) Cerca de 55% necesitar incubadora.

  • UNIVERSIDAD AUTNOMA DE CAMPECHE

    IIP. MANUEL JESS GONZLEZ GARCA, MEAP. Pgina 10

    Bibliografa

    1. Levin, Richard; Rubin, David. (2010). Estadstica para administracin y economa (7 edicin).

    Mxico: Pearson Educacin Prentice Hall.

    2. Webster, Allen L. (2000). Estadstica aplicada a los negocios y la economa (3 edicin).

    Colombia: Irwing

    3. Lind Marchal Wathen (2012) Estadstica Aplicada a los negocios y la economa (15 edicin)

    Mxico McGraw Hill

    .

    http://www.youtube.com/watch?v=OzS7xkOUaE0&NR=1&feature=fvwp http://www.youtube.com/watch?v=oI_90tE1jug

    http://www.youtube.com/watch?v=OzS7xkOUaE0&NR=1&feature=fvwphttp://www.youtube.com/watch?v=oI_90tE1jug