46
DISTRIBUCIÓN DE DISTRIBUCIÓN DE FRECUENCIAS FRECUENCIAS

Semana 3

Embed Size (px)

DESCRIPTION

Semana 3

Citation preview

DISTRIBUCIÓN DE DISTRIBUCIÓN DE FRECUENCIASFRECUENCIAS

¿CÓMO SE ORGANIZAN LOS DATOS U OBSERVACIONES?

La tabla que recoge de modo sistemático estos datos u observaciones se denomina distribución de frecuencias

Distribución de Frecuencias

Una distribución de frecuencias es una tabla en la que un conjunto de datos, se divide en un número adecuado de clases (categorías), se presenta también el número de unidades pertenecientes a cada clase.

Distribución de frecuencias según variablesCualitativas

ES LA TABLA QUE RESUME LA INFORMACIÓN, EN LA QUE SE REPRESENTA A LAS CATEGORÍAS DE UNA VARIABLE Y SUS RESPECTIVAS FRECUENCIAS. NOS INDICA CÓMO SE DISTRIBUYE LA FRECUENCIA TOTAL ENTRE LAS CATEGORÍASEJEMPLO 1: NIVEL EDUCATIVO SE HA CLASIFICADO A 20 INDIVIDUOS SEGÚN SU NIVEL DE ESTUDIOS QUE PUEDE TOMAR VALORES:

1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3

 

1 sin

2

3

4 sup

estudios

primariosNivel educativo

medios

eriores

EN DONDE:CATEGORÍAS

SIN ESTUDIOS 3 0,15

PRIMARIA 7 0,35

MEDIA 6 0,3

SUPERIOR 4 0,2

  1

fi hi

n=20

Xi

OBSERVACION

fi

FRECUENCIA

ABSOLUTA

Fi

FRECUENCIA

ABSOLUTA

ACUMULADA

hi

FRECUENCIA

RELATIVA

Hi

FRECUENCIA

RELATIVA

ACUMULADA

X1 f1 F1=f1 h1=f1/n H1=h1

X2 f2 F2=f1+ f2 h2 H1=h1+ h2

…Xm fm Fm=f1+ f2 +

…+fm

=n

hm Hm=h1+ h2 +…+hm

=1

Distribución de frecuencias según variable discreta Para obtener una tabla de distribución de frecuencias cuando la

variable es discreta se procede de la siguiente manera:a)       Se identifica la variable en estudiob)       Se ordenan los datos en forma ascendente o descendentec)    Se calculan los elementos de la tabla o distribución de

frecuencias.

EjemploLos siguientes datos corresponden al número

de errores ortográficos registrados en 30 jóvenes, durante un control :

2 0 4 4 1 4 0 3 2 0 0 1 1 1 0 1 2 43 1 1 1 5 2 2 5 4 0 4 0

Obtenga una tabla de distribución de frecuencias

Xi fi Fi hi % Hi %

0 7 7 23,3 23,3 1 8 15 26,7 50,0 2 5 20 16,7 66,7 3 2 22 6,7 73,3 4 6 28 20,0 93,3 5 2 30 6,7 100,0 ------- ------- Total 30 100,0  Donde:  Xi : Observación

fi : Frecuencia simple

Fi : Frecuencia acumulada

hi : Frecuencia relativa

Hi : Frecuencia relativa acumulada

X: Número de errores ortográficos

Distribución de frecuencias según variable continua

Para obtener una tabla de distribución de frecuencias cuando la variable es continua se procede de la siguiente manera:

a) Se identifica la variable en estudiob) Determinar el número de clases o intervalos (m)

m = 1+3.32 log n

c)Determinar la amplitud o recorridoA = V. Máximo - V. mínimo

d) Determinar el ancho o longitud del intervalo de clase 

  

Se recomienda el redondeo por exceso

e)Determinar los límites o intervalos de clase [ Li-1 , Li > ó < Li-1 , Li ]

 f) Determinar las marcas de clase g)Calcular las frecuencias absolutas simples, relativas, acumuladas, etc.

m

Ac

INTERVALO

[ Li, Ls>

Xi

MARCA

DE CLASE

fi

FRECUENCI

A

ABSOLUTA

Fi

FRECUENCIA

ABSOLUTA

ACUMULADA

hi

FRECUENCI

A

RELATIVA

Hi

FRECUENCIA RELATIVA

ACUMULADA

X1 f1 F1=f1 h1 H1=h1

X2 f2 F2=f1+ f2 h2 H1=h1+ h2

…Xm fm Fm=f1+ f2

+…+fm

=n

hm Hm=h1+ h2 +…+hm

=1

Las siguientes son medidas de la resistencia a rompimiento (en onzas) de una muestra de 40 hilos de lino. 32,5 15,2 35,4 21,3 28,4 21,2 28,3 27,125,0 32,7 27,3 33,7 29,4 21,9 29,3 20,629,5 21,8 37,5 33,5 25,4 34,1 27,5 29,622,2 26,9 24,6 28,9 24,8 28,1 26,9 29,517,3 29,6 22,7 34,6 30,2 29,0 26,8 31,3 Construya una tabla de distribución de frecuencias.

a)       X: Resistencia en onzas en hilos de lino.... b)       m=1+3,32log(40) aprox. m=6 c)       A = V. Max – V.Min

A = 37,5 – 15,2A = 22,3

 d)       C =A/m =3,72 Redondeado por exceso c = 3,8 Luego la Tabla de Distribución de frecuencias es:

Representaciones Gráficas de Distribuciones de frecuencias

MEDIDAS DE RESUMENPara describir un conjunto de OBSERVACIONES obtenidos de una muestra podemos emplear una serie de medidas que resumen toda la información o parte de la información de la muestra. Estas medidas pueden ser medidas de tendencia central o de posición, medidas de variabilidad o de dispersión y algunos índices. Las medidas de resumen son descripciones numéricas que se utilizan para caracterizar la información muestral.

MEDIDAS DE TENDENCIA CENTRALSon medidas que indican alrededor de qué valores se encuentran distribuidas las observaciones de la muestra.

medidas de tendencia central

MEDIDAS DE DISPERSION

Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de las observaciones de la distribución respecto al valor central.

medidas de dispersión

MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN

 

  EjemploLas siguientes 11 observaciones corresponden al contenido de

sólidos en el agua en partes por millón (ppm):4520 4570 4520 4490 4570 4500 4520 45204521 4540 4500 4590

Calcule el promedio, mediana y moda

La media aritmética para estas 11 observaciones es:Aprox. 4531 ppm

Para el cálculo de la mediana, ordenamos previamente la información

4490 4500 4500 4520 4520 4520 4520 4540 4570 4570 4590 Tenemos que la mediana es: 4520 ppm

y la moda es:

Mo=4520 ppm ¡interprete sus resultados!

EjemploUn analista desea determinar el número de moles de cobre II en un volumen dado de una solución, por electrólisis. Suponga que el químico empleó sólo 9 muestras de la solución para el experimento y que los resultados fueron, en moles de la sustancia en referencia, como sigue:

0,15 0,17 0,19 0,15 0,18 0,16 0,17 0,18 0,19

Calcule la media , mediana y moda

EjemploUn ingeniero químico vigila la calidad del agua midiendo la cantidad de sólidos suspendidos en una muestra de agua pluvial. En 11 días distintos observó los sólidos suspendidos (partes por millón).

14 12 21 28 30 63 29 63 55 19 20

Calcule e interprete la media aritmética y la mediana

PROPIEDADES DE LA MEDIA ARITMÉTICA

Ejemplo. Los siguientes datos corresponden al número de partículas de polen en 50 muestras (de 1 cm3 ) de aire.0 0 0 2 1 2 1 2 11 2 1 2 2 0 1 0 11 4 3 3 4 4 4 3 54 5 5 3 3 4 5 5 43 4 4 3 3 5 3 5 34 5 5 3 3a)Defina la variable en estudio, tipo de variable.b)Complete la tabla de frecuencias. Calcule e interprete la mediana y el promedioc)¿Cuál es la cantidad de partículas que más se repite en las muestras?d)¿Qué proporción de muestras contienen cuatro partículas?e)¿Qué cantidad de muestras presentan no más de tres partículas?f)¿Qué porcentaje de muestras contienen más de dos partículas?

Del ejemplo datos de resistencia en onzas, calcule la media aritmética, mediana y moda e interprete.

40

)3(1,36)6(3,32)18(5,28)4(7,24)7(9,20)2(1,17 x

=27,36 onzas

onzasme 07,288,318

)1320(6,26

Del ejemplo datos de resistencia en onzas, la clase modal es la cuarta clase por tener la mayor frecuencia absoluta simple. La moda es:

onzasMo 6,288,3618418

4186,26

1. Se realizó una encuesta sobre el número de hijos en 50 familias, con los siguientes resultados:

Complete la tabla de distribución de frecuencias. Calcule e interprete la media, mediana y moda

Además de la media aritmética, mediana y moda, podemosconsiderar otras medidas como:

Media Ponderada )( wx .- Cuando las observaciones no tienen el mismo peso, lo

recomendable es calcular un promedio o media ponderada

Ejercicio Pedro obtuvo la siguientes calificaciones en las asignaturas que cursó el semestre 2010-A Asignatura Número de créditos calificación Lenguaje 5 18 Matemática Básica 5 16 Actividades 4 15 Filosofía 3 15 Metodología del trabajo universitario 4 16 Determine la Calificación promedio obtenida por Pedro.

Media Geométrica(Mg).- De un conjunto de n observaciones x1,x2,....xn, , la media

geométrica es la raíz enésima del producto de las n observaciones.

nnxxxxMg ...321

Media Armónica ( )( Hx .- Se define como el recíproco de la media aritmética de

los recíprocos los n valores.

MEDIDAS DE POSICIÓN RELATIVA

Son medidas que permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, tenemos:CUARTILDECILPERCENTIL

1.Cuartil: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.

2.Decil: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.

3.Percentil: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

REGLA PARA EL CALCULO DE PERCENTILES DE LA MUESTRA

1. Ordenar las observaciones de menor a mayor2. Determine el producto np3. np no es un entero, redondéelo al entero

inmediato posterior y determine el valor ordenado correspondiente. si np es un entero digamos k, calcule la media de las observaciones ordenadas k-ésima y (k+1) ésima.

Ejemplo Las siguientes son 20 determinaciones de la emisión

diaria (en toneladas) de óxido de azufre de una planta industrial.

15,8 26,4 17,3 11,2 23,9 24,8 18,7 13,99,0

13,2 12,7 9,8 6,2 14,7 17,5 26,1 12,8 28,6

17,6 23,7Obtenga los cuartiles y percentiles 95, 65 y 85

Ordenando los datos:6,2 9,0 9,8 11,2 12,7 12,8 13,2 13,914,7 15,8 17,3 17,5 17,6 18,7 23,7 23,924,8 26,1 26,4 28,6 P95 =????

np = 20(95/100) = 19

P95 = (26,4+28,6) / 2 =27,5 toneladas.

Si los datos se encuentran agrupados (distribución de frecuencias), podemos hacer uso de la siguiente fórmula:

Pf

Ckpk

= Li + (

kn

100 - Fi-1)

Del ejemplo anterior . Calcule el P85 e interprete el

resultado obtenido.

Límite[ >

15,2 - 19,0 17,1 2 2 2/40 2/4019,0 - 22,8 20,9 7 9 7/40 9/4022,8 - 26,6 24,7 4 13 4/40 13/4026,6 - 30,4 28,5 18 31 18/40 31/4030,4 - 34,2 32,3 6 37 6/40 37/4034,2 - 38,0 36,1 3 40 3/40 1

Hixi fi Fi hi

La clase correspondiente al P85 es la clase cuya

frecuencia absoluta acumulada excede a kn/100, esto es 85x40/100 = 34 (quinta clase). Reemplazando, tenemos:

onzasp 3,328,3)6

3134(4,3085

Ejemplo Se realizó una investigación sobre la contaminación ambiental. Para ello se estudió la acidez del agua de lluvia caída en 40 localidades del país. Registrándose los siguientes niveles de pH:

6,9 5,9 5,7 6,0 3,9 4,8 4,9 6,0

3,2 4,2 4,9 6,2 4,9 6,0 6,4 5,8

5,0 3,9 5,0 5,3 5,8 5,7 5,7 6,2

5,1 6,0 5,1 5,7 5,1 4,8 5,8 5,9

5,3 5,0 5,4 5,9 6,4 5,9 5,7 6,0

a)Defina la variable en estudio.b)¿cuál es el nivel de acidez más frecuente?c)Calcule e interprete P25,Q3 y D4

d)Halle la desviación estándar e interprete.

a)       X: Niveles de pH… b)       m=1+3,32log(40) aprox. m=6 c)       A = V. Max – V.Min

A = 6,9 – 3,2A = 3,7

 d)       C =A/m =0,62 Redondeado por exceso c = 0,7 Luego la Tabla de Distribución de frecuencias es:

[ > Xi fi Fi3.2 3.9 3.55 1 13.9 4.6 4.25 3 44.6 5.3 4.95 11 155.3 6 5.65 15 30

6 6.7 6.35 9 396.7 7.4 7.05 1 40

a) X: niveles de pHb) Mo=?

58,57,09151115

11153,5

Mo

[ > Xi fi Fi3.2 3.9 3.55 1 13.9 4.6 4.25 3 44.6 5.3 4.95 11 155.3 6 5.65 15 30

6 6.7 6.35 9 396.7 7.4 7.05 1 40

c) Calcule e interprete P25,Q3 y D4

La clase correspondiente al P25 es la clase

cuya frecuencia absoluta acumulada excede a kn/100, esto es 25x40/100 = 10 (tercera clase).  98,47,0)

11410

(6,425 p

La clase correspondiente al P40 es la clase

cuya frecuencia absoluta acumulada excede a kn/100, esto es 40x40/100 = 16 (cuarta clase). 

34,57,0)15

1516(3,5404 pD

[ > Xi fi Fi3.2 3.9 3.55 1 13.9 4.6 4.25 3 44.6 5.3 4.95 11 155.3 6 5.65 15 30

6 6.7 6.35 9 396.7 7.4 7.05 1 40