10
NOCIONES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en un estudio estadístico. La suma de las frecuencias absolutas es igual al número total de datos (N): f 1 + f 2 + f 3 +…= f i = N La frecuencia relativa ( h i ), es decir, el cociente entre la frecuencia absoluta y el número total de datos, N : h i = f i N La suma de las frecuencias relativas es igual a 1. La frecuencia relativa porcentual ( p i ): es la frecuencia relativa expresada en tantos por ciento. Se obtiene multiplicando la frecuencia relativa por 100: p i = h i · 100 La frecuencia absoluta acumulada ( F i ), es decir, la suma de todas las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado i : F i = f i La frecuencia relativa acumulada ( H i ), es decir, la suma de todas las frecuencias relativas de todos los valores menores o iguales al valor considerado i : H i = h i La frecuencia relativa porcentual acumulada ( P i ): es la suma de todas las frecuencias relativas porcentuales menores o iguales que el dato considerado. P i = p i Ejemplo: La talla de calzado de 20 niños es: 43; 42; 41; 39; 41; 37; 40; 43; 44; 40; 39; 39; 38; 41; 40; 39; 38; 39; 39; 40. Construye la tabla de frecuencias y porcentajes. Valores x i f i h i = f i N Porcentajes p i =h i · 100 F i =Σf i H i = Σh i P i = Σp i 37 1 0,05 5% 1 0,05 5% 38 2 0,10 10% 3 0,15 15% 39 6 0,30 30% 9 0,45 45% 40 4 0,20 20% 13 0,65 65% 41 3 0,15 15% 16 0,80 80% 42 1 0,05 5% 17 0,85 85% 43 2 0,10 10% 19 0,95 95% 44 1 0,05 5% 20 1 100% Suma N f i =20 f i N =1 Σ p i =100 Matemáticas de Nivel II de E.S.P.A.■ 93 1

frecuencia absoluta ( f ), - Centro educativo de adultos en … · • La frecuencia absoluta (fi), es decir, el número de veces que aparece un determinado valor en un estudio estadístico

  • Upload
    ledang

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

NOCIONES de ESTADÍSTICA

En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos:

• La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en un

estudio estadístico. La suma de las frecuencias absolutas es igual al número total de datos (N):

f 1+ f 2+ f 3+…=∑ f i=N

• La frecuencia relativa ( hi ), es decir, el cociente entre la frecuencia absoluta y el número total de datos,

N :

hi=f i

N

La suma de las frecuencias relativas es igual a 1.

• La frecuencia relativa porcentual ( p i ): es la frecuencia relativa expresada en tantos por ciento. Se

obtiene multiplicando la frecuencia relativa por 100:

p i=hi ·100

• La frecuencia absoluta acumulada ( F i ), es decir, la suma de todas las frecuencias absolutas de todos

los valores inferiores o iguales al valor considerado i :

F i=∑ f i

• La frecuencia relativa acumulada ( H i ), es decir, la suma de todas las frecuencias relativas de todos los

valores menores o iguales al valor considerado i :

H i=∑ hi

• La frecuencia relativa porcentual acumulada ( P i ): es la suma de todas las frecuencias relativas

porcentuales menores o iguales que el dato considerado.

P i=∑ pi

Ejemplo:La talla de calzado de 20 niños es: 43; 42; 41; 39; 41; 37; 40; 43; 44; 40; 39; 39; 38; 41; 40; 39; 38; 39; 39;40. Construye la tabla de frecuencias y porcentajes.

Valores x i f i hi=f i

N

Porcentajes

pi=hi ·100Fi=Σ f i H i=Σ hi Pi=Σ p i

37 1 0,05 5% 1 0,05 5%38 2 0,10 10% 3 0,15 15%39 6 0,30 30% 9 0,45 45%40 4 0,20 20% 13 0,65 65%41 3 0,15 15% 16 0,80 80%42 1 0,05 5% 17 0,85 85%43 2 0,10 10% 19 0,95 95%44 1 0,05 5% 20 1 100%

Suma N=Σ f i=20 ∑ f i

N=1

Σ p i=100

Matemáticas de Nivel II de E.S.P.A.■ 93 © Fernando Moya Molina

1

Matemáticas de Nivel II de E.S.P.A. – NOCIONES de ESTADÍSTICA

Si la variable es continua o, siendo discreta toma muchos valores diferentes, los datos se agrupan en intervalos oclases. Estos intervalos tienen todos, la misma amplitud, siendo la marca de clase (xi), de cada intervalo, el puntomedio de cada uno.

Para formar los intervalos se procede de la siguiente manera:

Número de intervalos: se obtiene del valor resultante de redondear a un entero la raíz cuadrada del

número total de datos:

nº intervalos =√N

Amplitud de cada intervalo: Para determinar la amplitud de cada intervalo, se calcula el recorrido, es

decir, la diferencia entre el dato de mayor valor y el de menor valor. A continuación se busca un valorigual o superior al recorrido que sea múltiplo del número de intervalos. La amplitud de cada intervalose obtiene de dividir este valor entre el número de intervalos.

Ejemplo: El peso en kg de 20 niños es: 66,5; 59,2; 60,1; 64,2; 70; 50; 41,6; 47,9; 42,8; 55;52,2; 50,3; 42,2; 61,9; 52,4; 49,2; 41,6; 38,7; 36,5; 45. Crea una tabla agrupandolos datos en 6 intervalos de amplitud 7.

El número de intervalos es √20=4,47 ≈ 4

El recorrido es 70-36,5=33,5. Buscamos el primer múltiplo de 4 mayor que 33,5;es el 36.

Longitud= recorridonº de intervalos

=364

=9

El extremo inferior del primer intervalo se calcula dividiendo entre dos la restaobtenida entre el recorrido estimado y el recorrido calculado:

(36−33,5 ):2=1,25 →36,5−1,25=35,25

IntervaloMarca declase (xi)

Recuento (fi) hi pi Hi Fi Pi

[35-44) 39,5 6 6/20 30 6/20 6 30

[44-53) 48,5 7 7/20 35 13/20 13 65

[53-62) 57,5 4 4/20 20 17/20 17 85

[62-71] 66,5 3 3/20 15 20/20=1 20 100

Suma N=20

94 ■ Matemáticas de Nivel II de E.S.P.A.© Fernando Moya Molina

2

Matemáticas de Nivel II de E.S.P.A. – NOCIONES de ESTADÍSTICA

Ejemplo: Dibuja el histograma y el polígono de frecuencias acumuladas para la siguientetabla que muestra los resultados de un test realizado a los empleados de una fábrica:

Altura (xi) fi Fi

[38-44) 7 7

[44-50) 8 15

[50-56) 15 30

[56-62) 25 55

[62-68) 18 73

[68-74) 9 82

[74-80] 6 88

Actividades

4. Los pesos en kilogramos de los 40 jóvenes son los siguientes:

61 60 66 47 62 50 54 59 56 52

52 66 57 49 51 48 51 39 57 62

61 59 58 45 59 52 74 73 65 51

53 52 53 52 50 43 70 63 64 61

(a) Haz una tabla de frecuencias agrupando los datos.

(b) Representa la tabla anterior mediante un histograma y dibuja sobre éste un polígonode frecuencias.

98 ■ Matemáticas de Nivel II de E.S.P.A.© Fernando Moya Molina

3

NOCIONES de ESTADÍSTICA

Solución(a)

Intervalo Marca de clase Recuento (frecuencia)[38,5-44,5) 41,5 2[44,5-50,5) 47,5 6[50,5-56,5) 53,5 11[56,5-62,5) 59,5 12[62,5-68,5) 65,5 6[68,5-74,5] 71,5 3

(b)

Diagrama de sectoresOtro tipo de gráfico usado muy frecuentemente en los medios decomunicación es el diagrama de sectores o de tarta. Es muy útil parailustrar la división de una población en sus diversas partes, y laproporción de la totalidad que representa cada parte.

Consiste en dividir un círculo en tantos sectores como valores tenga lavariable, asignando a cada sector una amplitud proporcional a lafrecuencia de cada valor. Se utiliza para representar frecuencias decualquier tipo de variable siempre que no tome demasiados valoresdiferentes, en cuyo caso se perdería el impacto visual que este tipo degráfico pretende conseguir. Veamos un ejemplo:

Ejemplo: En un centro deportes municipal hay inscritas 120 personas en los siguientes deportes:

Deportes Nº de inscritos

Baloncesto 20Balonmano 14

Fútbol 48Atletismo 16Natación 22

Total 120

El diagrama de sectores correspondiente a esta variable es:

Matemáticas de Nivel II de E.S.P.A.■ 99 © Fernando Moya Molina

4

Matemáticas de Nivel II de E.S.P.A. – NOCIONES de ESTADÍSTICA

Observa que cada frecuencia que aparece en la tabla se representa por un sector de la tarta, de tamaño proporcional alvalor de la frecuencia. Para dibujar este gráfico se ha hecho lo siguiente:

Se ha dividido 360º entre 120, que es la suma de todas las frecuencias:

360 °120

=3 º

Se multiplica cada frecuencia por este resultado. Por ejemplo, para el baloncesto: 20 ·3 °=60 °

Se dibuja con el transportador el sector circular correspondiente a la medida obtenida.

Actividades

5. En un edificio de 16 vecinos, el número de televisores por vivienda es: 0, 1, 1, 2, 1,3, 2, 1, 1, 1, 2, 2, 3, 0, 3, 2. Haz una tabla de frecuencias y dibuja el dibuja el diagramade sectores.

Solución

Nº detelevisores

frecuenciasporcentajespi=hi ·100

gradossexagesimales

0 2 12,5 45°1 6 37,5 135°2 5 31,25 112,5°3 3 18,75 67,5°

Totales N=16 100 360°

100 ■ Matemáticas de Nivel II de E.S.P.A.© Fernando Moya Molina

5

NOCIONES de ESTADÍSTICA

4. Parámetros estadísticos

Sirven para sintetizar la información proporcionada por una tabla o gráfico estadístico logrando una visión globalde lo que acontece. Los hay de tres tipos: de centralización, de dispersión y de posición.

4.1 Medidas de centralización

Indican los valores más representativos de un conjunto de datos; en particular, en torno a qué valor (centro) sedistribuyen los datos. Las más utilizadas son la media aritmética, la mediana y la moda.

Media aritmética

La media aritmética, x , es el cociente entre la suma de todos los valores e la variable y el número total dedatos:

x=∑ xi · f i

N

En el caso de variables continuas o cuando los datos están agrupados en intervalos, se toma como valor dela variable la marca de clase.

Moda

La moda, Mo , es el valor que tiene mayor frecuencia absoluta. En el caso de una variable continua,hablaremos de intervalo modal o tomaremos la marca de clase. Si hay más de un valor con la máximafrecuencia, entonces no hay moda propiamente dicha aunque, en ocasiones se habla de distribución bimodalo trimodal.

Mediana

La mediana, M e , una vez ordenados los datos, es el valor del dato que ocupa la posición central, o la

media de los dos datos centrales, en el caso de que el número de datos sea par. La mediana divide los datosen dos partes, de forma que el 50% de los datos son menores que la mediana y el otro 50% son mayores.(En este sentido, además de ser una medida de centralización, lo es también de posición). Si la variable escontinua, hablaremos de intervalo mediano o consideraremos la marca de clase.

Ejemplo: Una encuesta realizada a 10 parejas en la que se les preguntaba sobre el número dehijos que tienen presenta los siguientes datos: 0, 1, 1, 3, 2, 0, 1, 2, 2, 1. Forma unatabla estadística con estos datos y calcula la media, la moda y la mediana.

Para calcular los parámetros estadísticos, es conveniente formar una tabla como la siguiente:

Nº de hijosx i

frecuenciasabsolutas

f i

x i · f i

0 2 01 4 42 3 63 1 3

Totales N=Σ f i=10 13

Esta tabla facilita el cálculo de los parámetros estadísticos:

Matemáticas de Nivel II de E.S.P.A.■ 101 © Fernando Moya Molina

6

Matemáticas de Nivel II de E.S.P.A. – NOCIONES de ESTADÍSTICA

Media: x=∑ xi · f i

N=

1310

=1,3

Moda: El dato de mayor frecuencia es 1: Mo=1 hijo

Mediana: Observando la tabla de los porcentajes acumulados, vemos que el 50%

corresponde al dato 1: Me=1 hijo

Ejemplo: Obtener la media, moda y mediana de los datos estadísticos recogidos en la siguientetabla:

Intervalos 10-15 15-20 20-25 25-30 30-35 35-40

f i 3 5 7 4 4 2

Media: x=∑ xi · f i

N=

597,525

=23,9

Moda: El dato de mayor frecuencia es 22,5: Mo=22,5

Mediana: Observando la tabla de los porcentajes acumulados, vemos que el 50% corresponde al dato

cuya marca de clase es 22,5: Me=22,5

4.2 Medidas de dispersión

Son medidas que permiten conocer como están de disgregados o alejados del centro los datos de un estudioestadístico. Generalmente, ese centro es la media aritmética de la distribución.

Rango o recorrido (R)

El rango o recorrido es la diferencia existente entre el valor mayor y el menor de la distribución. Realmente no es una medida muy significativa en la mayoría de los casos:

R=Máximo valor – mínimo valor

Varianza σ2

La varianza es la media de los cuadrados de las desviaciones de los datos respecto de la media. Se calculapor la expresión:

σ2=∑ f i · x i

2

N−x2

102 ■ Matemáticas de Nivel II de E.S.P.A.© Fernando Moya Molina

Intervalos Marca de clase

x if i x i · f i Fi Pi

10-15 12,5 3 37,5 3 1215-20 17,5 5 87,5 8 3220-25 22,5 7 157,5 15 6025-30 27,5 4 110 19 7630-35 32,5 4 130 23 9235-40 37,5 2 75 25 100

25 Σ xi · f i=597,5

7

NOCIONES de ESTADÍSTICA

Desviación típica

La desviación típica se define como la raíz cuadrada positiva de la varianza:

σ=√σ2=√∑ f i · xi

2

N−x2

Tiene la ventaja, respecto de la varianza, de que se mide en la misma unidad que la variable.

Coeficiente de variación (CV)

El coeficiente de variación CV es el cociente de la desviación típica entre la media:

CV =σx

No tiene unidades y se utiliza para comparar la dispersión entre distintas variables estadísticas. Cuanto máspequeño sea el coeficiente de variación más agrupados están los datos en torno a su media.

Veamos un ejemplo sobre el cálculo de todos estos parámetros.

Ejemplo:El número de preguntas acertadas por 100 opositores en un test de 30 cuestiones sepresenta agrupado en la tabla siguiente:

Número deaciertos

Marca de clase

x i

Frecuencia absoluta

f i

[0,5) 2,5 3

[5,10) 7,5 10

[10,15) 12,5 25

[15,20) 17,5 38

[20,25) 22,5 16

[25,30) 27,5 8

Total 100Calcula la media, moda, mediana, varianza, desviación típica y coeficiente de variación.

El cálculo de estos parámetros se facilita si añadimos las siguientes columnas a la tabla:

Númerode

aciertos

Marcade clase

x i

Frecuencia absoluta

f i

Frecuenciasacumuladas

Fi

x i · f i x i2 · f i

[0,5) 2,5 3 3 7,5 18,75

[5,10) 7,5 10 13 75 562,5

[10,15) 12,5 25 38 312,5 3906,25

[15,20) 17,5 38 76 665 11637,5

[20,25) 22,5 16 92 10360 8100

[25,30) 27,5 8 100 220 6050

Total N=∑ f i=100 ∑ x i · f i=1640 ∑ x i2 · f i=30275

Matemáticas de Nivel II de E.S.P.A.■ 103 © Fernando Moya Molina

8

Matemáticas de Nivel II de E.S.P.A. – NOCIONES de ESTADÍSTICA

Media

x=∑ xi · f i

N=

1640100

=16, 40

Moda o intervalo modal

Es el intervalo o marca de clase de mayor frecuencia: M o=[ 20,25 ) o bien M o=22,5

Mediana o intervalo mediano

Para calcular la mediana es conveniente obtener la tabla de porcentajes acumulados con el finde ver a qué intervalo pertenece el 50% de los datos. No obstante, podemos servirnos de lacolumna de frecuencias acumuladas. En ésta la frecuencia 50 corresponde al intervalo [15,20)cuya marca de clase es 17,5. Por tanto, podemos decir que el intervalo mediano es

M e=[15,20 ) o bien M e=17,5 .

Varianza

σ2=∑ f i · x i

2

N−x2

=30275100

−(16,40 )2=33,79

Desviación típica

σ=√σ2=√33,79=5,81

Coeficiente de variación

CV =σx=

5,8116,40

=0,35=35

Se observa que el coeficiente de variación es moderadamentegrande. Esto indica que los datos presentan una agrupaciónrelativamente pequeña respecto de las medidas centrales, es decir,que no están demasiado desagrupados. Esto se puede visualizar en elhistograma que se muestra al margen.

Veamos con un ejemplo la utilización del coeficiente de variación:

Compara la dispersión en dos variables: la primera mide el peso de los elefantes

xe=2000kg y σe=100kg , y la otra mide el peso de los ratones, con

xr=0,05 kg y σr=0,02kg .

Al comparar las desviaciones típicas, es mayor la de los elefantes. Sus coeficientes de variación son 0,05 para los elefantes y 0,4en los ratones. Por tanto, la dispersión es mayor en los ratones. (Cuanto menor es el coeficiente de variación menor es ladispersión de los datos). A veces, el coeficiente de variación se expresa en %. Según eso, el C.V. de los elefantes sería del 5%mientras el de los ratones del 40%.

4.3 Medidas de posición

Una medida de posición es un valor de la variable que nos informa del lugar que ocupa un dato dentro delconjunto ordenado de valores. Las más utilizadas son los cuartiles, la mediana y los percentiles o centiles.

104 ■ Matemáticas de Nivel II de E.S.P.A.© Fernando Moya Molina

9

NOCIONES de ESTADÍSTICA

Actividades

2. Los goles marcados por un equipo de fútbol en los 10 últimos partidos han sido: 1, 0, 3,1, 0, 2, 1, 2, 4, 2. Haz una tabla de frecuencias relativas, absolutas y porcentajes para estos valores.

Solución:

Valoresx i

f. absolutaf i

f. relativa

hi=f i

N

Porcentajespi=hi ·100

0 2 0,2 20%

1 3 0,3 30%

2 3 0,3 30%

3 1 0,1 10%

4 1 0,1 15%

Totales N=10∑ f i

N=1 100%

3. Elaborar una tabla de frecuencias absoluta, frecuencias relativas, frecuencias absolutasy relativas acumuladas, porcentajes y porcentajes acumulados con las estaturas de 40adolescentes (Reparte los datos en intervalos de igual longitud):

168 160 167 175 175 167 168 158 149 160

178 166 158 163 171 162 165 163 156 174

160 165 154 163 165 161 162 166 163 159

170 165 150 167 164 165 173 164 169 170

Solución:

Nº de intervalos: √40=6,32→6

Recorrido: 178-149=29 Tomamos el primer múltiplo de 6 superior a 29: 30

Amplitud del intervalo: 306

=5

El extremo inferior del primer intervalo se calcula dividiendo entre dos la resta obtenidaentre el recorrido estimado y el recorrido calculado:

(30−29 ):2=1:2=0,5 →149−0,5=148,5

Matemáticas de Nivel II de E.S.P.A.■ 95 © Fernando Moya Molina

10