Upload
dalila-gonzalez
View
222
Download
5
Embed Size (px)
DESCRIPTION
estadistica
Citation preview
Jos Luis Quintero
FUNDAMENTOS DE ESTADSTICA DESCRIPTIVA
Distribucinde
Frecuencias
EstadsticaDescriptiva
Medidas de Tendencia
Central
Diagrama de Caja yBigotes
Universidad Catlica Andrs BelloIngeniera en TelecomunicacionesSerie: Probabilidad y Estadstica
Medidas de
Localizacin
Medidas de
Dispersin
Jos Luis Quintero
FUNDAMENTOS DE ESTADSTICA DESCRIPTIVA
Distribucinde
Frecuencias
Universidad Catlica Andrs BelloAsignatura: Probabilidades
Caracas, Octubre 2013
EstadsticaDescriptiva
Medidas de
Localizacin
Medidas de
Dispersin
Medidas de Tendencia
Central
Diagrama de Caja yBigotes
Jos Luis Quintero
ROBABILIDADES (ITEL-30205)
Tema 1. Fundamentos de Estadstica Descriptiva
Distribucin de frecuencias y medidas de localizacin
Lo malo de escribir libros es que se nos va la vida en rehacerlos
Alfonso Reyes
El presente material ha tenido un proceso de actualizacin permanente, iniciado ya
hace algunos aos. En cada una de ellas, se han incluido nuevos temas y ejercicios, con lo cual
se ha venido enriqueciendo y mejorando su contenido, ajustndolo a las necesidades, para la
formacin de profesionales y para estudiosos de la materia, que requieren de esta materia.
En esta presentacin, se han mejorado sustancialmente aspectos tales como su
diagramacin haciendo ms agradable y hbil la presentacin de los diferentes tpicos, adems
en su contenido se han incluido, actualizado, revisado tanto los contenidos como los problemas
de aplicacin a fin de atender a las necesidades y consultas exigidas por estudiantes,
profesionales o personas que sin formacin acadmica requieren de su utilizacin.
Jos Luis Quintero
PROLOGO
Jos Luis Quintero
ROBABILIDADES (ITEL-30205)
Tema 1. Fundamentos de Estadstica Descriptiva
Distribucin de frecuencias y medidas de localizacin
Destacar la importancia del manejo estadstico descriptivo de un conjunto de datos Familiarizar al estudiante con la terminologa empleada en la organizacin y la descripcin de un conjunto de datos
Construir ejemplos sencillos donde se refleje la organizacin de los datos en una tabla de distribucin de frecuencias
Establecer diferencias entre las principales medidas de tendencia central Calcular los valores de las principales medidas de localizacin o de tendencia central tanto para el caso de agrupacin por valor o uso de clases discretas como para el caso de agrupacin por intervalos o uso de clases continuas
Calcular percentiles, dciles y cuartiles para un conjunto de datos organizados en clases discretas y un conjunto de datos organizados en clases continuas
Calcular el intervalo intercuartil para una muestra aleatoria Calcular los valores de las principales medidas de dispersin tanto para clases discretas como para clases continuas
Construir ejemplos sencillos donde se refleje la importancia y la utilidad de las principales medidas de dispersin
Construir un diagrama de caja y bigotes para una muestra dada Trabajar mediante problemas los fundamentos de la Estadstica Descriptiva
OBJETIVOS A LOGRAR
Jos Luis Quintero
ROBABILIDADES (ITEL-30205)
Tema 1. Fundamentos de Estadstica Descriptiva
Distribucin defrecuencias y medidas de localizacin
1. Definiciones de inters
1.1. Estadstica
1.2. Estadstica Descriptiva
1.3. Muestra aleatoria
1.4. Mnimo valor de una muestra
1.5. Mximo valor de una muestra
1.6. Intervalo de una muestra
1.7. Clase
1.8. Histograma de una muestra
2. Medidas de tendencia central
2.1. Media de una muestra
2.2. Mediana de una muestra
2.3. Moda de una muestra
3. Ejemplos ilustrativos para datos agrupados por valor o uso de clases discretas
4. Ejemplos ilustrativos para datos agrupados por intervalos o uso de clases continuas
5. Clculo de las medidas de tendencia central para datos agrupados por valor
6. Clculo de las medidas de tendencia central para datos agrupados por intervalos
7. Clculo de la media recortada al %
7.1. Definicin
7.2. Clculo de la media recortada
7.3. Clculo para datos no agrupados
7.4. Clculo para datos agrupados por valor o uso de clases discretas
7.5. Clculo para datos agrupados por intervalos o uso de clases continuas
8. Percentiles
8.1. Definicin
8.2. Clculo para datos agrupados por valor o uso de clases discretas
8.3. Clculo para datos agrupados por intervalos o uso de clases continuas
9. Intervalo intercuartil
9.1. Definicin
9.2. Clculo para datos agrupados por valor o uso de clases discretas
9.3. Clculo para datos agrupados por intervalos o uso de clases continuas
10. Definiciones de inters
10.1. Varianza de una muestra
10.2. Varianza corregida de una muestra
10.3. Desviacin estndar de una muestra
10.4. Desviacin estndar corregida de una muestra
10.5. Coeficiente de variacin de una muestra
1
1
1
1
1
1
1
1
1
2
2
2
2
2
4
5
6
10
10
10
11
11
12
13
13
13
14
16
16
16
16
17
17
17
17
17
17
INDICE GENERAL
Jos Luis Quintero
10.6. Sesgo de una muestra
10.7. Curtosis de una muestra
11. Clculo de las medidas de dispersin para datos agrupados por valor
11.1. Varianza de la muestra
11.2. Varianza corregida de la muestra
11.3. Desviacin estndar de la muestra
11.4. Desviacin estndar corregida de la muestra
11.5. Coeficiente de variacin de la muestra
11.6. Sesgo de la muestra
11.7. Curtosis de la muestra
12. Clculo de las medidas de dispersin para datos agrupados por intervalos
12.1. Varianza de la muestra
12.2. Varianza corregida de la muestra
12.3. Desviacin estndar de la muestra
12.4. Desviacin estndar corregida de la muestra
12.5. Coeficiente de variacin de la muestra
12.6. Sesgo de la muestra
12.7. Curtosis de la muestra
13. Diagrama de caja y bigotes
13.1. Definicin
13.2. Ejemplos ilustrativos
14. Problemas resueltos
15. Problemas propuestos
17
17
18
18
18
18
18
18
18
19
20
20
20
20
21
21
21
21
22
22
23
24
31
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 1
1. DEFINICIONES DE INTERS
Observacin 1. Consideraciones
acerca de la estadstica:
Los orgenes de la estadstica,
aunque no se sabe con exactitud
cundo se comenz a utilizar,
pueden estar ligados al antiguo
Egipto como a los censos chinos
que se realizaron hace unos
4.000 aos, aproximadamente
Sin duda, fueron los romanos,
maestros de la organizacin
poltica, quienes mejor supieron
usar la estadstica. Cada cinco
aos realizaban un censo de la
poblacin, cuyos datos de
nacimientos, defunciones y
matrimonios eran esenciales para
estudiar los avances del imperio;
sin olvidar los recuentos de
ganancias y las riquezas que
dejaban las tierras Los datos a trabajar se agruparn
por valor o en clases discretas o
por intervalo o en clases
continuas, considerando las
caractersticas de los datos
suministrados. En tal sentido, se
justificar la mejor manera de
agrupar los datos
1.1. Estadstica. Es una rama de la matemtica
que se encarga de estudiar mtodos cientficos
para recoger, organizar, resumir y analizar
datos, as como para sacar conclusiones
vlidas y tomar decisiones razonables basadas
en tal anlisis.
1.2. Estadstica Descriptiva. Es la parte de la Estadstica que se encarga de reunir
informacin cuantitativa concerniente a
individuos, grupos, series de hechos, etc
1.3. Muestra aleatoria. Grupo de resultados que
se obtienen al repetir varias veces un
experimento aleatorio, bajo las mismas
condiciones.
1.4. Mnimo valor de una muestra. El valor ms pequeo de una muestra.
1.5. Mximo valor de una muestra. El valor ms
grande de una muestra.
1.6. Intervalo de una muestra. Diferencia entre
el valor ms grande y el valor ms pequeo de
una muestra.
1.7. Clase. Es cada uno de los intervalos que se consiguen al realizar una particin dentro del
conjunto de los nmeros reales.
1.8. Histograma de una muestra. Es una representacin grfica en forma de barras de una muestra.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 2
9
9
Ejemplo 1.
Tabla de distribucin de frecuencias de la nota obtenida en un examen de Clculo
Clase Dato (xi) fi Fi hi Hi
1 2.8 1 1 0.0417 0.0417
2 3.2 4 5 0.1667 0.2084
3 3.9 3 8 0.1250 0.3334
4 4.2 5 13 0.2082 0.5416
5 5.0 4 17 0.1667 0.7083
6 5.6 3 20 0.1250 0.8333
7 6.0 4 24 0.1667 1.0000
2. MEDIDAS DE TENDENCIA CENTRAL
3. EJEMPLOS ILUSTRATIVOS PARA DATOS AGRUPADOS POR VALOR O USO DE CLASES DISCRETAS
2.1. Media de una muestra. Promedio de los valores de la muestra.
2.1. Mediana de una muestra. Valor que ocupa la
posicin intermedia de la muestra ya ordenada
previamente.
2.3. Moda de una muestra. Es el valor del dato que ocurre con ms frecuencia.
Observacin 2. Consideraciones
acerca de las medidas de tendencia
central:
Tambin son llamadas medidas
de localizacin
La media se ve afectada por la
presencia de valores extremos,
perdiendo representatividad
La media no necesariamente
coincide con un dato muestral
Por lo general, la mediana
coincide con un dato muestral
La moda puede usarse para datos
cualitativos
La moda pudiera no ser nica en
una muestra
La moda pierde representatividad
en muestras multimodales
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 3
Notacin de inters:
fi = frecuencia absoluta , Fi = Frecuencia absoluta acumulada
hi = frecuencia relativa , Hi = Frecuencia relativa acumulada
Frmulas de inters:
n = nmero de clases , N = nmero total de datos
i
i ii j i 1 i i i
j 1
f FF f F f , h , H , i 1,...,n
N N
=
= = + = = =
Ejemplo 2.
Tabla de distribucin de frecuencias de la duracin en minutos de las llamadas
telefnicas i(x ) entre las 9 a.m. y las 10 a.m. registradas en una central telefnica
Clase Dato
(xi)
fi Fi hi Hi Clase Dato
(xi)
fi Fi hi Hi
1 1 3 3 0.06 0.06 9 9 0 45 0.00 0.90
2 2 7 10 0.14 0.20 10 10 1 46 0.02 0.92
3 3 9 19 0.18 0.38 11 11 0 46 0.00 0.92
4 4 10 29 0.20 0.58 12 12 2 48 0.04 0.96
5 5 6 35 0.12 0.70 13 13 0 48 0.00 0.96
6 6 4 39 0.08 0.78 14 14 0 48 0.00 0.96
7 7 4 43 0.08 0.86 15 15 1 49 0.02 0.98
8 8 2 45 0.04 0.90 16 16 1 50 0.02 1.00
A continuacin la figura 1 visualiza el histograma para las frecuencias relativas:
Figura 1. Histograma de frecuencias relativas para la duracin en minutos de las llamadas telefnicas
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 4
Ejemplo 3.
Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso
del servicio telefnico i(x ) efectuado por los usuarios en un ao
Clase
Inicio
Fin
Marca
de clase
(xi)
fi
Fi
hi
Hi
1 1.465 1.497 1.481 4 4 0.08 0.08
2 1.497 1.529 1.513 4 8 0.08 0.16
3 1.529 1.561 1.545 15 23 0.30 0.46
4 1.561 1.593 1.577 12 35 0.24 0.70
5 1.593 1.625 1.609 9 44 0.18 0.88
6 1.625 1.657 1.641 5 49 0.10 0.98
7 1.657 1.689 1.673 1 50 0.02 1.00
A continuacin la figura 2 visualiza el histograma para las frecuencias relativas:
Figura 2. Histograma de frecuencias relativas para el pago anual del servicio telefnico
4. EJEMPLOS ILUSTRATIVOS PARA DATOS AGRUPADOS POR INTERVALOS O USO DE CLASES CONTINUAS
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 5
Ejemplo 4.
Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso
del servicio telefnico i(x ) efectuado por los usuarios en dos aos
Clase
Inicio
Fin
Marca
de clase
(xi)
fi
Fi
hi
Hi
1 3.62 3.70 3.66 2 2 0.02 0.02
2 3.70 3.78 3.74 7 9 0.07 0.09
3 3.78 3.86 3.82 11 20 0.11 0.20
4 3.86 3.94 3.90 11 31 0.11 0.31
5 3.94 4.02 3.98 23 54 0.23 0.54
6 4.02 4.10 4.06 22 76 0.22 0.76
7 4.10 4.18 4.14 15 91 0.15 0.91
8 4.18 4.26 4.22 5 96 0.05 0.96
9 4.26 4.34 4.30 3 99 0.03 0.99
10 4.34 4.42 4.38 1 100 0.01 1.00
5.1. Media de la muestra (M).
Notacin:
ix = dato que pertenece a la clase i
fi = frecuencia del dato que pertenece a la clase i
n = nmero de clases
N = tamao de la muestra n
i i
i 1
1M x f
N=
=
Ejemplo de las calificaciones obtenidas:
2.8 1 3.2 4 ... 5.6 3 6.0 4 109.1
M 4.545824 24
+ + + + = = =
Ejemplo de la duracin en minutos de las llamadas telefnicas:
5. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS POR VALOR
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 6
1 3 2 7 ... 15 1 16 1 247
M 4.9450 50
+ + + + = = =
5.2. Mediana de la muestra (Me).
Notacin:
ix = dato que ocupa la posicin i despus de estar ordenada la muestra
N = tamao de la muestra
i
i i 1
N 1x i si N es impar
2Me
x x Ni si N es par
2 2+
+=
= +
=
Ejemplo de las calificaciones obtenidas:
N 24= es par, por lo tanto i 12= y
12 13x x 4.2 4.2Me 4.22 2
+ += = =
Ejemplo de la duracin en minutos de las llamadas telefnicas:
N 50= es par, por lo tanto i 25= y
25 26x x 4 4Me 42 2
+ += = =
5.3. Moda de la muestra (Mo).
Ejemplo de las calificaciones obtenidas:
El dato de mayor frecuencia (igual a 5) es 4.2, por lo tanto la moda de la muestra es 4.2.
Ejemplo de la duracin en minutos de las llamadas telefnicas:
El dato de mayor frecuencia (igual a 10) es 4, por lo tanto la moda de la muestra es 4.
6.1. Media de la muestra (M).
Notacin:
6. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS POR INTERVALOS
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 7
ix = marca de clase que pertenece a la clase i
fi = frecuencia de la clase i
n = nmero de clases
N = tamao de la muestra n
i i
i 1
1M x f
N=
= .
Usando la expresin anterior se tendr entonces una estimacin de la media de la
muestra para datos agrupados por intervalos o uso de clases continuas.
Ejemplo del pago del uso del servicio telefnico anual:
1.481 4 1.513 4 ... 1.641 5 1.673 1 78.434
M 1.5686850 50
+ + + + = = =
Ejemplo del pago del uso del servicio telefnico en dos aos:
3.66 2 3.74 7 ... 4.30 3 4.38 1 399.76
M 3.9976100 100
+ + + + = = =
6.2. Mediana de la muestra (Me).
En primer lugar se identifica la clase k donde se encuentra el dato que ocupa la
posicin N/2. Esta clase es denominada clase medianal. Una vez ubicada la clase se procede
a estimar la mediana de la muestra usando la expresin N
k 12k k k
k
FMe LI (LS LI )
f
= +
Notacin:
kLI = Lmite inferior de la clase k (clase medianal)
kLS = Lmite superior de la clase k (clase medianal)
k 1F = Frecuencia absoluta acumulada de la clase anterior a la clase medianal
kf = Frecuencia absoluta de la clase medianal
Deduccin de la frmula de la mediana para datos agrupados por intervalos
La frmula utilizada para la estimacin de la mediana se obtiene por interpolacin
lineal, es decir se construye la recta que pasa por los puntos de coordenadas
k 1 k k k(F ,LI ) y (F ,LS ) . Esta recta tiene la ecuacin
k kk k 1
k k 1
LS LIy LI (x F )
F F
= +
El punto de coordenadas N2( ,Me) es un punto de la recta de modo que
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 8
N
k 1k k 2Nk k 1 k k k2
k k 1 k
FLS LIMe LI ( F ) LI (LS LI )
F F f
= + = +
Observacin. Se suponen que los datos dentro de la clase medianal estn equiespaciados y
se usa interpolacin lineal para la estimacin de la mediana.
Ejemplo del pago del uso del servicio telefnico anual:
N= 50 por lo tanto N/2 = 25 y la clase medianal identificada es la clase 4:
4 1.561 1.593 1.577 12 35 0.24 0.70
Calculando ahora la estimacin para la mediana se tiene: 25 23 2
Me 1.561 (1.593 1.561) 1.561 (0.032) 1.566312 12
= + = + =
Ejemplo del pago del uso del servicio telefnico en dos aos:
N = 100 por lo tanto N/2 = 50 y la clase medianal identificada es la clase 5:
5 3.94 4.02 3.98 23 54 0.23 0.54
Calculando ahora la estimacin para la mediana se tiene: 50 31 19
Me 3.94 (4.02 3.94) 3.94 (0.08) 4.006123 23
= + = + =
6.3. Moda de la muestra (Mo).
Deduccin de la frmula de la moda para datos agrupados por intervalos
a. En primera instancia se identifica la clase con mayor frecuencia la cual se llamar clase
modal. Esta clase pudiera no ser nica, y ese caso se estar en presencia de una muestra
con distribucin de frecuencia multimodal.
b. Una vez identificada la clase modal, la moda se estimar bajo la premisa de que ella
estar ms prxima a la clase contigua con mayor frecuencia, de modo que la distancia
entre la moda y las clases contiguas es inversamente proporcional a las frecuencias de
esas clases. El clculo de esta estimacin ser de la forma kMo LI p= + , donde
posteriormente se hablar del clculo de p.
c. Si se denotan 1 k k 1d f f = y 2 k k 1d f f += , representarn las diferencias de la frecuencia
de la clase modal y la frecuencia de la clase premodal y la de la frecuencia de la clase
modal y la frecuencia de la clase postmodal respectivamente. Se deduce que a mayor
frecuencia de la clase contigua, menor ser la diferencia respectiva.
d. Suponga que el intervalo de la clase modal es dividido en dos partes: una de ellas de denota con p y la otra como k kLS LI p . Se establecer la relacin
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 9
1
k k 2
dp
LS LI p d=
.
CASO 1. 1 2d d<
Aqui la clase premodal tiene una frecuencia absoluta mayor que la de la clase postmodal, de
modo que se desea que la moda estimada est ms cerca de ella que de la clase postmodal.
Trabajando la expresin anterior:
1 1k k
k k 2 2
d dpp (LS LI p)
LS LI p d d= =
,
lo cual permite ver que p es menor que k kLS LI p y la moda estimada como kMo LI p= +
estar ms cerca de la clase premodal que de la clase postmodal como se deseaba.
CASO 2. 1 2d d=
Aqui la clase premodal tiene una frecuencia absoluta igual que la de la clase postmodal, de
modo que se desea que la moda estimada est equidistante de ambas clases. Trabajando la
expresin anterior:
k kk k
k k
LS LIp1 p (LS LI p) p
LS LI p 2
= = =
,
lo cual permite ver que p es igual que k kLS LI p y la moda estimada como kMo LI p= + se
ver de la forma
k k k kk k
LS LI LI LSMo LI p LI
2 2
+= + = + =
CASO 3. 1 2d d>
Aqui la clase premodal tiene una frecuencia absoluta menor que la de la clase postmodal, de
modo que se desea que la moda estimada est ms lejos de ella que de la clase postmodal.
Trabajando la expresin anterior:
1 1k k
k k 2 2
d dpp (LS LI p)
LS LI p d d= =
,
lo cual permite ver que p es mayor que k kLS LI p y la moda estimada como kMo LI p= +
estar ms lejos de la clase premodal que de la clase postmodal como se deseaba.
Visto todo lo anterior, despejando p se tiene
1 11 2 1 k k k k
k k 2 1 2
d dpp(d d ) d (LS LI ) p (LS LI )
LS LI p d d d= + = =
+,
calculando entonces la estimacin de la moda como
1k k k
1 2
dMo LI (LS LI )
d d= +
+
Ejemplo del pago del uso del servicio telefnico anual:
La clase modal identificada es la clase 3.
3 1.529 1.561 1.545 15 23 0.30 0.46
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 10
Las clases premodal y postmodal sern respectivamente las clases 2 y 4.
2 1.497 1.529 1.513 4 8 0.08 0.16
4 1.561 1.593 1.577 12 35 0.24 0.70
Calculando ahora la estimacin para la moda se tiene
1k k k
1 2
d 15 4Mo LI (LS LI ) 1.529 (1.561 1.529) 1.5541
d d 15 4 15 12
= + = + + +
Ejemplo del pago del uso del servicio telefnico en dos aos:
La clase modal identificada es la clase 5.
5 3.94 4.02 3.98 23 54 0.23 0.54
Las clases premodal y postmodal sern respectivamente las clases 4 y 6.
4 3.86 3.94 3.90 11 31 0.11 0.31
6 4.02 4.10 4.06 22 76 0.22 0.76
Calculando ahora la estimacin para la moda se tiene
1k k k
1 2
d (23 11)Mo LI (LS LI ) 3.94 (4.02 3.94) 4.0138
d d (23 11) (23 22)
= + = + =+ +
7.2. Clculo de la media recortada:
La notacin a se lee parte entera de a y asigna como resultado la aproximacin
como truncamiento del nmero real a. La expresin
N
, [0,50)100
determina la cantidad de datos que deben eliminarse de la muestra ordenada tanto
inferiormente como superiormente. En tal sentido, la muestra recortada al % tiene como
tamao
7. CLCULO DE LA MEDIA RECORTADA AL %
7.1. Definicin (Media recortada). Se define como el promedio de los datos que quedan al eliminar el % inferior y superior en la muestra ordenada.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 11
N(1 ) N , con100
= .
7.3. Clculo para datos no agrupados:
Despus de ordenarlos la media recortada al % se calcula como
N(1 )
rec( ) i
i N 1
1M x
N(1 ) N
= +
=
.
7.4. Clculo para datos agrupados por valor o uso de clases discretas:
n n n1 2
rec( ) i i i i i i
i 1 i n 1 i n 11 2
1 M x f x f x fN(1 ) N
= = + = +
= + +
,
donde
if =nueva frecuencia absoluta de la clase i afectada despus de eliminar datos de la muestra
aleatoria.
Ejemplo de las calificaciones obtenidas:
Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
24 52 2
100
=
Tamao de la nueva muestra: 22
Clculo de la nueva media: 0 3
rec(5)
2.8 3.2 4 ... 5.6 3 6.0 100.3M 4.5591
22 22
+ + + + = =
Observaciones.
Las negritas se colocaron para indicar las frecuencias absolutas que fueron modificadas
La eliminacin de los 2 datos no afecta significativamente a la media anterior (4.5458) al
compararla con la nueva media (4.5591)
Ejemplo de la duracin en minutos de las llamadas telefnicas:
Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
50 52 4
100
=
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 12
Tamao de la nueva muestra: 46
Clculo de la nueva media: 1 0 0
rec(5)
1 2 7 ... 14 0 15 16 214M 4.65
46 46
+ + + + + = =
Observacin. Se puede notar la influencia de los 4 datos anteriores eliminados sobre la media anterior (4.94) al compararla con la nueva media (4.65)
7.5. Clculo para datos agrupados por intervalos o uso de clases continuas: n n n1 2
rec( ) i i i i i i
i 1 i n 1 i n 11 2
1 M x f x f x fN(1 ) N
= = + = +
= + +
,
donde
ix = marca de clase que pertenece a la clase i
if = nueva frecuencia absoluta de la clase i afectada despus de eliminar datos de la muestra
aleatoria.
Ejemplo del pago del uso del servicio telefnico anual:
Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
50 52 4
100
=
Tamao de la nueva muestra: 46 2 4 0
rec(5)
1.481 1.513 4 ... 1.641 1.673 72.158M 1.56865
46 46
+ + + + = =
Observacin. Se puede notar la poca influencia de los 4 datos eliminados sobre la media anterior (1.56868) al compararla con la nueva media (1.56865)
Ejemplo del pago del uso del servicio telefnico en dos aos:
Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
100 52 10
100
=
Tamao de la nueva muestra: 90
0 4 4 0 0rec(5)
3.66 3.74 ... 4.22 4.30 4.38 359.72M 3.9969
90 90
+ + + + + = = =
Observacin. Se puede notar la poca influencia de los 10 datos eliminados sobre la media anterior (3.9976) al compararla con la nueva media (3.9969)
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 13
9
8.2. Clculo para datos agrupados por valor o uso de clases discretas:
El percentil k-simo k(P ) ser igual a m 1x + , es
decir k m 1P x += , siempre y cuando se verifique
que
km N m 1
100< + , con m N .
Ejemplo de las calificaciones obtenidas:
Se desean encontrar los percentiles 25, 30
y 75, es decir 25P , 30P y 75P respectivamente.
Para 25P :
25 6
25m 24 m 1 m 6 m 1
100
m 5 P x 3.9
< + < +
= = =
Para 30P :
30 8
30m 24 m 1 m 7.2 m 1 m 7 P x 3.9
100< + < + = = =
Para 75P :
75 18
75m 24 m 1 m 18 m 1 m 17 P x 5.6
100< + < + = = =
Ejemplo de la duracin en minutos de las llamadas telefnicas:
Se desean encontrar los percentiles 25, 30 y 75, es decir 25P , 30P y 75P
respectivamente.
Para 25P :
25 13
25m 50 m 1 m 12.5 m 1 m 12 P x 3
100< + < + = = =
8. PERCENTILES
8.1. Definicin (Percentil). El k-simo percentil de una muestra aleatoria se define como el valor que ocupa una posicin tal en la muestra ordenada que aproximadamente el k% de
los datos es menor o igual que l.
Observacin 3. Consideraciones
acerca de las medidas de
localizacin:
El percentil k-simo tambin es
llamado medida de localizacin
La mediana es considerada como
el percentil 50 es decir 50P Me=
El cuartil k-simo k(Q ) es una
medida de localizacin tal que
1 25Q P= , 2 50Q P= , 3 75Q P= ,
4 100Q P=
El decil k-simo k(D ) es una
medida de localizacin tal que:
1 10 2 20 9 90D P , D P , ... , D P ,= = =
10 100D P=
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 14
Para 30P :
30 15
30m 50 m 1 m 15 m 1 m 14 P x 3
100< + < + = = =
Para 75P :
75 38
75m 50 m 1 m 37.5 m 1 m 37 P x 6
100< + < + = = =
8.3. Clculo para datos agrupados por intervalos o uso de clases continuas:
El percentil k-simo k(P ) ser igual a m 1x + , es decir k m 1P x += , siempre y cuando se
verifique que k
m N m 1100
< + , con m N .
En primer lugar se identifica la clase j donde est el dato que ocupa la posicin
encontrada anteriormente. Una vez ubicada la clase se procede a estimar el percentil k-
simo de la muestra usando la expresin k
j 1100k j j j
j
N FP LI (LS LI )
f
= +
La frmula utilizada para la estimacin del percentil se obtiene tambin por
interpolacin lineal, con el mismo basamento empleado para la frmula de estimacin de la
mediana discutido anteriormente.
Ejemplo del pago del uso del servicio telefnico anual:
Se desean encontrar los percentiles 25, 30 y 75, es decir 25P , 30P y 75P
respectivamente.
Para 25P :
25 13
25m 50 m 1 m 12.5 m 1 m 12 P x
100< + < + = =
La clase donde se encuentra 25P es la clase 3:
3 1.529 1.561 1.545 15 23 0.30 0.46
Calculando ahora la estimacin para 25P se tiene:
25100
25
50 8 4.5P 1.529 (1.561 1.529) 1.529 (0.032) 1.5386
15 15
= + = + =
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 15
Para 30P :
30 15
30m 50 m 1 m 15 m 1 m 14 P x
100< + < + = =
La clase donde se encuentra 30P es la clase 3:
3 1.529 1.561 1.545 15 23 0.30 0.46
Calculando ahora la estimacin para 30P se tiene:
30100
30
50 8 7P 1.529 (1.561 1.529) 1.529 (0.032) 1.5439
15 15
= + = + =
Para 75P :
75 38
75m 50 m 1 m 37.5 m 1 m 37 P x
100< + < + = =
La clase donde se encuentra 75P es la clase 5:
5 1.593 1.625 1.609 9 44 0.18 0.88
Calculando ahora la estimacin para 75P se tiene:
75100
75
50 35 2.5P 1.593 (1.625 1.593) 1.593 (0.032) 1.6019
9 9
= + = + =
Ejemplo del pago del uso del servicio telefnico en dos aos:
Se desean encontrar los percentiles 25, 30 y 75, es decir 25P , 30P y 75P .
Para 25P :
25 25
25m 100 m 1 m 25 m 1 m 24 P x
100< + < + = =
La clase donde se encuentra 25P es la clase 4:
4 3.86 3.94 3.90 11 31 0.11 0.31
Calculando ahora la estimacin para 25P se tiene:
25100
25
100 20 5P 3.86 (3.94 3.86) 3.86 (0.08) 3.8964
11 11
= + = +
Para 30P :
30 30
30m 100 m 1 m 30 m 1 m 29 P x
100< + < + = =
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 16
La clase donde se encuentra 30P es la clase 4:
4 3.86 3.94 3.90 11 31 0.11 0.31
Calculando ahora la estimacin para 30P se tiene:
30100
30
100 20 10P 3.86 (3.94 3.86) 3.86 (0.08) 3.9327
11 11
= + = + =
Para 75P :
75 75
75m 100 m 1 m 75 m 1 m 74 P x
100< + < + = =
La clase donde se encuentra 75P es la clase 6:
6 4.02 4.10 4.06 22 76 0.22 0.76
Calculando ahora la estimacin para 75P se tiene:
75100
75
100 54 21P 4.02 (4.10 4.02) 4.02 (0.08) 4.0964
22 22
= + = + =
9
9.2. Clculo para datos agrupados por valor o uso de clases discretas:
Intervalo intercuartil de la muestra Q(I ). Q 3 1I Q Q=
Ejemplo de las calificaciones obtenidas: Q 3 1I Q Q 5 3.2 1.8= = =
Ejemplo de la duracin en minutos de las llamadas telefnicas: Q 3 1I Q Q 6 3 3= = =
9.3. Clculo para datos agrupados por intervalos o uso de clases continuas:
Intervalo intercuartil de la muestra Q(I ). Q 3 1I Q Q=
Ejemplo del pago del uso del servicio telefnico anual:
9. INTERVALO INTERCUARTIL
9.1. Definicin (Intervalo intercuartil). Es el intervalo de la muestra que resulta al considerar solamente aquellos datos que estn entre el primer cuartil y el tercero.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 17
Q 3 1I Q Q 1.6019 1.5386 0.0633= = =
Ejemplo del pago del uso del servicio telefnico en dos aos:
Q 3 1I Q Q 4.0964 3.8964 0.2= = =
9
10. DEFINICIONES DE INTERS
10.1. Varianza de una muestra. Promedio
aritmtico de los cuadrados de las diferencias
de cada valor en la muestra y la media de la
muestra.
10.2. Varianza corregida de una muestra. Cociente que resulta de dividir la suma de los
cuadrados de las diferencias de cada dato en
la muestra y la media de la muestra, entre el
nmero de datos menos uno.
10.3. Desviacin estndar de una muestra. Es
la raz cuadrada positiva de la varianza de la
muestra.
10.4. Desviacin estndar corregida de una muestra. Es la raz cuadrada positiva de la
varianza corregida de la muestra.
Observacin 4. Consideraciones acerca de las medidas de dispersin:
Para conocer la varianza de la
muestra, previamente se debe
conocer la media de la muestra
La justificacin de la frmula de
la varianza corregida de la
muestra se halla en el estudio de
estimadores insesgados en
Estadstica
La desviacin estndar de la
muestra posee las mismas
unidades que tienen los datos de
la muestra
El coeficiente de variacin, el
sesgo y la curtosis de la muestra
son adimensionales, es decir, no
poseen unidades
El sesgo y la curtosis
proporcionan informacin acerca
de la forma de la distribucin de
la muestra
10.5. Coeficiente de variacin de una muestra. Es la relacin entre la desviacin estndar de
la muestra y el valor absoluto de la media de
la muestra.
10.6. Sesgo de una muestra. Es la relacin entre
el promedio aritmtico de las diferencias entre
cada dato y la media de la muestra elevadas
al cubo, y el cubo de la desviacin estndar.
10.7. Curtosis de una muestra. Es la relacin entre el promedio aritmtico de las diferencias
entre cada dato y la media de la muestra elevadas a la cuatro, y el cuadrado de la
varianza de la muestra.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 18
9
11.1. Varianza de la muestra 2(S ) .
Sean n = nmero de clases , N = tamao de la muestra
Una frmula para su clculo: n
2 2i i
i 1
1S f(x M)
N=
=
Otra frmula para su clculo:
n n n
2 2 2 2 2 2i i i i i i i i i i
i 1 i 1 i 1
n n n n
2 2 2 2 2 2 2i i i i i i i
i 1 i 1 i 1 i 1
1 1 1S f(x M) f (x 2xM M ) (fx 2fxM fM )
N N N
1 2 1 1fx fxM fM fx 2M M M M
N N N N
= = =
= = = =
= = + = +
= + = + =
11.2. Varianza corregida de la muestra 2c(S ) . n n
2 2 2 2c i i i i
i 1 i 1
1 N 1 NS f(x M) . f (x M) .S
N 1 N 1 N N 1= =
= = =
11.3. Desviacin estndar de la muestra (S). 2S S= +
11.4. Desviacin estndar corregida de la muestra c(S ) .
2c cS S= +
11.5. Coeficiente de variacin de la muestra (CV).
SCV
M=
11.6. Sesgo de la muestra (SE). n
3i i3
i 1
1SE f(x M)
NS=
=
11. CLCULO DE LAS MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS POR VALOR
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 19
11.7. Curtosis de la muestra (K). n
4i i4
i 1
1K f(x M)
NS=
=
Ejemplo de las calificaciones obtenidas:
Varianza de la muestra 2(S ) .
n 7= , N 24= , M 4.5458=
Primera forma para su clculo:
2 2 2 2 21S (2.8 4.5458) 4(3.2 4.5458) ... 3(5.6 4.5458) 4(6 4.5458)24
24.75961.0317
24
= + + + +
= =
Segunda forma para su clculo:
2 2 2 2 2 2 21 520.71S (2.8) 4(3.2) ... 3(5.6) 4(6) (4.5458) (4.5458) 1.031724 24
= + + + + = =
Varianza corregida de la muestra 2c(S ) .
2 2c
N 24S .S 1.0317 1.0766
N 1 23= =
Desviacin estndar de la muestra (S). 2S S 1.0157= +
Desviacin estndar corregida de la muestra c(S ) . 2S S 1.0376= +
Coeficiente de variacin de la muestra (CV). S 1.0157
CV 0.22344.5458M
= =
Sesgo de la muestra (SE). n
3i i3 3
i 1
1 0.1047SE f(x M) 0.0042
NS 24 (1.0157)=
= = =
Curtosis de la muestra (K).
n
4i i4 4
i 1
1 44.7672K f(x M) 1.7526
NS 24 (1.0157)=
= = =
Ejemplo de la duracin en minutos de las llamadas telefnicas:
Varianza de la muestra 2(S ) .
n 16= , N 50= , M 4.94=
Primera forma para su clculo:
2 2 2 2 21 538.82S 3(1 4.94) 7(2 4.94) ... 1(15 4.94) 1(16 4.94) 10.776450 50
= + + + + = =
Segunda forma para su clculo:
2 2 2 2 2 2 21 1759S 3(1) 7(2) ... 1(15) 1(16) (4.94) (4.94) 10.776450 50
= + + + + = =
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 20
Varianza corregida de la muestra 2c(S ) .
2 2c
N 50S .S 10.7764 10.9963
N 1 49= = =
Desviacin estndar de la muestra (S). 2S S 3.2827= + =
Desviacin estndar corregida de la muestra c(S ) . 2
c cS S 3.3161= + =
Coeficiente de variacin de la muestra (CV). S 3.2827
CV 0.66454.94M
= =
Sesgo de la muestra (SE). n
3i i3 3
i 1
1 2866SE f(x M) 1.6204
NS 50 (3.2827)=
= = =
Curtosis de la muestra (K).
n
4i i4 4
i 1
1 32463K f(x M) 5.5911
NS 50 (3.2827)=
= == =
9
12.1. Varianza de la muestra 2(S ) .
Sean
ix = marca de clase que pertenece a la clase i
n = nmero de clases
N = tamao de la muestra
Una frmula para su clculo: n
2 2i i
i 1
1S f(x M)
N=
= Otra frmula para su clculo: 2 2 2S M M=
12.2. Varianza corregida de la muestra 2c(S ) .
2 2c
NS .S
N 1=
12.3. Desviacin estndar de la muestra (S). 2S S= +
12. CLCULO DE LAS MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS POR INTERVALOS
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 21
12.4. Desviacin estndar corregida de la muestra c(S ) . 2
c cS S= +
12.5. Coeficiente de variacin de la muestra (CV). S
CVM
=
12.6. Sesgo de la muestra (SE).
n
3i i3
i 1
1SE f(x M)
NS=
=
12.7. Curtosis de la muestra (K). n
4i i4
i 1
1K f(x M)
NS=
=
Ejemplo del pago del uso del servicio telefnico anual:
Varianza de la muestra 2(S ) . n 7= , N 50=
Primera forma de clculo:
2 2 2 21S 4(1.481 1.56868) 4(1.513 1.56868) ... 1(1.673 1.56868) 0.002150
= + + + =
Segunda forma de clculo: 2 2 2 2S M M 2.4628 (1.56868) 0.0021= = =
Varianza corregida de la muestra 2c(S ) .
2 2c
N 50S .S 0.0021 0.0021
N 1 49= =
Desviacin estndar de la muestra (S). 2S S 0.0458= + =
Desviacin estndar corregida de la muestra c(S ) . 2
c cS S 0.0458= + =
Coeficiente de variacin de la muestra (CV). S 0.0458
CV 0.02921.56868M
= =
Sesgo de la muestra (SE). n
53
i i3 3
i 1
1 3.7434 10SE f(x M) 0.0078
NS 50 (0.0458)
=
= = =
Curtosis de la muestra (K).
n4
4i i4 4
i 1
1 5.5862 10K f(x M) 2.5391
NS 50 (0.0458)
=
= = =
Ejemplo del pago del uso del servicio telefnico en dos aos:
Varianza de la muestra 2(S ) . n 10= , N 100=
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 22
Primera forma de clculo:
2 2 2 21S 2(3.66 3.9976) 7(3.74 3.9976) ... 1(4.38 3.9976) 0.02209100
= + + + =
Segunda forma de clculo: 2 2 2 2S M M 16 (3.9976) 0.02= = =
Varianza corregida de la muestra 2c(S ) .
2 2c
N 100S .S 0.02 0.0202
N 1 99= =
Desviacin estndar de la muestra (S). 2S S 0.1414= + =
Desviacin estndar corregida de la muestra c(S ) . 2
c cS S 0.1421= + =
Coeficiente de variacin de la muestra (CV). S 0.1414
CV 0.03543.9976M
= =
Sesgo de la muestra (SE). n
3i i3 3
i 1
1 0.0260SE f(x M) 0.0920
NS 100 (0.1414)=
= = =
Curtosis de la muestra (K).
n
4i i4 4
i 1
1 0.1340K f(x M) 3.3520
NS 100 (0.1414)=
= = =
9
La figura 3 revela toda la informacin que se puede representar en un diagrama de caja.
Figura 3. Diagrama de caja y bigotes
13. DIAGRAMA DE CAJA Y BIGOTES
13.1. Definicin (Diagrama de caja y bigotes). Un diagrama de caja y bigotes busca
representar los tres cuartiles y los valores mnimo y mximo de la muestra con la
finalidad de definir la ubicacin de algunos valores de la muestra que no tienen un
comportamiento tpico o esperado y perfectamente podran deberse a errores en la
recoleccin y manipulacin de la muestra.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 23
13.2. Ejemplos ilustrativos.
Ejemplo 1. Suponga que de una muestra dada se tiene la siguiente informacin:
1 2 3Q 9.586 , Q 10.1825 , Q 10.448= = =
Construya el diagrama de caja y bigotes correspondiente.
Solucin. Clculo del rango intercuartil: Q 3 1I Q Q 10.448 9.586 0.862= = =
Clculo de la distancia Q1.5I 1.5 0.862 1.293= =
Clculo de los lmites inferior y superior de los bigotes:
Lmite inferior: i 1 Qa L Q 1.5I 9.586 1.293 8.293= = = =
Lmite superior: s 3 Qd L Q 1.5I 10.448 1.293 11.741= = + = + =
Finalmente el diagrama de caja y bigotes se visualiza en la figura 4.
Figura 4. Diagrama de caja y bigotes del ejemplo
Ejemplo 2. La figura 5 representa un diagrama de caja por cada mes que muestra los
niveles de precipitacin de los ltimos 38 aos en la estacin de San Fernando de Apure.
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
010
020
030
040
050
0
DIAGRAMAS DE CAJA MESES DE SAN FERNANDO
PREC
IPIT
ACI
N (m
m)
Figura 5. Niveles de precipitacin por mes medidos en la estacin de San Fernando
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 24
SOLUCIN.
a. Obtenga el salario promedio del grupo de obreros
SOLUCIN.
1 1 2 2 3 3 4 4 5 5 6 6 7 7f x f x f x f x f x f x f xM60
8 22 11 27 4 32 7 37 12 42 9 47 9 52 225537.583
60 60
+ + + + + +=
+ + + + + + = =
b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero
igual o menor a 44.000 Bs
SOLUCIN.
2 3 4 5f f f f 11 4 7 12 34Porcentaje 100 100 100 56.67%60 60 60
+ + + + + += = =
c. Calcule la moda SOLUCIN.
Clase modal:
Salario (Bs/sem)
Punto medio
Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
[40,44] 42 12 42 12/60 42/60
14. PROBLEMAS RESUELTOS
PROBLEMA 1.
Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario
semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro
adjunto.
Salario
(Bs/sem)
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[20,24] 22 8 8 8/60 8/60
[25,29] 27 11 19 11/60 19/60
[30,34] 32 4 23 4/60 23/60
[35,39] 37 7 30 7/60 30/60
[40,44] 42 12 42 12/60 42/60
[45,49] 47 9 51 9/60 51/60
[50,54] 52 9 60 9/60 60/60
a. Obtenga el salario promedio del grupo de obreros
b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero igual o menor a 44.000 Bs
c. Calcule la moda
d. Calcule el recorrido intercuartil
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 25
12 7 5 20 340
Moda 40 4 40 4 40 42.512 7 12 9 8 8 8
= + = + = + = = +
d. Calcule el recorrido intercuartil SOLUCIN.
25 6025 25 15100Clase P :14 15 14 15 15 P x< < =
Salario (Bs/sem)
Punto medio
Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
[25,29] 27 11 19 11/60 19/60
25
15 8 7 28 303P 25 4 25 4 25 27.55
11 11 11 11
= + = + = + =
75 6075 75 45100Clase P : 44 45 44 45 45 P x< < =
Salario (Bs/sem)
Punto medio
Frecuencia absoluta
Frecuencia absoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
[45,49] 47 9 51 9/60 51/60
75
45 42 3 12 417P 45 4 45 4 45 46.33
9 9 9 9
= + = + = + =
Finalmente
Q 3 1 75 25I Q Q P P 46.33 27.55 18.78= = = =
SOLUCIN. f3
3 360h 0.1 0.1 f 6= = = .
F33 360
H 0.3 0.3 F 18= = = .
3 2 3 2 2F F f 18 F 6 18 F 12= + = + = = . 4 3 4 4 4F F f 48 18 f 48 f 30= + = + = = .
Clase medianal: clase 4 N
324 4 4 4 4 4 4 4 4
4
F 30 18Me LI (LS LI ) 26 LI (LS LI ) 26 LI 0.4(LS LI )
f 30
= + = + = +
Ubicando el percentil 80:
80P : 80 4880
m 60 m 1 m 47 P x 38100
< + = = =
PROBLEMA 2.
60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.
Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias: La mediana es 26
El 20% de los datos es superior a 38 3H 0.3=
3h 0.1=
4F 48=
11 5 62f f f= =
Halle la distribucin de frecuencias.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 26
El percentil 80 se ubica en la clase 4.
80 803100 100
80 4 4 4 4 4 44
4 4 4
60 F 60 18P LI (LS LI ) 38 LI (LS LI )
f 30
38 LI (LS LI )
= + = +
= +
Resolviendo el sistema lineal:
4 4 4 4 4 4
4 4 4 4 4
LI 0.4(LS LI ) 26 0.6LI 0.4LS 26 LI 18
LI (LS LI ) 38 LS 38 LS 38
+ = + = =
+ = = =
1 2 3 4 5 6 1 2 5 6 1 2 5 6
1 2 5 6 1 2 1 2 1
1 2 1 1 5
f f f f f f 60 f f 6 30 f f 60 f f 36 f f 60
f f f f 24 4f f 24 4f F f 24
3f F 24 3f 12 f 4 f 4 f
+ + + + + = + + + + + = + + + + =
+ + + = + = + =
+ = = = = 6 8=
Finalmente 1 2 2 2 2 1f f F f F f 12 4 8+ = = = =
A continuacin se muestra la distribucin de frecuencias de los datos:
Clase
Inicio
Fin
Marca de
clase
(xi)
fi
Fi
hi
Hi
1 -42 -22 -32 4 4 4/60 4/60
2 -22 -2 -12 8 12 8/60 12/60
3 -2 18 8 6 18 6/60 18/60
4 18 38 28 30 48 30/60 48/60
5 38 58 48 4 52 4/60 52/60
6 58 78 68 8 60 8/60 1
SOLUCIN.
Distribucin simtrica:
1 2 3 4 5 6 1 2 3 3 2 1 1 2 3f f f f f f 300 f f f f f f 300 f f f 150+ + + + + = + + + + + = + + =
Relaciones entre las frecuencias:
2 1 3 1 1 1 1 1 6 2 5 3 4f 3f , f 2f f 3f 2f 150 f 25 f , f 75 f , f 50 f= = + + = = = = = = =
Informacin de la mediana: Clase medianal: clase 3 N
223 3 3 3 3 3 3
3
F 150 100Me LI (LS LI ) 25 LI (LS LI ) LS
f 50
= + = + =
Informacin del percentil: Ubicacin:
91.667P : 91.667 27591.667
m 300 m 1 m 274 P x 35100
< + = = =
PROBLEMA 3. Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual
amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 25
El percentil 91.667 es 35
2 1f 3f=
3 1f 2f=
Halle la distribucin de frecuencias.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 27
El percentil 91.667 se ubica en la clase 5.
491.667 5 5 5 5 5 5
5
5 5 5 5
275 F 275 200P LI (LS LI ) 35 LI (LS LI )
f 75
35 LI (LS LI ) 35 LS
= + = +
= + =
Amplitud (d) del intervalo de clase: 5 32d LS LS 35 25 10 d 5= = = =
A continuacin se muestra la distribucin de frecuencias de los datos:
Clase
Inicio
Fin
Marca
de clase
(xi)
fi
Fi
hi
Hi
1 10 15 12.5 25 25 25/300 25/300
2 15 20 17.5 75 100 75/300 100/300
3 20 25 22.5 50 150 50/300 150/300
4 25 30 27.5 50 200 50/300 200/300
5 30 35 32.5 75 275 75/300 275/300
6 35 40 37.5 25 300 25/300 1
SOLUCIN.
Informacin suministrada:
4 6 1 5 3 4 5 6 2 1 6f 2f , f f , f 25 , f f f 19 , f 3f , LI 20= = = + + = = =
Se sabe que
1 2 3 4 5 6 1 1 1 1f f f f f f 60 f 3f 25 19 60 4f 16 f 4+ + + + + = + + + = = =
Por lo tanto:
2 5f 12 , f 4= = .
Por otro lado
4 5 6 6 6 4f f f 19 3f 4 19 f 5 f 10+ + = + = = =
Hasta ahora se tiene la siguiente informacin:
PROBLEMA 4.
Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes
al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de
seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:
a. en la cuarta clase se tiene el doble de datos que en la sexta clase b. las clases uno y cinco tienen igual nmero de datos
c. la clase tres tiene la mayor cantidad de datos igual a 25
d. la mediana de los datos es igual a 10.24 e. el extremo inferior de la clase 6 es 20
f. por encima de la clase tres hay 19 datos
g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno Construya la distribucin de frecuencias para esos datos.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 28
Clase Inicio Fin fi Fi hi Hi
1 a a d+ 4 4 4/60 4/60
2 a d+ a 2d+ 12 16 12/60 16/60
3 a 2d+ a 3d+ 25 41 25/60 41/60
4 a 3d+ a 4d+ 10 51 10/60 51/60
5 a 4d+ 20 4 55 4/60 55/60
6 20 a 6d+ 5 60 5/60 1
Informacin suministrada: mediana 10.24=
Clase medianal: 3. Entonces N
223 3 3
3
F 30 16mediana LI (LS LI ) a 2d d 10.24
f 25
64a d 10.24 25a 64d 256
25
= + = + + =
+ = + =
Por otro lado se tiene que a 5d 20+ =
Construyendo y resolviendo el sistema se obtiene
25a 64d 256a 0,d 4
a 5d 20
+ = = =
+ =
Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:
Clase Inicio Fin fi Fi hi Hi
1 0 4 4 4 4/60 4/60
2 4 8 12 16 12/60 16/60
3 8 12 25 41 25/60 41/60
4 12 16 10 51 10/60 51/60
5 16 20 4 55 4/60 55/60
6 20 24 5 60 5/60 1
SOLUCIN.
PROBLEMA 5. Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una
distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las
caractersticas siguientes: La diferencia entre el percentil 90 y el percentil 2 es 0.88
Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio es
de 0.5776 Kg La primera clase contiene el 5% de los datos La mediana es el lmite superior de la tercera clase La frecuencia acumulada absoluta de la segunda clase es 40 4 3F F 64 =
6 55f 4f=
Halle la distribucin de frecuencias de estos datos.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 29
Informacin suministrada:
90 2P P 0.88 = , 1f 10= , 3Me LS= , 2F 40= , 4 3F F 64 =
Clculos
2 1 2 2 2F 40 f f 40 10 f 40 f 30= + = + = =
4 3 3 4 3 4F F 64 F f F 64 f 64 = + = =
3 3 3 3 33 3
100 40 100 40Me LS LI (LS LI ) 1 f 60
f f
= = + = =
Ubicando el percentil 2 y el percentil 90:
2P :
2 4
2m 200 m 1 m 3 P x
100< + = =
90P :
90 180
90m 200 m 1 m 179 P x
100< + = =
2 20100 100
2 1 1 1 1 1 1 1 1 11
200 F 200 0P LI (LS LI ) LI (LS LI ) LI 0.4(LS LI )
f 10
= + = + = +
90 904100 100
90 5 5 5 5 5 5 5 5 55
200 F 200 164P LI (LS LI ) LI (LS LI ) LI 0.8(LS LI )
f 20
= + = + = +
90 2 5 1 5 5 1 1P P (LI LI ) 0.8(LS LI ) 0.4(LS LI ) 4d 0.4d 0.88 d 0.2 = + = + = =
5 5 5
i i i i 2 3 4 5
i 2 i 2 i 2
1fx 0.5776 fx 98.192 30x 60x 64x 16x 98.192
170
15(2a d) 30(2a 3d) 32(2a 5d) 8(2a 7d) 98.192
170a 3 18 32 11.2 98.19
= = =
= = + + + =
+ + + + + + + =
+ + + + =
2 170a 64.2 98.192
a 0.2
+ =
Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:
Clase
Inicio
Fin
Marca
de clase
(xi)
fi
Fi
hi
Hi
1 0.0 0.2 0.1 10 10 0.05 0.05
2 0.2 0.4 0.3 30 40 0.15 0.20
3 0.4 0.6 0.5 60 100 0.30 0.50
4 0.6 0.8 0.7 64 164 0.32 0.82
5 0.8 1.0 0.9 20 184 0.10 0.92
6 1.0 1.2 1.1 16 200 0.08 1.00
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 30
SOLUCIN.
Codificacin de la informacin suministrada:
50 1 2 3 5 6 7 6 2 3 5
7 7 2 10 1 2 3 4 5 6 7
Me P 20 ; f f f 10 ; f f f 25 ; f f f ; f 11
f 6 ; f 2f ; P 10 ; f f f f f f f 50
= = + + = + + = = + =
= = = + + + + + + =
Usando algunas de las anteriores relaciones se tiene que
7 2 5 6 3 1 4f 6 f 3 ; f 11 f 8 f 5 f 2 f 15= = = = = = =
Se tiene hasta ahora la siguiente distribucin de frecuencias:
Clase
Inicio
Fin
Marca de clase (xi)
fi
Fi
hi
Hi
1 a a + d a + d/2 2 2 0.04 0.04
2 a + d a + 2d a + d + d/2 3 5 0.06 0.10
3 a + 2d a + 3d a + 2d + d/2 5 10 0.10 0.20
4 a + 3d a + 4d a + 3d + d/2 15 25 0.30 0.50
5 a + 4d a + 5d a + 4d + d/2 11 36 0.22 0.72
6 a + 5d a + 6d a + 5d + d/2 8 44 0.16 0.88
7 a + 6d a + 7d a + 6d + d/2 6 50 0.12 1.00
De la distribucin anterior se observa que la clase medianal es la clase 4 y se puede inferir que 20
es el lmite superior de la clase 4, por lo tanto se tiene que a 4d 20+ = . Por otro lado se puede
inferir tambin que el percentil 10 est en la clase 2 y 10 es su lmite superior. Este hecho genera
la ecuacin a 2d 10+ = . De las dos ecuaciones se tiene que a 0 ; d 5= = . Por lo tanto
Clase Inicio Fin Marca de clase (xi) fi Fi Hi Hi
1 0 5 2.5 2 2 0.04 0.04
2 5 10 7.5 3 5 0.06 0.10
3 10 15 12.5 5 10 0.10 0.20
4 15 20 17.5 15 25 0.30 0.50
5 20 25 22.5 11 36 0.22 0.72
6 25 30 27.5 8 44 0.16 0.88
7 30 35 32.5 6 50 0.12 1.00
PROBLEMA 6.
Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para
automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin: La mediana de la vida til de las bateras es de 20 meses
Las tres primeras clases contienen un total de 10 datos
La mitad de los datos est en las tres ltimas clases
La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6
En la clase 5 hay 11 datos y en la clase 7 hay 6 datos
7 2f 2f= y 10P 10=
Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 31
1. Coloque al lado de cada proposicin la letra V o F segn sea verdadera o falsa
respectivamente.
a. Los datos discretos slo se pueden expresar con nmeros enteros b. Un histograma es una serie de rectngulos, cada uno proporcional en ancho al nmero de
elementos que caen dentro de una clase especfica de datos
c. Todos los valores de los datos se toman en cuenta cuando se calcula la mediana del conjunto
d. La desviacin estndar se mide en las mismas unidades que las observaciones del conjunto
de datos
2. Subraye la respuesta que considere correcta.
a. Cul de las afirmaciones siguientes acerca de los rectngulos de un histograma es correcta?
i. Los rectngulos tienen una altura proporcional al nmero de elementos de las clases
ii. Por lo general existen cinco rectngulos en cada histograma iii. El rea de un rectngulo depende slo del nmero de elementos de la clase en
comparacin con el nmero de elementos de todas las dems clases
iv. Todas las anteriores b. Cul es la principal suposicin que se hace cuando se calcula la media de datos
agrupados?
i. Todos los valores son discretos ii. Cada valor de una clase es igual a su punto medio
iii. Ningn valor se presenta ms de una vez
iv. Cada clase contiene exactamente el mismo nmero de valores c. En cul de estos casos sera la moda ms til como indicador de la tendencia central?
i. Cada valor de un conjunto de datos se presenta solamente una vez
ii. Todos los valores de un conjunto de datos, excepto tres, se presentan slo una vez. Los tres valores se presentan 100 veces cada uno
iii. Todos los valores de un conjunto de datos se presentan 100 veces cada uno
iv. Todas las observaciones de un conjunto de datos tienen el mismo valor d. El cuadrado de la varianza de un conjunto de datos representa
i. La desviacin estndar
ii. La media iii. El alcance
iv. Ninguna de las anteriores
e. Por qu es necesario elevar al cuadrado las diferencias con respecto a la media cuando se calcula la varianza de la poblacin?
i. Para que los valores extremos no afecten el clculo
ii. Porque es posible que el tamao de la poblacin sea pequeo
15. PROBLEMAS PROPUESTOS
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 32
iii. Algunas de las diferencias sern positivas y otras negativas
iv. Ninguna de las anteriores
3. Halle la media y la mediana de los primeros n nmeros naturales.
4. Halle la media y la mediana de los cuadrados de los primeros n nmeros naturales.
5. Halle la varianza muestral y la varianza muestral corregida de los primeros n nmeros
naturales.
6. Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro
adjunto.
Salario
(Bs/sem)
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[20,24] 22 8 8 8/60 8/60
[25,29] 27 11 19 11/60 19/60
[30,34] 32 4 23 4/60 23/60
[35,39] 37 7 30 7/60 30/60
[40,44] 42 12 42 12/60 42/60
[45,49] 47 9 51 9/60 51/60
[50,54] 52 9 60 9/60 60/60
a. Obtenga el salario promedio del grupo de obreros
b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero igual o menor a 44.000 Bs
c. Calcule la moda
d. Calcule el recorrido intercuartil
7. 60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.
Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias: La mediana es 26
El 20% de los datos es superior a 38 3H 0.3=
3h 0.1=
4F 48=
11 5 62f f f= =
Halle la distribucin de frecuencias.
8. Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 25
El percentil 91.667 es 35
2 1f 3f=
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 33
3 1f 2f=
Halle la distribucin de frecuencias.
9. Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes
al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de
seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:
a. en la cuarta clase se tiene el doble de datos que en la sexta clase
b. las clases uno y cinco tienen igual nmero de datos c. la clase tres tiene la mayor cantidad de datos igual a 25
d. la mediana de los datos es igual a 10.24
e. el extremo inferior de la clase 6 es 20 f. por encima de la clase tres hay 19 datos
g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno
Construya la distribucin de frecuencias para esos datos.
10. Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una
distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las
caractersticas siguientes:
La diferencia entre el percentil 90 y el percentil 2 es 0.88
Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio
es de 0.5776 Kg
La primera clase contiene el 5% de los datos
La mediana es el lmite superior de la tercera clase La frecuencia acumulada absoluta de la segunda clase es 40 4 3F F 64 =
6 55f 4f=
Halle la distribucin de frecuencias de estos datos.
11. En un torneo de ftbol se conoce que el 15% de los jugadores ha anotado ms de 5 goles.
Hay dos jugadores que se disputan el liderato del torneo con 8 goles. El 30% de los jugadores
ha anotado 4 5 goles, sabiendo adems que la cantidad de jugadores es la misma para
ambas categoras. La cuarta parte de los jugadores anot un gol y el nmero de jugadores
que anot 2 goles es el doble del nmero que anot 3 goles. Por otro lado, se sabe que slo
un jugador ha anotado 7 goles. Los datos anteriores son relativos a aquellos jugadores que
anotaron al menos un gol y estos representan el 60% del total de 100 jugadores en el torneo.
Obtenga la tabla de frecuencias para estos datos.
12. Un complejo Sistema de Telecomunicaciones GSM est formado por 1000 nodos. El
Departamento de Estadstica Operativa que monitorea al Sistema de Telecomunicaciones se
encarg de recopilar las fallas que se presentaron en cada uno de los nodos durante un ao.
Los datos obtenidos corresponden a aquellos nodos que presentaron al menos una falla, que
representan el 90% del total de los nodos. Los resultados fueron los siguientes:
El nmero de nodos que presentaron 2 fallas es el mismo que el cudruple del nmero de
nodos que sufrieron 4 fallas
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 34
Solo el 20% de los nodos han presentado ms de 5 fallas
Una cuarta parte de los nodos han presentado 3 5 fallas
Solo el 20% de los nodos present una falla
El mismo nmero de nodos que presentaron 4 fallas tambin presentaron 7 fallas
El 70% de los nodos presentaron menos de 5 fallas
Slo 30 nodos presentaron un mximo de 8 fallas cada uno
a. Halle la distribucin de frecuencias de los datos
b. Calcule media, moda y mediana para la distribucin anterior
13. En una liga de bisbol aficionado slo 30 bateadores batearon por encima de 300 puntos. Los
1200 jugadores con turnos legales para ser tomados en cuenta han sido distribuidos en seis
clases de igual ancho donde el percentil 97,5 coincide con el lmite superior de la clase cinco.
Por otro lado, el tercer cuartil es 270 y coincide con el borde inferior de la clase cuatro. El
nmero de jugadores en la primera clase es el triple del nmero en la tercera clase mientras
que en la segunda clase hay el doble de jugadores que en la tercera. Finalmente, se conoce
que el 14,5% de los jugadores pertenece a la cuarta clase. Halle la distribucin de
frecuencias.
14. Una prestigiosa compaa ha decidido contratar a una compaa de recursos humanos para
que gestione la contratacin de varios ingenieros para el prximo proyecto que se va a licitar.
Esta compaa de recursos humanos tiene las calificaciones de una prueba tcnica presentada
por 800 ingenieros logrando distribuir en clases esta informacin. La informacin que se tiene
es la siguiente:
Las notas estn distribuidas en 7 clases de igual amplitud
El 10% superior de las notas supera el valor 96
La mitad de los datos est por debajo de 60
La clase 4 es una clase modal y contiene el 30% de los datos
Por encima de esa clase modal esta el 20% de las notas
La primera y la ltima clase contienen cada una 80 datos
La segunda clase contiene la tercera parte de los datos de la tercera clase
El percentil 85 es 84 puntos
a. Obtenga la tabla de distribucin de frecuencias b. Determine el rango intercuartlico
15. Pensando en la seleccin de estudiantes para su ingreso al Sistema de Educacin Superior, se han escogido los 5000 mejores estudiantes de aquellos que solicitan estudiar la carrera de
Ingeniera Elctrica. Para la escogencia de estos 5000 aspirantes se tom en cuenta el
promedio de sus asignaturas cursadas y aprobadas en los primeros cuatro aos de estudios de
educacin media. Se sabe que el promedio de notas de esta muestra de 5000 estudiantes es
de 15.94. Los promedios de notas para estos 5000 estudiantes han sido distribuidos en 8
clases de igual amplitud. De esta distribucin de frecuencias se conoce adems lo siguiente:
El primer cuartil es 15 y coincide con el borde inferior de la quinta clase
El percentil 90 es 18 y coincide con el borde superior de la sptima clase
El nmero de datos en la clase 4 es igual a la suma de los datos de las clases 2 y 3
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 35
Las clases 5 y 6 tienen cada una 4 veces el contenido de la primera clase
La sptima clase tiene 1250 datos
Obtenga la tabla de distribucin de frecuencias
16. Una mquina produce tornillos cuya longitud nominal es de 10 cm de largo. Se considera que un tornillo est en especificaciones si su longitud difiere menos de 2 mm de la longitud
nominal. La produccin de una hora correspondiente a 1500 tornillos, se ha distribuido en 7
clases de igual amplitud, con las caractersticas siguientes:
En las clases uno y siete hay igual cantidad de tornillos
El total de tornillos por encima de la clase cinco excede al total de la clase dos por cinco
En las dos primeras clases hay un total de 180 tornillos
Hasta la clase seis hay 1450 tornillos acumulados
El 37% de los tornillos cae en la cuarta clase
El percentil 27,33, igual a 9,95 cm, coincide con el lmite superior de la clase tres
La longitud promedio de los 1500 tornillos es de 10,033 cm
a. Obtenga la tabla de distribucin de frecuencias
b. Qu porcentaje de tornillos est en especificaciones?
17. A continuacin se presentan unos diagramas de cajas para los datos de precipitacin por mes
de la estacin meteorolgica de San Fernando en el estado Apure.
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
010
020
030
040
050
0
DIAGRAMAS DE CAJA MESES DE SAN FERNANDO
PREC
IPIT
ACI
N (m
m)
Analice el siguiente grfico considerando los siguientes aspectos de inters: media aritmtica y
mediana por mes, datos atpicos, rango intercuartlico y comportamiento de la precipitacin.
18. Una empresa productora de antenas satelitales tiene tres mquinas dedicadas a la produccin de antenas cuyo radio de pantalla debe ser de 11 cm. Debido a desperfectos en las mquinas
el radio de cada pantalla vara dificultando la calidad de las antenas producidas. Por esta
razn, el Departamento de Control de Calidad de la empresa ha decidido tomar una muestra
de 11 antenas de cada mquina para verificar su radio. La tabla siguiente presenta los
resultados obtenidos de las muestras tomadas.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 36
N de la muestra Mquina 1 Mquina 2 Mquina 3
1 11,6 12,2 11,8
2 11,2 11,7 11,2
3 11,3 11,7 11,5
4 11,8 12,0 11,5
5 11,7 11,9 11,6
6 11,0 11,5 11,2
7 9,6 11,4 10,4
8 10,1 11,4 10,2
9 10,2 11,2 11,2
10 9,5 11,4 10,7
11 9,6 11,3 10,4
Radios dados en centmetros
Con base en los diagramas de caja y bigotes para las 3 mquinas, qu podra decir usted acerca
de la calidad del lote de produccin analizado? Tome en cuenta localizacin y dispersin de la
muestra en su respuesta.
19. Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para
automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin:
La mediana de la vida til de las bateras es de 20 meses
Las tres primeras clases contienen un total de 10 datos
La mitad de los datos est en las tres ltimas clases
La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6
En la clase 5 hay 11 datos y en la clase 7 hay 6 datos
7 2f 2f= y 10P 10=
Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.
20. Construya el diagrama de caja y bigotes para los datos del ejercicio anterior.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 37
RESPUESTAS
1. a. F b. F c. F d. V 2. a.i b.ii c.ii d.iv e.iii 3. n 1
M Me2
+= =
4.
2
2
n 1n impar
2(n 1)(2n 1)M , Me
6 n 1 1n par
2 4
+
+ + = =
+ +
5. 2
2 2c
n 1 n(n 1)S , S
12 12
+= =
6. a. 37.583 b. 56.67 c. 42.5 d. 18.78 7.
Clase
Inicio
Fin
Marca de
clase
(xi)
fi
Fi
hi
Hi
1 -42 -22 -32 4 4 4/60 4/60
2 -22 -2 -12 8 12 8/60 12/60
3 -2 18 8 6 18 6/60 18/60
4 18 38 28 30 48 30/60 48/60
5 38 58 48 4 52 4/60 52/60
6 58 78 68 8 60 8/60 1 8.
Clase
Inicio
Fin
Marca
de clase
(xi)
Fi
Fi
hi
Hi
1 10 15 12.5 25 25 25/300 25/300
2 15 20 17.5 75 100 75/300 100/300
3 20 25 22.5 50 150 50/300 150/300
4 25 30 27.5 50 200 50/300 200/300
5 30 35 32.5 75 275 75/300 275/300
6 35 40 37.5 25 300 25/300 1 9.
Clase Inicio Fin fi Fi hi Hi
1 0 4 4 4 4/60 4/60
2 4 8 12 16 12/60 16/60
3 8 12 25 41 25/60 41/60
4 12 16 10 51 10/60 51/60
5 16 20 4 55 4/60 55/60
6 20 24 5 60 5/60 1
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 38
10.
Clase
Inicio
Fin
Marca
de clase
(xi)
fi
Fi
hi
Hi
1 0.0 0.2 0.1 10 10 0.05 0.05
2 0.2 0.4 0.3 30 40 0.15 0.20
3 0.4 0.6 0.5 60 100 0.30 0.50
4 0.6 0.8 0.7 64 164 0.32 0.82
5 0.8 1.0 0.9 20 184 0.10 0.92
6 1.0 1.2 1.1 16 200 0.08 1.00 11.
12.
MEDIA = 3.31 MEDIANA = 3 MODA = 2
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 39
13.
14.
RANGO INTERCUARTIL = 20 15.
Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva
Jos Luis Quintero 40
16.
PORCENTAJE EN ESPECIFICACIONES: 70%
19.
Clase
Inicio
Fin
Marca de
clase
(xi)
fi
Fi
hi
Hi
1 0 5 2.5 2 2 0.04 0.04
2 5 10 7.5 3 5 0.06 0.10
3 10 15 12.5 5 10 0.10 0.20
4 15 20 17.5 15 25 0.30 0.50
5 20 25 22.5 11 36 0.22 0.72
6 25 30 27.5 8 44 0.16 0.88
7 30 35 32.5 6 50 0.12 1.00
Jos Luis Quintero
ROBABILIDADES (ITEL-30205)
Tema 1. Fundamentos de Estadstica Descriptiva
Distribucin defrecuencias y medidas de localizacin
[1] CANAVOS, GEORGE. Probabilidad y Estadstica. Aplicaciones y Mtodos. Mc Graw Hill (1995)
[2] DEVORE, JAY. Probabilidad y Estadstica para Ingeniera y Ciencias. Quinta edicin.
Thomson Learning (2001)
[3] DAZ, RAFAEL. Introduccin a la Probabilidad y a los Procesos Estocsticos en Ingeniera.
Disponible en Mdulo 7 Universidad Catlica Andrs Bello (2011)
[4] HINES, WILLIAM y MONTGOMERY, DOUGLAS. Probabilidad y Estadstica para Ingeniera. Tercera edicin. CECSA (1999)
[5] LPEZ, RAFAEL. Clculo de Probabilidades e Inferencia Estadstica con tpicos de
Econometra. Quinta edicin. Publicaciones UCAB (2009)
[6] MARTNEZ, CIRO. Estadstica y Muestreo. Ecoe Ediciones (2003)
[7] MEYER, PAUL. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley Iberoamericana
(1986)
[8] MONTGOMERY, DOUGLAS y RUNGER, GEORGE. Probabilidad y Estadstica aplicadas a la Ingeniera. Mc Graw Hill (1998)
[9] NIEVES, ANTONIO y DOMNGUEZ, FEDERICO. Probabilidad y Estadstica para Ingeniera.
Un enfoque moderno. Mc Graw Hill (2010)
[10] ORTEGA, JOAQUIN y WSCHEBOR, MARIO. Introduccin a la Probabilidad. Universidad
Nacional Abierta (1993)
[11] SPIEGEL, MURRAY; SCHILLER, JOHN y SRINIVASAN, ALU. Probabilidad y Estadstica. Segunda edicin. Serie Schaum (2001)
[12] TRIOLA, MARIO. Probabilidad y Estadstica. Novena edicin. Pearson Addison Wesley
(2004)
[13] WACKERLY, DENNIS; MENDENHALL; WILLIAM y SCHEAFFER, RICHARD. Estadstica
Matemtica con Aplicaciones. Sptima edicin. Cengage Learning Editores (2010)
[14] WALPOLE, RONALD; MYERS, RAYMOND; MYERS, SHARON y YE, KEYING. Probabilidad y Estadstica para Ingeniera y Ciencias. Onceava edicin. Pearson (2012)
BIBLIOGRAFA GENERAL
Jos Luis Quintero
Ingeniero de Sistemas (I.U.P.F.A.N.) Magister Scientiarum enInvestigacin de Operaciones (U.C.V.) Doctor en Ciencias dela Computacin: rea de inters: Clculo Numrico yOptimizacin (U.C.V.). Postdoctor en Ciencias Gerenciales(U.N.E.F.A.). Actualmente se encuentra culminando el
Fundamentos de Estadstica Descriptiva rene en unsolo material los puntos de inters de este segundo tema parael curso de Probabilidades que forma parte del conjunto deasignaturas del programa de estudios de Ingeniera deTelecomunicaciones. Aspectos de inters como organizacinde los datos en tablas de distribucin de frecuencias, medidasde tendencia central, medidas de localizacin, medidas de
(U.N.E.F.A.). Actualmente se encuentra culminando elDoctorado en Ingeniera: rea de inters: Estadstica (U.S.B.).Investigador y profesor de pregrado y postgrado de la Facultadde Ingeniera de la Universidad Central de Venezuela. Profesorde la Escuela de Ingeniera de Telecomunicaciones de laUniversidad Catlica Andrs Bello.
http://www.joseluisquintero.com/
de tendencia central, medidas de localizacin, medidas dedispersin y diagramas de caja y bigotes forman parte delcontenido del tema. Se resuelven y proponen problemas adistintos niveles que buscan ilustran con situaciones sencillaslos aspectos tericos desarrollados en el tema. Determinadosgrficos estn generados con el programa MATLAB.
El presente material se encuentra disponible para descargarde forma gratuita del sitio web