UNIVERSIDAD PERUANA DE LAS AMÉRICAS FACULTAD DE CIENCIAS EMPRESARIALES PROGRAMA DE ESTUDIOS PROFESIONALES POR EXPERIENCIA LABORAL ESTADÍSTICA APLICADA A LOS NEGOCIOS I UNIDAD Nº I: LA ESTADÍSTICA: CONCEPTOS BÁSICOS. Profesor : Tito R. Navarro Guerrero LA ESTADÍSTICA Es una ciencia que nos proporciona un conjunto de métodos y técnicas que nos permite recolectar, clasificar, analizar, presentar y describir datos en forma adecuada a fin de tomar decisiones frente a una incertidumbre o predecir o afirmar algo de la población en estudio. División de la Estadística Está dividida en dos grandes áreas: 1. Estadística Descriptiva Es el conjunto de métodos estadísticos que implican la recolección, clasificación, presentación y caracterización de un conjunto de datos, con el fin de analizarlos y describirlos. 2. Estadística Inferencial Es el conjunto de métodos y/o técnicas que nos proporciona la teoría necesaria para afirmar algo acerca de la población o tomar decisiones generales en base a una información parcial obtenida mediante técnicas descriptivas. Es la que permite tomar decisiones y/o predecir fenómenos con respecto a las características de la población en estudio. 1
1. UNIVERSIDAD PERUANA DE LAS AMRICAS
FACULTAD DE CIENCIAS EMPRESARIALES
PROGRAMA DE ESTUDIOS PROFESIONALES POR EXPERIENCIA LABORAL
ESTADSTICA APLICADA A LOS NEGOCIOS I
UNIDAD N I:LA ESTADSTICA: CONCEPTOS BSICOS.
Profesor:Tito R. Navarro Guerrero
LA ESTADSTICA
Es una ciencia que nos proporciona un conjunto de mtodos y tcnicas
que nos permite recolectar, clasificar, analizar, presentar y
describir datos en forma adecuada a fin de tomar decisiones frente
a una incertidumbre o predecir o afirmar algo de la poblacin en
estudio.
Divisin de la Estadstica
Est dividida en dos grandes reas:
Estadstica Descriptiva
Es el conjunto de mtodos estadsticos que implican la recoleccin,
clasificacin, presentacin y caracterizacin de un conjunto de datos,
con el fin de analizarlos y describirlos.
Estadstica Inferencial
Es el conjunto de mtodos y/o tcnicas que nos proporciona la teora
necesaria para afirmar algo acerca de la poblacin o tomar
decisiones generales en base a una informacin parcial obtenida
mediante tcnicas descriptivas. Es la que permite tomar decisiones
y/o predecir fenmenos con respecto a las caractersticas de la
poblacin en estudio.
POBLACIN
Es el conjunto de todos los elementos (personas, animales, plantas,
objetos, etc.) que contienen una o ms caractersticas observables.
Cada elemento de una poblacin de le denomina unidad estadstica o
unidad anlisis. Por ejemplo: los estudiantes del programa PEL de la
Universidad Peruana de las Amricas; los trabajadores del Banco de
la Nacin; los automviles que circulan en Lima Metropolitana y el
Callao; etc. son ejemplos de poblaciones.
MUESTRA
Es una parte representativa o subconjunto representativo de la
poblacin. Al nmero de elementos de la muestra se le denomina tamao
de la muestra y al procedimiento de obtener la muestra se le llama
muestreo. Por ejemplo: seleccionar a 60 estudiantes del programa
PEL de la Universidad Peruana de las Amricas; contar el nmero de
vehculos que circulan por la avenida Garcilaso de la Vega en la
cuadra 18 entre las 10 y 11 de la maana del da 20 de Abril del
2010; seleccionar 100 amas de casa del distrito de San Juan de
Lurigancho; etc. son ejemplos de muestras.
PARMETRO
Es una medida descriptiva que resume alguna caracterstica de la
poblacin. Los parmetros ms utilizados son: La media poblacional (),
la varianza poblacional (2), la desviacin estndar poblacional (),
la proporcin poblacional (). Por ejemplo: Promedio mensual del
nmero de pares de zapatos producidos en Lima Metropolitana y el
Callao del ao 2009.
ESTADGRAFO O ESTADSTICO
Es una medida resumen o caracterstica de la muestra. Los
estadsticos ms utilizados son: La media muestral ( x ), la varianza
muestral (s2), la desviacin estndar muestral (s), la proporcin
muestral (p). El valor del estadstico de la muestra se usa para
estimar el valor del parmetro poblacional cuando ste se desconoce.
Por ejemplo: Promedio mensual del nmero de pares de zapatos
producidos por el 25 %de los productores de zapatos en Lima
Metropolitana y el Callao del ao 2009.
DATOS
Son valores recopilados de cualquier nmero de observaciones
relacionadas sobre una o ms caractersticas de una poblacin o de una
muestra.
FUENTES DE DATOS
Son los registros existentes y/o mtodos (encuestas, estudios
experimentales, etc.) que sirven para obtener informacin con fines
de trabajo estadstico.
VARIABLES
Son caractersticas definidas sobre las unidades de anlisis que
conforman una poblacin y que pueden tomar diferentes valores. Todas
las variables tienen una escala de registro llamada unidad de
medida. Por ejemplo: edad de los alumnos del programa PEL de la
Universidad Peruana de las Amricas; nmero de hijos de los
trabajadores del Banco de la Nacin; ingreso mensual de los
trabajadores del Hospital Rebagliati; peso de los recin nacidos del
Hospital Materno-Infantil San Bartolom; etc.
TIPOS DE VARIABLES
Se dividen en: Categricas y cuantitativas.
1.- Variables Categricas o Cualitativas
Son aquellas que expresan una categora, cualidad o atributo. Sus
datos se expresan mediante una palabra. Por ejemplo: estado civil,
lugar de nacimiento, profesin, etc.
Las variables categricas pueden ser: Nominales u Ordinales.
Variables Categricas Nominales.-son aquellas que se expresan en
categoras sin ningn tipo de orden o clasificacin. No hay jerarquas.
Por ejemplo: estado civil, sexo, nacionalidad, etc.
Variables Categricas Ordinales.-son aquellas que se expresan en
categoras con algn tipo de clasificacin u orden. Por ejemplo: clase
social, tipos de educacin, rango de los militares, etc.
2.- Variables Cuantitativas
Son aquellas que se expresan por una cantidad. El dato puede
resultar de la operacin de contar o medir. Por ejemplo: ingreso
familiar, nmero de hijos, produccin mensual de una empresa,
etc.
Las variables cuantitativas pueden ser: Discretas o Continuas
Variables Cuantitativas Discretas.- son aquellas que resultan de la
operacin de contar y se representan por nmeros enteros o naturales.
Por ejemplo: nmero de hijos por familia, nmero de personas por
vivienda, nmero de trabajadores por empresa, etc.
Variables CuantitativasContinuas.- son aquellas que se obtienen por
medicin o comparacin con un patrn de medida y se representan por
cualquier nmero real. Por ejemplo: tiempo de servicios, ingresos
monetarios, edad, peso, estatura, etc.
ESCALAS DE MEDICIN
Es un instrumento de medida con el que se asigna valores (categoras
o nmeros) a las unidades estadsticas para una variable
definida.
TIPOS DE ESCALAS DE MEDIDA
Se dividen en: Nominal, Ordinal, De intervalo yDe razn.
Escala Nominal.- son los nombres o clases que se utilizan para
organizar los datos en categoras separadas y distintas. Por
ejemplo: la variable sexo asigna a la persona dos valores masculino
y femenino; la variable estado civil asigna a la persona varios
valores como soltero, casado, conviviente, viudo y divorciado;
etc.
Usando computadoras, a los valores de la variable en esta escala se
les asigna nmeros que se les llama etiquetas (labels) y como la
asignacin que se hace de ellas es por la informacin disponible o
por el criterio de quienes las eligen, la agrupacin puede variar.
Por ejemplo: en la variable forma de ingreso a una empresa podra
considerarse el siguiente etiquetado: por concurso (1), por
invitacin (0) o bien: por concurso (3), por invitacin (2), por
prcticas profesionales (1), otras formas (0); y se observa que el
orden de los etiquetados no afecta la informacin.
Escala Ordinal.- son las modalidades o valores de la variable que
se pueden ordenar en forma ascendente o descendente. Por ejemplo:
la variable niveles de educacin asigna a la persona varios valores
como inicial, primaria, secundaria y superior; la variable estatus
econmico asigna a la persona valores como clase baja, clase media
baja, clase media, clase media alta, clase alta; etc.
En este tipo de escala tambin se usan etiquetas para asignar
valores a la variable cuando se usan computadoras.
Escala de intervalo.- son los valores de la variable que se les
puede asignar nmeros que, adems de poseer las caractersticas de las
escalas ordinales, permiten establecer diferencias entre ellos; sin
embargo, el punto cero es arbitrario y no se trata de un cero
absoluto. Por lo tanto, los valores no pueden compararse usando
razones. Por ejemplo: la variable temperatura, en grados Celsius,
asigna a las personas valores como 36.8 , 37.0 , 38.6, etc., los
cuales permiten establecer diferencias entre ellas pero no podemos
decir que la persona con 40 de fiebre sea dos veces ms afiebrada
que la que tiene 20.
Escala de razn.- llamada tambin escala de cociente o de proporcin,
son los valores de la variable que se les puede asignar nmeros que,
adems de poseer las caractersticas de las escalas de intervalo,
pueden compararse usando razones; es decir, tienen cero absoluto.
Por ejemplo: las variables edad, peso, estatura, etc. asignan a las
personas valores que, adems de poder establecer diferencias entre
ellas, se pueden hacer comparaciones de razones ya que una persona
puede tener el doble de edad, el doble de peso o el doble de
estatura que otra persona; asimismo, las variables ingreso,
inventario de artculos, etc. asignan valores dentro de una escala
de razn.
ORGANIZACIN Y PRESENTACIN DE DATOS
Representacin tabular de la informacin de variables de tipo
categrico
Cuando la variable es de tipo categrico, la organizacin y
presentacin de los datos se hace de la siguiente manera:
1)Se determina el nmero de clases que la variable est
tomando.
2)Se obtienen las frecuencias absolutas (fi) para cada clase, las
cuales son el nmero de veces que se presenta cada clase.
3)Se obtienen las frecuencias relativas (hi) para cada clase, las
cuales estn definidas por el cocientefin, donde n es el nmero total
de datos.
4)Se obtienen las frecuencias relativas porcentuales (%) para cada
clase, las cuales son las frecuencias relativas multiplicadas por
100.
En el siguiente cuadro se presenta la tabla de frecuencias de los
resultados de un estudio de mercado a 150 hogares de la clase media
del distrito de San Borja para conocer la marca de jabn de tocador
que usan.
Cuadro 1. Marca de jabn de tocador que usan los hogares de la clase
media de San Borja
Marca de jabnN de Hogares (fi)Frecuencia relativa (hi)Frecuencia
relativa porcentual
(hix100%)Camay500.3333Palmolive250.1717Rexona180.1212Lux250.1717Nivea150.1010Henio
de Pravia170.1111Total1501.00100
Representacin grfica de la informacin de variables de tipo
categrico
Para representar grficamente un conjunto de datos estadsticos
referidos a variables de tipo categrico se utilizan diferentes
formas grficas, siendo las ms usadas: el grfico de barras y el
grfico de sectores circulares.
El grfico de barras son rectngulos, separados unos de otros, donde
cada uno representa una clase que toma la variable y cuya altura
corresponde a las frecuencias (absolutas o relativas) de dicha
clase. Estos grficos pueden ser: de barras simples, de barras
compuestas y de barras mltiples (dobles, triples, etc.).
El grfico de sectores circulares son crculos, enteros o
entrecortados, donde las categoras o clases que toma la variable
estn representadas por un sector circular que es un rea circular
igual al rea total del crculo multiplicada por la frecuencia
relativa de la clase que toma la variable. Cuando este tipo de
grfica se representa en un espacio tridimensional se le llama de
pastel.
En la prctica, estos grficos de sectores circulares se obtienen
dividiendo el crculo, desde su centro, en un nmero de sectores
circulares igual al nmero de clases que toma la variable, y en
donde cada sector circular es el valor del ngulo central del crculo
que se obtiene mediante la siguiente frmula:
x= 360 (hi), para todo i.
A continuacin se dan algunos ejemplos de estos grficos.
Grfico 1. Barras simples
Nmero de hogares que usan jabn de tocador en San Borja
60
40
20
camaypalmolive rexonaluxnvea heno de pravia
Grfico 2. Barras dobles
Tipos de aceites consumidos en el ao 2007 y 2008
60%
40%
20%
2007 2008
Leyenda:Aceite vegetal:
Aceite compuesto:
Grfico 3. Barras compuestas
Tipos de aceites consumidos en el ao 2007 y 2008
100%
50%
2007 2008
Leyenda: Aceite vegetal:
Aceite compuesto:
Grfico 4. Grfico circular
Porcentaje de hogares que usan jabn de tocador en San Borja
henio de pravia (11%)
nvea (10%) Camay (33%)
lux (17%)PPalmolive (17%)
rexona (12%)
Representacin tabular de la informacin de variables de tipo
cuantitativo discreto
La forma ms simple de organizar las observaciones de una variable
discreta, cuando algunas de ellas se repiten, consiste en ordenar
los valores diferentes que toma la variable en forma ascendente y
luego proceder a construir una tabla de distribucin de frecuencias
de tales observaciones. Las frecuencias que se obtienen son como
las obtenidas anteriormente (absolutas, relativas y relativas
porcentuales) pero adems se incluyen las llamadas frecuencias
acumuladas de las antes mencionadas (absolutas acumuladas,
relativas acumuladas y relativas porcentuales acumuladas), las
cuales se obtienen acumulando sucesivamente las frecuencias de los
valores anteriores a la del valor que se desea obtener la
acumulacin.
En el siguiente cuadro se presenta una tabla de distribucin de
frecuencias de los resultados de un estudio a 200 hogares del
Callao para ver el nmero de celulares que tienen.
Cuadro 2. Nmero de celulares que hay en los hogares del
Callao
N de celulares(xi)Nmero de hogares (fi)Frecuencias
relativas(hi)Frecuencias relativas porcentuales(hix100%)Frecuencias
absolutas acumuladas(Fi)Frecuencias relativas
acumuladas(Hi)Frecuencias
porcentualesAcumuladas(Hix100%)0300.1515300.15151900.45451200.60602500.25251700.85853300.15152001.00100Total2001.00100
Representacin grfica de la informacin de variables de tipo
cuantitativo discreto
Un conjunto de datos estadsticos referidos a variables de tipo
discreto se representan grficamente mediante una grfica de lneas
cuyo eje horizontal corresponde a los diferentes valores de la
variable y el eje vertical a las frecuencias correspondientes de
dichos valores diferentes, la cual se representa por un segmento
vertical levantado desde cada valor diferente; tal como se muestra
a continuacin.
Grfico 5. Nmeros de celulares que hay en los hogares del
Callao
N de hogares
100
75
50
25
0 1 23
Celulares
Representacin tabular de la informacin de variables de tipo
cuantitativo continuo
El procedimiento para construir una tabla de distribucin de
frecuencias cuando la variable es de tipo continuo es el
siguiente:
1)Determinar el rango R de la variable, el cual es la diferencia
del valor mximo de los datos con el valor mnimo de los mismos; es
decir:
R=xmx-xmn
2)Determinar el nmero K de intervalos o clases, el cual se obtiene
aplicando por lo general la regla de Sturges que est dada
por:
K=1+3.3 log n
dondeKes el nmero de intervalos ynes el total de las observaciones,
redondeando el valor al entero ms cercano
3)Determinar el tamao o amplitud W de los intervalos, el cual es la
longitud del intervalo de clase y se obtiene como el cociente del
rango entre el nmero de intervalos; es decir:
W= RK
Si el nmero resultante no es exacto se redondea al valor superior
ms cercano segn las cifras decimales de los datos.
4)Determinar los lmites de cada intervalo, donde el lmite inferior
del primer intervalo es el valor mnimo de los valores observados y
el lmite superior de este primer intervalo se obtiene sumando la
amplitud del intervalo a dicho valor mnimo; este valor sera su vez
el lmite inferior de la clase siguiente y as se obtienen los dems
lmites superiores e inferiores como se obtuvo el primero.
Se usa preferentemente la notacin de intervalos cerrados por la
izquierda y abiertos por la derecha, excepto el ltimo que se
considerar cerrado tanto por la izquierda como por la
derecha.
5) Finalmente, se procede al conteo y registro de los datos para as
construir la tabla de distribucin de frecuencias respectiva.
Cuando los datos discretos presentan una gran dispersin que hara
utilizar un gran nmero de clases, se prefiere procesarlos como
datos continuos.
MARCAS DE CLASE
Es el punto medio xide los valores extremos de cada intervalo de
clase; es decir:
Xi = xmx+xmn2
Representacin grfica de la informacin de variables de tipo
cuantitativo continuo
A partir de la tabla de distribucin de frecuencias de variables
continuas se pueden construir los siguientes grficos: los
histogramas de frecuencias, los polgonos de frecuencias y las
ojivas.
El histograma de frecuencias es una representacin grfica
medianterectngulos adyacentes donde en el eje horizontal se
representan los intervalos de clase y en el eje vertical
serepresenta los valores de las frecuencias (absolutas o
relativas).
El polgono de frecuencias es un polgono asociado a las frecuencias
absolutas o relativas que se forma uniendo los puntos medios de los
rectngulos del histograma de frecuencias, incluyendo los dos
intervalos adicionales a los intervalos extremos, uno en el lado
izquierdo y el otro en el lado derecho.
La ojiva es un polgono asociado a las frecuencias absolutas
acumuladas o relativas acumuladas que se forma de manera anloga a
la del polgono de frecuencias
A continuacin se muestran ejemplos de lo anteriormente
expuesto:
Cuadro 3. Ventas (en kgs.) de pollo en un establecimiento del
mercado central de Lima Metropolitana
Ventas(kgs.)Marcas de clase (xi)Frec.absol.(fi)Frec.abs.
acum.(Fi)Frec.relat.(hi)Frec. rel.
acum.(Hi)Frecuenciaporcentual(hix100%)Frec.
porc.acumulada(Hix100%)[22 27>24.5550.140.141414[27
32>29.57120.200.342034[32 37>34.512240.340.683468[37
42>39.57310.200.882088[42 47>44.53340.090.97997[47 -
52]49.51350.031.003100Total351.00100
Grfico 6. Ventas (en kgs.) de pollo en un establecimiento del
mercado central de Lima Metropolitana
Das
10
5
22 27 32 37 42 47 52
Ventas
Grfico 7. Ventas (en kgs.) de pollo en un establecimiento del
mercado central de Lima Metropolitana
Das
10
5
17 22 27 32 37 42 47 52 57
Ventas
Grfico 8. Ventas (en kgs.) de pollo en un establecimiento del
mercado central de Lima Metropolitana
Das
40
30
20
10
17 22 27 32 37 42 47 52 57
Ventas
Observaciones:
Cuando el tamao de la muestranes mayor o igual a 30 (n30), las
frecuencias relativas (hi) se pueden tomar como aproximaciones de
las probabilidades de que un valor de la variable considerada en la
poblacin sea la clase de la variable categrica o sea el valor de la
variable discreta o bien pertenezca al intervalo de clase de la
variable continua respectivamente donde est dicha frecuencia
relativa. Matemticamente, esto quiere decir que:
hiP (a =C)bien hi P(b = X) bienhi P(c [xi-1, xi])
donde a es el valor de la clase C de la variable categrica, b es el
valor Xde la variable discretayces un valor que est en el intervalo
[xi-1, xi] de la variable continua.
El rea total que determinan los rectngulos del histograma de
frecuencias es igual al rea que est bajo el polgono de frecuencias
en las variables cuantitativas continuas.
PRCTICA DIRIGIDA N 1
LA ESTADSTICA: CONCEPTOS BSICOS
Profesor:Tito R. Navarro Guerrero
Identifique y seale la poblacin y muestra en cada una de las
siguientes proposiciones:
Obtener el nivel educativo de 150 trabajadores de la
Telefnica.
Obtener el nmero de llamadas que ingresan a Radio Programas del Per
sobre opinin pblica, el da 20 de Marzo del presente ao, durante 10
minutos dentro del horario de 4 a 5 de la tarde.
Conocer la marca de pasta de dientes que usan 180 hogares del
distrito de Lince.
Conocer los aos de servicios eingresos de 300 trabajadores
administrativos y de servicios de los hospitales de salud de Lima
Metropolitana y el Callao.
Obtener el porcentaje de desempleo de 2 000 personas mayores de 20
aos de Lima Metropolitana y el Callao.
2.Clasifique las siguientes variables por su escala de medicin y
luego categorcelas ya sea directamente y/o en forma codificada
(etiquetada).
a) tiempo de servicios. b)nivel educativo.c)color de ojos.d)sexo.e)
temperatura ambiental.e)nmero de hijos por familia. f)estado civil.
g) gastos en consumo de agua. h)tiempo de fabricacin de camisas.k)
peso. l)produccin de aceite comestible. ll)ventas de gas natural
para vehculos.
3.Clasifique las siguientes variables por su tipo: cualitativa
(nominal u ordinal) o cuantitativas (discreta o continua).
a) marcas de impresoras.b)la estatura (en cms.) de nios de un
centro educativo.c) consumo (en kws.) de energa elctrica por
vivienda. d)los alumnos poseen o no calculadoras cientficas.e)nmero
mensual de matrimonios.f) la vida til (en horas) de los focos de
100 watts.g)afiliacin poltica de los congresistas peruanos.
4.Clasifique las variables del ejercicio 2 por su tipo: cualitativa
(nominal u ordinal) o cuantitativa (discreta o continua).
5.Se realiz un estudio a 180 hogares del distrito de Lince para
conocer la marca de pasta dental que usan. Los resultados fueron
los siguientes:Colgate 41, Kolynos 70, Dento 35, Splendid 20, Otros
10.
a) Identifique la variable y su tipo, as como la poblacin y la
muestra.b) Construya una tabla de frecuencias de la informacin
obtenida.c) Construya el grfico de barras de las frecuencias
absolutas. d) Construya un grfico circular con las frecuencias
relativas porcentuales.
6.En Junio del 2005 y del 2006, la inversin extranjera en el Per de
acuerdo al sector de destino fue como sigue:Comunicaciones 45% y
48%, Minera 20% y 17%, Industria 12% y 15%, Energa 8% y 7%,
Finanzas 6% y 5%, Comercio 5% y 4%, Otros 4% y 4%.
a) Identifique la variable medida y su tipo, as como la poblacin y
la muestra. b) Construya un grfico de barras para comparar la
informacin obtenida.
7.Se hizo una encuesta a 26 trabajadores de una empresa de
manufactura para conocer su nivel educativo: primaria incompleta
(PI), primaria completa (PC), secundaria incompleta (SEI),
secundaria completa (SEC), superior incompleta (SUI), superior
completa (SUC). Los resultados fueron los siguientes:PI, SEI, SEI,
PC, SUC, SUI, SUI, SUI, PI, PI, SEI, SEC, SEC, SEI, PI, PI, PC, PC,
PI, SEC, SEI, SUC, SUI, SEC, PC, SEI.
a)Identifique la variable y su tipo, as como la poblacin y la
muestra.b)Construya una tabla de distribucin de frecuencias de la
informacin obtenida. c) Construya un grfico de barras y otro
circular para la informacin obtenida.
8.Se pregunt a 20 amas de casa sobre el nmero de celulares que hay
en el hogar. Los resultados fueron: 0, 1, 1, 2, 3, 2, 1, 1, 1, 1,
2, 1, 3, 0, 2, 1, 2, 3, 1, 0.
a)Identifique la variable y su tipo, as como la poblacin y la
muestra b)Construya una tabla de distribucin de frecuencias de la
informacin obtenida. c)Construya el grfico de lneas de las
frecuencias absolutas. d)Cuntos hogares tienen a lo ms un celular?
e)Qu porcentaje de hogares poseen hasta dos celulares?f)Qu
porcentaje de hogares poseen ms de un celular?
9.Los siguientes datos son el nmero de accidentes automovilsticos
que ocurren en 35 cruces ms transitados de Lima Metropolitana
durante el ltimo fin de semana del mes de Noviembre del 2002:4, 0,
1, 6, 1, 2, 5, 7, 2, 8, 5, 5, 6, 4, 7, 4, 6, 8, 6, 7, 5, 4, 8, 6,
8, 5, 6, 5, 6, 5, 4, 6, 5, 7, 3.
a)Identifique la variable y su tipo, as como la poblacin y la
muestra. b)Construya una tabla de distribucin de frecuencias de la
informacin obtenida. c)Construya el grfico de lneas de las
frecuencias relativas. d)Cuntos cruces ms transitados han tenido ms
de5 accidentes?e) Qu porcentaje de cruces ms transitados han tenido
menos de4 accidentes? f) Qu porcentaje de cruces ms transitados han
tenido a lo ms 2 accidentes?
10.Una agencia de empleos temporales registr el salario neto
semanal de cincuenta trabajadores obteniendo los siguientes
valores: 68.10 26.15 63.70 34.10 71.75 48.66 79.51 35.18 28.10
49.2438.18 32.15 29.90 60.12 47.11 53.33 40.26 31.17 29.66
35.0158.56 31.24 52.02 41.63 39.54 69.54 69.40 33.09 32.05 26.70
44.40 83.74 37.20 25.65 46.42 45.89 47.29 30.09 33.81 40.10 73.78
30.33 50.12 59.39 33.55 39.19 38.70 48.62 38.69 55.17
a) Identifique la variable y su tipo, as como la poblacin y la
muestra. b) Construya la tabla de distribucin de frecuencias de la
informacin obtenida.c) Construya el histograma y el polgono de las
frecuencias absolutas.d) Construya la ojiva de las frecuencias
relativas acumuladas.e) Interprete adecuadamente los resultados a
partir de la tabla construida.
11.El consumo de agua, en metros cbicos, de 30 viviendas en el mes
de Enero fue como sigue: 4.3 7.8 6.1 15.7 12.8 17.2 3.5 16.1 12.4
6.9 18.0 11.5 13.4 6.55.9 14.3 8.7 13.0 9.2 12.8 3.0 4.2 11.2 16.2
7.0 4.5 7.8 15.9 16.5 8.4.
a) Identifique la variable y su tipo, as como la poblacin y la
muestra.b) Construya la tabla de distribucin de frecuencias de la
informacin obtenida. c) Construya el histograma y el polgono de las
frecuencias relativas.d) Construya la ojiva de las frecuencias
absolutas acumuladas. e) Interprete adecuadamente los resultados a
partir de la tabla construida.
12.Se han tomado las ventas en miles de soles de 40 supermercados
de nuestro pas correspondiente al mes de Octubre del ao pasado. Los
resultados fueron: 168 160 168 175 175 160 165 154 163 165 168 168
158 149 160 161 162 166 163 159 178 169 158 163 171 170 165 150 167
164 162 165 163 156 174 165 173 172 168 168.
a) Identifique la variable y su tipo, as como la poblacin y la
muestra.b) Construya la tabla de distribucin de frecuencias de la
informacin obtenida. c) Construya el histograma y el polgono de las
frecuencias absolutas.d) Construya la ojiva de las frecuencias
absolutas acumuladas.e)Interprete adecuadamente los resultados a
partir de la tabla construida.
13.Los siguientes datos proporcionan los ingresos anuales en miles
de dlares de 50 personas: 7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0
30.5 25.0 40.0 30.0 25.5 50.0 17.1 25.5 43.5 31.659.0 41.5 13.5
12.0 9.2 42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0
16.5 18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0 12.0
8.3.
a)Identifique la variable y su tipo, as como la poblacin y la
muestra.b)Construya la tabla de distribucin de frecuencias de la
informacin obtenida.c)Construya el histograma y el polgono de las
frecuencias relativas. d)Construya la ojiva de las frecuencias
relativas acumuladas.e)Interprete adecuadamente los resultados a
partir de la tabla construida.
14.En la siguiente tabla de distribucin de frecuencias, un agente
de seguros ha ordenado los datos mensuales correspondientes a la
cantidad de dlares de las plizas de seguros que ha vendido durante
los tres ltimos aos.
Venta mensualFrecuenciaVenta mensualFrecuencia[10 000 12
000>2[18 000 20 000>6[12 000 14 000>4[20 000 22
000>8[14 000 16 000>7[22 000 24 000>2[16 000 18
000>5[24 000 26 000]1
a) Identifique la variable y su tipo, as como la poblacin y la
muestra.b) Construya el histograma y el polgono de las frecuencias
relativas. c) Construya la ojiva de las frecuencias relativas
acumuladas. d) Interprete adecuadamente los resultados a partir de
la tabla construida.
ESTADSTICA APLICADAA LOS NEGOCIOS I
UNIDAD N II:MEDIDAS DE TENDENCIA CENTRAL Y DE VARIACIN
Profesor: Tito R. Navarro Guerrero
MEDIDAS DE TENDENCIA CENTRAL MUESTRALES
Son valores de la variable que estn situados en el centro o
alrededor del punto medio de un conjunto de datos. Este valor
tambin se le denomina indicador estadstico o estadstico o
estadgrafo.
Las medidas de tendencia central ms importantes son: la media
aritmtica, la mediana,la moda y los cuartiles.
La media aritmtica o media muestral o promedio muestral.- es un
valor o medida de tendencia central en una muestra de datos de
variables cuantitativas que se toma como si fuera el valor que
tuvieran cada uno de los datos obtenidos; es decir, una sustitucin
o aproximacin de cada datomuestral, y se representa por el smbolo
x. Por ejemplo,si los datos fueran 2, 3 y 4, entonces, se puede
decir que cada unode ellos podra tomar el valor 3, ya que 2 +3 +43
=3+3+33. El valor 3 es la media aritmtica xdel conjunto {2, 3, 4}
de datos muestrales.
La mediana muestral.-es un valor o medida de tendencia central en
una muestra de datos de variables categricas ordinales o
cuantitativas que divide al conjunto de datos, previamente
ordenados en forma creciente o decreciente, en dos partes iguales;
es decir, el 50% de los datos ordenados estar a su izquierda y el
otro 50% a su derecha, y se representa por el smbolo Me. Por
ejemplo, el nmero 2.5es la mediana Me del conjunto{1, 1, 2, 3, 4,
5} de datos muestrales, ya que tres datos estn a su izquierda y los
otros tres a su derecha.
La moda muestral.-es un valor o medida de tendencia central en una
muestra de datos de variables tanto categricas como cuantitativas
que se repite con mayor frecuencia, y se representa por el smbolo
Mo. Si el conjunto de datos tiene una moda se llama unimodal, si
tiene dos modas se llamabimodal, y al conjunto de datos que tiene
ms de dos modas se llamamultimodal. Por ejemplo, el nmero 1 es la
moda Mo del conjunto{1, 1, 2, 3, 4, 5}de datos muestrales, ya queel
1 es el dato que ms se repite.
Los cuartiles muestrales.-son valores o medidas de tendencia
central en una muestra de datos de variables categricas ordinales o
cuantitativas que dividen al conjunto de datos, previamente
ordenados en forma creciente o decreciente, en cuatro partes
iguales, y se representan por los smbolos Q1, Q2 y Q3, donde Q1 se
llama primer cuartil, Q2 se llama segundo cuartil o mediana y Q3 se
llama tercer cuartil.
El primer cuartil o cuartil inferior muestral Q1.-es un valor o
medida de tendencia central que supera a no ms del 25% de las n
observaciones y que es superado por no ms del 75% de las n
observaciones, previamente ordenadas.
El segundo cuartil o cuartil medio muestral Q2.-es un valor o
medida de tendencia central que coincide con el valor de la mediana
Me, anteriormente descrita.
El tercer cuartil o cuartil superior muestral Q3.-es un valor o
medida de tendencia central que supera a n o ms del 75% de las n
observaciones y que es superado por no ms del 25% de las n
observaciones, previamente ordenadas.
Frmulas para calcular la media aritmtica o media muestralx
a) Para datos cuantitativos no agrupados
x = xn,dondexes el valor del dato no agrupado,n es el total de los
datos yel smbolosignifica sumar.
b) Para datos cuantitativos agrupados
x =( xi fi )n,dondexies la marca de clase del intervalo i,nes el
total de los datos y el smbolosignifica sumar los productos entre
parntesis.
En la prctica, para calcular el valor dela media muestral xpara
datos cuantitativos agrupados se debe formar una columna en la
tabla de los datos agrupados, despus de la columna de las
frecuencias absolutas, donde se exprese losproductosxi fi,y luego
sumar todos los valores de dicha columna. Este total ser
elnumerador de la frmula dada.
Procedimiento para calcular la mediana muestral Me
a)Para datos categricos ordinales y cuantitativos discretos
agrupados
1) Se forma la columna de las frecuencias absolutas acumuladas.2)
Se divide el totalnde los datos entre 2. 3) Se busca este valor en
la columna de las frecuencias absolutas acumuladas.4) La mediana Me
se encuentra en la clase donde se ubica el valor hallado.
b)Para datos cuantitativos no agrupados
1) Se ordenan los datos en forma creciente o decreciente.2) Si el
nmero de datos es impar, la mediana Me es el valor que est situado
exactamente a la mitad de los datos.3) Si el nmero de datos es par,
la mediana Me es la media aritmtica de los dos valores que estn a
la mitad del conjunto de datos ordenados.
c)Para datos cuantitativos continuos agrupados
1) Se forma la columna de las frecuencias absolutas acumuladas. 2)
Se divide el totalnde los datos entre 2. 3) Se busca este valor en
la columna de las frecuencias absolutas acumuladas.4)La mediana Me
se encuentra en el intervalo donde se ubica el valor hallado.5)Se
calcula el valor de Me utilizando la siguiente frmula:
Me= Li + A. [ n2F(Me-1)f(Me) ], donde Lies el lmite inferior del
intervalo de clase donde se encuentra la mediana, A es la longitud
del intervalo de clase donde se encuentra la mediana, F(Me 1)es la
frecuencia absoluta acumulada del intervalo de clase anterior al
intervalo de clase donde se encuentra la mediana yf(Me)es la
frecuencia absoluta del intervalo de clase donde se encuentra la
mediana.
Procedimiento para calcular la moda muestral Mo
a)Para datos categricos (o cualitativos) nominales u
ordinales
Se determina la categora (o las categoras) que ms se repite (o
repiten).
b)Para datos cuantitativos no agrupados y cuantitativos discretos
agrupados
Se determina el valor (o los valores) del conjunto de datos que ms
se repite (o repiten).
c)Para datos cuantitativos continuos agrupados
1)Se identifica el intervalo de clase con mayor frecuencia absoluta
(clase modal). 2)La moda Mo se encuentra en la clase modal. 3)Se
calcula el valor de Mo utilizando la siguiente frmula:
Mo= Li + A. [d1d1 +d2],donde Lies el lmite inferior de la clase
modal, Aes la longitud de la clase modal, dies la diferencia de las
frecuencias absolutas de la clase modal con la del intervalo de
clase anterior yd2es la diferencia de las frecuencias absolutas de
la clase modal con la del intervalo de clase siguiente.
Procedimiento para calcular el primer cuartil muestral Q1
a)Para datos categricos ordinales y cuantitativos discretos
agrupados
1) Se forma la columna de las frecuencias absolutas acumuladas.2)
Se divide el total n de los datos entre 4.3) Se busca este valor en
la columna de las frecuencias absolutas acumuladas. 4) El primer
cuartilQ1 se encuentra en la clase donde se ubica el valor
hallado.
b) Para datos cuantitativos no agrupados
1) Se ordenan los datos en forma creciente o decreciente. 2) Si el
nmero de datos es impar, el primer cuartil Q1es el valor que est
situado en la cuarta parte del conjunto de los datos ordenados.3)
Si el nmero de datos es par, el primer cuartil Q1 es la media
aritmtica de los dos valores que estn en la cuarta parte de los
datos ordenados.
c)Para datos cuantitativos continuos agrupados
1) Se forma la columna de las frecuencias absolutas acumuladas.2)
Se divide el total n de los datos entre 4.3) Se busca este valor en
la columna de las frecuencias absolutas acumuladas.4) El primer
cuartil Q1 se encuentra en el intervalo donde se ubica dicho valor.
5) Se calcula el valor de Q1 utilizando la siguiente frmula:
Q1 = L1 +A. [ n4 + F(Q1- 1)fQ1 ],dondeLies el lmite inferior del
intervalo de clase donde se encuentra el primer cuartil, A es la
longitud del intervalo de clase donde se encuentra el primer
cuartil, F(Q1- 1)es la frecuencia absoluta acumulada del intervalo
de clase anterior al intervalo de clase donde se encuentra el
primer cuartil yfQ1 es la frecuencia absoluta del intervalo de
clase donde se encuentra el primer cuartil.
Procedimiento para calcular el segundo cuartil muestral Q2
Como el segundo cuartil es la mediana muestral, ya est dado all el
procedimiento para calcularlo.
Procedimiento para calcular el tercer cuartil muestral Q3
a)Para datos categricos ordinales y cuantitativos discretos
agrupados
1) Se forma la columna de las frecuencias absolutas acumuladas. 2)
Se multiplica el total n de los datos por34. 3) Se busca este valor
en la columna de las frecuencias absolutas acumuladas.4) El tercer
cuartil Q3 se encuentra en la clase donde se ubica el valor
hallado.
b)Para datos cuantitativos no agrupados
1) Se ordenan los datos en forma creciente o decreciente. 2) Si el
nmero de datos es impar, el tercer cuartil Q3 es el valor que est
situado en la tres cuartas partes del conjunto de los datos
ordenados. 3) Si el nmero de datos es par, el tercer cuartil Q3 es
la media aritmtica de los dos valores que estn en la tres cuarta
parte de los datos ordenados.
c)Para datos cuantitativos continuos agrupados
1) Se forma la columna de las frecuencias absolutas acumuladas.2)
Se multiplica el total n de los datos por34. 3) Se busca este valor
en la columna de las frecuencias absolutas acumuladas.4) El tercer
cuartil Q3 se encuentra en el intervalo donde se ubica dicho
valor.5) Se calcula el valor de Q3 utilizando la siguiente
frmula:
Q3 = L1 + A. [ 3n4+F(Q3- 1) fQ3 ],donde L1 es el lmite inferior del
intervalo de clase donde se encuentra el tercer cuartil, A es la
longitud del intervalo de clase donde se encuentra el tercer
cuartil, F(Q3- 1)es la frecuencia absoluta acumulada del intervalo
de clase anterior al intervalo de clase donde se encuentra el
tercer cuartil yfQ3es la frecuencia absoluta del intervalo de clase
donde se encuentra el tercer cuartil.
Ventajas y desventajas de las medidas de tendencia central
Ventajas de la media aritmtica
a)Es una medida que tiene en cuenta toda la informacin
suministrada.b)Es la ms estable de las medidas de tendencia
central.c)Puede ser utilizada como dato para anlisis estadsticos
posteriores.
Desventajas de la media arimtica
No es conveniente utilizarla cuando los datos se aglomeran en los
extremos del conjunto de datos ordenados habiendo poca informacin
en las partes centrales de la distribucin. Los datos estn
fuertemente sesgados. En este caso se prefiere utilizar la
mediana.
Ventajas de la mediana muestral
La mediana se utiliza cuando los datos estn fuertemente
sesgados.
No est afecta a los valores extremos de los datos.
Se utiliza tambin en las variables categricas ordinales.
Desventajas de la mediana muestral
Es una medida que no tiene en cuenta los valores que toman las
variables en los extremos de los datos ordenados en la
muestra.
Ventajas de la moda muestral
a)Se puede calcular tanto para datos categricos como para los
cuantitativos. b)No est afectada por los valores extremos de los
datos ordenados.
Desventajas de la moda muestral
Es muy difcil de interpretar o comparar cuando la distribucin es
multimodal.
Comparaciones entre la media aritmtica, la mediana y la moda
Si en la distribucin de frecuencias x=Me=Mo,entonces, la
distribucin es simtrica.
Si en la distribucin de frecuencias xMeMo,entonces, la distribucin
es asimtrica o sesgada, y puede ocurrir los siguientes casos:
Si Mo Si x < Me< Mo,entonces, la distribucin es sesgada a la
izquierda.
MEDIDASDE VARIACIN ODISPERSIN MUESTRALES
Son medidas que explican cuan dispersos estn los datos muestrales
entre s. Estas medidas pretenden caracterizar el conjunto de datos
segn su forma de distribucin.
Son medidas que expresan segmentos de recta en el conjunto de
nmeros reales que definen los valores en el conjunto de datos
muestrales; en algunos casos, estos segmentos se obtienen con
referencia a una medida de tendencia central (especialmente la
media aritmtica).
Entre estas medidas de variacin o dispersin se tienen: el rango
muestral, la varianza muestral, la desviacin estndar muestral y el
coeficiente de variacin.
El rango muestral.- es la longitud o distancia entre el dato mayor
y el menor, y se representa por la letra R; es decir:
R=xmx.xmn.
La varianza muestral.- es una medida de variacin que mide la
dispersin cuadrtica de los datos con respecto a la media aritmtica,
y se representa por el smbolo s2. Su unidad de medida es el
cuadrado de la unidad de medida utilizada para medir los
datos.
Clculo de la varianza muestral
Para datos cuantitativos no agrupados
Se aplica la frmula general: s2= (xx)2n.
Pero, en la prctica, es ms usual aplicar la siguiente frmula
derivada de la anterior:
s2= x2n(x)2, donde xes el valor del dato observado, xes la media
muestral ynes el tamao de la muestra (el smbolo significa
sumar).
Para datos cuantitativos (discretos o continuos) agrupados
Se aplica la frmula general:s2=fi (xi x)2n.
Pero, en la prctica, es ms usual aplicar la siguiente frmula
derivada de la anterior:
s2= fi (xi)2n(x)2,donde xies el valor del dato observado, xes la
media muestraly nes el tamao de la muestra (el smbolo significa
sumar).
Esta ltima frmula implica construir dos columnas ms en la tabla de
distribucin de frecuencias: la columna de los productosfi xiy la
columna de los productosfi (xi)2 y luego sumar todos los valores de
cada una de esas columnas para usarlas en las expresiones dadas en
la frmulas, recordando la frmula para obtener x.
La desviacin estndar muestral.-es la raz cuadrada de la varianza
muestral, y se representa por la letra s; es decir:
s =s2
Es la ms completa entre las medidas de dispersin porque interviene
la unidad de medida que se usa para medir los datosyel nmero total
de ellos.
El coeficiente de variacin muestral.- es una medida de dispersin
relativa que proporciona una estimacin de la magnitud de la
desviacin estndar respecto a la magnitud de la media, y
generalmente est expresado en porcentaje, y se representa por las
letras CV. Matemticamente, esto se expresa por:
CV= sx .100%
Observamos que el coeficiente de variacin no est expresado en
ninguna unidad de medida, ya que sta se cancela cuando se divide la
desviacin entre la media muestral correspondiente. Por tal motivo,
es til para comparar distribuciones con unidades de medida
diferentes para ver as cul de ellas es ms variable.
Desventaja del coeficiente de variacin
Una desventaja del coeficiente de variacin es que deja de ser til
cuando la media muestral es un valor cercano a cero.
PRCTICA DIRIGIDA N 2
MEDIDAS DE TENDENCIA CENTRAL Y DE VARIACIN
Profesor:Tito R. Navarro Guerrero
Con referencia al ejercicio 5 de la prctica dirigidaN 1, calcular
la moda de la distribucin, y con referencia al ejercicio 7de la
misma prctica dirigida, calcular los cuartiles muestrales y la moda
correspondiente.
2. Con referencia a los ejercicios 8 al 14 de la prctica dirigida N
1, calcular las diferentes medidas de tendencia central y de
variacin para cada uno de ellos. Interprete los resultados. As
mismo, compare la variabilidad relativa entre ellos mediante sus
coeficientes de variacin.
3.Se realiz una encuesta en viviendas que dan alojamiento en el
Cuzco sobre el nmero de habitaciones por vivienda, y se obtuvo la
siguiente informacin:2 3 4 3 2 3 4 2 3 3 3 2 2 2 2 4 4 2 3 3 5 3 4
5 2 3.Calcular las diferentes medidas de tendencia central y de
variacin. Interprete los resultados.
4.Los siguientes datos corresponden al nmero de pasajeros que salen
del pas durante 30 das del mes de Julio del 2008:35 38 30 32 39 40
42 45 43 37 38 30 39 38 31 37 32 38 35 39 33 32 36 37 39 40 40 33
31 35
Calcular las diferentes medidas de tendencia central y de variacin.
Interprete los resultados.
5.Una cadena de restaurantes de comidas rpidas contrat los
servicios de una empresa de televisin para que pasen sus anuncios
publicitarios, obteniendo los siguientes resultados:
Nmero de veces que la persona observa el aviso01234Nmero de
personas3205401300600380
Calcular las diferentes medidas de tendencia central y de variacin.
Interprete los resultados.
6.En la siguiente tabla se ha registrado los aos de antigedad de
una muestra de automviles de los profesores y administrativos de la
Universidad.
Antigedad[02>[24>[46>[68>[810>[1012]Autos de
prof.1015121085Autos de adm.31015201810
Calcular las diferentes medidas de tendencia central y de variacin
para cada una de las distribuciones de frecuencias. Interprete los
resultados. As mismo, compare la variabilidad relativa entre las
dos distribuciones.
7.Un analista realiz un estudio de 50 empresas sobre los gastos
semanales (en dlares) en propaganda turstica. La informacin que
obtuvo fue la siguiente:
2230 1290 2500 3200 3150 3560 3860 3760 3490 4520 4020 4100 4080
4200 3550 2800 2990 3000 3600 4180 4000 2800 2770 2990 2400 2670
2800 2950 2840 2960 3020 3100 3500 3600 4200 4350 2900 3250 3780
3600 3450 3800 3900 3780 2770 3120 3200 2900 3500 3800
Elabore primero una tabla de distribucin de frecuencias y luego
calcule las medidas de tendencia central y de variacin. Interprete
los resultados.
8.La siguiente informacin seala el tiempo de vida til (en miles de
horas) de 80focos de luz de100 watts.
670 340 530 450 470 520 680 730 610 550 650 620 540 410 590 260 580
820 740 410 700 380 500 360 670 320 630 520 620 350 340 740 530 510
550 480 600 760 510 350 440 330 450 610 530 210 680 850 600 420 430
280 560 790 840 490 820 220 620 550 720 680 400 370 650 730 570 390
460 570 560 600 450 560 750 400 510 700 740 760
Elabore primero una tabla de distribucin de frecuencias y luego
calcule las medidas de tendencia central y de variacin. Interprete
los resultados.
9.El tiempo que 30 operarios demoraron en ejecutar una tarea fue
registrados en minutos, obtenindose:
7.0 9.0 11.47.210.2 13.5 17.0 14.0 14.5 8.09.1 9.413.1 8.510.415.5
12.0 11.0 11.29.6 9.2 9.515.6 8.4 10.8 13.0 12.5 12.4 10.5
7.8
Elabore primero una tabla de distribucin de frecuencias y luego
calcule las medidas de tendencia central y de variacin. Interprete
los resultados.