8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
1/88
Federico Villarreal
U n i v e r s i d a d N a c i o n a l
GUÍA ACADÉMICA INTRODUCCIÓN A LA ESTADÍSTICA
PARA ECONOMISTAS
ECONOMÍA CICLOIII
Euded
Escuela Universitaria
Educación a distancia
ECON. EDWARD HUAMANI ALHUAY
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
2/88
2
INDICE
PRESENTACIÓN 04INTRODUCCIÓN A LA ASIGNATURA 05ORIENTACIONES GENERALES DE ESTUDIO 06
TUTORÍAS 07CRONOGRAMA 07EVALUACIÓN 08MEDIOS Y RECURSOS DIDÁCTICOS 09OBJETIVOS GENERALES 10
UNIDAD 1 CONCEPTOS GENERALES Y SISTEMATIZACIÓN DE DATOS 11
Tema 1: Conceptos Generales de Estadística 121.1. La estadística 121.2. Clases de estadística 121.3. Población 13
1.4. Muestra 131.5. Parámetro y Estadígrafo 141.6. Variables 141.7 Sumatorias 16
Tema 2 Sistematización de Datos en Tablas de Frecuencias 172.1. Tabla de Distribución de Frecuencias 172.2. Tabla de Frecuencias de una Variable Cualitativa 182.3. Tabla de Frecuencias de una Variable Cuantitativa Discreta 192.4. Tabla de Frecuencias de Variables Cuantitativas agrupadas en intervalos 20
Tema3 Representaciones Gráficas 223.1. Gráficos Estadísticos 223.2. Partes de un gráfico 223.3. Clasificación de los gráficos 22
ACTIVIDADES 25 AUTOEVALUACIÓN N°1 27
UNIDAD2 MEDIDAS DESCRIPTIVAS NUMERICAS 28
Tema 4 Medidas de Tendencia Central 294.1. Concepto y Clasificación 294.2. Media Aritmética 294.3. Moda 304.4. Mediana 324.5. Comparación entre la media, moda y mediana 34
Tema 5 Medidas de Dispersión 355.1. Concepto y Clasificación 35
5.2. Rango 355.3. Varianza y Desviación Estándar 365.4. Coeficiente de variación 38
ACTIVIDADES 39 AUTOEVALUACIÓN N°2 41
UNIDAD3 DISTRIBUCIONES BIDIMENSIONALES 42
Temas 6 Distribuciones Bidimensionales 436.1. Definición 43
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
3/88
3
6.2. Tablas Estadísticas Bidimensionales 446.3. Distribuciones Marginales 456.4. Frecuencias Relativas 466.5. Grafico Bidimensional 48
Tema 7 Medidas Estadísticas Bidimensionales 497.1. Mediciones Marginales 49
7.1.1 Medias Marginales de X e Y 497.1.2 Varianzas Marginales de X e Y 497.1.3 Desviaciones Estándar Marginales de X e Y 507.1.4 Covarianza Entre X e Y 50
7.2. Distribuciones condicionadas 52Tema 8 Análisis de Correlación y Regresión 54
8.1. Análisis de Correlación 548.1.1 Tipos de correlación 548.1.2 Diagrama de dispersión 548.1.3 Coeficiente de Correlación 558.1.4 Niveles de correlación 56
8.2. Análisis de regresión 568.2.1 Regresión Lineal simple 578.2.2 Recta de mínimos cuadrados 578.2.3 Coeficiente de Determinación 58
ACTIVIDADES 59 AUTOEVALUACIÓN N°3 61
UNIDAD4 PROBABILIDADES, SERIES DE TIEMPO Y NUMEROS INDICES 62
Tema 9 Introducción a las Probabilidades 639.1. Probabilidades y eventos 639.2. Experimento aleatorio 639.3. Espacio muestral y eventos 649.4. Técnicas de conteo 649.5. Concepto clásico de probabilidad 65
9.6. Probabilidad Condicional 669.7. Teorema de Bayes 68Tema 10 Análisis de Series Temporales 69
10.1. Definición 6910.2. Importancia de las Series de Tiempo 7010.3. Componentes de una serie cronológica 7010.4. Análisis de Series de Tiempo 7210.5. Estudio de la Tendencia 72
Tema 11 Números Índices 7711.1. Definición 7711.2. Clasificación de Números Índices 7711.3. Números Índices Simples 7811.4. Números Índices Compuestos 79
11.5. Índices Compuestos no ponderados 7911.6. Índices Compuestos ponderados 80 ACTIVIDADES 82 AUTOEVALUACIÓN N°4 84SOLUCIONARIO DE AUTOEVALUACIONES 85
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
4/88
4
PRESENTACIÓN
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
5/88
5
INTRODUCCIÓN A LA ASIGNATURA
El seguimiento de una economía se basa habitualmente en mediciones o indicadores que
recogen distintos aspectos de la actividad económica de un país o región, estos indicadores
permiten hacer comparaciones y análisis más complejos partiendo de un conjunto de datosbien recolectados y organizados como por ejemplo una encuesta de hogares para conocer el
nivel económico de los habitantes. Ese proceso se logra mediante técnicas estadísticas que
proporcionan justamente herramientas de recolección, clasificación, organización y análisis de
datos que ayudaran en la toma de decisiones por medio de los indicadores hallados.
El contenido del presente manual se caracteriza primero por la exposición del método
estadístico, sus características y alcance de fenómenos a los cuales son factibles de analizar y
segundo la aplicación del método mediante técnicas con el análisis e interpretaciones
correspondientes. Con lo cual se hace una aportación con ejercicios aplicativos usando la
bondad del método estadístico aplicado a la empresa y la economía en general, cuya
transmisión resultará rápida y atractiva para el estudiante.
Para un mejor aprovechamiento se ha dividido la presente guía en 4 unidades: Unidad I trata
sobre Conceptos generales y sistematización de datos mediante tablas y gráficos, en la Unidad
II se calculan Medidas descriptivas de Tendencia Central y Dispersión más utilizadas, en la
Unidad III se analizan distribuciones bidimensionales así como la correlación y regresión entre
dos variables y en la Unidad IV se hará una introducción a las probabilidades y se analizaranseries temporales y números índices.
En general, el análisis estadístico de cualquier problema económico requiere en una primera
etapa determinar los objetivos y el colectivo informante. A lo largo de este manual se
introducirán los conceptos básicos vinculados a esta fase inicial de un estudio estadístico.
Asimismo se ofrecerá una panorámica de los principales organismos y fuentes que
proporcionan información estadística y se estima que resultara de gran ayuda el poder aplicar
los principales métodos estadísticos en el análisis de la economía y los negocios.
Mg Edward F Huamani Alhuay
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
6/88
6
ORIENTACIONES GENERALES DE ESTUDIO
Estimados participantes:
La razón de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situación geográfica no son compatibles con la formación
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad académica igual o
superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se
apoyan en la más moderna tecnología informática y de comunicaciones (aulas virtuales) que
permiten un alto grado de interacción y orientación del profesor y una elevada interrelación
entre los estudiantes.
En las aulas virtuales de la Escuela Universitaria de Educación a Distancia, nuestros
estudiantes encontrarán, además de la información detallada del programa, los materiales de
estudio, la agenda de actividades propuestas por los profesores y todas las herramientas de
comunicación que permitirán el desarrollo dinámico del curso. Para comprender y asimilar
adecuadamente el material didáctico del curso, se recomienda lo siguiente:
Leer, estudiar y trabajar el material didáctico diariamente. Es preferible una hora diaria
durante siete días consecutivos, que 10 horas en un solo día. Las claves del éxito son
continuidad y constancia. Organizar el tiempo de estudio según las propias condiciones, dificultades y necesidades
de trabajo; en caso contrario el plan de estudios no se cumplirá.
Leer varias veces el material y después comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resúmenes, cuadros sinópticos, etc.
Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las
actividades que tiene en su Texto como en su Guía Académica.
Estudiar en un lugar donde se sienta cómodo para realizar las lecturas y hacer sus tareas.
En lo posible un lugar con claridad y libre de ruido.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
7/88
7
TUTORÍAS
Las tutorías se desarrollarán mediante la programación de un calendario de tutorías. La tutoría
será presencial y virtual.
CRONOGRAMA
TUTORÍAS PRESENCIALES
Y VIRTUALES
CANTIDAD DE HORAS ACADÉMICAS
HORAS
PRESENCIALES
HORAS
VIRTUALES
PRIMER MES
Semana 1 2 2
Semana 2 2 2
Semana 3 2 2
Semana 4 2 2
SEGUNDO MES
Semana 5 2 2
Semana 6 2 2
Semana 7 2 2
Semana 8 2 2
TERCER MES
Semana 9 2 2
Semana 10 2 2
Semana 11 2 2
Semana 12 2 2
CUARTO MES
Semana 13 2 2
Semana 14 2 2
Semana 15 2 2
Semana 16 2 2
TOTAL32 32
64 HORAS ACADÉMICAS
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
8/88
8
EVALUACIÓN
El promedio final de la asignatura de Estadística en la Modalidad Presencial – Virtual se
obtiene aplicando los siguientes pasos porcentuales:
Evaluación de trabajos académicos presenciales (TA): (40%) Evaluación de participación en interacción virtual (IV): (20%).
Evaluación final (EF): (40%).
PF = TA (0,4) + IV (0,2) + EF (0,4)
El promedio final en la Modalidad Virtual se obtiene aplicando la siguiente ponderación
porcentual:
Evaluación de trabajos académicos virtuales (TA): (40%)
Evaluación de participación en interacción virtual (IV): (20%)
Evaluación final en línea (EF): (40%)
El estudiante que abandona la asignatura tendrá promedio 00 (cero) en el acta final,
debiendo registrar nuevamente su matrícula.
Se consideran como parte de criterios de evaluación la aplicación de un examen
parcial virtual en la 8° semana del ciclo, un examen final presencial y la presentación
de un trabajo monográfico en la 16° semana del ciclo.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
9/88
9
MEDIOS Y RECURSOS DIDÁCTICOS
(Unidad I,II) Consultar los siguientes textos y enlaces:
PÉREZ, Rigoberto. Introducción a la Estadística Económica,
Universidad de Oviedo. España 2012
NEWBOLD, Paul. Estadística para Administración y Economía,Prentice Hall. Universidad de Alcalá 2008
DIAZ. Estadística Aplicada a la Administración y la Economía.Editorial Mcgraw-Hill México 2010
MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Perú2013
Referencias electrónicas http://www2.ulpgc.es/hege/almacen/download/25/25022/estadstica
itemav.pdf http://www.fuenterrebollo.com/Economicas2013/unidimensional-
ejercicios.pdf http://herzog.economia.unam.mx/profesor/barajas/estadis/parte1.p
df
(Unidad III-IV) GUJARATI, Damodar. Econometría Básica. Editorial Mcgraw-Hill Latinoamericana S.A. Brazil 2008
CASTILLO. Estadística Descriptiva y Cálculo deProbabilidades. Editorial Pearson. España 2009
MOYA, Rufino. Probabilidades e Inferencia Estadística.Editorial San Marcos. Perú 2012
Referencias electrónicas: http://www2.ulpgc.es/hege/almacen/download/25/25022/estad
sticaitemav.pdf http://pendientedemigracion.ucm.es/info/amanece/oferdocs/TA
SAS.pdf
Textoscomplementarios IBM. Manual de Usuario del Sistema Básico de IBM SPSS
Statistics 21. IBM Corporation, EE. UU. 2012
CARRASCAL, Urcisino. Estadística descriptiva con MicrosoftExcel.Editorial Alfaomega. España 2010
Plataformavirtual Herramientas a emplearse en plataforma virtual:
Foros, tareas, chat
Enlaces, videos, examen, páginas entre otros
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
10/88
10
OBJETIVOS
GENERALES
Determinar e identificar los instrumentos para el estudio de la estadística
mediante los conceptos previos así como la sistematización y resumen de datos
cualitativos y cuantitativos unidimensionales realizando un análisis crítico
descriptivo e interpretativo de los resultados
Calcular e interpretar las medidas descriptivas de tendencia central y dispersiónmediante fórmulas establecidas, siendo capaz de resolver problemas aplicados en
economía así como el uso de las propiedades de medidas descriptivas
Analizar la dependencia y asociación de variables estadísticas mediante el uso de
modelos lineales y de medidas de asociación en el estudio de los fenómenos
económico-financieros.
Aplicar la teoría de la probabilidad en sucesos y eventos. Analizar Series de
Tiempo aplicados en economía así como la comparación de datos en distintos
momentos del tiempo usando número índices.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
11/88
11
Unidad
1
CONCEPTOS GENERALES YSISTEMATIZACIÓN DE DATOS
En esta primera unidad se definirá y explicará los primeros conceptos de Estadística y la
representación y resumen de datos cualitativos y cuantitativos unidimensionales realizando un
análisis crítico descriptivo e interpretativo de los resultados.
ontenido Temático
Tema I: Conceptos generales de estadística
Tema II: Sistematización de datos en tablas de frecuencia
Tema III: Representaciones gráficas
OBJETIVOS ESPECÍFICOS
Conocer los conceptos previos de población y muestra para su aplicación en la solución de
problemas así como diferenciar entre variables cualitativas y cuantitativas.
Sistematizar y organizar los datos en tablas de frecuencias por medio de los diversos
elementos que se utilizan en la distribución de frecuencias en datos no agrupados y datos
agrupados.
Presentar y analizar adecuadamente un conjunto de datos mediante gráficos estadísticos
con su correspondiente diseño e interpretación.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
12/88
12
Conceptos Generales deEstadística
1.7. La estadística1.8. Clases de estadística1.9. Población
1.10. Muestra1.11. Parámetro y Estadígrafo1.12. Variables1.13. Sumatorias
1.1. La Estadística
La Estadística es una ciencia que tiene por objeto recolectar, organizar, resumir,
presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A
través de la cuantificación y el ordenamiento de los datos intenta explicar los fenómenosobservados, por lo que resulta una herramienta de suma utilidad para la toma de
decisiones
1.2. Clases de Estadística
Estadística Descriptiva. Son métodos y técnicas de recolección, resumen y
presentación para describir apropiadamente las características de un conjunto de datos.
Comprende el uso de gráficos, tablas y criterios para el análisis y únicamente se limita a
realizar deducciones directamente a partir de los datos y parámetros obtenidos.
Estadística Inferencial. Son métodos y técnicas que hacen posible estimar una o más
características de una población o tomar decisiones sobre población basadas en el
resultado de muestras. Estas conclusiones tienen cierto margen de error. Apoyándose en
el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones,
decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
TEMA
1§
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
13/88
13
Podríamos por tanto decir que se usa estadística en descriptiva, cuando los resultados del análisis
no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es
derivar las conclusiones obtenidas a un conjunto de datos más amplio.
1.3. Población
Es el conjunto de unidades o elementos que presentan algunas características comunes,
que han sido escogidos para el estudio y que a partir de ellos se desea obtener la
información. El estudio de la población completa se llama censo y es con frecuencia
costoso, lleva mucho tiempo y no es práctico. Tiene las siguientes características:
Homogeneidad - que todos los miembros de la población tengan las mismas
características.
Tiempo - se refiere al período de tiempo donde se ubicaría la población de interés.
Espacio - se refiere al lugar donde se ubica la población de interés. Un estudio no
puede ser muy abarcador, hay que limitarlo a un área o comunidad en específico.
Cantidad - se refiere al tamaño de la población. La falta de recursos y tiempo también
nos limita la extensión de la población.
Ejemplos Total de amas de casa de Lima metropolitana en Abril del 2015
Total de proveedores de Supermercados Peruanos en el año 2014
La totalidad de Empresas pesqueras del Perú en el año 2013
1.4. Muestra
Es una pequeña porción representativa y adecuada de la población. Representativa, en el
sentido de reflejar fielmente las características de la población
de la cual procede y diferir de ella sólo en el número de
unidades incluidas.
Las razones para trabajar con muestras son: Ahorro de
tiempo, ahorro de dinero, facilidades operativas y rapidez en la
obtención de resultados.Ejemplos:
500 de amas de casa de Lima metropolitana elegidas al azar.
Un grupo de proveedores de Supermercados peruanos escogidos aleatoriamente.
15 empresas pesqueras del Perú escogidas en forma aleatoria.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
14/88
14
Unidad de Análisis. Son cada uno de los elementos de la población que mediante las técnicas de
muestreo van a ser seleccionados para constituir la muestra
Dato. Valor asociado con un elemento de la población o muestra. Puede ser un número, una palabra
o un símbolo.
1.5. Parámetro y Estadígrafo
Parámetro. Es una medida de resumen que para determinar su
valor es necesario utilizar la información de la población
completa y por lo tanto las decisiones se tomaran con
certidumbre total.
Estadígrafo. Es una medida que se calcula con los datos de la
muestra. Los estadígrafos se usan para hacer inferenciasacerca de los parámetros de la población.
1.6. Variable
El término variable se utiliza para referirse a cualquier característica, que toma valores
diferentes en un conjunto de observaciones extraídos de una población en estudio. Es
todo aquello que puede ser medido, observado o manipulado durante un estudio. A
las variables se les denota con las letra: x, y, z
Ejemplo: marca de un producto, factura mensual de
electricidad, número de clientes, genero de una
persona, etc.
Los datos son los valores que adoptanlas variables en cada caso particular
Clasificación de las Variables
Según su naturaleza: Variables Cualitativas y cuantitativas
Según su posición en una relación causal: dependientes e independientes
Parámetros más conocidos
Media poblacional
Varianza poblacional2
Proporción poblacional P
Estadígrafos más conocidos
Media muestra x
Varianza muestral2 s
Proporción muestral p
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
15/88
15
A. Según su Naturaleza
A1. Variables Cualitativas. Llamadas también no numéricas, son variables cuyos
valores consisten en categorías de clasificación y responde a una cualidad o atributo.
No es posible realizar operaciones algebraicas con ellas.
Ejemplo: género, calidad de un producto, tipo de teléfono celular, etc.
Las variables cualitativas a su vez pueden clasificarse en:
Variables cualitativas Nominales. Son aquellas que comprenden solo
categorías de clasificación y no llevan ninguna ordenación Ejemplo: tipo de
empleo, marca de un producto, carrera que uno
sigue, partido político al que voto, tipo de crédito
bancario que uno solicita, etc.
Variables cualitativas Ordinales. Cuando lascaracterísticas no solo comprenden categorías
de clasificación sino que llevan alguna
ordenación. Ejemplo: satisfacción con el
servicio, grado de instrucción, jerarquía
gerencial, clase social, el nivel de desempeño,
calidad de un material, etc.
A2. Variables Cuantitativas. Son características cuyos valores pueden ser obtenidos
por medición o por conteo y a su vez pueden ser clasificadas en: Variables cuantitativas discretas. Cuando las variables toman valores
enteros y son obtenidos por conteo. Ejemplo: Número de tarjetas de crédito
que se posee, cantidad de entidades bancarias por distrito, número de
empleados por área, número de empresas por sector, etc.
Variables cuantitativas continuas. Son aquellas que
pueden tomar cualquier valor (entero, fraccionario o
irracional) dentro un intervalo. Sus valores se obtienen
principalmente a través de mediciones y están sujetos
a la precisión de los instrumentos de medición.
Ejemplo: la superficie de un terreno, la estatura de un
individuo, los sueldos de los congresistas, el costo
efectivo de un producto, el PBI anual, el monto de
exportaciones e importaciones, etc.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
16/88
16
B. Según su posición en una Relación Causal
B1. Variable Independiente. Es aquella que no depende de otras y afecta a otras
variables. Son las características controladas por el
investigador y que afecta o influye a la variable
dependiente
B2. Variable Dependiente. Recibe la influencia o efecto de
la variable independiente. También se le llama variable
respuesta y cumple el papel de efecto causa.
Ejemplo: El clima organizacional de una entidad influye en
el rendimiento y desempeño de los gerentes. De este enunciado identifica:
Variable independiente: Clima organizacional
Variable dependiente: rendimiento humano
1.7. Sumatorias
La suma de los valores de la variable X :1 2, ,.........,
n x x x se define mediante la
notación
que indica que han de sumarse los elementos de la sucesión desde el
subíndice 1i hasta el subíndice i n , esto es:
1 2
1
......... n
i n
i
x x x x
Ejemplo: sean los gastos en alimentos de un ama de casa en 6 días de la semana: i 1 2 3 4 5 6
i x 30 45 36 52 40 50
Calcular la siguiente sumatoria:
2 3 4 5
5
2
45 36 52 40 173i
i
x x x x x
Propiedades:
a)
1 1
n n
i i
i i
cx c x
, para todo constante c
b)1 1 1
n n n
i i i ii i i
x y x y
c)1 1 1
n n n
i i i ii i i
x y x y
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
17/88
17
Sistematización de Datos enTablas de Frecuencias
2.1. Tabla de Distribución de Frecuencias2.2. Tabla de Frecuencias de una Variable Cualitativa2.3. Tabla de Frecuencias de una Variable Cuantitativa
Discreta2.4. Tabla de Frecuencias de Variables Cuantitativas
agrupadas en intervalos
2.1. Tabla de Distribución de Frecuencias
Efectuados la clasificación y el conteo de los datos, es necesario presentarlos de manera
clara, sintética y significativa para su mejor y fácil entendimiento. Para ello se recurre a la
tabla de distribución de frecuencias. Una Tabla de distribución de frecuencias de una
variable es una descripción del número de veces, es decir, de las frecuencias con que se
presentan las diversas categorías mutuamente excluyentes que corresponden a esa
variable. Es un arreglo de los valores observados1 2, , .....,
k x x x de la variable x con sus
respectivas frecuencias, en una tabla de la forma:
Tabla N° 1
Variable (xi) f i F i hi H i
X 1 f 1 f 1 h1=n1 /n h1
X 2 f 2 f 1+f 2 h 2=n 2 /n h1+h 2
… …. …. …. ….
X k f k f 1+f 2+….+n k h k=n k /n h1+h 2+….+h k
Total
1
k
i
i
n
1
1 k
i
i
h
Frecuencia Absoluta Simple ( i ), es el número de veces que aparece repetido el valor
o cualidadi
x , y se cumple que:1
k
i
i
f n
Frecuencia Absoluta Acumulada ( i
F ), Es la que resulta de sumar sucesivamente las
frecuencias absolutas, así tenemos: 1
i
i k
k
F f
TEMA
2§
PROPIEDAD: la suma de todas las frecuenciasabsolutas es igual al total de observaciones (n).
PROPIEDAD: La última frecuencia acumuladaabsoluta es igual al total de observaciones.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
18/88
18
Frecuencia Relativa Simple ( i
h ), es aquella que resulta de dividir cada una de las
frecuencias absolutas entre el número total de datos. Sus valores son números reales
que oscilan entre 0 y 1. Se denota por:
ii
f h n ; 0 1i h
Frecuencia Relativa Acumulada ( i
H ), es igual al cociente entre la frecuencia absoluta
acumulada y el número de observaciones realizadas ( n ), o también es la que resulta de
sumar sucesivamente las frecuencias relativas. Se denota por:
1
i
ii k
k
F H h
n
2.2. Tabla de Frecuencias de una Variable Cualitativa
Se usa para clasificar variables cualitativas.
Ejemplo: Un grupo de clientes valora la gestión del
departamento de servicio al cliente de un supermercado
catalogándolo como: Excelente (E), Bueno (B), Regular (R) o
Malo (M). Los resultados obtenidos son:
E B B R E B E BM B E B R B E R
R R M B B E B M
E M E R R R B R
B B E R R M B E
Organice los datos en una tabla de distribución de frecuencias:
Tabla N° 2
Distribución de clientes según su valoración de la Gestión de
Calidad del departamento del servicio al clientePreferencia f i Fi hi H i
Excelente 10 10 0.25 0.25 Buena 14 24 0.35 0.60 Regular 11 35 0.28 0.88 Mala 5 40 0.13 1.00
Total 50 1
PROPIEDAD: la suma de todas las frecuencias
relativas es igual a la unidad.
PROPIEDAD: La última frecuencia relativaacumulada es la unidad.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
19/88
19
Interpretación:
f 3: 11 clientes opinaron que la gestión del departamento fue regular
F2: 24 clientes opinaron que la gestión del departamento fue de buena a excelente
h1: El 25% de clientes opinaron que la gestión del departamento fue excelente
H3: El 88% de clientes opinaron que la gestión fue de regular a excelente
2.3. Tabla de Frecuencias de una Variable Cuantitativa Discreta
Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes
valores que toman las variables.
Ejemplo: Se preguntó a 40 empleados de una empresa acerca del
número de tarjetas de crédito que tienen afiliadas a un banco. Sus
respuestas se encuentran a continuación
1 3 1 1 1 2 4 2 1 12 2 4 1 2 3 1 2 5 14 3 5 1 1 1 2 1 2 22 4 3 1 2 1 1 2 3 3
Tabla N° 3
Distribución de empleados según el número de tarjetas de crédito que
poseen en el banco
N° de Tarjetas decrédito
f i Fi hi H i
1 16 16 0.40 0.4 2 12 28 0.30 0.7 3 6 34 0.15 0.85 4 4 38 0.10 0.95 5 2 40 0.05 1
Total 40 1.00
Interpretación:
f 3:6 empleados poseen 3 tarjetas de crédito
F2: 28 empleados poseen menos de 3 tarjetas de crédito
H3: 85% de empleados poseen menos de 4 tarjetas de crédito
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
20/88
20
2.4. Tabla de Frecuencias de Variables Cuantitativas agrupadasen intervalos
Son aquellas que se utilizan para agrupar datos cuantitativos mediante intervalos de
frecuencias llamados intervalos de clase. Para construir la tabla con intervalos de clase se
debe seguir los siguientes pasos:
Paso1: Rango (R). Llamado también “recorrido de los datos”, es la diferencia entre el
valor máximo y el valor mínimo de la variable. Consideremos las siguientes variables
1 2 3, , , ......,
n y y y y , entonces:
max min R Y Y
Ejemplo: Los siguientes datos corresponden al tiempo en minutos que han necesitado
16 clientes de un banco para llevar a cabo una transacción bancaria:
5.3 2.4 2.1 1.2 1.3 1.4 5.5 1.6
2.0 2.5 1.1 2.8 3.1 2.8 3.6 4.1
Notamos que el tiempo mayor es 5.5 min y el tiempo menor es 1.1 min; El rango es
R= 5.5-1.1= 4.4
Paso2: Número de intervalos de clase ( m ). Consiste en dividir el rango en un
número conveniente de intervalos de clase. El número de intervalos depende
principalmente del número de observaciones, sin embargo es recomendable que no
sea menor que 5 ni mayor de 15 intervalos. Para determinar el número de intervalos
usaremos la fórmula de Sturges: 1 3.32 og m L n
Si m es decimal, entonces se redondeará al entero superior inmediato.
Ejemplo: Si 40 n entonces 1 3.32 og 40 6.32 m L , redondeando 7 m
Si 100 n entonces 1 3.32 og100 7.64 m L , redondeando 8 m
Paso3: Amplitud de Clase ( c ). Es el tamaño o longitud que deben tener los
intervalos; se recomienda tener intervalos del mismo tamaño. Se calcula mediante la
formula: R
c
m
Marca de clase ( i
y ). Es la semisuma entre el límite superior y el límite inferior del
intervalo de clase. Sea el intervalo I S L L entonces2
I Si
L L y
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
21/88
21
Ejemplo: El Boston Bank verificó el estado de la cuenta de 42 clientes tomados al azar y
obtuvo los siguientes datos de sus saldos (en dólares)
271 337 319 363 279 177 232429 235 123 294 227 295 250
205 159 240 310 199 363 285459 170 320 309 279 434 325278 41 181 116 297 162 303188 294 335 266 100 131 200
Construye una tabla de frecuencias adecuada para esta información e interprete.
Pasos:
Vmin= 41 Vmax=459
Rango : R = 459 – 41 =418
N° de intervalos : m= 1+3.32*log(42)= 6.4= 7 Amplitud de intervalo: c= 418/7=59.7 =60
Se construirá una tabla de frecuencias con 7 intervalos y amplitud constante de 60.
Tabla N° 4
Distribución de clientes según saldos que tienen en sus cuentas del
Boston Bank
Li -
Ls
Y i f i Fi hi H i
41 - 101 71 2 2 0.05 0.05
101 - 161 131 4 6 0.10 0.14
161 - 221 191 8 14 0.19 0.33
221 - 281 251 10 24 0.24 0.57
281 - 341 311 13 37 0.31 0.88
341 - 401 371 2 39 0.05 0.93
401 - 461] 431 3 42 0.07 1.00 Total 42 1
Interpretación:
f 3: 8 clientes tienen un saldo mínimo de $161 pero menos de $221
F4: 24 clientes tienen en sus cuentas un saldo menor a $281
h5: 31% de clientes tienen un saldo mínimo $281 pero menos de $341
H3: ___________________________________________________________________
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
22/88
22
Representaciones Gráficas3.1. Gráficos Estadísticos3.2. Partes de un gráfico3.3. Clasificación de los gráficos
Gráfico de Barras Polígono de frecuencias
Gráfico Circular Gráfico de OjivasGráfico Lineal Gráfico BidimensionalHistogramas
3.1. Gráficos Estadísticos
Los gráficos estadísticos son aquellas imágenes que, combinando la utilización de
sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de
coordenadas permiten presentar información cuantitativa, con el fin de obtener una
impresión visual global del material presentado, que facilite su rápida comprensión.
3.2. Partes de un gráfico
Los gráficos son una herramienta estadística que detecta la variabilidad, consistencia,
control o mejora de un proceso y consta de las siguientes partes:
• El título principal
• Título secundario o subtítulo
• El gráfico propiamente dicho
• Fuente
• Las notas explicativas
• Interpretación
Interpretación: En el Perú la exportación de langostinos tiene una tendencia creciente
desde 2002 hasta el 2013.
3.3. Clasificación de los gráficos
Gráfico de Barras Polígono de frecuencias
Gráfico Circular Gráfico de Ojivas
Gráfico Lineal Gráfico Bidimensional
Histogramas
TEMA
3§
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
23/88
23
3.3.1. Gráfico de Barras. Este diagrama
representa los valores de la variable en el
eje de abscisas levantando en cada punto
una barra de longitud igual a la frecuencia
de ese valor. El ancho de las barras ha de
ser el mismo y las divisiones de la escala,
equitativas.
3.3.2 Grafico Circular . Consiste en dividir
un círculo en tantas porciones como clases
existan, de modo que a cada clase le
corresponde un sector circular proporcional
a su frecuencia absoluta o relativa. Se
utiliza para cualquier tipo de variable,
especialmente cuando las frecuencias
están expresadas en porcentajes. Siempre
va acompañado de una leyenda.
3.3.3 Gráfico lineal. Este diagrama es
utilizado frecuentemente para mostrar
los cambios de los valores de una
variable con el paso del tiempo. Conjuntode puntos unidos por segmentos de
líneas. Por lo general esta gráfica se
utiliza para mostrar una tendencia
3.3.4 Histogramas. Es una representación
gráfica de una distribución de frecuencias
agrupadas en intervalos de clase, mediante una
serie de rectángulos contiguos. Su gráfica se
realiza entre: (Intervalos vs f i) e (Intervalos vs hi)
Ejemplo: En una muestra de 51 restaurantes de
la ciudad a los cuales se les consultó los precios
de sus platos (en nuevos soles), se obtuvo el
histograma respectivo.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
24/88
24
3.3.5 Polígonos de Frecuencias. Este
diagrama consiste en una serie de
segmentos de recta que unen los puntos
cuyas abscisas son los valores de la
variable, o las marcas de clase, en el
caso de variables continuas, y cuyas
ordenadas son proporcionales a sus
frecuencias respectivas.
3.3.6 Gráfico de Ojivas. Su objetivo, al
igual que el histograma y el polígono de
frecuencias es representar distribuciones de
frecuencias de variables cuantitativas
continuas, pero sólo para frecuencias
acumuladas.
3.3.7 Gráfico Bidimensional.
Permiten representar las series de
datos en dos dimensiones o sea los
valores se representan alineados en
dos ejes perpendiculares: el eje
horizontal X y el eje vertical Y. Son
aplicaciones estadísticas al estudio
en conjunto de dos variables
cualitativas.
4.6%
66.0%
29.5%
5.6%
65.2%
29.1%
6.2%
68.3%
25.4%
0.0%
10.0%
20.0%
30.0%
40.0%
50.0%
60.0%
70.0%
Pobre
extremo
Pobre no
extremo
No pobre
Distribución de los hogares en el área urbana según supercepción del nivel de vida de los hogares de su
localidad y nivel de pobreza
Mejoró
Está igual
Empeoró
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
25/88
25
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD1
1. Una empresa dedicada a la producción de ciertos artefactos eléctricos está conformada por 120empleados encargados de ventas. El Gerente desea realizar una proyección de las ventas para lospróximos años y para lograr esto considerará la cantidad de artefactos vendidos en los últimosmeses por 34 empleados escogidos de la empresa. Responda lo siguiente:
a) ¿Cuál es la población y cuál es la muestra?
b) Cual es la variable analizada y su tipo
c) Identifique la estadística y proporcione su valor.
c) Identifique el parámetro de interés e indique su valor
2. Clasificar adecuadamente las diversas variables con un aspa (X):
Nº VARIABLECUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 El monto ahorrado de una persona
2 La altura de los edificios bancarios
3 Situación laboral de un individuo
4 El número de personas sin vivienda
5 El municipio de ubicación de una empresa
6 El desempeño de un economista
7 El Nivel socioeconómico alcanzado
8 Número de empleados por empresa
9 El sector industrial de una empresa
10 El costo de las materias primas
3. Considere la siguiente situación. En una gran compañía, se está desarrollando un programa paraofrecer a los trabajadores una prestación que les permita adquirir un automóvil nuevo a un costomoderado tanto para el trabajador como para la empresa. Sin embargo, el contrato de arrendamientoimplica decidir qué tipo de automóvil prefieren los trabajadores, pues en función de esto se podráseleccionar la mejor empresa arrendadora. El gerente de recursos humanos realiza un muestreoaleatorio simple en la nómina de la empresa: selecciona 60 trabajadores sin importar los niveles, y lesaplica una encuesta en la cual les pregunta cuál sería la marca de su preferencia. A continuación sepresentan los resultados.
FORD = F CHEVROLET = CH MAZDA = M VOLKSWAGEN = V NISSAN = NOTROS = O.
F CH CH F M CH F CH CH O
V F N CH CH CH F CH V VN CH CH N M M O V F F
CH CH N F CH V V V CH VM V CH CH V N O V F M
CH V V M CH CH CH O V M
a) Construya una tabla de Distribución de Frecuencia para dichos datos.
b) Interprete las siguientes frecuencias:3
;2
F ;4
h ;3
H
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
26/88
26
4. Construye la taba de frecuencias en base a la información dada a continuación:
i X Precio de productos
312 f
20.40 H
210.5 X
10.08 h 50
i n
418.5 X
40.36 h 4 m
5. Se desea realizar un estudio acerca de los gastos mensuales que efectúan los docentes de laUniversidad Villarreal al estudiar un doctorado, para lo cual se tienen los siguientes gastos en solesde 30 docentes elegidos al azar:
a) Construir la correspondiente tabla de distribución de frecuencias por intervalos.
b) Interpretar: F h H 3 4 6 5
; ; ;
c) ¿Qué porcentaje de docentes gastan más de S/.564?
6. La empresa SILICON.COM es creadora de software a medida para los Bancos. Al igual que encualquier negocio, es importante el tiempo que demoran los clientes para pagar sus facturas. Acontinuación se presentan los tiempos en días de una muestra de facturas de esa compañía:
X=Tiempoi
y i
i F
i h
i H
[ - 23 7
[ - 31 20
[ - 16
[ -
[ - ] 60 0.15
Total
a) Completar la tabla de frecuencias b) Interpretar:3 3
; H
7. Este histograma representa el número de artículos vendidos en una tienda en una semana,clasificados según su precio en euros…
a) Construye la tabla de frecuencias.b) ¿Qué grupo de artículos tuvo mayor venta?
567 559 564 570 564 558
551 568 574 558 563 569
560 578 550 572 569 571
559 558 553 557 556 561
575 565 564 558 563 570
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
27/88
27
AUTOEVALUACIÓN N° 11. En una encuesta publicada en el diario EL COMERCIO se preguntó a 2013 adultos lectores: “¿Qué
tan satisfecho está usted con la economía peruana en la actualidad?” (El comercio, 12 de diciembrede 1997). Las categorías de las respuestas eran Insatisfecho, Satisfecho y No estoy seguro.Determine:
a) Objetivo del problema _____________________________________________________________b) Variable y tipo ___________________________________________________________________
c) Población _______________________________________________________________________
d) Muestra ________________________________________________________________________
e) Parámetro ______________________________________________________________________
2. Marca un aspa (X) identificando el tipo de variable
Nº VARIABLE CUALITATIVA CUANTITATIVANOMINAL ORDINAL CONTINUA DISCRETA
1 Marcas de cerveza de las tiendas2 N° de pedidos ingresados al sistema
3 Los interés ganados por un préstamo4 El nivel de audición de un individuo5 Opinión sobre la economía actual
3. Los productores del programa televisivo PROMOVIENDO hicieron un estudio sobre los puntos derating por día que tiene el programa. Como resultado se obtuvo la siguiente tabla para n de días:
Puntos de Ratingi
y i
f i
F i
h i
H
[ - 0.10
[ - 11
[ - 26 0.16
[ - 15
[ - [ - ] 4 50TOTAL
a) Completar la tabla de distribución si C= 8
b) Interpretar 3
F ________________________________________________________________
c) ¿En cuántos días se obtuvieron por lo menos 34 puntos de rating? _______________________d) Construya un polígono de frecuencias
4. Analiza Interpreta el siguiente gráfico estadístico acerca de la producción nacional:
________________________________________
________________________________________ ________________________________________
________________________________________
________________________________________
________________________________________
________________________________________
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
28/88
28
Unidad
2
MEDIDAS DESCRIPTIVASNUMERICAS
En esta unidad el estudiante calculará las medidas descriptivas de tendencia central y
dispersión mediante fórmulas establecidas, siendo capaz de resolver problemas aplicados en
economía así como el uso de las propiedades de medidas descriptivas.
ontenido Temático
Tema IV: Medidas de Tendencia central
Tema V: Medidas de Dispersión o Variabilidad
OBJETIVOS ESPECÍFICOS
Calcular e interpretar los diferentes tipos de medidas de tendencia central para su
aplicación en distintos problemas de economía según se trate de datos agrupados y no
agrupados.
Identificar y calcular las medidas de dispersión que más se utilizan en la solución de
problemas con datos que presentan variación así como la interpretación y comparación
de la variabilidad de dos o más distribuciones de datos.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
29/88
29
Medidas de Tendencia Central4.1. Concepto y Clasificación4.2. Media Aritmética4.3. Moda4.4. Mediana
4.5. Comparación entre la media, moda y mediana
4.1. Concepto y Clasificación
Se denominan también medidas de centralización, son aquellos valores numéricos en
torno a los cuales se agrupan, en mayor medida, los valores de una variable e indican el
centro de la distribución de los datos, es decir es el valor representativo de estos. Las más
comunes son:
Media Aritmética
Mediana
Moda
4.2. Media Aritmética
La Media Aritmética o simplemente media es el estadígrafo de tendencia central mas
importante y comúnmente se le conoce como Promedio. La Media Aritmética se define
como el cociente de la suma de los valores de una variable entre el número deobservaciones o valores. Simbólicamente se denota con X
4.2.1 Calculo de la Media para Datos no Agrupados
Se calculará cuando se tiene un conjunto de “n” observaciones que no estan
agrupados en tablas de frecuencias. Se calcula con la siguiente formula:
1 1 2...........
n
ii
n X
X X X X
n n
Ejemplo: Sea una muestra del precio de 7 libros de economía: 73, 68, 59, 40, 81, 72 y
40. Calcula e interprete la media aritmética.
73 68 59 40 81 72 4061.86
7 X
TEMA
4§
Interpretación : El precio
medio de los libros de
economía es de S/. 61.86
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
30/88
30
4.2.2 Calculo de la Media para Datos Agrupados
Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luego
se calcula la media aritmética aplicando la fórmula:
1
n
i i
i
f y
x n
Ejemplo: A continuación se muestra la producción anual de caña azúcar en miles de
toneladas en 80 haciendas del departamento Lambayeque. Calcule la media
aritmética e interprete:
Producción
I S L L
i y i f i i f y
[5 12
8.5 10 85
[12 19
15.5 14 217
[19 26 22.5 28 630
[26 33
29.5 20 590
[33 40 36.5 8 292
TOTAL n =80 1814
Aplicando la formula se tiene:1814
22.6880
i i f y
x n
Interpretación: La producción anual media de caña de azúcar en las haciendas de
Lambayeque es de 22680 toneladas
4.3. Moda (Mo)
La moda es el dato que aparece más veces en un grupo. Es el valor que más se repite o el
que se presenta con mayor frecuencia en un conjunto de datos. La moda puede ser:
Donde:
f i= frecuencia absoluta
yi= Marca de clase
n = número de observaciones
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
31/88
31
4.3.1 Calculo de la Moda para Datos no Agrupados
Se ordenan los datos en forma creciente o decreciente y se ubica los valores que más
se repiten.
Ejemplo: Los datos de rendimiento por acción para una muestra de 8 empresas son
los siguientes: (Hallar la moda en los tres casos)
a) 2.2; 3.4; 2.1; 3.4; 2.2; 2.2; 1.8; 2.2 Mo= 2.2
b) 1.2; 2.5; 2.1; 2.4; 2.4; 2.4; 1.2; 1.2 Mo= 1.2 y 2.4
c) 1.9; 2.5; 2.3; 2.4; 1.4; 3.4; 2.2; 1.2 Mo= no existe moda
4.3.2 Calculo de la Moda para Datos Agrupados
Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luegose calcula la Moda aplicando la fórmula:
1
2 1
I j o M L c
Donde:
I L : Límite inferior de la clase modal
j
c : Amplitud del intervalo de la clase modal
1 1 j f
2 1 j j f f
j f : Frecuencia absoluta modal
1 j f
: Frecuencia absoluta anterior a la frecuencia modal
1 j f
: Frecuencia absoluta posterior a la frecuencia modal
Observaciones:
La moda se puede determinar en todos los dos tipos de variables cualitativas y
cuantitativas.
La moda tiene la ventaja de no ser afectada por valores extremos
Ejemplo: Calcule e interprete la moda de la la producción anual de caña azúcar en
miles de toneladas en 80 haciendas del departamento Lambayeque.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
32/88
32
Producción
I S L L
i y i f
[5 12
8.5 10
[12 19 15.5 14
[19 26
22.5 28
[26 33 29.5 20
[33 40
36.5 8
TOTAL n =80
Pasos:
Ubicamos primero la mayor frecuencia: 28 j
f
Luego la moda se encuentra en la clase 19 - 26, por lo tanto
19 I
L ; 28 j
f
; 1 14 j f ; 1 20 j f 7 j c
1 28 14 14 ; 2 28 20 8
1419 7 23 455
14 8. Mo
Interpretación: La producción anual que más se repite es 23455 Tm, lo que significa
que la mayoría de las haciendas producen esa cantidad.
4.4. Mediana (Me)
Es el valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma
cantidad de elementos, es decir la media se encuentre exactamente en el centro. La mitad
de los datos son menores que la mediana y la otra mitad son mayores.
4.4.1 Mediana de Datos no Agrupados
Para determinar la Mediana de n observaciones1 2, ,........., n x x x primero se ordenan
dichas observaciones descendentemente ó ascendentemente luego se ubica o se
calcula la mediana dependiendo de la cantidad de datos “n” si es par o impar:
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
33/88
33
Ejemplo1. (Cuando el nº de datos es impar)
17, 24, 20, 18, 22, 21, 24; Ordenando: 17, 18, 20, 21, 22, 24, 24 (n=7 impar)
7 14
2 Posicion
21 Me
Ejemplo2. (Cuando el nº de datos es par)
13 , 14, 7, 11, 15, 16, 12, 9 ; ordenando: 7, 9, 11, 12, 13, 14, 15, 16 (n=8 par)
12 1312.5
2 Me
4.4.2 Mediana para Datos Agrupados
Cuando se trabajan con tablas de frecuencias de intervalos, la fórmula para calcular la
mediana es:
1
1
2 j
I j
j j
n F Me L c
F F
Donde:
I L : Límite inferior de la clase mediana
J c : Amplitud del intervalo de la clase mediana
n : número total de observaciones o datos
F : Frecuencia acumulada de la clase mediana
1 j F
:Frecuencia acumulada anterior de la clase mediana.
Ejemplo: Calcule e interprete la mediana de la la producción anual de caña azúcar
en miles de toneladas en 80 haciendas del departamento Lambayeque.
Producción
I S L L
i y i i F
[5 12
8.5 10 10[12 19 15.5 14 24
[19 26 22.5 28 52
[26 33 29.5 20 72
[33 40
36.5 8 80
TOTAL n =80
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
34/88
34
Pasos:
i) Calcular80
402 2
n y ubicar en los i F
ii) Luego la mediana se encuentra en la clase [19 26 , por lo tanto:
19 I
L ; 52 j
F ;
124
j F
; ; j
c =7
40 24 1619 7 19 7 23
52 24 28 Me
Interpretación: El 50% de las haciendas producen anualmente una cantidad menor
o igual a 23000 toneladas.
4.5. Comparación entre la media, moda y mediana
Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la
distribución, la mediana está hacia la derecha de la moda y la media más a la derecha.
Es decir Mo < Me < x (a)
En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está
a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir x < Me < Mo (b)
Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser
la mejor medida de posición. La mediana no se ve influida por la frecuencia de aparición de
un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores
extremos como la media.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
35/88
35
Medidas de Dispersión5.1. Concepto y Clasificación5.2. Rango5.3. Varianza y Desviación Estándar
5.3.1 Para datos no agrupados
5.3.2 Para datos agrupados5.4. Coeficiente de variación
5.1. Concepto y Clasificación
La dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las
diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor
concentración de los datos en torno a un valor central. Las más comunes son:
Recorrido o rango Varianza
Desviación Estándar o Típica
Coeficiente de Variación
Ejemplo: Dados los siguientes histogramas ¿en cuál de los gráficos existe mayor
dispersión?
5.2. Rango o recorrido
El rango es la diferencia entre los datos mayor y menor del conjunto. También se llama
“recorrido”. En un conjunto de datos, mientras mayor sea el rango, mayor será su
dispersión y mientras menor sea su rango, menor su dispersión. Su fórmula es:
max min R X X
TEMA
5§
Según los histogramas elgráfico (d) presenta mayor
dispersión y el gráfico (a)
menor dispersión o poca
variabilidad.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
36/88
36
Ejemplo: A continuación se muestran las utilidades de 10 corporaciones industriales
estadounidenses más grandes en millones de dólares. Calcular el rango de los datos.
Utilidades($millones) 242 580 187 258 515 234 213 597 212 268
597 187 410 R (Millones de dólares)
5.3. Varianza y Desviación Estándar
La Varianza es un valor numérico que cuantifica el grado de dispersión de los valores de
una variable respecto a su media aritmética. La Varianza y la Desviación Estándar son las
medidas de dispersión más importantes. Si se trabaja con la población se calcula la
varianza poblacional (2
) y si se toma una muestra se calcula la varianza muestral (s2
)
Para Datos No Agrupados
TIPO VARIANZA DESVIACIÓNESTÁNDAR
POBLACIONAL
22
2
2 1( )
N
ii
i
X X X N X
V X N N
( )V X
MUESTRAL2 2
1 1
2
2
( ) 1 1
n n
i
i ii x x x nx
s V x n n
( ) s V x
Para Datos Agrupados
TIPO VARIANZA DESVIACIÓNESTÁNDAR
POBLACIONAL
2 22
2 1 1( )
N N
ii i
i ii X X f X N X
V X N N
( )V X
MUESTRAL2 2
1 1
2
2 ( )1 1
n n
i
i i
i i i x x f x nx
s V x n n
( ) s V x
Observaciones:
A la desviación estándar también se la llama desviación típica y es la raíz
cuadrada de la varianza. La varianza nunca es negativa.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
37/88
37
Cuando la variable toma un único valor; es decir cuando es constante entonces la
varianza es cero.
Mientras más se aproxima a cero, más concentrados están los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la varianza, más
dispersos están.
5.3.1 Cálculo de la varianza y desviación estándar para datos no agrupados
Ejemplo: en una fábrica ensambladora de autos se desea analizar el tiempo que
demora un empleado en terminar de armar una puerta. A continuación se tienen
los tiempos en minutos de dicho empleado al armar 10 puertas:
39 29 43 52 3944 40 36 44 35
Calcule e interprete la Varianza y Desviación Típica.
Hallamos primero la media: 40.1 x
Varianza :
2 2 2
239 40.1 29 40.1 ....... 35 40.1
38.7710 1
s
Desviación estándar : 38.77 6.23 s
Interpretación: Los tiempos que tardan en armar una puerta se alejan de la mediaen 6.23 minutos aproximadamente por puerta.
5.3.2 Cálculo de la varianza y desviación estándar para datos agrupados
Ejemplo: A continuación se muestra la producción anual de caña azúcar en miles de
toneladas en 80 haciendas del departamento Lambayeque:
Producción
I S L L
i y i f i i f y
2
i i f y
[5 12
8.5 10 85 722.5[12 19 15.5 14 217 3363.5
[19 26
22.5 28 630 14175
[26 33 29.5 20 590 17405
[33 40 36.5 8 292 10658
TOTAL n =80 1814 46324
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
38/88
38
Calcula la media, varianza y desviación estándar:
Determinando la media:1814
22.6880
i i f x
x n
La Varianza es:2
2 46324 80(22.68)65.49
80 1 s
La Desviación Estándar es 2 65.49 8.09 s s
Interpretación: La cantidad producida por las haciendas se desvían de su media
aritmética en 8.09 toneladas aproximadamente.
5.4. Coeficiente de Variación
Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de
hacer comparaciones entre muestras. No tiene unidades de medida. Siempre seexpresa en porcentajes, no en términos de la unidad de medida de los datos
estudiados. Se calcula mediante la fórmula:
. % 100S
C V X
(Coeficiente de variación muestral)
Observación:
Al realizar comparaciones entre dos variables, el C.V. más pequeño será el que
tenga menor dispersión relativa.
Un C.V. mayor a 30% indica un alto grado de dispersión y pequeña representatividad
de la media, pero cuanto menor sea a 30% la media será más representativa.
Ejemplo: Supongamos que dos empresas repartieron sus beneficios entre sus
principales accionistas, y que el reparto se realiza de la siguiente forma:
Empresa A Empresa B
Media Aritmética 25000 125000Desviación Estándar 19148.54 12909.94
¿Cuál de los dos repartos es el más equitativo?
Solución: Calculamos el coeficiente de variación para ambas empresas:
Empresa A Empresa B
C.V. 0.766 0.103
Comparando los dos coeficientes se observa que la empresa B tiene el menorcoeficiente, por lo tanto dicho empresa tiene los repartos más equitativos.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
39/88
39
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD2
1. Los sueldos de cinco empleados de una empresa son: $4000, $5000, $4500, $6000 y $35000. Calcula
el sueldo medio, la moda, si es que existe, y la mediana e indica cuál representa mejor a los datos.
2. Se desea analizar el precio de las viviendas en el municipio de Villa el Salvador para ello tras unminucioso estudio en el registro de la propiedad y una agrupación de los datos se obtiene quedurante los primeros 5 meses del presente año los precios vienen reflejados en la tabla siguiente y lasunidades vienen dadas en miles de euros.
Precio i y i i F i i y f
[ 12 – 16 3
[ – 14
[ – 33[ – 21
[ – ] 9
Total
a) Calcule el precio medio, moda y mediana e interpreteb) Calcule e interprete la varianza, desviación estándar y coeficiente de variación
.3. En el departamento de bienestar de cierto municipio se realiza una encuesta en un condominio para
estimar el monto mínimo diario para cubrir la canasta familiar de los vecinos:
Monto mínimoi
f
65 1166 1567 968 569 2
Total
Calcule e interprete las medidas de tendencia central media, moda y mediana
4. En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el siguientehistograma de frecuencias, entonces la nota promedio del curso y la desviación estándar son:
i y i i i y f [ –
[ –
[ –
[ –
[ –
[ – ]
Total
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
40/88
40
5. Dado el siguiente cuadro estadístico sobre el número de empleados de un grupo de compañíasazucareras con ancho de clase constante igual a 20. Determine la media, moda y mediana de losdatos e interpreta.
si L L iY i i F i iY f
- 880
- 1950
- 35 1800 - 13
- 200
- ] 4 70
Total
6. Los costos de fabricación, en soles, de siete objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77,
9.00, 9.36 si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5 soles,
calcular la utilidad media por objeto.
7. En una encuesta sobre bienes y raíces en la Urbanización Santa Eulalia, se obtiene entre otras cosas,información sobre el valor actual de la casa y el tamaño del lote de terreno. Se está interesado endeterminar si el valor de avalúo tiene mayor variabilidad que el tamaño del lote. De la mencionadaencuesta se consigue lo siguiente:
Valor de la casa Tamaño del terreno
Media= S/350.00 Media = 120 m2
Desviación estándar=S/ 50.00 Desviación estándar = 5m2
8. En un estudio comparativo de los rendimientos de ciertos bonos, se elaboró la siguiente distribución
de los rendimientos al vencimiento de una muestra de 50 bonos.Resumenporcentual
i y Números de
bonosi i
y 2i i
f y
6.0 -7.9 48.0 -9.9 5
10.0 -11.9 1112.0 -13.9 2114.0 -15.9 9
Total
a) Determina la media y la desviación típicab) Se puede concluir que los rendimientos son uniformes
9. Se realiza un estudio sobre los gastos mensual en alimentación en tres niveles socioeconómicos. Secuenta con la siguiente información:
Nivel A Nivel B Nivel CGasto promedio 4000 2500 900Desviación estándar 520 310 120
¿En qué nivel socioeconómico los gastos son más homogéneos?
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
41/88
41
AUTOEVALUACIÓN N° 21. Indique si son verdaderas o falsas las siguientes afirmaciones
Afirmación V F
a) El valor de la mediana solo se puede calcular en variables cuantitativas
b) La desviación estándar es siempre menor que la varianza
c) Si las unidades están en minutos, la varianza se expresa en minutos al cuadrado
d) El rango es la diferencia entre el valor máximo y el valor mínimo
e) Dentro de un conjunto de datos puede existir más de una moda
2. La venta semanal en florería el ROSAL es la siguiente:
Preciosi
y i
f
(Clientes)i
F i i
y 2i i
y
[25 – 35) 25
[35 – 45 ) 40
[ 45 – 55) 13
[55 – 65 ) 38
[65 – 75 ) 15
TOTAL
a) Calcule la media, moda, mediana e interpretea) Calcula La Varianza, desviación estándar en interpretab) ¿Se puede decir que la distribución de precios es uniforme? Justifique su respuesta
3. Se clasifica a los Gerentes de acuerdo a grado de responsabilidad obteniéndose los siguientesresultados respecto de su sueldo promedio anual:
a) ¿Qué medida me permite comparar la dispersión de sueldos? b) Calcule el coeficiente de variación para cada grupo y responda ¿Qué grupo es más homogéneo
en sus sueldos?
4. Enseguida, aparecen los números de automóviles vendidos por dos agentes, por arriba y por debajode sus cuotas de ventas, en seis períodos semanales:
a) Calcule la desviación estándar de cada una de estas muestrasb) ¿Cuál de las dos muestras es más homogénea?
Vendedor 1 3 5 -1 4 3 4
Vendedor 2 2 5 4 -1 4 2
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
42/88
42
Unidad
3
DISTRIBUCIONESBIDIMENSIONALES
En esta unidad se analizará la dependencia y asociación de variables estadísticas mediante el
uso de modelos lineales y de medidas de asociación en el estudio de los fenómenos
económico-financieros.
OBJETIVOS ESPECÍFICOS Clasificar datos cuantitativos bidimensionales en forma sistemática, aplicando las técnicas
de la estadística descriptiva.
Resumir datos cuantitativos bidimensionales, aplicando medidas estadísticas descriptivas y
realizando un análisis crítico e interpretativo de los resultados.
Determinar la correlación y regresión lineal existente entre dos variables X e Y. Dominar los
métodos de regresión simple, análisis de correlación y coeficiente de determinación.
ontenido Temático
Tema VI: Distribuciones Bidimensionales
Tema VII: Medidas estadísticas bidimensionales
Tema VIII: Análisis de Correlación y Regresión
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
43/88
43
Distribuciones Bidimensionales6.1. Definición
6.2. Tablas Estadísticas Bidimensionales
6.3. Distribuciones Marginales
6.4. Frecuencias Relativas6.5. Grafico Bidimensional
6.1. Definición
Las distribuciones bidimensionales son
aquellas en las que se estudian al mismo
tiempo dos variables de cada elemento
de la población. Estas variables pueden
ser cuantitativas o cualitativas. Por
ejemplo: peso y altura de un grupo de
estudiantes; edad y horas de lectura;
usuario y turno de asistencia, etc.
Se desarrollaran un conjunto de técnicas
que permite describir las relaciones que ligan a esas dos variables o a esos dos atributos,
para establecer el grado de dependencia o asociación entre ellos, así como para estimar
una de ellas a partir del comportamiento de la otra.
Ejemplo1: Entre los empleados de una empresa se ha realizado una encuesta sobre el
consumo del tabaco, que ha arrojado los siguientes resultados:
HabitoSexo
Fumadores No fumadores Totales defilas
VaronesMujeres
4943
6437
11380
Totales decolumnas
92 101 193
Interpretación: 49 empleados son varones y fumadores, 43 empleados son mujeres y
fumadoras, etc.
TEMA
6§
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
44/88
44
6.2. Tablas Estadísticas Bidimensionales
Consideremos un conjunto de n observaciones para dos variables X e Y en forma
simultánea:
1 2 3 k x , x , x , ......,x las k modalidades o valores de la variable x
1 2 3 e y , y , y , ......, y las l modalidades o valores de la variable y
Una tabla de distribución de frecuencias bidimensional es una tabla de doble entrada que
agrupa en filas las modalidades o valores de X, y en columnas las modalidades o valores
de la característica Y (tabla de kxe, k-filas y e-columnas)
Y
X
y1 y 2 y 3 .........ye TOTAL
f i.
x1 f 11 f 12 f 13 .........f 1e f 1.
x 2 f 21 f 22 f 23 .........f 2e f 2.
x 3 f 31 f 32 f 33 .........f 3e f 3.
. . . . ............ .
. . . . …......... .
. . . . ……..... .
x k f l1 f l2 f l3 .........f ke f k.
TOTAL f .j f.1 f .2 f .3 f .e
k e
ij
i 1 j 1
n f
Donde:
ij f = número de veces que aparece repetido el par i j( x ,y ) y se llama frecuencia
absoluta.
e
i . ij j 1
f f
= Frecuencia marginal de i . x , es el total de cada fila.
k
. j ij
i 1
f f
= Frecuencia marginal de . j , es el total de cada columna.
k e
ij
i 1 j 1
n f
= número total de pares observados
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
45/88
45
Ejemplo 2: Dada la distribución bidimensional:
X 1 2 1 2 3 2 2 2 3 1 Y 3 5 2 3 5 4 3 5 5 3
Su la tabla de frecuencias bidimensional correspondiente es:
Y
X
2 3 4 5 Frec. absolu tas
marginales de X
1 1 2 0 0 3
2 0 2 1 2 5
3 0 0 0 2 2
Frec. absolutas
marginales de Y
1 4 1 4 n=10
6.3. Distribuciones Marginales
Son tablas que representan a la variable X y sus frecuencias marginales y de igual manera
a la variable Y con sus frecuencias marginales:
Distribución marginal de X Distribución marginal de Y
X
i .
f Y . j
f
x1 1.
f y1 .1 f
x 2 2.
f y 2 .2 f
x 3 3.
f y 3 .3 f
.
.
.
.
.
.
.
.
x k k .
f Y e . j f
Total k
i .
i 1
n f
Total e
. j
j 1
n f
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
46/88
46
Ejemplo 3: del ejemplo 2 obtener la distribución marginal de X e Y
Distribución marginal de X Distribución marginal de Y
X i . f Y . j f
1 3 2 1
2 5 3 4
3 2 4 1
Total 10 5 4
Total 10
6.4. Frecuencias Relativas
En muchas situaciones en vez de trabajar con las frecuencias absolutas, podemos
construir tablas con las frecuencias relativas (proporciones), como se hizo en el caso
unidimensional. Sin embargo aquí existen 3 posibilidades de expresar la proporción de
elementos en cada celda:
i) Con relación al total general y se llama frecuencia relativaij
ij
f h
n
ii) Con relación al total de cada filaij
ij
i .
f h
f
iii) Con relación al total de cada columnaij
ij
. j
f h
f
De acuerdo al objetivo de cada investigación, una de estas proporciones será la más
conveniente para ser usada.
Ejemplo 4: Supongamos que queremos analizar el comportamiento conjunto de las
variables: Grado de instrucción (Y), y región de procedencia (X) de los empleados del
Ministerio de Salud. Los datos están agrupados en la siguiente tabla de doble entrada:
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
47/88
47
Y
X
Primaria
Completa
Secundaria
Completa
Superior Total
Costa 40 30 20 90
Sierra 35 15 10 60
Selva 30 15 5 50
Total 105 60 35 n=200
a) Hallar la distribución conjunta de las proporciones con relación al total general
b) Hallar la distribución conjunta de las proporciones con relación al total de cada fila
c) Hallar la distribución conjunta de las proporciones con relación al total de cada columna.
Tabla A: Distribución conjunta de las proporciones con relación al total
Y
X
Primaria
Completa
Secundaria
Completa
Superior Total
Costa 20.0% 15.0% 10.0% 45.0%
Sierra 17.5% 7.5% 5.0% 30.0%
Selva 15.0% 7.5% 2.5% 25.0%
Total 52.5% 30.0% 17.5% 100.0%
Interpretación: El 20% de los empleados son de la costa y tienen primaria completa. El2.5% son de la selva y tienen estudios superiores. El 45% son de la costa, el 52.5% tienen
primaria completa.
Tabla B: Distribución de las proporciones con relación al total de cada fila
Y
X
Primaria
Completa
Secundaria
Completa
Superior Total
Costa 44.4% 33.3% 22.2% 100.0%
Sierra 58.3% 25.0% 16.7% 100.0%
Selva 60.0% 30.0% 10.0% 100.0%
Total 52.5% 30.0% 17.5% 100.0%
Interpretación: El 44.4% de los empleados de la costa tienen primaria completa, el 16.7%
de los empleados de la sierra tienen estudios superiores.
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
48/88
48
Tabla C: Distribución de las proporciones con relación al total de cada Columna
Y
X
Primaria
Completa
Secundaria
Completa
Superior Total
Costa 38.1% 50.0% 57.1% 45.0%
Sierra 33.3% 25.0% 28.6% 30.0%
Selva 28.6% 25.0% 14.3% 25.0%
Total 100.0% 100.0% 100.0% 100.0%
Interpretación: El 38.1% de los empleados con primaria completa son de la costa, el 25%
de los empleados con secundaria completa son de la sierra.
6.5. Grafico Bidimensional
Permiten representar las series de datos en dos dimensiones o sea los valores se
representan alineados en dos ejes perpendiculares: el eje horizontal X y el eje vertical Y.
Son aplicaciones estadísticas al estudio en conjunto de dos variables cualitativas.
Ejemplo: tomando en cuenta el ejemplo anterior de la distribución conjunta de las
proporciones del Grado de instrucción (Y), y región de procedencia (X) de los empleadosdel Ministerio de Salud con relación al total tenemos el siguiente gráfico:
0.0
2.0
4.0
6.08.0
10.0
12.0
14.0
16.0
18.0
20.0
Primaria Completa SecundariaCompleta
Superior
20.0%
15.0%
10.0%
17.5%
7.5%
5.0%
15.0%
7.5%
2.5%
Costa Sierra Selva
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
49/88
49
Medidas EstadísticasBidimensionales
7.1. Mediciones Marginales
7.1.1 Medias Marginales de X e Y
7.1.2 Varianzas Marginales de X e Y:
7.1.3 Desviaciones Estándar Marginales de X e Y
7.1.4 Covarianza Entre X e Y
7.2. Distribuciones condicionadas
7.1. Mediciones Marginales
Sabemos que las distribuciones marginal de X son los totales de las filas y la distribución
marginal de Y son los totales de las columnas, dichos totales vendrían a ser sus
frecuencias absolutas. (Ver tema 6)
Distribución marginal de X Distribución marginal de Y
Xi .
f Y . j f
x1 1.
f y1 .1 f
x2 2.
f y2 .2 f
x3 3.
f y3 .3 f
.
.
.
.
.
.
.
.xk
k . f Ye . j f
Total k
i .
i 1
n f
Total e
. j
j 1
n f
7.1. 1 Medias Marginales de X e Y:
k
i . i
i 1
f x
x n
e
. j j
j 1
f y
y n
7.1.2 Varianzas Marginales de X e Y:
X
k 2 2
i . i 2 i 1
f x nx
s n 1
e 2 2
. j j
j 1 2
Y
f y ny
s n
TEMA
7§
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
50/88
50
7.1.3 Desviaciones Estándar Marginales de X e Y:
Sabemos por la clase de medidas de dispersión que la desviación estándar es la raíz
cuadrada de las varianzas marginales:
k 2 2
i . i
i 1
X
f x nx
s n 1
e 2 2
. j j
j 1
Y
f y ny
s n
7.1.4 Covarianza Entre X e Y
La covarianza es una medida de asociación lineal más simple entre dos variables X e
Y está definida como:
k e
XY ij i i
i 1 j 1
1 s f x y x.y
n
Si S xy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x
corresponden grandes valores de y.
Si S xy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal
entre las dos variables estudiadas.
Si S xy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x
corresponden pequeños valores de y.
Ejemplo1: En una encuesta efectuada en una población se obtuvo la siguiente
información, relativo al número de habitantes (X) y número de dormitorios (Y), en unamuestra de 50 viviendas. Los cuales se agruparon en la siguiente tabla bidimensional.
YX
1 2 3 4 Total
2 6 0 0 0 6
3 7 4 0 0 11
4 10 5 1 0 16
5 0 9 0 0 9
6 1 2 2 0 5
8 0 0 1 2 3
Total 24 20 4 2 50
a) Hallar las frecuencias marginales, acumuladas y relativas para X e Y
b) Hallar las medias, varianzas y desviaciones estandar marginales
c) Hallar la covarianza e interpretar
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
51/88
51
Solución:
a) Frecuencias marginales, acumuladas y relativas para X e Y
a1) Distribución Marginal de X
i x
.i
.i F
.i h
2 6 6 12%3 11 17 22%4 16 33 32%5 9 42 18%6 5 47 10%8 3 50 6%
TOTAL n =50 100%
a2) Distribución Marginal de Y y
. j f
. F
. h
1 24 24 48%
2 20 44 40%3 4 48 8%4 2 50 4%
TOTAL n =50 100%
b) Medias y Varianzas Marginales
i x
i f .
i i f x . 2.
i i x
2 6 12 243 11 33 99
4 16 64 2565 9 45 2256 5 30 1808 3 24 192
50 208 976
2084.16
50
i i f x
x n
2
2 976 50(4.16) 2.2649
X s
1.5 X
s
y .
f .
j i f y . 2.
j j f x
1 24 24 24
2 20 40 803 4 12 364 2 8 32
50 84 172
841.68
50
j j f y y
n
2
2 172 50(1.68) 0.6349
Y s
0.79Y
s
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
52/88
52
a) Covarianza X Y
k e
XY ij i i
i 1 j 1
1 393 s f x y x.y ( 4.16 )(1.68 ) 0.872
n 50
Interpretación: como 0.872 >0, existe una asociación directa entre el número de
habitantes y numero de dormitorios es decir, a mayor número de habitantes mayor
cantidad de dormitorios por vivienda.
7.2. Distribuciones Condicionadas
Sea (X,Y) una variable estadística bidimensional tal que X presenta k-modalidades y la
variable Y e-modalidades mutuamente excluyentes. La distribución de la variable X
condicionada a que la variable Y tome el valor fijoi y ( 1,2,..., j e ) está dado en la tabla:
Tabla 1: Distribución de la variable X condicionada a jY y
1 x 2 x
........ k
x Totales
Frecuencia absoluta de X
condicionada a jY y
X Y y j f
1 j f 2 j f
……. kj
f . j f
Frecuencia relativa de X
condicionada a jY y
X Y y j h
1
. j
f
f
2
.
j
j
f
f
…….
.
kj
j
f
f
1
De igual manera la distribución de la variable Y condicionada a que la variable X tome el
valor fijoi
x ( 1,2,...,i k ) está dado en la tabla:
Tabla 2: Distribución de la variable Y condicionada a i X x
1 y 2 y
........e
y Totales
Frecuencia absoluta de Ycondicionada a i X x
Y X xi f
1i f 2i f
…….ie
f .i f
Frecuencia relativa de Y
condicionada a i X x
Y X xi h
1
.
i
i
f
f
2
.
i
i
f
f
…….
.
ie
i
f
f
1
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
53/88
53
Ejemplo 2: Tomando la tabla bidimensional del ejemplo 1:
YX
1 2 3 4 Total
2 6 0 0 0 6
3 7 4 0 0 11
4 10 5 1 0 16
5 0 9 0 0 9
6 1 2 2 0 5
8 0 0 1 2 3
Total 24 20 4 2 50
a) Hallar la distribución X condicionada a Y=2
b) Hallar la distribución Y condicionada a X=6
c) Hallar la distribución X condicionada a Y=3d) Hallar la distribución Y condicionada a X=8
Solución:
a)
b)
c)
d)
Valores de X 2 3 4 5 6 8 Totales
2 X Y f 0 4 5 9 2 0 20
2 X Y h 0 0,20 0,25 0,45 0,10 0 1
Valores de Y 1 2 3 4 Totales
6Y X f 1 2 2 0 5
6Y X h 0,2 0,4 0,4 0 1
Valores de X 2 3 4 5 6 8 Totales
3 X Y f 0 0 1 0 2 1 4
3 X Y h 0 0 0,25 0 0,50 0,25 1
Valores de Y 1 2 3 4 Totales
8Y X f 0 0 1 2 3
8Y X h 0,00 0,00 0,33 0,67 1
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
54/88
54
Análisis de Correlación yRegresión
8.1. Análisis de Correlación8.1.1 Tipos de correlación
8.1.2 Diagrama de dispersión8.1.3 Coeficiente de Correlación8.1.4 Niveles de correlación
8.2. Análisis de regresión8.2.1 Regresión Lineal simple8.2.2 Recta de mínimos cuadrados8.2.3 Coeficiente de Determinación
8.1. Análisis de Correlación
La correlación estadística determina la relación o dependencia que existe entre las dos
variables que intervienen en una distribución bidimensional. Es decir, determinar si los
cambios en una de las variables influyen en los cambios de la otra. En caso de que
suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.
La correlación es la teoría que se encarga de estudiar las posibles relaciones existentes
entre dos variables X e Y estadísticas.
8.1.1 Tipos de Correlación. Según la relación entre las variables X e Y podemos tener:
A. Correlación Directa o Positiva. Cuando las variables X e Y presentan variaciones
en un mismo sentido, esto es, para mayores valores de X, mayores valores de Y.
B. Correlación Inversa o Negativa. Cuando las variaciones de X e Y son en sentidoscontrarios, esto es, para mayores valores de X corresponden menores valores de Y.
C. Sin correlación. Cuando no existe ningún tipo de relacionamiento entre las
variables.
8.1.2 Diagrama de Dispersión. Es la representación gráfica más útil para describir el
comportamiento conjunto de dos variables X e Y, consiste en una nube de puntos que
indicará si existe o no correlación dependiendo de la tendencia de los puntos.
TEMA
8§
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf
55/88
55
Ejemplo1: Una compañía de seguros desea determinar el grado de relación que existe
entre el ingreso familiar y el monto del seguro de vida del jefe de familia. Con base a una
muestra aleatoria de 9 familias, se obtuvo la siguiente información (en miles de dólares)
Ingreso (X) Seguro deVida (Y)
45 70
20 50
40 60
40 50
47 90
30 55
25 55
20 35
15 40
Interpretación: Observando el gráfico podemos decir que el
Ingreso familiar y el seguro de Vida tienen correlación positiva
8.1.3 Coeficiente de Correlación. Es un número que indica el grado de asociación entre
las variables y se define del siguiente modo:
Características:
El coeficiente r es un número comprendido entre -1 y +1
1 r 1
Si r 0 Existe una correlación directa o positiva
Si r 0 Existe una correlación Inversa o negativa
Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.
Ejemplo2: Del ejemplo1 sobre el Ingreso profesional y el seguro de vida hallar el
coeficiente de correlación:
N° Ingreso(X)
Seguro deVida (Y)
XY X2 Y2
1 45 70 3150 2025 4900
2 20 50 1000
400
2500
3 40 60 2400 1600 3600
4 40 50 2000 1600 2500
5 47 90 4230 2209 8100
1 1
1
2 2 2 2
i i
i
n n
i i
n
i i
x nx y ny
x y nxy r
8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTA