INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

Embed Size (px)

Citation preview

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    1/88

    Federico Villarreal

    U n i v e r s i d a d N a c i o n a l

    GUÍA ACADÉMICA INTRODUCCIÓN A LA ESTADÍSTICA 

    PARA ECONOMISTAS

    ECONOMÍA CICLOIII

    Euded

    Escuela Universitaria

    Educación a distancia

    ECON. EDWARD HUAMANI ALHUAY

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    2/88

    2

    INDICE

    PRESENTACIÓN 04INTRODUCCIÓN A LA ASIGNATURA 05ORIENTACIONES GENERALES DE ESTUDIO 06

    TUTORÍAS 07CRONOGRAMA 07EVALUACIÓN 08MEDIOS Y RECURSOS DIDÁCTICOS 09OBJETIVOS GENERALES 10 

    UNIDAD 1 CONCEPTOS GENERALES Y SISTEMATIZACIÓN DE DATOS 11

    Tema 1: Conceptos Generales de Estadística 121.1. La estadística 121.2. Clases de estadística 121.3. Población 13

    1.4. Muestra 131.5. Parámetro y Estadígrafo 141.6. Variables 141.7 Sumatorias 16

    Tema 2 Sistematización de Datos en Tablas de Frecuencias 172.1. Tabla de Distribución de Frecuencias 172.2. Tabla de Frecuencias de una Variable Cualitativa 182.3. Tabla de Frecuencias de una Variable Cuantitativa Discreta 192.4. Tabla de Frecuencias de Variables Cuantitativas agrupadas en intervalos 20

    Tema3 Representaciones Gráficas 223.1. Gráficos Estadísticos 223.2. Partes de un gráfico 223.3. Clasificación de los gráficos 22

     ACTIVIDADES 25 AUTOEVALUACIÓN N°1 27

    UNIDAD2 MEDIDAS DESCRIPTIVAS NUMERICAS 28

    Tema 4 Medidas de Tendencia Central 294.1. Concepto y Clasificación 294.2. Media Aritmética 294.3. Moda 304.4. Mediana 324.5. Comparación entre la media, moda y mediana 34

    Tema 5 Medidas de Dispersión 355.1. Concepto y Clasificación 35

    5.2. Rango 355.3. Varianza y Desviación Estándar 365.4. Coeficiente de variación 38

     ACTIVIDADES 39 AUTOEVALUACIÓN N°2 41

    UNIDAD3 DISTRIBUCIONES BIDIMENSIONALES 42

    Temas 6 Distribuciones Bidimensionales 436.1. Definición 43

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    3/88

    3

    6.2. Tablas Estadísticas Bidimensionales 446.3. Distribuciones Marginales 456.4. Frecuencias Relativas 466.5. Grafico Bidimensional 48

    Tema 7 Medidas Estadísticas Bidimensionales 497.1. Mediciones Marginales 49

    7.1.1 Medias Marginales de X e Y 497.1.2 Varianzas Marginales de X e Y 497.1.3 Desviaciones Estándar Marginales de X e Y 507.1.4 Covarianza Entre X e Y 50

    7.2. Distribuciones condicionadas 52Tema 8 Análisis de Correlación y Regresión 54

    8.1. Análisis de Correlación 548.1.1 Tipos de correlación 548.1.2 Diagrama de dispersión 548.1.3 Coeficiente de Correlación 558.1.4 Niveles de correlación 56

    8.2. Análisis de regresión 568.2.1 Regresión Lineal simple 578.2.2 Recta de mínimos cuadrados 578.2.3 Coeficiente de Determinación 58

     ACTIVIDADES 59 AUTOEVALUACIÓN N°3 61

    UNIDAD4 PROBABILIDADES, SERIES DE TIEMPO Y NUMEROS INDICES 62

    Tema 9 Introducción a las Probabilidades 639.1. Probabilidades y eventos 639.2. Experimento aleatorio 639.3. Espacio muestral y eventos 649.4. Técnicas de conteo 649.5. Concepto clásico de probabilidad 65

    9.6. Probabilidad Condicional 669.7. Teorema de Bayes 68Tema 10 Análisis de Series Temporales 69

    10.1. Definición 6910.2. Importancia de las Series de Tiempo 7010.3. Componentes de una serie cronológica 7010.4. Análisis de Series de Tiempo 7210.5. Estudio de la Tendencia 72

    Tema 11 Números Índices 7711.1. Definición 7711.2. Clasificación de Números Índices 7711.3. Números Índices Simples 7811.4. Números Índices Compuestos 79

    11.5. Índices Compuestos no ponderados 7911.6. Índices Compuestos ponderados 80 ACTIVIDADES 82 AUTOEVALUACIÓN N°4 84SOLUCIONARIO DE AUTOEVALUACIONES 85

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    4/88

    4

    PRESENTACIÓN

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    5/88

    5

    INTRODUCCIÓN A LA ASIGNATURA

    El seguimiento de una economía se basa habitualmente en mediciones o indicadores que

    recogen distintos aspectos de la actividad económica de un país o región, estos indicadores

    permiten hacer comparaciones y análisis más complejos partiendo de un conjunto de datosbien recolectados y organizados como por ejemplo una encuesta de hogares para conocer el

    nivel económico de los habitantes. Ese proceso se logra mediante técnicas estadísticas que

    proporcionan justamente herramientas de recolección, clasificación, organización y análisis de

    datos que ayudaran en la toma de decisiones por medio de los indicadores hallados.

    El contenido del presente manual se caracteriza primero por la exposición del método

    estadístico, sus características y alcance de fenómenos a los cuales son factibles de analizar y

    segundo la aplicación del método mediante técnicas con el análisis e interpretaciones

    correspondientes. Con lo cual se hace una aportación con ejercicios aplicativos usando la

    bondad del método estadístico aplicado a la empresa y la economía en general, cuya

    transmisión resultará rápida y atractiva para el estudiante.

    Para un mejor aprovechamiento se ha dividido la presente guía en 4 unidades: Unidad I trata

    sobre Conceptos generales y sistematización de datos mediante tablas y gráficos, en la Unidad

    II se calculan Medidas descriptivas de Tendencia Central y Dispersión más utilizadas, en la

    Unidad III se analizan distribuciones bidimensionales así como la correlación y regresión entre

    dos variables y en la Unidad IV se hará una introducción a las probabilidades y se analizaranseries temporales y números índices.

    En general, el análisis estadístico de cualquier problema económico requiere en una primera

    etapa determinar los objetivos y el colectivo informante. A lo largo de este manual se

    introducirán los conceptos básicos vinculados a esta fase inicial de un estudio estadístico.

     Asimismo se ofrecerá una panorámica de los principales organismos y fuentes que

    proporcionan información estadística y se estima que resultara de gran ayuda el poder aplicar

    los principales métodos estadísticos en el análisis de la economía y los negocios. 

    Mg Edward F Huamani Alhuay

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    6/88

    6

    ORIENTACIONES GENERALES DE ESTUDIO

    Estimados participantes:

    La razón de ser de los cursos virtuales es facilitar el acceso a los programas educativos de

    aquellos estudiantes cuyos horarios o situación geográfica no son compatibles con la formación

    presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad académica igual o

    superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se

    apoyan en la más moderna tecnología informática y de comunicaciones (aulas virtuales) que

    permiten un alto grado de interacción y orientación del profesor y una elevada interrelación

    entre los estudiantes.

    En las aulas virtuales de la Escuela Universitaria de Educación a Distancia, nuestros

    estudiantes encontrarán, además de la información detallada del programa, los materiales de

    estudio, la agenda de actividades propuestas por los profesores y todas las herramientas de

    comunicación que permitirán el desarrollo dinámico del curso. Para comprender y asimilar

    adecuadamente el material didáctico del curso, se recomienda lo siguiente:

      Leer, estudiar y trabajar el material didáctico diariamente. Es preferible una hora diaria

    durante siete días consecutivos, que 10 horas en un solo día. Las claves del éxito son

    continuidad y constancia.  Organizar el tiempo de estudio según las propias condiciones, dificultades y necesidades

    de trabajo; en caso contrario el plan de estudios no se cumplirá.

      Leer varias veces el material y después comenzar con el resaltado de las ideas principales

    para organizar el material de estudio (resúmenes, cuadros sinópticos, etc.

      Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las

    actividades que tiene en su Texto como en su Guía Académica.

      Estudiar en un lugar donde se sienta cómodo para realizar las lecturas y hacer sus tareas.

    En lo posible un lugar con claridad y libre de ruido.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    7/88

    7

    TUTORÍAS

    Las tutorías se desarrollarán mediante la programación de un calendario de tutorías. La tutoría

    será presencial y virtual.

    CRONOGRAMA

    TUTORÍAS PRESENCIALES

     Y VIRTUALES

    CANTIDAD DE HORAS ACADÉMICAS

    HORAS

    PRESENCIALES

    HORAS

    VIRTUALES

    PRIMER MES

    Semana 1 2 2

    Semana 2 2 2

    Semana 3 2 2

    Semana 4 2 2

    SEGUNDO MES

    Semana 5 2 2

    Semana 6 2 2

    Semana 7 2 2

    Semana 8 2 2

    TERCER MES

    Semana 9 2 2

    Semana 10 2 2

    Semana 11 2 2

    Semana 12 2 2

    CUARTO MES

    Semana 13 2 2

    Semana 14 2 2

    Semana 15 2 2

    Semana 16 2 2

    TOTAL32 32

    64 HORAS ACADÉMICAS

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    8/88

    8

    EVALUACIÓN

    El promedio final de la asignatura de Estadística en la Modalidad Presencial – Virtual se

    obtiene aplicando los siguientes pasos porcentuales: 

      Evaluación de trabajos académicos presenciales (TA): (40%)  Evaluación de participación en interacción virtual (IV): (20%).

      Evaluación final (EF): (40%).

    PF = TA (0,4) + IV (0,2) + EF (0,4)

    El promedio final en la Modalidad Virtual se obtiene aplicando la siguiente ponderación

    porcentual:

      Evaluación de trabajos académicos virtuales (TA): (40%)

      Evaluación de participación en interacción virtual (IV): (20%)

      Evaluación final en línea (EF): (40%)

    El estudiante que abandona la asignatura tendrá promedio 00 (cero) en el acta final,

    debiendo registrar nuevamente su matrícula.

    Se consideran como parte de criterios de evaluación la aplicación de un examen

    parcial virtual en la 8° semana del ciclo, un examen final presencial y la presentación

    de un trabajo monográfico en la 16° semana del ciclo.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    9/88

    9

    MEDIOS Y RECURSOS DIDÁCTICOS

    (Unidad I,II) Consultar los siguientes textos y enlaces:

      PÉREZ, Rigoberto. Introducción a la Estadística Económica,

    Universidad de Oviedo. España 2012

      NEWBOLD, Paul. Estadística para Administración y Economía,Prentice Hall. Universidad de Alcalá 2008

      DIAZ. Estadística Aplicada a la Administración y la Economía.Editorial Mcgraw-Hill México 2010

      MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Perú2013

      Referencias electrónicas   http://www2.ulpgc.es/hege/almacen/download/25/25022/estadstica

    itemav.pdf  http://www.fuenterrebollo.com/Economicas2013/unidimensional-

    ejercicios.pdf  http://herzog.economia.unam.mx/profesor/barajas/estadis/parte1.p

    df  

    (Unidad III-IV)   GUJARATI, Damodar. Econometría Básica. Editorial Mcgraw-Hill Latinoamericana S.A. Brazil 2008

      CASTILLO. Estadística Descriptiva y Cálculo deProbabilidades. Editorial Pearson. España 2009

      MOYA, Rufino. Probabilidades e Inferencia Estadística.Editorial San Marcos. Perú 2012

      Referencias electrónicas:   http://www2.ulpgc.es/hege/almacen/download/25/25022/estad

    sticaitemav.pdf    http://pendientedemigracion.ucm.es/info/amanece/oferdocs/TA

    SAS.pdf  

    Textoscomplementarios   IBM. Manual de Usuario del Sistema Básico de IBM SPSS

    Statistics 21. IBM Corporation, EE. UU. 2012

      CARRASCAL, Urcisino. Estadística descriptiva con MicrosoftExcel.Editorial Alfaomega. España 2010

    Plataformavirtual Herramientas a emplearse en plataforma virtual:

      Foros, tareas, chat

      Enlaces, videos, examen, páginas entre otros 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    10/88

    10

    OBJETIVOS

    GENERALES

      Determinar e identificar los instrumentos para el estudio de la estadística

    mediante los conceptos previos así como la sistematización y resumen de datos

    cualitativos y cuantitativos unidimensionales realizando un análisis crítico

    descriptivo e interpretativo de los resultados 

      Calcular e interpretar las medidas descriptivas de tendencia central y dispersiónmediante fórmulas establecidas, siendo capaz de resolver problemas aplicados en

    economía así como el uso de las propiedades de medidas descriptivas 

       Analizar la dependencia y asociación de variables estadísticas mediante el uso de

    modelos lineales y de medidas de asociación en el estudio de los fenómenos

    económico-financieros. 

       Aplicar la teoría de la probabilidad en sucesos y eventos. Analizar Series de

    Tiempo aplicados en economía así como la comparación de datos en  distintos

    momentos del tiempo usando número índices. 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    11/88

    11

    Unidad

    CONCEPTOS GENERALES YSISTEMATIZACIÓN DE DATOS

    En esta primera unidad se definirá y explicará los primeros conceptos de Estadística y la

    representación y resumen de datos cualitativos y cuantitativos unidimensionales realizando un

    análisis crítico descriptivo e interpretativo de los resultados.

    ontenido Temático

      Tema I: Conceptos generales de estadística 

      Tema II: Sistematización de datos en tablas de frecuencia

      Tema III: Representaciones gráficas

    OBJETIVOS ESPECÍFICOS

      Conocer los conceptos previos de población y muestra para su aplicación en la solución de

    problemas así como diferenciar entre variables cualitativas y cuantitativas.

      Sistematizar y organizar los datos en tablas de frecuencias por medio de los diversos

    elementos que se utilizan en la distribución de frecuencias en datos no agrupados y datos

    agrupados.

      Presentar y analizar adecuadamente un conjunto de datos mediante gráficos estadísticos

    con su correspondiente diseño e interpretación.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    12/88

    12

    Conceptos Generales deEstadística

    1.7. La estadística1.8. Clases de estadística1.9. Población

    1.10. Muestra1.11. Parámetro y Estadígrafo1.12. Variables1.13. Sumatorias

    1.1. La Estadística

    La Estadística es una ciencia que tiene por objeto recolectar, organizar, resumir,

    presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A

    través de la cuantificación y el ordenamiento de los datos intenta explicar los fenómenosobservados, por lo que resulta una herramienta de suma utilidad para la toma de

    decisiones

    1.2. Clases de Estadística

    Estadística Descriptiva. Son métodos y técnicas de recolección, resumen y

    presentación para describir apropiadamente las características de un conjunto de datos.

    Comprende el uso de gráficos, tablas y criterios para el análisis y únicamente se limita a

    realizar deducciones directamente a partir de los datos y parámetros obtenidos.

    Estadística Inferencial. Son métodos y técnicas que hacen posible estimar una o más

    características de una población o tomar decisiones sobre población basadas en el

    resultado de muestras. Estas conclusiones tienen cierto margen de error. Apoyándose en

    el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones,

    decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

    TEMA 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    13/88

    13

    Podríamos por tanto decir que se usa estadística en descriptiva, cuando los resultados del análisis

    no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es

    derivar las conclusiones obtenidas a un conjunto de datos más amplio.

    1.3. Población

    Es el conjunto de unidades o elementos que presentan algunas características comunes,

    que han sido escogidos para el estudio y que a partir de ellos se desea obtener la

    información. El estudio de la población completa se llama censo y es con frecuencia

    costoso, lleva mucho tiempo y no es práctico. Tiene las siguientes características:

      Homogeneidad - que todos los miembros de la población tengan las mismas

    características.

      Tiempo - se refiere al período de tiempo donde se ubicaría la población de interés.

      Espacio  - se refiere al lugar donde se ubica la población de interés. Un estudio no

    puede ser muy abarcador, hay que limitarlo a un área o comunidad en específico.

      Cantidad - se refiere al tamaño de la población. La falta de recursos y tiempo también

    nos limita la extensión de la población.

    Ejemplos  Total de amas de casa de Lima metropolitana en Abril del 2015

      Total de proveedores de Supermercados Peruanos en el año 2014

      La totalidad de Empresas pesqueras del Perú en el año 2013

    1.4. Muestra

    Es una pequeña porción representativa y adecuada de la población. Representativa, en el

    sentido de reflejar fielmente las características de la población

    de la cual procede y diferir de ella sólo en el número de

    unidades incluidas.

    Las razones para trabajar con muestras son:  Ahorro de

    tiempo, ahorro de dinero, facilidades operativas y rapidez en la

    obtención de resultados.Ejemplos:

      500 de amas de casa de Lima metropolitana elegidas al azar.

      Un grupo de proveedores de Supermercados peruanos escogidos aleatoriamente.

      15 empresas pesqueras del Perú escogidas en forma aleatoria.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    14/88

    14

    Unidad de Análisis. Son cada uno de los elementos de la población que mediante las técnicas de

    muestreo van a ser seleccionados para constituir la muestra

    Dato. Valor asociado con un elemento de la población o muestra. Puede ser un número, una palabra

    o un símbolo.

    1.5. Parámetro y Estadígrafo

    Parámetro. Es una medida de resumen que para determinar su

    valor es necesario utilizar la información de la población

    completa y por lo tanto las decisiones se tomaran con

    certidumbre total. 

    Estadígrafo. Es una medida que se calcula con los datos de la

    muestra. Los estadígrafos se usan para hacer inferenciasacerca de los parámetros de la población.

    1.6. Variable

    El término variable se utiliza para referirse a cualquier característica, que toma valores

    diferentes en un conjunto de observaciones extraídos de una población en estudio. Es

    todo aquello que puede ser medido, observado o manipulado durante un estudio. A

    las variables se les denota con las letra: x, y, z

    Ejemplo: marca de un producto, factura mensual de

    electricidad, número de clientes, genero de una

    persona, etc.

    Los datos son los valores que adoptanlas variables en cada caso particular  

    Clasificación de las Variables

     Según su naturaleza: Variables Cualitativas y cuantitativas

     Según su posición en una relación causal: dependientes e independientes

    Parámetros más conocidos

    Media poblacional  

    Varianza poblacional2

     

    Proporción poblacional P  

    Estadígrafos más conocidos

    Media muestra  x  

    Varianza muestral2 s  

    Proporción muestral  p  

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    15/88

    15

    A. Según su Naturaleza

    A1. Variables Cualitativas.  Llamadas también no numéricas, son variables cuyos

    valores consisten en categorías de clasificación y responde a una cualidad o atributo.

    No es posible realizar operaciones algebraicas con ellas.

    Ejemplo: género, calidad de un producto, tipo de teléfono celular, etc.

    Las variables cualitativas a su vez pueden clasificarse en:

      Variables cualitativas Nominales. Son aquellas que comprenden solo

    categorías de clasificación y no llevan ninguna ordenación Ejemplo: tipo de

    empleo, marca de un producto, carrera que uno

    sigue, partido político al que voto, tipo de crédito

    bancario que uno solicita, etc.

      Variables cualitativas Ordinales. Cuando lascaracterísticas no solo comprenden categorías

    de clasificación sino que llevan alguna

    ordenación. Ejemplo:  satisfacción con el

    servicio, grado de instrucción, jerarquía

    gerencial, clase social, el nivel de desempeño,

    calidad de un material, etc.

    A2. Variables Cuantitativas. Son características cuyos valores pueden ser obtenidos

    por medición o por conteo y a su vez pueden ser clasificadas en:  Variables cuantitativas discretas. Cuando las variables toman valores

    enteros y son obtenidos por conteo. Ejemplo: Número de tarjetas de crédito

    que se posee, cantidad de entidades bancarias por distrito, número de

    empleados por área, número de empresas por sector, etc.

      Variables cuantitativas continuas. Son aquellas que

    pueden tomar cualquier valor (entero, fraccionario o

    irracional) dentro un intervalo. Sus valores se obtienen

    principalmente a través de mediciones y están sujetos

    a la precisión de los instrumentos de medición.

    Ejemplo: la superficie de un terreno, la estatura de un

    individuo, los sueldos de los congresistas, el costo

    efectivo de un producto, el PBI anual, el monto de

    exportaciones e importaciones, etc.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    16/88

    16

    B. Según su posición en una Relación Causal

    B1. Variable Independiente. Es aquella que no depende de otras y afecta a otras

    variables. Son las características controladas por el

    investigador y que afecta o influye a la variable

    dependiente

    B2. Variable Dependiente. Recibe la influencia o efecto de

    la variable independiente. También se le llama variable

    respuesta y cumple el papel de efecto causa.

    Ejemplo: El clima organizacional de una entidad influye en

    el rendimiento y desempeño de los gerentes. De este enunciado identifica:

    Variable independiente: Clima organizacional

    Variable dependiente: rendimiento humano

    1.7. Sumatorias

    La suma de los valores de la variable X :1 2, ,.........,

     n x x x se define mediante la

    notación

    que indica que han de sumarse los elementos de la sucesión desde el

    subíndice 1i   hasta el subíndice i n , esto es:

    1 2

    1

      ......... n

    i n

    i

     x x x x

    Ejemplo: sean los gastos en alimentos de un ama de casa en 6 días de la semana: i  1 2 3 4 5 6

    i x   30 45 36 52 40 50

    Calcular la siguiente sumatoria:

    2 3 4 5

    5

    2

    45 36 52 40 173i

    i

     x x x x x

     

    Propiedades:

    a)

    1 1

     n n

    i i

    i i

     cx c x

    , para todo constante  c  

    b)1 1 1

     n n n

    i i i ii i i

     x y x y

     

     

    c)1 1 1

     n n n

    i i i ii i i

     x y x y

     

     

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    17/88

    17

    Sistematización de Datos enTablas de Frecuencias

    2.1. Tabla de Distribución de Frecuencias2.2. Tabla de Frecuencias de una Variable Cualitativa2.3. Tabla de Frecuencias de una Variable Cuantitativa

    Discreta2.4. Tabla de Frecuencias de Variables Cuantitativas

    agrupadas en intervalos

    2.1. Tabla de Distribución de Frecuencias

    Efectuados la clasificación y el conteo de los datos, es necesario presentarlos de manera

    clara, sintética y significativa para su mejor y fácil entendimiento. Para ello se recurre a la

    tabla de distribución de frecuencias. Una  Tabla de distribución de frecuencias de una

    variable es una descripción del número de veces, es decir, de las frecuencias con que se

    presentan las diversas categorías mutuamente excluyentes que corresponden a esa

    variable. Es un arreglo de los valores observados1 2, , .....,

     k x x x  de la variable  x  con sus

    respectivas frecuencias, en una tabla de la forma:

    Tabla N° 1

    Variable (xi)   f i  F i   hi   H i 

     X 1   f 1   f 1   h1=n1 /n   h1 

     X  2   f  2   f 1+f  2   h 2=n 2 /n   h1+h 2 

    …  ….  ….  ….  …. 

     X  k   f  k   f 1+f  2+….+n k   h k=n k /n   h1+h 2+….+h k 

    Total  

    1

     k

    i

    i

     n

     1

    1 k

    i

    i

     h

     

     Frecuencia Absoluta Simple (   i ), es el número de veces que aparece repetido el valor

    o cualidadi

     x , y se cumple que:1

     k

    i

    i

     f n

     

     Frecuencia Absoluta Acumulada (  i

     F ), Es la que resulta de sumar sucesivamente las

    frecuencias absolutas, así tenemos:  1

    i

    i k

     k

     F f 

     

    TEMA 

    PROPIEDAD: la suma de todas las frecuenciasabsolutas es igual al total de observaciones (n).

    PROPIEDAD: La última frecuencia acumuladaabsoluta es igual al total de observaciones. 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    18/88

    18

     Frecuencia Relativa Simple  (  i

     h ), es aquella que resulta de dividir cada una de las

    frecuencias absolutas entre el número total de datos. Sus valores son números reales

    que oscilan entre 0 y 1. Se denota por:

    ii

     f  h  n   ; 0 1i h  

     Frecuencia Relativa Acumulada (  i

     H  ), es igual al cociente entre la frecuencia absoluta

    acumulada y el número de observaciones realizadas ( n ), o también es la que resulta de

    sumar sucesivamente las frecuencias relativas. Se denota por:

    1

    i

    ii k

     k

     F H h

     n 

     

    2.2. Tabla de Frecuencias de una Variable Cualitativa

    Se usa para clasificar variables cualitativas.

    Ejemplo: Un grupo de clientes valora la gestión del

    departamento de servicio al cliente de un supermercado

    catalogándolo como: Excelente (E), Bueno (B), Regular (R) o

    Malo (M). Los resultados obtenidos son:

    E B B R E B E BM B E B R B E R

    R R M B B E B M

    E M E R R R B R

    B B E R R M B E

    Organice los datos en una tabla de distribución de frecuencias:

    Tabla N° 2

    Distribución de clientes según su valoración de la Gestión de

    Calidad del departamento del servicio al clientePreferencia  f i  Fi  hi  H i 

    Excelente  10  10  0.25  0.25 Buena  14  24  0.35  0.60 Regular   11  35  0.28  0.88 Mala  5  40  0.13  1.00 

    Total 50 1  

    PROPIEDAD: la suma de todas las frecuencias

    relativas es igual a la unidad.

    PROPIEDAD: La última frecuencia relativaacumulada es la unidad.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    19/88

    19

    Interpretación:

    f 3: 11 clientes opinaron que la gestión del departamento fue regular

    F2: 24 clientes opinaron que la gestión del departamento fue de buena a excelente

    h1: El 25% de clientes opinaron que la gestión del departamento fue excelente

    H3: El 88% de clientes opinaron que la gestión fue de regular a excelente

    2.3. Tabla de Frecuencias de una Variable Cuantitativa Discreta

    Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes

    valores que toman las variables. 

    Ejemplo: Se preguntó a 40 empleados de una empresa acerca del

    número de tarjetas de crédito que tienen afiliadas a un banco. Sus

    respuestas se encuentran a continuación

    1 3 1 1 1 2 4 2 1 12 2 4 1 2 3 1 2 5 14 3 5 1 1 1 2 1 2 22 4 3 1 2 1 1 2 3 3

    Tabla N° 3

    Distribución de empleados según el número de tarjetas de crédito que

    poseen en el banco

    N° de Tarjetas decrédito

     f i  Fi  hi  H i 

    1  16  16  0.40  0.4 2  12  28  0.30  0.7 3  6  34  0.15  0.85 4  4  38  0.10  0.95 5  2  40  0.05  1 

    Total 40 1.00  

    Interpretación:

    f 3:6 empleados poseen 3 tarjetas de crédito

    F2: 28 empleados poseen menos de 3 tarjetas de crédito

    H3: 85% de empleados poseen menos de 4 tarjetas de crédito

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    20/88

    20

    2.4. Tabla de Frecuencias de Variables Cuantitativas agrupadasen intervalos

    Son aquellas que se utilizan para agrupar datos cuantitativos mediante intervalos de

    frecuencias llamados intervalos de clase. Para construir la tabla con intervalos de clase se

    debe seguir los siguientes pasos:

      Paso1: Rango (R). Llamado también “recorrido de los datos”, es la diferencia entre el

    valor máximo y el valor mínimo de la variable. Consideremos las siguientes variables

    1 2 3, , , ......,

     n y y y y , entonces:

    max min R Y Y  

    Ejemplo: Los siguientes datos corresponden al tiempo en minutos que han necesitado

    16 clientes de un banco para llevar a cabo una transacción bancaria:

    5.3 2.4 2.1 1.2 1.3 1.4 5.5 1.6

    2.0 2.5 1.1 2.8 3.1 2.8 3.6 4.1

    Notamos que el tiempo mayor es 5.5 min y el tiempo menor es 1.1 min; El rango es

    R= 5.5-1.1= 4.4

      Paso2: Número de intervalos de clase ( m ).  Consiste en dividir el rango en un

    número conveniente de intervalos de clase. El número de intervalos depende

    principalmente del número de observaciones, sin embargo es recomendable que no

    sea menor que 5 ni mayor de 15 intervalos. Para determinar el número de intervalos

    usaremos la fórmula de Sturges: 1 3.32 og m L n 

    Si  m  es decimal, entonces se redondeará al entero superior inmediato.

    Ejemplo: Si 40 n  entonces 1 3.32 og 40 6.32 m L  , redondeando 7 m   

    Si 100 n  entonces 1 3.32 og100 7.64 m L  , redondeando 8 m   

      Paso3: Amplitud de Clase ( c ).  Es el tamaño o longitud que deben tener los

    intervalos; se recomienda tener intervalos del mismo tamaño. Se calcula mediante la

    formula: R

     c

     m

     

    Marca de clase (  i

     y ). Es la semisuma entre el límite superior y el límite inferior del

    intervalo de clase. Sea el intervalo  I S L L  entonces2

     I Si

     L L y

     

     

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    21/88

    21

    Ejemplo: El Boston Bank verificó el estado de la cuenta de 42 clientes tomados al azar y

    obtuvo los siguientes datos de sus saldos (en dólares)

    271 337 319 363 279 177 232429 235 123 294 227 295 250

    205 159 240 310 199 363 285459 170 320 309 279 434 325278 41 181 116 297 162 303188 294 335 266 100 131 200

    Construye una tabla de frecuencias adecuada para esta información e interprete.

    Pasos:

      Vmin= 41 Vmax=459 

      Rango : R = 459 – 41 =418

      N° de intervalos : m= 1+3.32*log(42)= 6.4= 7   Amplitud de intervalo: c= 418/7=59.7 =60

    Se construirá una tabla de frecuencias con 7 intervalos y amplitud constante de 60.

    Tabla N° 4

    Distribución de clientes según saldos que tienen en sus cuentas del

    Boston Bank

    Li -

    Ls

      Y i  f i  Fi  hi  H i 

    41  -  101  71  2  2  0.05  0.05 

    101  -  161  131  4  6  0.10  0.14 

    161  -  221  191  8  14  0.19  0.33 

    221  -  281  251  10  24  0.24  0.57 

    281  -  341  311  13  37  0.31  0.88 

    341  -  401  371  2  39  0.05  0.93 

    401  -  461]  431  3  42  0.07  1.00 Total 42 1

    Interpretación:

    f 3: 8 clientes tienen un saldo mínimo de $161 pero menos de $221

    F4: 24 clientes tienen en sus cuentas un saldo menor a $281

    h5: 31% de clientes tienen un saldo mínimo $281 pero menos de $341

    H3: ___________________________________________________________________

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    22/88

    22

    Representaciones Gráficas3.1. Gráficos Estadísticos3.2. Partes de un gráfico3.3. Clasificación de los gráficos

    Gráfico de Barras Polígono de frecuencias

    Gráfico Circular Gráfico de OjivasGráfico Lineal Gráfico BidimensionalHistogramas

    3.1. Gráficos Estadísticos

    Los gráficos estadísticos son aquellas imágenes que, combinando la utilización de

    sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de

    coordenadas permiten presentar información cuantitativa, con el fin de obtener una

    impresión visual global del material presentado, que facilite su rápida comprensión.

    3.2. Partes de un gráfico

    Los gráficos son una herramienta estadística que detecta la variabilidad, consistencia,

    control o mejora de un proceso y consta de las siguientes partes:

    • El título principal

    • Título secundario o subtítulo

    • El gráfico propiamente dicho

    • Fuente

    • Las notas explicativas

    • Interpretación

    Interpretación: En el Perú la exportación de langostinos tiene una tendencia creciente

    desde 2002 hasta el 2013.

    3.3. Clasificación de los gráficos

      Gráfico de Barras  Polígono de frecuencias

      Gráfico Circular  Gráfico de Ojivas

      Gráfico Lineal  Gráfico Bidimensional

      Histogramas

    TEMA 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    23/88

    23

    3.3.1. Gráfico de Barras. Este diagrama

    representa los valores de la variable en el

    eje de abscisas levantando en cada punto

    una barra de longitud igual a la frecuencia

    de ese valor. El ancho de las barras ha de

    ser el mismo y las divisiones de la escala,

    equitativas.

    3.3.2 Grafico Circular . Consiste en dividir

    un círculo en tantas porciones como clases

    existan, de modo que a cada clase le

    corresponde un sector circular proporcional

    a su frecuencia absoluta o relativa. Se

    utiliza para cualquier tipo de variable,

    especialmente cuando las frecuencias

    están expresadas en porcentajes. Siempre

    va acompañado de una leyenda.

    3.3.3 Gráfico lineal. Este diagrama es

    utilizado frecuentemente para mostrar

    los cambios de los valores de una

    variable con el paso del tiempo. Conjuntode puntos unidos por segmentos de

    líneas. Por lo general esta gráfica se

    utiliza para mostrar una tendencia

    3.3.4 Histogramas. Es una representación

    gráfica de una distribución de frecuencias

    agrupadas en intervalos de clase, mediante una

    serie de rectángulos contiguos. Su gráfica se

    realiza entre: (Intervalos vs f i) e (Intervalos vs hi)

    Ejemplo: En una muestra de 51 restaurantes de

    la ciudad a los cuales se les consultó los precios

    de sus platos (en nuevos soles), se obtuvo el

    histograma respectivo.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    24/88

    24

    3.3.5 Polígonos de Frecuencias. Este

    diagrama consiste en una serie de

    segmentos de recta que unen los puntos

    cuyas abscisas son los valores de la

    variable, o las marcas de clase, en el

    caso de variables continuas, y cuyas

    ordenadas son proporcionales a sus

    frecuencias respectivas.

    3.3.6 Gráfico de Ojivas. Su objetivo, al

    igual que el histograma y el polígono de

    frecuencias es representar distribuciones de

    frecuencias de variables cuantitativas

    continuas, pero sólo para frecuencias

    acumuladas.

    3.3.7 Gráfico Bidimensional.

    Permiten representar las series de

    datos en dos dimensiones o sea los

    valores se representan alineados en

    dos ejes perpendiculares: el eje

    horizontal X y el eje vertical Y. Son

    aplicaciones estadísticas al estudio

    en conjunto de dos variables

    cualitativas.

    4.6%

    66.0%

    29.5%

    5.6%

    65.2%

    29.1%

    6.2%

    68.3%

    25.4%

    0.0%

    10.0%

    20.0%

    30.0%

    40.0%

    50.0%

    60.0%

    70.0%

    Pobre

    extremo

    Pobre no

    extremo

    No pobre

    Distribución de los hogares en el área urbana según supercepción del nivel de vida de los hogares de su

    localidad y nivel de pobreza

    Mejoró

    Está igual

    Empeoró

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    25/88

    25

    ACTIVIDADES

    EJERCICIOS DE APLICACIÓN DE UNIDAD1

    1. Una empresa dedicada a la producción de ciertos artefactos eléctricos está conformada por 120empleados encargados de ventas. El Gerente desea realizar una proyección de las ventas para lospróximos años y para lograr esto considerará la cantidad de artefactos vendidos en los últimosmeses por 34 empleados escogidos de la empresa. Responda lo siguiente:

    a) ¿Cuál es la población y cuál es la muestra?

    b) Cual es la variable analizada y su tipo

    c) Identifique la estadística y proporcione su valor. 

    c) Identifique el parámetro de interés e indique su valor

    2. Clasificar adecuadamente las diversas variables con un aspa (X):

    Nº VARIABLECUALITATIVA CUANTITATIVA

    NOMINAL ORDINAL CONTINUA DISCRETA

    1 El monto ahorrado de una persona

    2 La altura de los edificios bancarios

    3 Situación laboral de un individuo

    4 El número de personas sin vivienda

    5 El municipio de ubicación de una empresa

    6 El desempeño de un economista

    7 El Nivel socioeconómico alcanzado

    8 Número de empleados por empresa

    9 El sector industrial de una empresa

    10 El costo de las materias primas

    3. Considere la siguiente situación. En una gran compañía, se está desarrollando un programa paraofrecer a los trabajadores una prestación que les permita adquirir un automóvil nuevo a un costomoderado tanto para el trabajador como para la empresa. Sin embargo, el contrato de arrendamientoimplica decidir qué tipo de automóvil prefieren los trabajadores, pues en función de esto se podráseleccionar la mejor empresa arrendadora. El gerente de recursos humanos realiza un muestreoaleatorio simple en la nómina de la empresa: selecciona 60 trabajadores sin importar los niveles, y lesaplica una encuesta en la cual les pregunta cuál sería la marca de su preferencia. A continuación sepresentan los resultados.

    FORD = F  CHEVROLET = CH  MAZDA = M VOLKSWAGEN = V NISSAN = NOTROS = O. 

    F CH CH F M CH F CH CH O

    V F N CH CH CH F CH V VN CH CH N M M O V F F

    CH CH N F CH V V V CH VM V CH CH V N O V F M

    CH V V M CH CH CH O V M

    a) Construya una tabla de Distribución de Frecuencia para dichos datos.

    b) Interprete las siguientes frecuencias:3

    ;2

     F ;4

     h ;3

     H   

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    26/88

    26

    4. Construye la taba de frecuencias en base a la información dada a continuación:

    i X   Precio de productos 

    312 f    

    20.40 H    

    210.5 X    

    10.08 h    50

    i n   

    418.5 X    

    40.36 h    4 m

     

     

    5. Se desea realizar un estudio acerca de los gastos mensuales que efectúan los docentes de laUniversidad Villarreal al estudiar un doctorado, para lo cual se tienen los siguientes gastos en solesde 30 docentes elegidos al azar:

    a) Construir la correspondiente tabla de distribución de frecuencias por intervalos.

    b) Interpretar:  F h H 3 4 6 5

    ; ; ;

    c) ¿Qué porcentaje de docentes gastan más de S/.564?

    6. La empresa SILICON.COM  es creadora de software a medida para los Bancos. Al igual que encualquier negocio, es importante el tiempo que demoran los clientes para pagar sus facturas. Acontinuación se presentan los tiempos en días de una muestra de facturas de esa compañía:

    X=Tiempoi

     y  i 

    i F  

    i h  

    i H   

    [ -   23 7

    [ -   31 20

    [ -   16

    [ -  

    [ - ] 60 0.15

    Total

    a) Completar la tabla de frecuencias b) Interpretar:3 3

    ; H   

    7. Este histograma representa el número de artículos vendidos en una tienda en una semana,clasificados según su precio en euros…

    a) Construye la tabla de frecuencias.b) ¿Qué grupo de artículos tuvo mayor venta?

    567 559 564 570 564 558

    551 568 574 558 563 569

    560 578 550 572 569 571

    559 558 553 557 556 561

    575 565 564 558 563 570

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    27/88

    27

    AUTOEVALUACIÓN N° 11. En una encuesta publicada en el diario EL COMERCIO se preguntó a 2013 adultos lectores: “¿Qué

    tan satisfecho está usted con la economía peruana en la actualidad?” (El comercio, 12 de diciembrede 1997). Las categorías de las respuestas eran Insatisfecho, Satisfecho y No estoy seguro.Determine:

    a) Objetivo del problema _____________________________________________________________b) Variable y tipo ___________________________________________________________________

    c) Población _______________________________________________________________________

    d) Muestra ________________________________________________________________________

    e) Parámetro ______________________________________________________________________

    2. Marca un aspa (X) identificando el tipo de variable

    Nº VARIABLE CUALITATIVA CUANTITATIVANOMINAL ORDINAL CONTINUA DISCRETA

    1 Marcas de cerveza de las tiendas2 N° de pedidos ingresados al sistema

    3 Los interés ganados por un préstamo4 El nivel de audición de un individuo5 Opinión sobre la economía actual

    3. Los productores del programa televisivo PROMOVIENDO  hicieron un estudio sobre los puntos derating por día que tiene el programa. Como resultado se obtuvo la siguiente tabla para n de días:

    Puntos de Ratingi

     y  i

     f   i

     F  i

     h  i

     H   

    [ -   0.10

    [ -   11

    [ - 26   0.16

    [ -   15

    [ -  [ - ]  4 50TOTAL

    a) Completar la tabla de distribución si C= 8 

    b) Interpretar 3

     F ________________________________________________________________

    c) ¿En cuántos días se obtuvieron por lo menos 34 puntos de rating? _______________________d) Construya un polígono de frecuencias

    4. Analiza Interpreta el siguiente gráfico estadístico acerca de la producción nacional:

     ________________________________________ 

     ________________________________________  ________________________________________ 

     ________________________________________ 

     ________________________________________ 

     ________________________________________ 

     ________________________________________

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    28/88

    28

    Unidad

    MEDIDAS DESCRIPTIVASNUMERICAS

    En esta unidad el estudiante calculará las medidas descriptivas de tendencia central y

    dispersión mediante fórmulas establecidas, siendo capaz de resolver problemas aplicados en

    economía así como el uso de las propiedades de medidas descriptivas.

    ontenido Temático

      Tema IV: Medidas de Tendencia central

      Tema V: Medidas de Dispersión o Variabilidad

    OBJETIVOS ESPECÍFICOS

      Calcular e interpretar los diferentes tipos de medidas de tendencia central para su

    aplicación en distintos problemas de economía según se trate de datos agrupados y no

    agrupados.

      Identificar y calcular las medidas de dispersión que más se utilizan en la solución de

    problemas con datos que presentan variación así como la interpretación y comparación

    de la variabilidad de dos o más distribuciones de datos.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    29/88

    29

    Medidas de Tendencia Central4.1. Concepto y Clasificación4.2. Media Aritmética4.3. Moda4.4. Mediana

    4.5. Comparación entre la media, moda y mediana

    4.1. Concepto y Clasificación

    Se denominan también medidas de centralización, son aquellos valores numéricos en

    torno a los cuales se agrupan, en mayor medida, los valores de una variable e indican el

    centro de la distribución de los datos, es decir es el valor representativo de estos. Las más

    comunes son:

      Media Aritmética

      Mediana

      Moda

    4.2. Media Aritmética

    La Media Aritmética o simplemente media es el estadígrafo de tendencia central mas

    importante y comúnmente se le conoce como Promedio. La Media Aritmética se define

    como el cociente de la suma de los valores de una variable entre el número deobservaciones o valores. Simbólicamente se denota con  X  

    4.2.1 Calculo de la Media para Datos no Agrupados

    Se calculará cuando se tiene un conjunto de “n” observaciones que no estan

    agrupados en tablas de frecuencias. Se calcula con la siguiente formula:

    1 1 2...........

     n

    ii

     n X 

     X X X  X 

     n n

     

     

    Ejemplo: Sea una muestra del precio de 7 libros de economía: 73, 68, 59, 40, 81, 72 y

    40. Calcula e interprete la media aritmética.

    73 68 59 40 81 72 4061.86

    7 X 

     

     

    TEMA 

    Interpretación : El precio

    medio de los libros de

    economía es de S/. 61.86 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    30/88

    30

    4.2.2 Calculo de la Media para Datos Agrupados

    Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luego

    se calcula la media aritmética aplicando la fórmula:

    1

     n

    i i

    i

     f y

     x n

     

    Ejemplo: A continuación se muestra la producción anual de caña azúcar en miles de

    toneladas en 80 haciendas del departamento Lambayeque. Calcule la media

    aritmética e interprete:

    Producción

      I S L L  

    i y   i f    i i f y  

    [5 12

      8.5 10 85

    [12 19

      15.5 14 217

    [19 26   22.5 28 630

    [26 33

      29.5 20 590

    [33 40  36.5 8 292

    TOTAL n =80 1814

     Aplicando la formula se tiene:1814

    22.6880

    i i f y

     x n

     

    Interpretación: La producción anual media de caña de azúcar en las haciendas de

    Lambayeque es de 22680 toneladas

    4.3. Moda (Mo)

    La moda es el dato que aparece más veces en un grupo. Es el valor que más se repite o el

    que se presenta con mayor frecuencia en un conjunto de datos. La moda puede ser:

    Donde: 

     f i= frecuencia absoluta 

     yi= Marca de clase 

     n = número de observaciones 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    31/88

    31

    4.3.1 Calculo de la Moda para Datos no Agrupados

    Se ordenan los datos en forma creciente o decreciente y se ubica los valores que más

    se repiten.

    Ejemplo: Los datos de rendimiento por acción para una muestra de 8 empresas son

    los siguientes: (Hallar la moda en los tres casos)

    a) 2.2; 3.4; 2.1; 3.4; 2.2; 2.2; 1.8; 2.2 Mo= 2.2

    b) 1.2; 2.5; 2.1; 2.4; 2.4; 2.4; 1.2; 1.2 Mo= 1.2 y 2.4

    c) 1.9; 2.5; 2.3; 2.4; 1.4; 3.4; 2.2; 1.2 Mo= no existe moda

    4.3.2 Calculo de la Moda para Datos Agrupados 

    Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luegose calcula la Moda aplicando la fórmula:

    1

    2 1

     I j o M L c

     

    Donde:

     I  L : Límite inferior de la clase modal

     j

     c : Amplitud del intervalo de la clase modal

    1 1 j f 

     

    2 1 j j f f 

     

     j f  : Frecuencia absoluta modal

    1 j f 

     

    : Frecuencia absoluta anterior a la frecuencia modal

    1 j f 

     

    : Frecuencia absoluta posterior a la frecuencia modal

    Observaciones:

      La moda se puede determinar en todos los dos tipos de variables cualitativas y

    cuantitativas.

      La moda tiene la ventaja de no ser afectada por valores extremos

    Ejemplo: Calcule e interprete la moda de la la producción anual de caña azúcar en

    miles de toneladas en 80 haciendas del departamento Lambayeque.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    32/88

    32

    Producción

      I S L L  

    i y   i f   

    [5 12

      8.5 10

    [12 19   15.5 14

    [19 26

      22.5 28

    [26 33   29.5 20

    [33 40 

    36.5 8

    TOTAL   n =80

     

    Pasos:

      Ubicamos primero la mayor frecuencia: 28 j

     f    

      Luego la moda se encuentra en la clase 19 - 26, por lo tanto

      19 I 

     L   ; 28 j

     f  

     ; 1 14 j f    ; 1 20 j f     7 j c   

      1 28 14 14 ; 2 28 20 8  

    1419 7 23 455

    14 8. Mo

     

     

     

    Interpretación: La producción anual que más se repite es 23455 Tm, lo que significa

    que la mayoría de las haciendas producen esa cantidad.

    4.4. Mediana (Me)

    Es el valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma

    cantidad de elementos, es decir la media se encuentre exactamente en el centro. La mitad

    de los datos son menores que la mediana y la otra mitad son mayores.

    4.4.1 Mediana de Datos no Agrupados

    Para determinar la Mediana de  n  observaciones1 2, ,.........,  n x x x primero se ordenan

    dichas observaciones descendentemente ó ascendentemente luego se ubica o se

    calcula la mediana dependiendo de la cantidad de datos “n” si es par o impar:

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    33/88

    33

      Ejemplo1. (Cuando el nº de datos es impar)

    17, 24, 20, 18, 22, 21, 24; Ordenando: 17, 18, 20, 21, 22, 24, 24 (n=7 impar)

    7 14

    2 Posicion

     

     21 Me   

      Ejemplo2. (Cuando el nº de datos es par)

    13 , 14, 7, 11, 15, 16, 12, 9 ; ordenando: 7, 9, 11, 12, 13, 14, 15, 16 (n=8 par)

    12 1312.5

    2 Me

     

     

    4.4.2 Mediana para Datos Agrupados

    Cuando se trabajan con tablas de frecuencias de intervalos, la fórmula para calcular la

    mediana es:

    1

    1

    2  j

     I j

     j j

     n  F Me L c

     F F

     

     

     

     

    Donde:

     I  L : Límite inferior de la clase mediana

     J  c : Amplitud del intervalo de la clase mediana

     n : número total de observaciones o datos

     F : Frecuencia acumulada de la clase mediana

    1 j F

     

    :Frecuencia acumulada anterior de la clase mediana.

    Ejemplo: Calcule e interprete la mediana de la la producción anual de caña azúcar

    en miles de toneladas en 80 haciendas del departamento Lambayeque.

    Producción

      I S L L  

    i y   i   i F  

    [5 12

      8.5 10 10[12 19   15.5 14 24

    [19 26   22.5 28 52

    [26 33   29.5 20 72

    [33 40 

    36.5 8 80

    TOTAL n =80

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    34/88

    34

    Pasos:

    i) Calcular80

    402 2

     n  y ubicar en los i F  

    ii) Luego la mediana se encuentra en la clase [19 26 , por lo tanto:

    19 I 

     L   ; 52 j

     F  ;

    124

     j F

     

     ; ; j

    c =7  

    40 24 1619 7 19 7 23

    52 24 28 Me

     

     

     

    Interpretación: El 50% de las haciendas producen anualmente una cantidad menor

    o igual a 23000 toneladas.

    4.5. Comparación entre la media, moda y mediana

      Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.

      En una distribución con sesgo positivo, la moda se halla en el punto más alto de la

    distribución, la mediana está hacia la derecha de la moda y la media más a la derecha.

    Es decir Mo < Me <  x   (a)

      En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está

    a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir x   < Me < Mo (b)

    Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser

    la mejor medida de posición. La mediana no se ve influida por la frecuencia de aparición de

    un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores

    extremos como la media.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    35/88

    35

    Medidas de Dispersión5.1. Concepto y Clasificación5.2. Rango5.3. Varianza y Desviación Estándar

    5.3.1 Para datos no agrupados

    5.3.2 Para datos agrupados5.4. Coeficiente de variación

    5.1. Concepto y Clasificación

    La dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las

    diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor

    concentración de los datos en torno a un valor central. Las más comunes son:

      Recorrido o rango  Varianza

      Desviación Estándar o Típica

      Coeficiente de Variación

    Ejemplo: Dados los siguientes histogramas ¿en cuál de los gráficos existe mayor

    dispersión?

    5.2. Rango o recorrido

    El rango es la diferencia entre los datos mayor y menor del conjunto. También se llama

    “recorrido”. En un conjunto de datos, mientras mayor sea el rango, mayor será su

    dispersión y mientras menor sea su rango, menor su dispersión. Su fórmula es:

    max min R X X  

    TEMA 

    Según los histogramas elgráfico (d) presenta mayor

    dispersión y el gráfico (a)

    menor dispersión o poca

    variabilidad. 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    36/88

    36

    Ejemplo: A continuación se muestran las utilidades de 10 corporaciones industriales

    estadounidenses más grandes en millones de dólares. Calcular el rango de los datos.

    Utilidades($millones) 242 580 187 258 515 234 213 597 212 268

    597 187 410 R   (Millones de dólares)

    5.3. Varianza y Desviación Estándar

    La Varianza es un valor numérico que cuantifica el grado de dispersión de los valores de

    una variable respecto a su media aritmética. La Varianza y la Desviación Estándar son las

    medidas de dispersión más importantes. Si se trabaja con la población se calcula la

    varianza poblacional (2

    ) y si se toma una muestra se calcula la varianza muestral (s2

    )

     Para Datos No Agrupados

    TIPO VARIANZA DESVIACIÓNESTÁNDAR

    POBLACIONAL

    22

    2

    2 1( )

     N 

    ii

    i

     X X  X N X 

    V X  N N 

     

      ( )V X   

    MUESTRAL2 2

    1 1

    2

    2

    ( ) 1 1

     n n

    i

    i ii x x x nx

     s V x  n n

     

     

      ( ) s V x  

     Para Datos Agrupados

    TIPO VARIANZA DESVIACIÓNESTÁNDAR

    POBLACIONAL

    2 22

    2 1 1( )

     N N 

    ii i

    i ii X X f X N X 

    V X  N N 

     

     

    ( )V X   

    MUESTRAL2 2

    1 1

    2

    2 ( )1 1

     n n

    i

    i i

    i i i x x f x nx

     s V x n n

     

     

      ( ) s V x  

    Observaciones:

      A la desviación estándar también se la llama desviación típica y es la raíz

    cuadrada de la varianza. La varianza nunca es negativa.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    37/88

    37

      Cuando la variable toma un único valor; es decir cuando es constante entonces la

    varianza es cero.

      Mientras más se aproxima a cero, más concentrados están los valores de la serie

    alrededor de la media. Por el contrario, mientras mayor sea la varianza, más

    dispersos están.

    5.3.1 Cálculo de la varianza y desviación estándar para datos no agrupados  

    Ejemplo: en una fábrica ensambladora de autos se desea analizar el tiempo que

    demora un empleado en terminar de armar una puerta. A continuación se tienen

    los tiempos en minutos de dicho empleado al armar 10 puertas:

    39 29 43 52 3944 40 36 44 35

    Calcule e interprete la Varianza y Desviación Típica. 

      Hallamos primero la media: 40.1 x   

      Varianza :

    2 2 2

    239 40.1 29 40.1 ....... 35 40.1

    38.7710 1

     s 

     

      Desviación estándar : 38.77 6.23 s   

    Interpretación: Los tiempos que tardan en armar una puerta se alejan de la mediaen 6.23 minutos aproximadamente por puerta.

    5.3.2 Cálculo de la varianza y desviación estándar para datos agrupados  

    Ejemplo: A continuación se muestra la producción anual de caña azúcar en miles de

    toneladas en 80 haciendas del departamento Lambayeque:

    Producción

      I S L L  

    i y   i f    i i f y  

    2

    i i f y  

    [5 12

      8.5 10 85 722.5[12 19   15.5 14 217 3363.5

    [19 26

      22.5 28 630 14175

    [26 33   29.5 20 590 17405

    [33 40  36.5 8 292 10658

    TOTAL n =80 1814 46324 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    38/88

    38

    Calcula la media, varianza y desviación estándar:

      Determinando la media:1814

    22.6880

    i i f x

     x n

     

      La Varianza es:2

    2 46324 80(22.68)65.49

    80 1 s

     

     

      La Desviación Estándar es 2 65.49 8.09 s s  

    Interpretación: La cantidad producida por las haciendas se desvían de su media

    aritmética en 8.09 toneladas aproximadamente.

    5.4. Coeficiente de Variación

    Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de

    hacer comparaciones entre muestras. No tiene unidades de medida. Siempre seexpresa en porcentajes, no en términos de la unidad de medida de los datos

    estudiados. Se calcula mediante la fórmula:

    . % 100S

    C V  X 

      (Coeficiente de variación muestral)

    Observación:

      Al realizar comparaciones entre dos variables, el C.V. más pequeño será el que

    tenga menor dispersión relativa.

      Un C.V. mayor a 30% indica un alto grado de dispersión y pequeña representatividad

    de la media, pero cuanto menor sea a 30% la media será más representativa.

    Ejemplo: Supongamos que dos empresas repartieron sus beneficios entre sus

    principales accionistas, y que el reparto se realiza de la siguiente forma:

    Empresa A Empresa B

    Media Aritmética 25000 125000Desviación Estándar  19148.54 12909.94

    ¿Cuál de los dos repartos es el más equitativo?

    Solución: Calculamos el coeficiente de variación para ambas empresas:

    Empresa A Empresa B

    C.V. 0.766 0.103

    Comparando los dos coeficientes se observa que la empresa B tiene el menorcoeficiente, por lo tanto dicho empresa tiene los repartos más equitativos.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    39/88

    39

    ACTIVIDADES

    EJERCICIOS DE APLICACIÓN DE UNIDAD2

    1. Los sueldos de cinco empleados de una empresa son: $4000, $5000, $4500, $6000 y $35000. Calcula

    el sueldo medio, la moda, si es que existe, y la mediana e indica cuál representa mejor a los datos.

    2. Se desea analizar el precio de las viviendas en el municipio de Villa el Salvador para ello tras unminucioso estudio en el registro de la propiedad y una agrupación de los datos se obtiene quedurante los primeros 5 meses del presente año los precios vienen reflejados en la tabla siguiente y lasunidades vienen dadas en miles de euros.

    Precio i y i   i F   i i y f   

    [ 12 – 16   3

    [ –   14

    [ –   33[ –   21

    [ – ] 9

    Total

    a) Calcule el precio medio, moda y mediana e interpreteb) Calcule e interprete la varianza, desviación estándar y coeficiente de variación

    .3. En el departamento de bienestar de cierto municipio se realiza una encuesta en un condominio para

    estimar el monto mínimo diario para cubrir la canasta familiar de los vecinos:

    Monto mínimoi

     f   

    65 1166 1567 968 569 2

    Total

    Calcule e interprete las medidas de tendencia central media, moda y mediana

    4. En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el siguientehistograma de frecuencias, entonces la nota promedio del curso y la desviación estándar son:

    i y i   i i y f   [ –  

    [ –  

    [ –  

    [ –  

    [ –  

    [ – ]

    Total

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    40/88

    40

    5. Dado el siguiente cuadro estadístico sobre el número de empleados de un grupo de compañíasazucareras con ancho de clase constante igual a 20. Determine la media, moda y mediana de losdatos e interpreta.

      si  L L     iY    i   i F   i iY f   

      -   880

      -   1950

      -   35 1800  -   13

      - 200  

      - ] 4 70

    Total

    6. Los costos de fabricación, en soles, de siete objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77,

    9.00, 9.36 si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5 soles,

    calcular la utilidad media por objeto.

    7. En una encuesta sobre bienes y raíces en la Urbanización Santa Eulalia, se obtiene entre otras cosas,información sobre el valor actual de la casa y el tamaño del lote de terreno. Se está interesado endeterminar si el valor de avalúo tiene mayor variabilidad que el tamaño del lote. De la mencionadaencuesta se consigue lo siguiente:

    Valor de la casa Tamaño del terreno

    Media= S/350.00 Media = 120 m2

    Desviación estándar=S/ 50.00 Desviación estándar = 5m2

    8. En un estudio comparativo de los rendimientos de ciertos bonos, se elaboró la siguiente distribución

    de los rendimientos al vencimiento de una muestra de 50 bonos.Resumenporcentual

    i y   Números de

    bonosi i

     y   2i i

     f y  

    6.0 -7.9 48.0 -9.9 5

    10.0 -11.9 1112.0 -13.9 2114.0 -15.9 9

    Total

    a) Determina la media y la desviación típicab) Se puede concluir que los rendimientos son uniformes

    9. Se realiza un estudio sobre los gastos mensual en alimentación en tres niveles socioeconómicos. Secuenta con la siguiente información:

    Nivel A Nivel B Nivel CGasto promedio 4000 2500 900Desviación estándar 520 310 120

    ¿En qué nivel socioeconómico los gastos son más homogéneos?

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    41/88

    41

    AUTOEVALUACIÓN N° 21. Indique si son verdaderas o falsas las siguientes afirmaciones

    Afirmación V F

    a) El valor de la mediana solo se puede calcular en variables cuantitativas

    b) La desviación estándar es siempre menor que la varianza

    c) Si las unidades están en minutos, la varianza se expresa en minutos al cuadrado

    d) El rango es la diferencia entre el valor máximo y el valor mínimo

    e) Dentro de un conjunto de datos puede existir más de una moda

    2. La venta semanal en florería el ROSAL es la siguiente:

    Preciosi

     y  i

     f 

    (Clientes)i

     F  i i

     y   2i i

     y  

    [25 – 35) 25

    [35 – 45 ) 40

    [ 45 – 55) 13

    [55 – 65 ) 38

    [65 – 75 ) 15

    TOTAL

    a) Calcule la media, moda, mediana e interpretea) Calcula La Varianza, desviación estándar en interpretab) ¿Se puede decir que la distribución de precios es uniforme? Justifique su respuesta

    3. Se clasifica a los Gerentes de acuerdo a grado de responsabilidad obteniéndose los siguientesresultados respecto de su sueldo promedio anual:

    a) ¿Qué medida me permite comparar la dispersión de sueldos? b)  Calcule el coeficiente de variación para cada grupo y responda ¿Qué grupo es más homogéneo

    en sus sueldos? 

    4. Enseguida, aparecen los números de automóviles vendidos por dos agentes, por arriba y por debajode sus cuotas de ventas, en seis períodos semanales:

    a) Calcule la desviación estándar de cada una de estas muestrasb) ¿Cuál de las dos muestras es más homogénea?

    Vendedor 1 3 5 -1 4 3 4

    Vendedor 2 2 5 4 -1 4 2

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    42/88

    42

    Unidad

    DISTRIBUCIONESBIDIMENSIONALES

    En esta unidad se analizará la dependencia y asociación de variables estadísticas mediante el

    uso de modelos lineales y de medidas de asociación en el estudio de los fenómenos

    económico-financieros.

    OBJETIVOS ESPECÍFICOS  Clasificar datos cuantitativos bidimensionales en forma sistemática, aplicando las técnicas

    de la estadística descriptiva.

      Resumir datos cuantitativos bidimensionales, aplicando medidas estadísticas descriptivas y

    realizando un análisis crítico e interpretativo de los resultados.

      Determinar la correlación y regresión lineal existente entre dos variables X e Y. Dominar los

    métodos de regresión simple, análisis de correlación y coeficiente de determinación.

    ontenido Temático

      Tema VI: Distribuciones Bidimensionales

      Tema VII: Medidas estadísticas bidimensionales

      Tema VIII: Análisis de Correlación y Regresión

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    43/88

    43

    Distribuciones Bidimensionales6.1. Definición

    6.2. Tablas Estadísticas Bidimensionales

    6.3. Distribuciones Marginales

    6.4. Frecuencias Relativas6.5. Grafico Bidimensional

    6.1. Definición

    Las distribuciones bidimensionales son

    aquellas en las que se estudian al mismo

    tiempo dos variables de cada elemento

    de la población. Estas variables pueden

    ser cuantitativas o cualitativas. Por

    ejemplo: peso y altura de un grupo de

    estudiantes; edad y horas de lectura;

    usuario y turno de asistencia, etc.

    Se desarrollaran un conjunto de técnicas

    que permite describir las relaciones que ligan a esas dos variables o a esos dos atributos,

    para establecer el grado de dependencia o asociación entre ellos, así como para estimar

    una de ellas a partir del comportamiento de la otra.

    Ejemplo1: Entre los empleados de una empresa se ha realizado una encuesta sobre el

    consumo del tabaco, que ha arrojado los siguientes resultados:

    HabitoSexo

    Fumadores No fumadores Totales defilas

    VaronesMujeres

    4943

    6437

    11380

    Totales decolumnas

    92 101 193

    Interpretación: 49 empleados son varones y fumadores, 43 empleados son mujeres y

    fumadoras, etc.

    TEMA 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    44/88

    44

    6.2. Tablas Estadísticas Bidimensionales

    Consideremos un conjunto de n observaciones para dos variables X e Y en forma

    simultánea:

    1 2 3 k x , x , x , ......,x  las k modalidades o valores de la variable x

    1 2 3 e y , y , y , ......, y   las l modalidades o valores de la variable y

    Una tabla de distribución de frecuencias bidimensional es una tabla de doble entrada que

    agrupa en filas las modalidades o valores de X, y en columnas las modalidades o valores

    de la característica Y (tabla de kxe, k-filas y e-columnas)

    Y

     X

     y1  y 2  y 3  .........ye  TOTAL

     f i. 

     x1   f 11  f 12  f 13  .........f 1e  f 1. 

     x 2   f 21  f 22  f 23  .........f 2e  f 2. 

     x 3   f 31  f 32  f 33  .........f 3e  f 3. 

     . . . . ............ .

     . . . . …......... .

     . . . . ……..... .

     x k   f l1  f l2  f l3  .........f ke  f k. 

    TOTAL f  .j  f.1  f  .2  f  .3  f  .e 

     k e

    ij

    i 1 j 1

     n f 

     

    Donde:

    ij f  = número de veces que aparece repetido el par i j( x ,y )   y se llama frecuencia

    absoluta.

    e

    i . ij j 1

     f f 

    = Frecuencia marginal de   i . x , es el total de cada fila.

     k

     . j ij

    i 1

     f f 

    = Frecuencia marginal de   . j , es el total de cada columna.

     k e

    ij

    i 1 j 1

     n f 

    = número total de pares observados

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    45/88

    45

    Ejemplo 2: Dada la distribución bidimensional:

    X  1 2 1 2 3 2 2 2 3 1 Y  3 5 2 3 5 4 3 5 5 3

    Su la tabla de frecuencias bidimensional correspondiente es:

     Y

    2 3 4 5 Frec. absolu tas

    marginales de X 

    1 1 2 0 0 3

    2 0 2 1 2 5

    3 0 0 0 2 2

    Frec. absolutas

    marginales de Y

    1 4 1 4 n=10

    6.3. Distribuciones Marginales

    Son tablas que representan a la variable X y sus frecuencias marginales y de igual manera

    a la variable Y con sus frecuencias marginales:

    Distribución marginal de X Distribución marginal de Y

     X

    i .

     f    Y . j

     f   

     x1 1.

     f     y1   .1 f   

     x 2  2.

     f     y 2   .2 f   

     x 3  3.

     f     y 3   .3 f   

     .

     .

    .

    .

     .

     .

    .

    .

     x k  k .

     f    Y e   . j f   

    Total  k

    i .

    i 1

     n f 

     Total e

     . j

     j 1

     n f 

     

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    46/88

    46

    Ejemplo 3: del ejemplo 2 obtener la distribución marginal de X e Y

    Distribución marginal de X Distribución marginal de Y

    X i . f    Y  . j f   

    1 3 2 1

    2 5 3 4

    3 2 4 1

    Total 10 5 4

    Total 10

    6.4. Frecuencias Relativas

    En muchas situaciones en vez de trabajar con las frecuencias absolutas, podemos

    construir tablas con las frecuencias relativas (proporciones), como se hizo en el caso

    unidimensional. Sin embargo aquí existen 3 posibilidades de expresar la proporción de

    elementos en cada celda:

    i) Con relación al total general y se llama frecuencia relativaij

    ij

     f  h

     n  

    ii) Con relación al total de cada filaij

    ij

    i .

     f  h

     f   

    iii) Con relación al total de cada columnaij

    ij

     . j

     f  h

     f   

    De acuerdo al objetivo de cada investigación, una de estas proporciones será la más

    conveniente para ser usada.

    Ejemplo 4: Supongamos que queremos analizar el comportamiento conjunto de las

    variables: Grado de instrucción (Y), y región de procedencia (X) de los empleados del

    Ministerio de Salud. Los datos están agrupados en la siguiente tabla de doble entrada:

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    47/88

    47

    Y

    X

    Primaria

    Completa

    Secundaria

    Completa

    Superior Total

    Costa 40 30 20 90

    Sierra 35 15 10 60

    Selva 30 15 5 50

    Total 105 60 35 n=200

    a) Hallar la distribución conjunta de las proporciones con relación al total general

    b) Hallar la distribución conjunta de las proporciones con relación al total de cada fila

    c) Hallar la distribución conjunta de las proporciones con relación al total de cada columna.

     

    Tabla A: Distribución conjunta de las proporciones con relación al total

    Y

    X

    Primaria

    Completa

    Secundaria

    Completa

    Superior  Total

    Costa 20.0% 15.0% 10.0% 45.0%

    Sierra 17.5% 7.5% 5.0% 30.0%

    Selva 15.0% 7.5% 2.5% 25.0%

    Total 52.5% 30.0% 17.5% 100.0%

    Interpretación: El 20% de los empleados son de la costa y tienen primaria completa. El2.5% son de la selva y tienen estudios superiores. El 45% son de la costa, el 52.5% tienen

    primaria completa.

    Tabla B: Distribución de las proporciones con relación al total de cada fila

    Y

    X

    Primaria

    Completa

    Secundaria

    Completa

    Superior  Total

    Costa 44.4% 33.3% 22.2% 100.0%

    Sierra 58.3% 25.0% 16.7% 100.0%

    Selva 60.0% 30.0% 10.0% 100.0%

    Total 52.5% 30.0% 17.5% 100.0%

    Interpretación: El 44.4% de los empleados de la costa tienen primaria completa, el 16.7%

    de los empleados de la sierra tienen estudios superiores.

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    48/88

    48

    Tabla C: Distribución de las proporciones con relación al total de cada Columna

    Y

    X

    Primaria

    Completa

    Secundaria

    Completa

    Superior  Total

    Costa 38.1% 50.0% 57.1% 45.0%

    Sierra 33.3% 25.0% 28.6% 30.0%

    Selva 28.6% 25.0% 14.3% 25.0%

    Total 100.0% 100.0% 100.0% 100.0%

    Interpretación: El 38.1% de los empleados con primaria completa son de la costa, el 25%

    de los empleados con secundaria completa son de la sierra.

    6.5. Grafico Bidimensional

    Permiten representar las series de datos en dos dimensiones o sea los valores se

    representan alineados en dos ejes perpendiculares: el eje horizontal X y el eje vertical Y.

    Son aplicaciones estadísticas al estudio en conjunto de dos variables cualitativas.

    Ejemplo: tomando en cuenta el ejemplo anterior de la distribución conjunta de las

    proporciones del Grado de instrucción (Y), y región de procedencia (X) de los empleadosdel Ministerio de Salud con relación al total tenemos el siguiente gráfico:

    0.0

    2.0

    4.0

    6.08.0

    10.0

    12.0

    14.0

    16.0

    18.0

    20.0

    Primaria Completa SecundariaCompleta

    Superior 

    20.0%

    15.0%

    10.0%

    17.5%

    7.5%

    5.0%

    15.0%

    7.5%

    2.5%

    Costa Sierra Selva

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    49/88

    49

    Medidas EstadísticasBidimensionales

    7.1. Mediciones Marginales

    7.1.1 Medias Marginales de X e Y

    7.1.2 Varianzas Marginales de X e Y:

    7.1.3 Desviaciones Estándar Marginales de X e Y

    7.1.4 Covarianza Entre X e Y

    7.2. Distribuciones condicionadas

    7.1. Mediciones Marginales

    Sabemos que las distribuciones marginal de X son los totales de las filas y la distribución

    marginal de Y son los totales de las columnas, dichos totales vendrían a ser sus

    frecuencias absolutas. (Ver tema 6)

    Distribución marginal de X Distribución marginal de Y

    Xi .

     f    Y  . j f   

    x1 1.

     f     y1   .1 f   

    x2  2.

     f     y2   .2 f   

    x3  3.

     f     y3   .3 f   

    .

    .

    .

    .

    .

    .

    .

    .xk 

     k . f    Ye   . j f   

    Total  k

    i .

    i 1

     n f 

     

    Total e

     . j

     j 1

     n f 

     

    7.1. 1 Medias Marginales de X e Y:

     k

    i . i

    i 1

     f x

     x  n

     

    e

     . j j

     j 1

     f y

     y  n

     

    7.1.2 Varianzas Marginales de X e Y:

     X 

     k 2 2

    i . i 2   i 1

     f x nx

     s n 1

     

     

     

    e 2 2

     . j j

     j 1 2

     f y ny

     s n

     

     

    TEMA 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    50/88

    50

    7.1.3 Desviaciones Estándar Marginales de X e Y:

    Sabemos por la clase de medidas de dispersión que la desviación estándar es la raíz

    cuadrada de las varianzas marginales:

     k 2 2

    i . i

    i 1

     X 

     f x nx

     s n 1

     

     

     

    e 2 2

     . j j

     j 1

     f y ny

     s n

     

     

    7.1.4 Covarianza Entre X e Y

    La covarianza es una medida de asociación lineal más simple entre dos variables X e

    Y está definida como:

     k e

     XY ij i i

    i 1 j 1

    1 s f x y x.y

     n 

     

      Si S xy  > 0 hay dependencia directa (positiva), es decir, a grandes valores de x

    corresponden grandes valores de y.

      Si S xy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal

    entre las dos variables estudiadas.

      Si S xy  < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x

    corresponden pequeños valores de y.

    Ejemplo1: En una encuesta efectuada en una población se obtuvo la siguiente

    información, relativo al número de habitantes (X) y número de dormitorios (Y), en unamuestra de 50 viviendas. Los cuales se agruparon en la siguiente tabla bidimensional.

     YX

    1 2 3 4 Total

    2 6 0 0 0 6

    3 7 4 0  0 11

    4 10 5 1 0 16

    5 0 9 0 0 9

    6 1 2 2 0 5

    8 0 0 1 2 3

    Total 24 20 4 2 50

    a) Hallar las frecuencias marginales, acumuladas y relativas para X e Y

    b) Hallar las medias, varianzas y desviaciones estandar marginales

    c) Hallar la covarianza e interpretar

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    51/88

    51

    Solución:

    a) Frecuencias marginales, acumuladas y relativas para X e Y

    a1) Distribución Marginal de X

    i x  

    .i 

    .i F  

    .i h  

    2 6 6 12%3 11 17 22%4 16 33 32%5 9 42 18%6 5 47 10%8 3 50 6%

    TOTAL n =50 100%

    a2) Distribución Marginal de Y y  

    . j f   

    . F  

    . h  

    1 24 24 48%

    2 20 44 40%3 4 48 8%4 2 50 4%

    TOTAL n =50 100%

    b) Medias y Varianzas Marginales

    i x  

    i f    .

    i i f x . 2.

    i i x  

    2 6 12 243 11 33 99

    4 16 64 2565 9 45 2256 5 30 1808 3 24 192

    50 208 976

    2084.16

    50

    i i f x

     x n

     2

    2 976 50(4.16) 2.2649

     X  s

     

      1.5 X 

     s   

     y  .

     f   .

     j i f y . 2.

     j j f x  

    1 24 24 24

    2 20 40 803 4 12 364 2 8 32

    50 84 172

    841.68

    50

     j j f y y

     n

     2

    2 172 50(1.68) 0.6349

    Y  s 

      0.79Y 

     s   

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    52/88

    52

    a) Covarianza X Y

     k e

     XY ij i i

    i 1 j 1

    1 393 s f x y x.y ( 4.16 )(1.68 ) 0.872

     n 50

     

    Interpretación: como 0.872 >0, existe una asociación directa entre el número de

    habitantes y numero de dormitorios es decir, a mayor número de habitantes mayor

    cantidad de dormitorios por vivienda.

    7.2. Distribuciones Condicionadas

    Sea (X,Y) una variable estadística bidimensional tal que X presenta k-modalidades y la

    variable Y e-modalidades mutuamente excluyentes. La distribución de la variable X

    condicionada a que la variable Y tome el valor fijoi y  ( 1,2,..., j e ) está dado en la tabla:

    Tabla 1: Distribución de la variable X condicionada a  jY y  

    1 x   2 x  

    ........ k

     x   Totales

    Frecuencia absoluta de X

    condicionada a  jY y  

     X Y y j f 

     

    1 j f    2 j f   

    ……. kj

     f    . j f   

    Frecuencia relativa de X

    condicionada a  jY y  

     X Y y j h

     

    1

    . j

     f 

     f  

    2

    .

     j

     j

     f 

     f  

    …….

    .

     kj

     j

     f 

     f  

    1  

      De igual manera la distribución de la variable Y condicionada a que la variable X tome el

    valor fijoi

     x  ( 1,2,...,i k ) está dado en la tabla:

    Tabla 2: Distribución de la variable Y condicionada a i X x  

    1 y   2 y  

    ........e

     y   Totales

    Frecuencia absoluta de Ycondicionada a i X x  

    Y X xi f 

     

    1i f    2i f   

    …….ie

     f    .i f   

    Frecuencia relativa de Y

    condicionada a i X x  

    Y X xi h

     

    1

    .

    i

    i

     f 

     f  

    2

    .

    i

    i

     f 

     f  

    …….

    .

    ie

    i

     f 

     f  

    1  

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    53/88

    53

    Ejemplo 2: Tomando la tabla bidimensional del ejemplo 1:

    YX

    1 2 3 4 Total

    2 6 0 0 0 6

    3 7 4 0  0 11

    4 10 5 1 0 16

    5 0 9 0 0 9

    6 1 2 2 0 5

    8 0 0 1 2 3

    Total 24 20 4 2 50

    a) Hallar la distribución X condicionada a Y=2

    b) Hallar la distribución Y condicionada a X=6

    c) Hallar la distribución X condicionada a Y=3d) Hallar la distribución Y condicionada a X=8

    Solución:

    a) 

    b) 

    c)

    d) 

    Valores de X 2 3 4 5 6 8 Totales

    2 X Y  f   0 4 5 9 2 0 20

    2 X Y  h   0 0,20 0,25 0,45 0,10 0 1

    Valores de Y 1 2 3 4 Totales

    6Y X  f   1 2 2 0 5

    6Y X  h   0,2 0,4 0,4 0 1

    Valores de X 2 3 4 5 6 8 Totales

    3 X Y  f   0 0 1 0 2 1 4

    3 X Y  h   0 0 0,25 0 0,50 0,25 1

    Valores de Y 1 2 3 4 Totales

    8Y X  f   0 0 1 2 3

    8Y X  h   0,00 0,00 0,33 0,67 1

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    54/88

    54

    Análisis de Correlación yRegresión

    8.1. Análisis de Correlación8.1.1 Tipos de correlación

    8.1.2 Diagrama de dispersión8.1.3 Coeficiente de Correlación8.1.4 Niveles de correlación

    8.2. Análisis de regresión8.2.1 Regresión Lineal simple8.2.2 Recta de mínimos cuadrados8.2.3 Coeficiente de Determinación

    8.1. Análisis de Correlación

    La correlación estadística determina la relación o dependencia que existe entre las dos

    variables que intervienen en una distribución bidimensional. Es decir, determinar si los

    cambios en una de las variables influyen en los cambios de la otra. En caso de que

    suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.

    La correlación es la teoría que se encarga de estudiar las posibles relaciones existentes

    entre dos variables X e Y estadísticas.

    8.1.1 Tipos de Correlación. Según la relación entre las variables X e Y podemos tener:

     A. Correlación Directa o Positiva. Cuando las variables X e Y presentan variaciones

    en un mismo sentido, esto es, para mayores valores de X, mayores valores de Y.

    B. Correlación Inversa o Negativa. Cuando las variaciones de X e Y son en sentidoscontrarios, esto es, para mayores valores de X corresponden menores valores de Y.

    C. Sin correlación. Cuando no existe ningún tipo de relacionamiento entre las

    variables.

    8.1.2 Diagrama de Dispersión. Es la representación gráfica más útil para describir el

    comportamiento conjunto de dos variables X e Y, consiste en una nube de puntos que

    indicará si existe o no correlación dependiendo de la tendencia de los puntos.

    TEMA 

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTAS_2 1 1.pdf

    55/88

    55

    Ejemplo1: Una compañía de seguros desea determinar el grado de relación que existe

    entre el ingreso familiar y el monto del seguro de vida del jefe de familia. Con base a una

    muestra aleatoria de 9 familias, se obtuvo la siguiente información (en miles de dólares)

    Ingreso (X) Seguro deVida (Y)

    45  70 

    20  50 

    40  60 

    40  50 

    47  90 

    30  55 

    25  55 

    20  35 

    15  40 

    Interpretación: Observando el gráfico podemos decir que el

    Ingreso familiar y el seguro de Vida tienen correlación positiva

    8.1.3 Coeficiente de Correlación. Es un número que indica el grado de asociación entre

    las variables y se define del siguiente modo:

    Características:

    El coeficiente r es un número comprendido entre -1 y +1

    1 r 1

      Si  r 0  Existe una correlación directa o positiva

      Si  r 0  Existe una correlación Inversa o negativa

      Si  r 0  No Existe asociación entre las dos variables, no existe asociación lineal.

    Ejemplo2: Del ejemplo1 sobre el Ingreso profesional y el seguro de vida hallar el

    coeficiente de correlación:

    N° Ingreso(X)

    Seguro deVida (Y)

    XY X2  Y2 

    1 45 70 3150 2025 4900 

    2 20 50 1000 

    400 

    2500 

    3 40 60 2400 1600 3600 

    4 40 50 2000 1600 2500 

    5 47 90 4230  2209  8100 

    1 1

    1

    2 2 2 2

    i i

    i

     n n

    i i

     n

    i i

     x nx y ny

     x y nxy r

     

     

  • 8/20/2019 INTRODUCCIÓN A LA ESTADÍSTICA PARA ECONOMISTA