23
Gráficos y tipos de variables Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos Profesor Iván Fernando Camacho

Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos y tipos de variables

Universidad Nacional de Colombia

Curso Análisis de Datos Cuantitativos

Profesor Iván Fernando Camacho

Page 2: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Escalas de medición

• NOMINAL• ORDINAL

• INTERVALO• RAZÓN

Variables Cualitativas

Variables Cuantitativas

Page 3: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLES

CUALITATIVAS O CATEGÓRICAS: clasifican elementos en categorías conceptuales

Se clasifican según su escala de medición:

•Nominales: No se pueden ordenar•P ej: estado civil, sexo, una lista de ciudades de origen, etc.

•Ordinales: Se pueden ordenar•P ej: Ciudades grandes, medianas pequeñas. Nivel educativo ordenado en categorías de menos educación a más educación.

Page 4: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLES

• En estas variables hay que tener en cuenta dos condiciones:– Mutuamente excluyentes: No es posible que un mismo valor o sujeto

esté en dos grupos a la vez.

– Exhaustivas: Deben abarcar todos los objetos a clasificar

• Los números no tienen interpretación más que como nombres o etiquetas de los grupos.

• Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como el promedio, la varianza no tienen sentido.

• Solo en las escalas ordinales se puede hablar de medidas relacionales: > , < , mediana y en algunos casos cuantiles.

CUALITATIVAS O CATEGÓRICAS: clasifican elementos en categorías conceptuales

Page 5: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLES

� Permiten comparaciones entre grupos a través de todas las medidas de tendencia central o dispersión.

� Permiten conversiones numéricas

� No siempre las frecuencias tienen sentido. Para solucionar eso, es necesario construir rangos de valores. • ¿Qué tipo de escala es una variable por

rangos?

CUANTITATIVAS O NUMÉRICAS: Asignan números que representan magnitudes

ESTATURA f(x)

1,65 1

1,68 1

1,7 1

1,72 1

1,76 1

1,78 1

1,79 1

1,8 1

1,85 1

1,91 1

Total 10

Page 6: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLESCUANTITATIVAS O NUMÉRICAS

Las frecuencias como variables numéricas

•Las frecuencias son variables numéricas que se construyen para describir conjuntos de datos, no los datos en sí mismos. •Las frecuencias absolutas f(x), se pueden transformar como comparaciones respecto a otras cifras. En este sentido las frecuencias se pueden expresar como:�Razón : Cociente de dos números, en este caso frecuencias.

� P ej. La razón entre Afros e Indígenas en Colombia es de 3,06:1

Categoría f(x)Negro (a), mulato,

afrocolombiano 4’273.722Indígena 1’392.623

Razón Afros/Indígenas 3,06:1

Fuente: REDATAM DANE censo 2005

Page 7: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

� Proporción: Cuando se hace una razón entre una categoría y el total.

� Frecuencia relativa. Proporción entre la frecuencia absoluta y el total: p(x) = f(x) / Σ f(x)

� Porcentajes respecto al total : % = 100* p(x)� Tasa: Proporción que implica tiempo:

Tasa de homicidio= Total de homicidios en el periodo considerado /Total de población a mitad del mismo periodo

Las tasas se pueden expresar como porcentaje o como frecuencia en otro numero redondo. p. ej. La tasa de homicidios en junio de 2006 fue de 18 por cada 100.000 habitantes.

TIPOS DE VARIABLESCUANTITATIVAS O NUMÉRICAS

Las frecuencias como variables numéricas

Page 8: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLES

CUANTITATIVAS O NUMÉRICAS: Asignan números que representan magnitudes

Se pueden clasificar según :•El tipo de número que usan

•Su nivel de medición

Page 9: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLES

• Discretas (Valores sin parte decimal) – P ej. nº. de hijos nº. de accidentes, pues no tiene mucho

sentido decir que una mujer tiene 3.5 hijos, o que en Bogotá hubo 3000.21 accidentes de tránsito el mes pasado.

• Continuas (Incluyen cualquier valor de la recta real con decimales) – P ej. Las notas de un curso, las estaturas de personas, ingresos,

probabilidades, etc.

CUANTITATIVASSegún el tipo de número:

Page 10: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

TIPOS DE VARIABLES

• Escalas de intervalo: Son mediciones en las que un valor de cero NO implica ausencia de la característica que se mide. – P ej. La temperatura de 0 grados centígrados no implica ausencia de

temperatura. De ahí se sigue que un objeto con temperatura de 100º centígrados no es el doble de caliente que uno que esté a 50º centígrados.

• Escalas de razón: Cero absoluto que representa ausencia de la variable. – P ej. Ingreso. Un ingreso de 0 implica que la persona no recibe ingreso,

una persona que recibe $100 gana el doble que una persona que recibe $50.

CUANTITATIVASSegún el nivel de medición (Escala de medida):

Page 11: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

GRAFICOS

• Los gráficos deben ser auto explicativos en lo posible• Deben expresar fielmente las características de los datos• No presentar información redundante• El título y las etiquetas de datos deben expresar clara y

exhaustivamente cuál es el contenido. X

Ok

Page 12: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

GráficosTorta (Variables categóricas)

-Se suele usar el porcentaje sobre el total - También se puede hacer con la frecuencia absoluta-Es práctico solo con pocas categorías

Page 13: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Ocupación (Mujeres palenque 2012)Cuenta % f(x)

AGRICULTORA 1 0,1%MUSICA-ARTISTA 1 0,1%DESEMPLEADA 4 0,3%AGRICULTORA 9 0,7%DISCPACITADA 11 0,9%EMPLEADA-ASALARIADA 17 1,3%PROFESIONAL 39 3,0%DOCENTE 40 3,1%TRABAJO VARIOS 47 3,7%INDEPENDIENTE 49 3,8%COMERCIANTE 50 3,9%ESTUDIANTE 411 32,1%VENDEDORAS 600 46,9%

Total observados 1279100,0

%

GráficosDiagramas de barras para Variables nominales

Se puede hacer con porcentajes o con frecuencias absolutas

Page 14: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos

Diagramas de barras para Variables ordinales

Nivel Educativo Palenque 2012Cuenta %

Sin educación formal 1248 25,8%

Primaria incompleta 1221 25,3%

Primaria completa 421 8,7%

Secundaria incompleta 763 15,8%Secundaria completa 507 10,5%

Técnico/Universitario y superior 670 13,9%

Total observados 4830 100,0%Se puede hacer con porcentajes o con frecuencias absolutas

Page 15: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numéricaDiagramas de frecuencias (Para Variables discretas)

Nº personas hogar f(x)2 43 114 115 66 67 2

Σ Totales 30

Xi F(x)1 32 83 114 135 146 157 16

Σ Totales 16

Se pueden hacer con frecuencias absolutas o relativas, solo cambia el rango en el eje y

Page 16: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numérica

Histogramas (Variables continuas o por rangos)

�Se puede hacer con porcentajes o con frecuencias absolutas�El área de los rectángulos es proporcional a la frecuencia

Fuente: REDATAM DANE censo 2005

Page 17: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numérica

Pirámides de población

�Tipo particular de histogramas�Se puede hacer con valores simples o por rangos�Permite comparar rápidamente áreas geográficas

Page 18: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numérica

Polígonos de frecuencias (Variables por rangos continuos)

�Consiste en unir con líneas rectas los puntos medios (Mc) de un histograma. �Su límite matemático cuando h tiende a cero es una curva�Solo aplica a f(x) ó p(x)�Se puede hacer también con variables ordinales

Page 19: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numérica

Polígonos de frecuencias (Variables por rangos continuos)

Son bastante útiles para comparar grupos, incluso en variables ordinales.

Page 20: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numérica

Ojiva (Variables por rangos continuos)

Área en hectáreas

f(x) F(x) p(x) P(x)

[0 a 5) 45 45 0,45 0,45

[5 a 10) 35 80 0,35 0,8

[10 a 15) 5 85 0,05 0,85

[15 a 20) 15 100 0,15 1

Totales 100 1,00

Se usa solamente para F(x) ó P(x)

Page 21: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Gráficos variable numérica

Caja y bigotes (Comparación de variables)

Page 22: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia, siendo la diferencia entre el máximo y el mínimo menor, como así también la diferencia intercuartílica.

Gráficos variable numérica

Caja y bigotes (Comparación de variables)

COMPARACIÓN ENTRENAMIENTOS DE UN CORREDORUn corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer los 100m, durante 10 días consecutivos (cada semana se toman varios tiempos y se calculan mediana, cuartiles, valores mínimo y máximo)

Page 23: Universidad Nacional de Colombia Curso Análisis de Datos ......o etiquetas de los grupos. • Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como

Tipo de Números

Escala de medida Frecuencias

Medidas de posición y dispersión Gráficos

Códigos Nominal Si Moda, rango Torta , diagrama de barras

Códigos Ordinal SiModa, rango, mediana,

cuantilesTorta , diagrama de barras,

polígono

Discreta Intervalo Si Todas Diagrama de frecuencias , polígono, caja y bigotesRazón

ContinuaIntervalo No siempre Todas Histograma, polígono,

ojiva, caja y bigotesRazón

Numérica por rangos

Intervalo

Si Todas (Menos precisas) Histograma, polígono, ojiva, caja y bigotesRazón

Gráficos y variablesCuadro resumen