Upload
others
View
12
Download
0
Embed Size (px)
Citation preview
Gráficos y tipos de variables
Universidad Nacional de Colombia
Curso Análisis de Datos Cuantitativos
Profesor Iván Fernando Camacho
Escalas de medición
• NOMINAL• ORDINAL
• INTERVALO• RAZÓN
Variables Cualitativas
Variables Cuantitativas
TIPOS DE VARIABLES
CUALITATIVAS O CATEGÓRICAS: clasifican elementos en categorías conceptuales
Se clasifican según su escala de medición:
•Nominales: No se pueden ordenar•P ej: estado civil, sexo, una lista de ciudades de origen, etc.
•Ordinales: Se pueden ordenar•P ej: Ciudades grandes, medianas pequeñas. Nivel educativo ordenado en categorías de menos educación a más educación.
TIPOS DE VARIABLES
• En estas variables hay que tener en cuenta dos condiciones:– Mutuamente excluyentes: No es posible que un mismo valor o sujeto
esté en dos grupos a la vez.
– Exhaustivas: Deben abarcar todos los objetos a clasificar
• Los números no tienen interpretación más que como nombres o etiquetas de los grupos.
• Solo se pueden resumir y/o comparar mediante la moda y las frecuencias : medidas como el promedio, la varianza no tienen sentido.
• Solo en las escalas ordinales se puede hablar de medidas relacionales: > , < , mediana y en algunos casos cuantiles.
CUALITATIVAS O CATEGÓRICAS: clasifican elementos en categorías conceptuales
TIPOS DE VARIABLES
� Permiten comparaciones entre grupos a través de todas las medidas de tendencia central o dispersión.
� Permiten conversiones numéricas
� No siempre las frecuencias tienen sentido. Para solucionar eso, es necesario construir rangos de valores. • ¿Qué tipo de escala es una variable por
rangos?
CUANTITATIVAS O NUMÉRICAS: Asignan números que representan magnitudes
ESTATURA f(x)
1,65 1
1,68 1
1,7 1
1,72 1
1,76 1
1,78 1
1,79 1
1,8 1
1,85 1
1,91 1
Total 10
TIPOS DE VARIABLESCUANTITATIVAS O NUMÉRICAS
Las frecuencias como variables numéricas
•Las frecuencias son variables numéricas que se construyen para describir conjuntos de datos, no los datos en sí mismos. •Las frecuencias absolutas f(x), se pueden transformar como comparaciones respecto a otras cifras. En este sentido las frecuencias se pueden expresar como:�Razón : Cociente de dos números, en este caso frecuencias.
� P ej. La razón entre Afros e Indígenas en Colombia es de 3,06:1
Categoría f(x)Negro (a), mulato,
afrocolombiano 4’273.722Indígena 1’392.623
Razón Afros/Indígenas 3,06:1
Fuente: REDATAM DANE censo 2005
� Proporción: Cuando se hace una razón entre una categoría y el total.
� Frecuencia relativa. Proporción entre la frecuencia absoluta y el total: p(x) = f(x) / Σ f(x)
� Porcentajes respecto al total : % = 100* p(x)� Tasa: Proporción que implica tiempo:
Tasa de homicidio= Total de homicidios en el periodo considerado /Total de población a mitad del mismo periodo
Las tasas se pueden expresar como porcentaje o como frecuencia en otro numero redondo. p. ej. La tasa de homicidios en junio de 2006 fue de 18 por cada 100.000 habitantes.
TIPOS DE VARIABLESCUANTITATIVAS O NUMÉRICAS
Las frecuencias como variables numéricas
TIPOS DE VARIABLES
CUANTITATIVAS O NUMÉRICAS: Asignan números que representan magnitudes
Se pueden clasificar según :•El tipo de número que usan
•Su nivel de medición
TIPOS DE VARIABLES
• Discretas (Valores sin parte decimal) – P ej. nº. de hijos nº. de accidentes, pues no tiene mucho
sentido decir que una mujer tiene 3.5 hijos, o que en Bogotá hubo 3000.21 accidentes de tránsito el mes pasado.
• Continuas (Incluyen cualquier valor de la recta real con decimales) – P ej. Las notas de un curso, las estaturas de personas, ingresos,
probabilidades, etc.
CUANTITATIVASSegún el tipo de número:
TIPOS DE VARIABLES
• Escalas de intervalo: Son mediciones en las que un valor de cero NO implica ausencia de la característica que se mide. – P ej. La temperatura de 0 grados centígrados no implica ausencia de
temperatura. De ahí se sigue que un objeto con temperatura de 100º centígrados no es el doble de caliente que uno que esté a 50º centígrados.
• Escalas de razón: Cero absoluto que representa ausencia de la variable. – P ej. Ingreso. Un ingreso de 0 implica que la persona no recibe ingreso,
una persona que recibe $100 gana el doble que una persona que recibe $50.
CUANTITATIVASSegún el nivel de medición (Escala de medida):
GRAFICOS
• Los gráficos deben ser auto explicativos en lo posible• Deben expresar fielmente las características de los datos• No presentar información redundante• El título y las etiquetas de datos deben expresar clara y
exhaustivamente cuál es el contenido. X
Ok
GráficosTorta (Variables categóricas)
-Se suele usar el porcentaje sobre el total - También se puede hacer con la frecuencia absoluta-Es práctico solo con pocas categorías
Ocupación (Mujeres palenque 2012)Cuenta % f(x)
AGRICULTORA 1 0,1%MUSICA-ARTISTA 1 0,1%DESEMPLEADA 4 0,3%AGRICULTORA 9 0,7%DISCPACITADA 11 0,9%EMPLEADA-ASALARIADA 17 1,3%PROFESIONAL 39 3,0%DOCENTE 40 3,1%TRABAJO VARIOS 47 3,7%INDEPENDIENTE 49 3,8%COMERCIANTE 50 3,9%ESTUDIANTE 411 32,1%VENDEDORAS 600 46,9%
Total observados 1279100,0
%
GráficosDiagramas de barras para Variables nominales
Se puede hacer con porcentajes o con frecuencias absolutas
Gráficos
Diagramas de barras para Variables ordinales
Nivel Educativo Palenque 2012Cuenta %
Sin educación formal 1248 25,8%
Primaria incompleta 1221 25,3%
Primaria completa 421 8,7%
Secundaria incompleta 763 15,8%Secundaria completa 507 10,5%
Técnico/Universitario y superior 670 13,9%
Total observados 4830 100,0%Se puede hacer con porcentajes o con frecuencias absolutas
Gráficos variable numéricaDiagramas de frecuencias (Para Variables discretas)
Nº personas hogar f(x)2 43 114 115 66 67 2
Σ Totales 30
Xi F(x)1 32 83 114 135 146 157 16
Σ Totales 16
Se pueden hacer con frecuencias absolutas o relativas, solo cambia el rango en el eje y
Gráficos variable numérica
Histogramas (Variables continuas o por rangos)
�Se puede hacer con porcentajes o con frecuencias absolutas�El área de los rectángulos es proporcional a la frecuencia
Fuente: REDATAM DANE censo 2005
Gráficos variable numérica
Pirámides de población
�Tipo particular de histogramas�Se puede hacer con valores simples o por rangos�Permite comparar rápidamente áreas geográficas
Gráficos variable numérica
Polígonos de frecuencias (Variables por rangos continuos)
�Consiste en unir con líneas rectas los puntos medios (Mc) de un histograma. �Su límite matemático cuando h tiende a cero es una curva�Solo aplica a f(x) ó p(x)�Se puede hacer también con variables ordinales
Gráficos variable numérica
Polígonos de frecuencias (Variables por rangos continuos)
Son bastante útiles para comparar grupos, incluso en variables ordinales.
Gráficos variable numérica
Ojiva (Variables por rangos continuos)
Área en hectáreas
f(x) F(x) p(x) P(x)
[0 a 5) 45 45 0,45 0,45
[5 a 10) 35 80 0,35 0,8
[10 a 15) 5 85 0,05 0,85
[15 a 20) 15 100 0,15 1
Totales 100 1,00
Se usa solamente para F(x) ó P(x)
Gráficos variable numérica
Caja y bigotes (Comparación de variables)
Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia, siendo la diferencia entre el máximo y el mínimo menor, como así también la diferencia intercuartílica.
Gráficos variable numérica
Caja y bigotes (Comparación de variables)
COMPARACIÓN ENTRENAMIENTOS DE UN CORREDORUn corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer los 100m, durante 10 días consecutivos (cada semana se toman varios tiempos y se calculan mediana, cuartiles, valores mínimo y máximo)
Tipo de Números
Escala de medida Frecuencias
Medidas de posición y dispersión Gráficos
Códigos Nominal Si Moda, rango Torta , diagrama de barras
Códigos Ordinal SiModa, rango, mediana,
cuantilesTorta , diagrama de barras,
polígono
Discreta Intervalo Si Todas Diagrama de frecuencias , polígono, caja y bigotesRazón
ContinuaIntervalo No siempre Todas Histograma, polígono,
ojiva, caja y bigotesRazón
Numérica por rangos
Intervalo
Si Todas (Menos precisas) Histograma, polígono, ojiva, caja y bigotesRazón
Gráficos y variablesCuadro resumen