Upload
juan-de-j-sandoval
View
677
Download
1
Embed Size (px)
Citation preview
VARIABLES EN ESTADÍSTICA 2010
DEFINICIÓN
Cuando se hable de variable se hará referencia a una característica de interés que puede ser medida u
observada a las unidades elementales de una población y que tiene una variabilidad intrínseca a los mismos.
Se simbolizará con letras minúsculas (x, y, a, b,...) que puede tomar cualquier valor (o atributo) de un conjunto
determinado de elementos, que se llamará recorrido de la variable.
CLASIFICACIÓN SEGÚN LA NATURALEZA DE LA VARIABLE
Según su naturaleza las variables se clasifican del siguiente modo:
• Variables cualitativas. Son llamadas también variables categóricas. Miden una cualidad o atributo
de determinada unidad elemental y no toman valores numéricos, o si los toman, solo representan
códigos; ejemplo de ello es la variable sexo que resultará ser masculino o femenino; También el
estado civil que será: casado, soltero, separado, viudo. Una degustación un producto puede ser:
bueno, regular, malo o excelente.
• Variables Cuantitativas. Como su nombre lo indica están asociadas a un número (numéricas)
entero o real, ellas pueden ser:
• Variables discretas: resultan de conteos asociados a los números enteros positivos, por
ejemplo el número de personas infectadas de gripe en una comunidad, el número de aves
migratorias en el verano pasado; El número de personas que opinan a favor de un
candidato.
• Variables continuas: estas variables resultan básicamente de mediciones asociadas a un
instrumento de medición o una razón, por consiguiente están asociadas a los números
reales; en este tipo de variables es muy común encontrar mediciones, razones o tiempos
por tal razón tales valores resultan decimales como por ejemplo: la calificación numérica de
una evaluación, medición del peso de una persona; tiempos de llegada a una estación, tasa
de desempleados por municipio en el país.
CLASIFICACIÓN SEGÚN LA ESCALA O NIVEL DE MEDICIÓN
Las escalas de medición son las herramientas apropiadas para medir y clasificar las variables mediante un
orden jerárquico según la cantidad de información que ofrezcan al investigador. Estas permitirán precisar en
VARIABLES EN ESTADÍSTICA 2010
su momento las técnicas de muestreo y metodologías estadísticas adecuadas para los análisis estadísticos.
Para empezar, es conveniente definir mejor el concepto de medida, se entiende el acto de medir como “un
proceso por el cual los números o símbolos se asignan para representar características o propiedades de
acuerdo a determinadas reglas o patrones de comparación establecidos”.
Según su escala de medición (nivel), las variables se clasifican en nominales u ordinales (el caso de las
cualitativas) y de intervalo o razón (el caso de las cuantitativas).
ESCALA NOMINAL. Son variables cualitativas cuyas categorías no se pueden ordenar según criterios
universales, por eso son llamadas variables en escala nominal. Los estadísticos que son apropiados para las
escalas nominales están solamente basados sobre conteos de frecuencias absolutas o relativas sobre las
categorías o la identificación del atributo más frecuente (la moda).
Considere la variable sexo (biológico), sus categorías son hombre y mujer. Típicamente se puede usar
números para facilidad de notación, por ejemplo se puede representar hombre con 1 y mujer con 2 (esto es
absolutamente necesario) para representarlos. La asignación de números los entre las categorías no tiene
importancia numérica y sería inapropiado realizar cálculos numéricos (como por ejemplo operaciones
aritméticas u ordenarlos), otro ejemplo de ello es el número de la cedula. Estos números simplemente son
utilizados para clasificar sujetos en diferentes grupos y contar qué cantidad hay en cada categoría.
ESCALA ORDINAL. Supóngase que se desea medir la preferencia por un producto (1: me gusta muchísimo,
2: me gusta medianamente, 3: me gusta poco, 4: no me gusta), que tiene de un individuo para cuatro marcas
de refresco, digamos A, B, C y D. Podría preguntársele a cada sujeto el rango de orden de de preferencia de
las cuatro marcas, Considere el siguiente rango de orden para una preferencia particular de un sujeto:
MARCA RANGO
A 1
B 2
C 3
D 4
Desde la tabla anterior se puede concluir que el sujeto en mención prefiere más la marca A que la marca C,
prefiere la C más que la D, etc... No obstante, aunque las diferencias entre los valores numéricos sucesivos
asignados a las categorías sean las mismas, no se puede manifestar que este individuo prefiera tantas veces
mas una marca que otra, como por ejemplo decir que D es 4 veces más preferida que A, no porque los
VARIABLES EN ESTADÍSTICA 2010
números asignados son códigos, que bien podían ser cambiados (como por ejemplo por 0, 10, 12, 28), sin
embargo, se sabe el orden de su preferencia. Variables con estas categorías, son catalogadas en escalas de
medición ordinales. Los estadísticos que pueden ser calculados en la escala ordinal son: son los mismos de la
escala nominal, en adición a los estadísticos de orden (mediana, percentiles), además, distribuciones de
frecuencias acumuladas y estadísticos no paramétricos tales como la correlación de Spearman1.
ESCALA DE INTERVALO. Supóngase que en vez de preguntar al individuo en el ejemplo anterior, por el
rango de orden de las 4 marcas, se le pregunta por un orden de preferencia de 1 a 10 (por ejemplo que tanto
le gusta el producto), de cada una de las marca de acuerdo a la siguiente escala:
Tabla No 1
Si se asume que categorías sucesivas representan iguales grados de preferencia entonces se podría decir
que la diferencia entre la preferencia de un sujeto para la marca que se codificó con 1 y 2, es la misma
diferencia para otra marca que se codificó con 4 y 5. Sin embargo, no se puede decir que la preferencia por
una marca digamos codificó con 5, es 5 veces más preferida que la marca codificó con 1. El siguiente ejemplo
donde se inicia una codificación desde 4 hasta 22, clarifica este punto:
Tabla No 2
Desde la tabla 2 es claro que las diferencias entre códigos sucesivos son iguales; sin embargo, el cociente
entre el último valor (22) y el primer (4) no es el mismo que para la escala de la tabla 1, que es de 10. La
razón entre el último valor y el primero es de 10 para la tabla No 1 y de 5,5 para la tabla 2, no obstante, los
valores en preferencias son los mismos.
Al cambiar la escala se ha cambiado el valor de la categoría base (es decir el valor del peor nivel de
preferencia). La escala de intervalo no tiene un valor o punto de base natural. Esto es, el valor base es
arbitrario. Las escalas de medición cuyas categorías sucesivas representan iguales niveles de la
1 Estadístico que permite calcular la correlación entre dos variables cuyas categorías o valores se puedan
ordenar, creado por Charles Spearman, Estadístico de S. XIX, fundador de la estadística no paramétrica
PUNTO DE
ESCALA10 9 8 7 6 5 4 3 2 1
PREFERENCIA Excelente Muy bueno Medio bueno AceptableMedianamente
aceptablePoco aceptable Bajo
Medianamente
bajoMuy bajo malo
PUNTO DE
ES CALA22 20 18 16 14 12 10 8 6 4
PREFERENCIA Excelente Muy bueno Medio bueno AceptableMedianamente
aceptablePoco aceptable Bajo
M edianamente
bajoM uy bajo malo
VARIABLES EN ESTADÍSTICA 2010
característica que está siendo medida y cuyos valores de base son arbitrarios son llamadas: Variables en
Escala de Intervalo. Valores como por ejemplo, los de la temperatura son variables de escala de intervalo
porque no hay ceros absolutos, por ejemplo, 0°C no indica ausencia de medida, por consiguiente no es un
punto de referencia válido para comparar los valores de la temperatura. Tampoco se podrá decir que para
cada individuo hay la misma sensación, al pasar de frio o calor, por ejemplos pasar de 20°C a 30°C, no es lo
mismo que pasar de –10°C a 0°C (aunque la diferencia sea la misma), razón por la cual aquí no tienen
sentido los cocientes entre pares de valores de la temperatura ya que las mismas distancias entre los valores
son arbitrarias. Se podría decir que las variables en escala de intervalo son puntajes numéricos ampliados de
la escala ordinal en la que no necesariamente se deberá tomar valores enteros.
Las variables en esta escala se pueden calcular todos los estadísticos conocidos excepto comparaciones con
algunos en los haya que realizar un cociente entre valores de la variable tales como el coeficiente de
variación.
ESCALA DE RAZÓN. La escala de razón tiene todas las propiedades de las variables en escala de intervalo,
pero además de ello, tiene una base natural que no puede ser cambiada, como por ejemplo, la edad de un
sujeto que tiene un valor absoluto de base natural (cero) y no depende de las unidades de medición que se
asignen. Las escalas de razón pueden ser transformadas multiplicando por una constante, sin embargo ellas
no pueden ser transformadas adicionando una constante, esto cambiaría su valor de base.
En las escalas de razón se dan afirmaciones como: la edad de Jorge es 3 veces la edad de su hijo Samuel.
No hay restricción para que todo tipo de estadísticos numéricos puedan ser calculados en unos datos de
escala de razón. Las variables medidas usando escalas de intervalo y de razón son denominadas variables
métricas.
Taller No 1
1. Clasificar las siguientes características según su naturaleza, escala de medición:
1. ¿Cuál es su preferencia política?
2. ¿Qué marca de cerveza en Colombia le gusta más?
3. ¿Cómo se considera en cuanto a su rendimiento académico en el ITM?
4. ¿A qué velocidad en Km/h regularmente anda Ud en un móvil (carro, moto)?
5. ¿Cuánto pesa ud. en Kg?
6. ¿Cuál fue su puntaje cuantitativo obtenido en la pruebas de ICFES?
7. ¿Cuál es su Signo del zodiaco?
VARIABLES EN ESTADÍSTICA 2010
8. En que semestre académico del ITM está actualmente?
9. ¿Cuál es el Nivel educativo del padre?
10. ¿Hace cuanto tiempo empezó a estudiar durante toda su vida?
11. ¿Qué tipo de colegio es de donde proviene ud?
12. ¿Cuál es color de su cabello?
13. ¿Qué cantidad de cantidad de memoria en Gigabyte tiene su computador?
14. ¿a qué temperatura en grados Celsius esta de Medellín actualmente?
15. ¿En qué régimen de seguridad social se encuentra actualmente?
16. ¿Cuál es el tipo de creencia religiosa que profesa?
Clasifique las variables anteriores siguiente cuadro, según su naturaleza, escala de medición,
categorías (si es cualitativa) o unidad de medida, estadísticos calculables con una tabla de la siguiente
forma:
Operatividad de variables
definición Naturaleza Escala de medición Categorización o unidad
de medida
Estadísticos
a calcular
“como se debe preguntar”
“cuáles son las categorías
(cuales) o la unidad de
medida”
“cuáles son los posibles
estadísticos a calcular con
dicha variable”