Breve introducción a la
estadística
Preparado por Marcos Torres Nazario, Ed.D. IR Certificate
Agosto 2012
Temas
Definiciones
Tipos de datos
Niveles de mediciónNominal, ordinal, intervalo y ratio
Abusos de la estadística
Resumen
Definiciones
Estadística – colección de métodos para planear experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones con base en esos datos. Es mucho más que trazar gráficas y calcular
promedios.
Contempla sacar conclusiones generalizadas y significativas que van más allá de los datos originales.
Esta definición ilustra la fuerte conexión entre la metodología de investigación y las estadísticas.
Definiciones (cont.)
Población – es la colección completa de todos los
elementos que se van a estudiar (Triola, 2002).
Ponce (1998) lo define como el conglomerado
teórico posible de todos los elementos de donde se
puede conseguir la información que se interesa. Por
ejemplo, el universo de votantes en una encuesta
política sería todas las personas que cumplen con
todos los requisitos para votar.
Censo – es la colección de datos de cada elemento
de una población.
Definiciones (cont.)
Muestra – es un subconjunto de elementos extraído
de una población (Triola, 2002). Omar Ponce (1998)
lo define como el extracto de elementos del
universo del cual se extrae. Esencialmente debe
tener las mismas características de la población. Se
extraen muestras por dos razones:
Generalización – para hacer inferencias de la muestra a la
población
Economía – para hacer el estudio viable en términos de
tiempo y costo.
Aspectos importantes
Tamaño- el volumen de participantes sea suficiente
para poder hacer inferencias a partir de la muestra
hacia la población
Representatividad – que la muestra refleje las
características de la población de la cual se extrae
(p.e. igual proporción de hombres y mujeres).
Error de muestreo – se conoce como el error de
muestreo cuando la muestra no es representativa de
la población de la cual se extrae. Es la diferencia
entre el resultado de una muestra y el verdadero
resultado de la población (Triola, 2002)
Definiciones (cont.)
Parámetro – es una medición numérica que describe alguna característica de una población. Ejemplos de parámetros incluye la media, desviación estándar, proporciones y coeficientes de correlación de la población.
Estadígrafo – es una medición numérica que describe alguna característica de una muestra. Ejemplos de estadígrafos incluye la media, desviación estándar, proporciones y coeficientes de correlación de la muestra.
Tipos de datos
Datos cuantitativos – consisten en números que
representan conteos o mediciones.
Datos cualitativos, categóricos o de atributos –
se pueden dividir en diferentes categorías que se
distinguen por alguna característica no numérica.
Datos discretos – se obtienen de un número finito
de posibles valores qe pueden contarse.
Datos continuos – se obtienen de un número
infinito de posibles valores que pueden asociarse a
puntos de una escala continua.
Niveles de medición
Los niveles de medición se dividen en
cuatro categorías:
Nominal Bajo nivel
Ordinal
Intervalo
Razón/Ratio Más alto nivel
Nivel nominal de medición
Consiste de nombres, etiquetas y
categorías
Los sujetos se clasifican de acuerdo a
unas características comunes
NO se califican u ordena de forma
alguna
NO implica cantidad
Ejemplo: género, raza, religión, partido
político al que pertenece.
Nivel ordinal de medición
Va más allá de una mera clasificación y asigna un
orden a los valores de la variable en términos del
grado en que el sujeto posee la característica que
se está midiendo
Se asigna un orden pero no es posible asignar
diferencias entre los valores ya que no hay una
escala estandarizada o tales diferencias carecen
de valor.
Limitación: las distancias entre los valores no son
consistentes o continuas.
Ejemplos: Escala Likert (excelente-bueno-regular-
pobre), estado socioeconómico, orden en una
carrera.
Nivel de intervalo de medición
Posee las características de anteriores
pero las escalar tienen distancias
exactas
Limitación: No tiene un punto de
partida, cero absoluto o inherente en el
que la cantidad esté totalmente
ausente.
Ejemplos: Temperatura en Celsius o en
grados Fahrenheit.
Nivel de ratio de medición
Es el nivel más alto de medición y
posee las siguientes características:
La escala tiene un orden
Unidades estandarizadas de medida
Cero significativo
Ejemplos: Salario, número de niños,
Temperatura en grados Kelvin, peso,
estatura, entre otros.
Críticas al uso de la estadística
Existe una percepción general de que “el
conocimiento estadístico es intencionado y
frecuentemente mal usado, encontrando
maneras de interpretar los datos que sean
favorables presentador” (Estadística, 2012).
De hecho, existe un refrán que describe la
estadística como “el arte de torturar los números
hasta que confiesen lo que uno quiere”. En esta
misma línea, a Benjamin Disraeli, se le adjudica
haber dicho lo siguiente: «Hay tres tipos de
mentiras: mentiras pequeñas, mentiras grandes
y las estadísticas».
Críticas al uso de la estadística
En el libro How to lie with statistics (Cómo mentir con las estadísticas en la edición española) de Darrell Huffdiscute muchos casos de mal uso de la estadística, con énfasis en gráficas malintencionadas.
Asimismo, al escoger (o rechazar o modificar) una cierta muestra, los resultados pueden ser manipulados; por ejemplo, mediante la eliminación selectiva de valores atípicos (outliers). Este puede ser el resultado de fraudes o sesgos intencionales por parte del investigador.
Para lidiar con esta situación, el Decano de la Universidad de Harvard, Lawrence Lowell escribió en 1909 que las estadísticas, «como algunos bizcochos, son buenas si se sabe quién las hizo y se está seguro de los ingredientes» (Estadística, 2012).
A continuación se describen algunos de los usos incorrectos de las estadísticas.
Críticas al uso de la estadística
Muestras pequeñas – sacar conclusiones con
muestras muy pequeñas.
Porcentajes distorsionados – interpretar
incorrectamente cifras de mejoría.
Distorsiones deliberadas – manipular los datos para
su conveniencia.
Gráficas engañosas – presentar gráficas diseñadas
para exagerar diferencias de forma engañosa.
Muestras incorrectas – el método para la recolección
de los datos es incorrecta.
Porcentajes distorsionados
Distorsionado Correcto
Gráficas distorcionadas
Distorcionada Correcta
?
Referencias Estadísticas (2012, 20 de agosto de 2012) . In Wikipedia, the free
enciclopedia. Disponible en: http://es.wikipedia.org/wiki/Estad%C3%ADstica
Otras fuentes:
Uso y abuso de los datos estadísticos. Disponible en: http://www.wharton.universia.net/index.cfm?fa=viewArticle&ID=1503
How graphs can fool you. Disponible en: http://www.exercisebiology.com/index.php/site/articles/how_graphs_can_fool_you/
Las mentiras estadísticas. Disponible en: http://lamoraldelosbuitres.com/1765/las-mentiras-estadisticas/
Data Analysis: Displaying Data - Deception with Graphs. Disponibleen: http://www.sao.state.tx.us/resources/Manuals/Method/data/12DECEPD.pdf
On Graphs. Disponible en: https://afrankangle.wordpress.com/2012/08/06/on-graphs/
Mentiras, pecados y abusos estadísticos. Disponible en: http://www.dmae.upm.es/WebpersonalBartolo/articulosdivulgacion/estadistica.html
Recommended