47

¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Embed Size (px)

Citation preview

Page 1: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina
Page 2: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

¿Nos engañan las estadísticas?¿Nos engañan las estadísticas?

Nora Gatica

Universidad Nacional de San Luis - Argentina

Page 3: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

- Elegimos la pasta de dientes X porque la publicidad dice que nos va a disminuir en 20% de las caries

- El candidato a elecciones cambia su campaña en vista de los resultados de una encuesta de opinión

- El médico prescribe un tratamiento porque las estadísticas le informan que el tratamiento cura su enfermedad en 70 % de los casos

- Una muestra de sangre es suficiente para decir miles de cosas sobre la totalidad de la sangre en tu cuerpo

Page 4: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Los métodos y los términos estadísticos son necesarios para

informar sobre los datos masivos de las tendencias sociales

y económicas, las situaciones de los negocios, las encuestas de

opinión y los censos.

Pero muchas veces se emplea para causar sensación, deformar

confundir y simplificar en demasía.

Page 5: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Si quieres demostrar algo absurdo toma un montón de datos,tortúralos hasta que digan lo que quieres demostrar, y a laconfesión así obtenida llámalo “Estadística”(Darrel Huff: How to lie with statistics)

Si se reúnen suficientes datos, se puede demostrar cualquiercosa con ayuda de la Estadística.(Ley de Williams y Holland)

Recelo de la Estadística; un buen amigo mío murió ahogadoen un río cuya profundidad media era de 40 cm. (Pío Baroja)

Page 6: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Según acaba de publicar una reciente estadística, más del 80 % delos hombres obesos del mundo están gordos.

Según las últimas estadísticas, de cada tres niños que nacen en elmundo, dos son chinos. Menos en China que son los tres.

El 100 % de las personas que realizaron una encuesta declaró haberparticipado en dicha encuesta.

Según la últimas estadísticas, tomando medio litro de leche todas las mañanas durante 1200 meses se consigue vivir más de 100 años.

Según las últimas estadísticas un alto porcentaje de españoles son padres. Lo que es seguro es que el 100% son hijos

Page 7: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

En la práctica hay tres razones para utilizar las estadísticas:

Para resumir: digamos que queremos saber cuánto calor hace en un sitio (por ejemplo en Valladolid) comparado con otro sitio (Málaga). Podemos medir la temperatura cada día y compararla, haciendo largas listas durante un año. Estamos utilizando estadística.

Para apostar. Si tiramos una moneda no podemos saber de qué lado caerá. Podemos hablar de las "posibilidades" de que salga cara. O de las "probabilidades" de que salga cara. Estamos utilizando estadísticas otra vez.

Para mentir. Algo muy común en todos los medios. Esta es la utilización de las estadísticas que nos concierne hoy.

Page 8: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

-¿Cómo se ha hecho para graficar los resultados?

- ¿Quién lo dice? ¿Cuáles pueden ser sus intenciones? ¿Las autoridades citadas realmente dicen lo que se afirma?

- ¿Cómo lo saben? ¿Qué pruebas realizaron para llegar a esos resultados?

Aún sabiendo que en ocasiones la estadística es manipulada de manera engañosa, la actitud menos apropiada sería la de ignorar los datos. De nada sirve percibir la artimaña, si no somos capaces de identificar en donde radica la trampa.

Un aspecto interesante consiste en desmenuzar la metodología, constatar que lo que dice es pertinente o, de lo contrario, encontrar los argumentos para invalidar

Page 9: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Histograma: representa el número de "visitas" que ha tenido un hipertexto de acuerdo a la hora de la visita.

Page 10: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Gráfico que representa el comportamiento de las calificaciones parciales de cuatro alumnos de preparatoria

Gráfico que representa el porcentaje del PIB gastado en docencia e investigación por cinco países en el lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12).

Page 11: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Comparación del total de las especies de las familias del orden Carnivora y las que están amenazadas, en México, (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):58):

Page 12: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Matrícula en licenciatura (en México) por áreas de conocimiento en el año de 1992 (Fuente: ANUIES,1995):

Page 13: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

1

2

3

4

5

1

2

3

4

5

Circular con subgráfico de barras

Circular con subgráfico circular

Datos: 200 – 300 – 400 - 12 – 15

Page 14: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Pirámide de edades del país X

Gráfico de líneas: comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco

observaciones anuales.

Page 15: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina
Page 16: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12)

Este diagrama compara la distancia que existe en cada uno de los planetas interiores de nuestro sistema solar al Sol contra el tiempo que necesitan para recorrer sus órbitas, y el tamaño de las burbujas indica la masa de cada planeta

Page 17: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Población de los Estados Unidos (cada hombrecillo representa a dos millones de habitantes)

PICTOGRAMA

Page 18: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Diagrama de caja y bigotes o bloxplot: Se realizó una prueba de velocidad al inicio del semestre a un grupo de atletas del área especial de atletismo, donde se obtuvieron malos resultados. Luego de un entrenamiento de 3 meses se repitió la prueba en igualdad de condiciones.

Page 19: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Representación gráfica de tronco y hojas

Un método para iniciar el análisis exploratorio de los datos, previo al uso de los métodos estadísticos tradicionales, y que además proporciona información rápida, visual y es relativamente nueva, es la representación gráfica de tronco y hoja. Esta representación se basa en la ordenación de los datos a manera de gráfico, pero sin llegar a ello, utilizando las decenas y las unidades.

78, 93, 61, 100, 70, 83, 88, 74, 97, 72, 66, 73, 76, 81, 83, 64, 91, 70, 77, 86

6 1 6 47 8 0 4 2 3 6 0 78 3 8 1 3 69 3 7 110 0

Page 20: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

6 1 4 6 7 0 0 2 3 4 6 7 88 1 1 3 6 89 1 3 710 0

6- 1 4 6+ 67- 0 0 2 3 47+ 6 7 88- 1 3 38+ 6 89- 1 39+ 710- 0

Representación gráfica de doble tronco

Page 21: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Diagrama de Pareto: Herramienta Básica para la mejora de la CalidadSe utiliza para priorizar los problemas o las causas que los generan. El nombre de Pareto fue dado por el Dr. Juran en honor del economista italiano VILFREDO PARETO (1848-1923) quien realizó un estudio sobre la distribución de la riqueza, en el cual descubrió que la minoría de la población poseía la mayor parte de la riqueza y la mayoría de la población poseía la menor parte de la riqueza. El Dr. Juran aplicó este concepto a la calidad, obteniéndose lo que hoy se conoce como la regla 80/20.

Se recomienda su uso: Para identificar oportunidades para mejorar Para identificar un producto o servicio para el análisis de mejora de la calidad. Cuando existe la necesidad de llamar la atención a los problemas o causas Para analizar las diferentes agrupaciones de datos. Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones Para evaluar los resultados de los cambos efectuados a un proceso comparando sucesivos diagramas obtenidos en momentos diferentes, (antes y después) Cuando los datos puedan clasificarse en categorías Cuando el rango de cada categoría es importante Para comunicar fácilmente a otros miembros de la organización las conclusiones sobre causas, efectos y costes de los errores.

Page 22: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Gráfica de Pareto: Un fabricante de accesorios plásticos desea analizar cuáles son los defectos más frecuentes que aparecen en las unidades al salir de la línea de producción. Para esto, empezó por clasificar todos los defectos posibles en sus diversos tipos:

Tipo de defecto

Detalle del problema Frec. Frec.% Acumul. %

Aplastamient El accesorio se aplasta 40 42.6 % 42.6 %

Rotura El accesorio se quiebra 35 37.2 % 79.8 %

Fuera de medida

Ovalización mayor 8 8.5 % 88.3 %

Mal color El color no se ajusta 3 3.2 % 91.5 %

Mal alabeo Nivel no aceptable 3 3.2 % 94.7%

Mal terminación

Aparición de rebabas 2 2.1 % 96.8 %

Incompleto Falta alguno 2 2.1 % 98.9 %

Desbalanceo El accesorio requiere contrapesos adicionales 1 1.1 % 100 %

Otros Otros defectos 0 0 % 100 %

TOTAL 94 100 %

Page 23: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Ahora resulta evidente cuales son los tipos de defectos más frecuentes. Podemos observar que los 2 primeros tipos de defectos se presentan en el 79,8 % de los accesorios con fallas. Por el Principio de Pareto, concluimos que: La mayor parte de los defectos encontrados en el lote pertenece sólo a 2 tipos de defectos (los "pocos vitales"), de manera que si se eliminan las causas que los provocan desaparecería la mayor parte de los defectos.

Page 24: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Howard Wainer, en su libro “Visual Revelations” expresa tres principios - No muestres los datos (en todo caso que sean pocos). •Los que muestres, que sea de forma imprecisa. •Ofusca la interpretación de los datos.

1. Minimiza la densidad de datos (muestra pocos datos en mucho espacio).

2. Minimiza la razón datos/tinta (poca tinta para datos y mucha para accesorios, ejes, retículos, títulos, adornos...).

3. Ignora la metáfora visual (las magnitudes no tienen por que corresponderse con su representación).

4. Maximiza el factor de mentira 5. Haz el gráfico fuera de contexto (para qué enseñar el trozo de gráfica en

que nos iba mejor...)6. Cambia la escala en medio del eje, normalmente nadie se dará cuenta y

puedes cambiar el significado de lo que muestras a tu gusto.7. Enfatiza lo trivial y despista la atención de lo que interesa.8. Dificulta la comparación, al fin y al cabo lo que muestran los gráficos son

diferencias, por tanto, que no se noten...9. Ordena alfabéticamente, seguramente será más difícil detectar patrones

que si los ordenas por los valores crecientes de alguna de las variables.10. Etiqueta lo peor que puedas, de forma ilegible, incompleta, incorrecta y

ambigua, nada mejor para confundir a propios y extraños.11. Añade información inútil: más decimales y más dimensiones de lo

necesario contribuyen a la confusión.

Page 25: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina
Page 26: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

De acuerdo al gráfico se crearon 100.000 empleos en el año 1996.200.000 en 1998 y así siguiendo. Dice: “creación de empleo” ... ¿No se perdieron empleos en esos años? Debería estar la palabra “neto”.¿Es empleo acumulado?El eje de la derecha representa cientos de miles de trabajos creados.¿cuál es el nivel inicial? Manipulando el nivel inicial se pueden lograr que los cambios chicos parezcan grandes.Tampoco hay información de los desempleados porque si los desempleados son varios millones, no es significativa la creación de empleo. Debería dar evidencia de la tasa de desempleo para poder establecer si bajó un 10%, un 20 % etc.

OBSERVACIONES

Page 27: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Miremos al otro eje. La tasa del impuesto a las ganancias bajó del 58% al 40% en cuatro años. ¿ 58% de impuesto a las ganancias? No es la tasa del impuesto a las ganancias. Es "impuesto a las ganancias como porcentaje del impuesto federal básico"¿Que significa eso? Parecería que el impuesto a las ganancias está bajando comparado con el impuesto federal. ¿Pero acaso esto no puede deberse a que el impuesto federal estaba aumentando?El eje del gráfico sólo va de 40 a 60. Si el eje del gráfico fuese de 0 a 100, la tendencia no parecería tan importante, quedaría como una línea bastante horizontal.¿Qué intentan hacer al poner dos tipos distintos de información en el mismo gráfico con diferentes unidades? Todo lo que muestran es que una estaba bajando mientras la otra subía. Podrían haber manipulado los gráficos para hacer que la creación de empleo pareciese incluso más alta, o que el impuesto a las ganancias pareciese más bajo adelgazando el gráfico.

Page 28: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina
Page 29: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina
Page 30: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

1000

1200

1400

1000

1200

1400

Page 31: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina
Page 32: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

HISTOGRAMA

6000

8000

12000

40 50 70 100

Frecuencias

200

800

600

40 50 70 100

Áreas=Frecuencias

Densidades=Frec/Amplitud

Page 33: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Las visualizaciones no son neutras, dependen de nuestra elección y de lo que queramos mostrar a los demás y a nosotros mismos. Cultivar este sentido crítico respecto de lo que hacemos y de lo que se nos presenta es vital para evitar la confusión.

Page 34: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

POBLACIÓN Y MUESTRA

Población: Conjunto total que se pretende estudiar estadísticamenteMuestra: Subconjunto de esa población. Debe ser representativa de la población.

Muestreo al azar

Muestreo al azar por estratos: se divide la población en partes y se toman grupos proporcionales a las mismas

¿Cómo se obtiene una muestra al azar dentro de la estratificación?

Para averiguar si los individuos entre 20 y 30 años leen no es correcto tomar una muestra a los asistentes al Bar de la esquina de la Facultad de Letras

Page 35: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Hay más negros en prisión que en la Universidad

Dos grupos Hombres negros en la Universidad

Hombres negros en la cárcel

Una persona va a la Universidad por cuatro años pero en prisión puede estar diez, quince o más años

¿Es una afirmación razonable?

Los hombres negros en la Universidad están en edad de ir a la Universidad.Los hombres negros en la cárcel pueden tener cualquier edad.¿Tiene lógica que la cifra de la prisión sea más alta? ¿Tendría más lógica examinar el número de hombres negros en prisión en edad de ir a la Universidad?

Cuando se comparan grupos hay que preguntarse quien está en el grupo y quién queda fuera, y si es conveniente para la conclusión que se intenta convencer

Page 36: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

“El promedio de los componentes de la promoción 1924 de la Universidad de Yale gana 25.111 dólares al año”

- Normalmente no se recuerda exactamente los propios ingresos.

- Esta cifra parte de lo que DIJERON los graduados.

- Algunas personas exageran (vanidad, optimismo) otras miminizan (declaraciones de hacienda)

- No es posible que se pueda tener contacto con todos los sobrevivientes de la promoción 1924, muchas direcciones son desconocidas, otros no contestarían el cuestionario.

Muestra formada por los componentes de la promoción cuyas direcciones se conocen y que contestaron el cuestionario.¿Es representativa esta muestra?

Page 37: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Hacer una encuesta telefónica en la que consultara a los suscriptores sobre la carencia de algunos servicios como electricidad, agua, recolección de basura, etc, sería totalmente absurdo.

El método de recolección de datos sería tendencioso ya que se trata de individuos que tienen teléfono en sus casas, evidentemente tienen condiciones de bienestar y acceso a los servicios.

Page 38: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

GRANDES DISTORSIONES EN LOS INDICES

El desempleo en las provincias, camuflado por planes sociales

Por ejemplo, en San Luis la desocupación salta del 3 al 26,9% si se computa la ayuda.

Ismael Bermúdez.

Bravo Puntanos!, dice la propaganda radial, televisiva y gráfica del Gobierno de San Luis porque los datos del INDEC marcan que allí el desempleo es de apenas el 3%. Hasta compara la situación de la provincia con Japón. Pero lo que la publicidad provincial no dice es que ese bajo guarismo se debe al efecto estadístico de considerar a los beneficiarios de los planes sociales como ocupados. Porque si se los considera como desocupados, el desempleo en San Luis trepa al 26,9% , casi 9 veces más. Y ese porcentaje ubica a San Luis como la segunda ciudad con el mayor desempleo, detrás de Catamarca. Según el criterio que se aplique al momento de medir el desempleo, ciudades como San Luis, Formosa, Resistencia o La Rioja tienen tasas de desempleo muy bajas, por debajo del 10%, cuando se computa a los beneficiarios de planes sociales como ocupados. Pero esos lugares saltan dramáticamente a los primeros puestos, con 20% o más de desempleo, cuando esa gente es considerada desocupada. Así el mapa del desempleo varía según el criterio que se siga con los planes sociales. La mayoría de los especialistas se inclina por considerar a los beneficiarios de esos planes sociales como desocupados porque, aunque realicen alguna actividad, no cobran un sueldo sino que reciben una "ayuda", la ocupación es transitoria, no cuentan con Seguridad Social y muchas veces no pasa de un empleo disfrazado. Por ese motivo, desde hace tiempo, el INDEC da a conocer dos índices, aunque el oficial —más bajo— es considerando a los beneficiarios de esos planes como ocupados. De los datos del INDEC del primer semestre de 2004 surge que el desempleo nacional se ubicó en el 14,6%. Y sin considerar a los que reciben los planes sociales como ocupados, la desocupación trepa al 19,8% , un 35% más. En 8 ciudades, el desempleo oficial es de apenas un dígito. Sin considerar a San Luis, donde la diferencia es del 800% , en 5 ciudades (Resistencia, Formosa, La Rioja, Ushuaia y Comodoro Rivadavia) el segundo índice de desempleo es entre dos o tres veces superior, con más del 20%. Otro caso es Río Gallegos donde el 2,2% de desempleo, sube al 5,4% con los planes sociales como desocupados. Pero en la capital de Santa Cruz estas tasas están influenciadas por la fuerte presencia del empleo público, que abarca al 41% de los ocupados. Según los últimos datos oficiales hay 1,5 millón de personas que cobran el Plan Jefas y Jefes de Hogar. Sumado a otros planes nacionales y provinciales, habría casi 2 millones de personas con planes sociales. En proporción a la población ocupada, la incidencia de esa ayuda es muy elevada en provincias como Chaco, Jujuy, Tucumán, Santiago del Estero, Formosa, Catamarca, San Luis y Corrientes.

Page 39: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

PROMEDIOS

Familias Ingresos

A $ 2.000

B $ 2.000

C $ 2.000

D $ 2.000

E $ 92.000

Barrio X

Familias Ingresos

F $ 20.000

G $ 20.000

H $ 20.000

I $ 20.000

J $ 20.000

Barrio Y

¿Cuál es el ingreso promedio en el Barrio X?¿Cuál es el ingreso promedio en el Barrio Y?

Tienen el mismo promedio por lo que concluimos que a los dos barrios son muy similares económicamente

Page 40: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Moda: Es el valor de la variable que ocurre con mayor frecuencia

Mediana: Es el valor de la variable que divide a la distribución de datos en dos partes iguales

¿cuál es el ingreso mediano en el Barrio X?¿cuál es el ingreso modal en el Barrio X?

¿cuál utilizaríamos para mostrar altos ingresos en el Barrio X?

¿En realidad existe la familia promedio?

Page 41: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

TENDENCIAS

“Las mujeres ganan menos que los hombres”

“Todas las mujeres ganan menos que los hombres”

“Algunas mujeres ganan menos que los hombres”

Las tendencias están relacionadas con los promedios. “Las mujeres tienden a ganar menos que los hombres”

¿Podemos llegar a la conclusión de que María tiende a ganar menos que Jose?

No, María no tiende, es un individuo. Se puede comparar a María con la tendencia “María gana más que el promedio” pero en sentido estadístico no tiene tendencia propia

¿Podemos sacar alguna conclusión acerca de los individuos basándonos en tendencias?En sentido lógico, no.

Page 42: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

CORRELACIONES

Dados dos relojes que marcha perfectamente. Cuando “a” señala la hora, “b” toca la hora. ¿Fue “a” la causa de que “b” tocase?

Estudio: averiguar si los fumadores sacaban notas más bajas que los no fumadores

Correlación producida por la casualidad.

Otras veces hay correlación real pero no se puede establecer cual de las variables es la causa y cual es el efecto. En algún caso la causa y el efecto pueden cambiar de posición o ambas variables pueden ser causa y efecto al mismo tiempo. Ejempo: Ingresos y propiedad.

Correlación positiva y correlación negativa

Page 43: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

¿CÓMO SE HACEN DIGNAS DE CONFIANZA?

Hay varios elementos a tener en cuenta:Representatividad de la muestra, tamaño de la misma, margen de error, diseño de las categorías, tratamiento numérico, temporalidad y consideraciones. Es lo que llamamos METODOLOGÍA

Con un error involuntario o intencional, es cuando la estadística deja de ofrecernos información útil y apropiada para convertirse en algo que manipula o provoca equívocos

Page 44: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

PROBABILIDADES

¿cuál es la probabilidad de lograr un cinco en un dado de seis lados?

Todos los lados son igualmente probables: 1/6

Si arrojamos una moneda un millón de veces, obtendremos aproximadamente quinientas mil caras

¿Lo mismo ocurre su la arrojamos cuatro o cinco veces?¿Obtendremos dos o dos caras y media?

Es en este momento donde interviene la probabilidad

Page 45: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Distribución de probabilidades: distribución normal

La idea es que si se tiene un gran número de muestras y la variación entre ellas es pequeña, tiene una distribución normal. La media, la mediana y la moda coinciden

Page 46: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Pero hay distintos tipos de distribuciones normales. La temperatura de dos ciudades pueden tener distribuciones normales con medias similares, pero el clima en una ciudad (Variable) puede ser mucho más variable que en otra (Estable), por lo que las distribuciones serían:

Desviación estándarSignificancia

Page 47: ¿ Nos enga ñ an las estad í sticas? Nora Gatica Universidad Nacional de San Luis - Argentina

Ejemplo: Una encuesta de opinión sobre si apoya o no al candidato A.Resultados: 60 % no y el 40 % si.“Resultados válidos dentro del 1 %, 19 de 20 veces”

1 % es la desviación.19 de 20 veces es la significancia.

Esto quiere decir que si se toma una nueva muestra habrá un 95 % (19 de 20 veces) de que la respuesta sea entre el 59 y 61 % No y entre 39 y 41 % SI

Estos números son los que nos dicen cuanto se puede confiar en ese promedio.Rara vez se incluyen en las estadísticas, excepto que la gente que las hace no se ve perjudicada como ser las encuestas de opinión