56

Ucn Fundamentos De Estadadistica

Embed Size (px)

DESCRIPTION

Trabajo y taller para curso de Estadística de La Fundación Universitaria Católica Del Norte de Colombia

Citation preview

Page 1: Ucn Fundamentos De Estadadistica
Page 2: Ucn Fundamentos De Estadadistica

FUNDAMENTOS DE ESTADISTICA DESCRIPTIVA

Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información.

Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerarla para así evitar malentendidos, tergiversaciones o errores.

Page 3: Ucn Fundamentos De Estadadistica

I. Medidas de tendencia Central

• Las Medidas de Tendencia central son la media, la mediana y la moda:

• A. La Media: es la suma de los valores de los elementos dividida por la cantidad de estos.

• Es conocida tambien como promedio , o media aritmetica• Ej: calcule la media de los siguientes numeros:• 10,11,12,12,13• 10+11+12+12+13=58• Dividir la suma por la cantidad de elementos• 58/5• El resultado es la media: 11.6. • Por o tanto, la media de los 5 numeros es 11.6. Note que la media esta entre el

rango de elementos, en ete caso 11.6 esta entre 10,11,12 y 13

Page 4: Ucn Fundamentos De Estadadistica

Ejemplos de Media estadística

• 9, 3, 7, 1• La media de 9, 3, 7, 1 es 5• 5, 7, 9• La media de 5, 7, 9 es 7• 8, 7• La media de 8, 7 es 8• 5, 11, 7, 9• La media de 5, 11, 7, 9 es 8

Page 5: Ucn Fundamentos De Estadadistica

Ahora usted Averigua la media de los números:

• 3, 6 5, 9, 1,• 2, 10, 7, 2, 11, 8, 1• 5, 1, 11• 2, 10, 4, 10, 9, 8• 7, 6, 11, 3• 1, 7, 6, 1, 7, 11• 11, 9, 4, 10, 8• 10, 5, 4, 5, 8, 5

Page 6: Ucn Fundamentos De Estadadistica

Recordemos Media estadística

• La media estadística es comúnmente llamada promedio:

• Para averiguar la media de un grupo de números:

• Suma los números todos juntos• Divide por la cantidad de números que fueron

sumados

Page 7: Ucn Fundamentos De Estadadistica

Medidas de tendencia Central

• B. Mediana estadística• La mediana estadística es el número central de un

grupo de números ordenados por tamaño. Si la cantidad de términos es par, la mediana es el promedio de los dos números centrales:

• Para averiguar la mediana de un grupo de números:

• Ordena los números según su tamaño• Si la cantidad de términos es impar, la mediana es

el valor central.• Si la cantidad de términos es par, suma los dos

términos del medio y divide por 2.

Page 8: Ucn Fundamentos De Estadadistica

Ejemplos de Mediana estadística• La mediana de los números:• 657, 523, 887• La mediana de 657, 523, 887 = 657• 306, 287, 688, 354, 1004, 497 • La mediana de 306, 287, 688, 354, 1004, 497 = 425.5• 980, 963, 555 = 963• La mediana de 980, 963, 555 = 963• 816, 751, 131, 932 • La mediana de 816, 751, 131, 932 = 783.5• 444, 361, 339, 435• La mediana de 444, 361, 339, 435 = 398• 739, 834, 772, 1005, 808, 643• La mediana de 739, 834, 772, 1005, 808, 643 = 790

Page 9: Ucn Fundamentos De Estadadistica

Ahora usted Averigüe la mediana de los números:

• 268, 476, 284• 962,282,821,235• 981,204• 309,431,258• 1012,216,551,940,358• 818, 503, 545, 696• 939, 1018, 417, 341, 121, 739, 196

Page 10: Ucn Fundamentos De Estadadistica

Medidas de tendencia Central• C. Moda estadística• La moda estadística es el valor que más se repite en un grupo de

números.• Para averiguar la moda en un grupo de números:• Ordena los números según su tamaño.• Determina la cantidad de veces de cada valor numérico.• El valor numérico que más se repite es la moda.• Puede haber más de una moda cuando dos o más números se

repiten la misma cantidad de veces y además este es el máximo número de veces del conjunto.

• No hay moda si ningún número se repite más de una vez.• Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.• Ahora usted busque la moda de: 5, 12, 9, 5, 8, 7, 1• En una muestra pueden exister varias modas

Page 11: Ucn Fundamentos De Estadadistica

Medidas de Dispersión

• E. Rango estadístico • El rango estadístico es la diferencia entre el valor

mínimo y el valor máximo en un grupo de números.

• Para averiguar el rango de un grupo de números:• Ordena los números según su tamaño• Resta el valor mínimo del valor máximo.

Page 12: Ucn Fundamentos De Estadadistica

Ejemplos de Rango estadístico

• 9, 4, 9• El rango de 9, 4, 9 = 5• 8, 6, 3, 5, 7, 3, 2• El rango de 8, 6, 3, 5, 7, 3, 2 = 6• 3, 2, 10, 5, 4, 6, 5• El rango de 3, 2, 10, 5, 4, 6, 5 = 8• 8, 3, 4, 3, 5, 7• El rango de 8, 3, 4, 3, 5, 7 = 5

Page 13: Ucn Fundamentos De Estadadistica

Ahora usted Averigüe el Rango estadístico de los números:

• 8, 4, 1, 7, 8, 4, 3• 7, 5, 2, 4• 5, 4, 9, 1, 9, 5, 2, 7• 3, 1, 10, 2, 10• 4, 10, 2• 9, 10, 6, 4• 8, 3, 10• 8, 9, 8, 6, 10, 8

Page 14: Ucn Fundamentos De Estadadistica

Población y muestra

• Algo importante que hay que mencionar es que no siempre se trabaja con todos los datos. Esto por diversas razones, que pueden ser desde prácticas hasta por economía. Por esta razón se considera un subconjunto del total de los casos, sujetos u objetos que se estudian y que se les obtienen los datos. La población, entonces, es el total hipotético de los datos que se estudian o recopilan. Ante la imposibilidad ocasional de conseguir a la población, entonces se recurre a la muestra, que viene siendo un subconjunto de los datos de la población, pero tal subconjunto tiene que contener datos que pueden servir para posteriores generalizaciones de las conclusiones.

Page 15: Ucn Fundamentos De Estadadistica

I: Ejemplos de Construcción de tablas de frecuencia.

• Punto 1: Conjuntos de datos 

• Imagina que hemos preguntado a un conjunto de N personas qué opinión tienen acerca de la subvención (entiéndase ayuda monetaria) que el Gobierno ha concedido a los Grandes Industriales a través del Ministerio de Agricultura y de su programa Agro Ingreso. Las N respuestas se encuentran en una escala que va de 1 a 9, donde 1 representa un total desacuerdo con la subvención, mientras que 9 quiere significar un acuerdo total.

• El resultado de la medición es el siguiente:

7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4 8 4 3 4  3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2 6 3 4 2 4 1 3 6 3 1 2 4 4 6 2 4 7 4 2 4 6 4 4 6 7 5 8 5 7 6 5 6 5 7 5 6  4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6 5 4 4 3 5 5 9 4 3 6 5 7 3 2  4 4 7 4 2 1 8 2 7 4 5 5 7 5 5 1 5 8 5  6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5  

• Realiza Tabla 1: Conjunto original de datos(vea ejemplos aquí masabajo)

Page 16: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 1• La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de

una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.

• Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

• Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

• Las variables también se pueden clasificar en: Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).

• Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).

• Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

• Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).

• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.

Page 17: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 2• Cuando se estudia el comportamiento de una variable hay que distinguir los

siguientes conceptos:• Individuo: cualquier elemento que porte información sobre el fenómeno que se

estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.

• Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

• Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

Page 18: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 3

• Medidas de posición central• Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando.

Estas medidas permiten conocer diversas características de esta serie de datos. • Las medidas de posición son de dos tipos:• a) Medidas de posición central: informan sobre los valores medios de la serie de datos.• b) Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la

serie.• a) Medidas de posición central• Las principales medidas de posición central son las siguientes:• 1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de

media, siendo las más utilizadas:• a) Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La

suma de todos estos productos se divide por el total de datos de la muestra:• Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que

no se pierde ninguna información. • Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como

geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

Page 19: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 3

• Medidas de posición central•

2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro

de la muestra (un 50% de valores son inferiores y otro 50% son superiores).• No presentan el problema de estar influido por los valores extremos, pero en cambio

no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

• 3.- Moda: es el valor que más se repite en la muestra.

Page 20: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 4• Ejemplo: vamos a utilizar una tabla de distribución de frecuencias con los datos de

la estatura de los alumnos

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Page 21: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 4• Vamos a calcular los valores de las distintas posiciones centrales:• 1.- Media aritmética:• Xm =• (1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)• --------------------------------------------------------------------------------------------------• 30• Luego:• Xm =• 1,253• Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.

Page 22: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 4• 3.- Mediana:• La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de los

valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas.

• En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situaría exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la división entre el 50% inferior y el 50% superior.

• 4.- Moda:• Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto

esta seria cuenta con 3 modas.

Page 23: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 4• Medidas de dispersión• Estudia la distribución de los valores de la serie, analizando si estos se encuentran

más o menos concentrados, o más o menos dispersos.• Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar

las siguientes:• 1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia

entre el valor más elevado y el valor más bajo.• Medidas de dispersión• 2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se

calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.

• La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

• 3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.• 4.- Coeficiente de variación de Pearson: se calcula como cociente entre la

desviación típica y la media.

Page 24: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 4• Ejemplo Medidas de dispersión: vamos a utilizar una tabla de distribución de

frecuencias con los datos de la estatura de los alumnos y vamos a calcular sus medidas de dispersión.

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Page 25: Ucn Fundamentos De Estadadistica

REPASEMOS Y APLIQUEMOS 4• Medidas de dispersión• 1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego

el rango de esta muestra es 10 cm.• 2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la

fórmula:• Por lo tanto, la varianza es 0,0010• 3.- Desviación típica: es la raíz cuadrada de la varianza.• 4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y

la media de la muestra.

Page 26: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.1

• Con el fin de seleccionar un profesional para dirigir una selección departamental, se citaron a tres ex jugadores del deporte, dos Especialistas en la materia y una persona empírica (sólo experiencia). Dado la idoneidad de los aspirantes, el cargo se va a proveer al azar. a) Cuál es la probabilidad que se seleccione un Especialista? b) Se seleccione un ex jugador? c) No se seleccione un Especialista? d) Sea Especialista o ex jugador?. Si se seleccionan dos personas, cuál es la probabilidad de que: e) ambos sean ex jugadores, f) todos Especialistas, g) uno ex jugador y el otro Especialista. Si se seleccionan tres aspirantes cual es la probabilidad de: H) Dos sean Especialistas, I) mínimo uno sea ex jugador, j) redacte otra pregunta que se acomode a los datos del problema

Page 27: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de

frecuencia. 2

2.5 3.6 2.8 4.3 4.0 3.6

2.3 3.1 3.5 2.5 4.2 3.5  

3.5 4.1 4.2 3.6 2.6 3.6  

2.7 4.0 3.7 2.8 3.1 3.3  

3.3 3.8 4.3 3.5 3.8 2.6  

4.0 2.7 2.5 2.7 4.5 3.2  

•Los siguientes datos representan las notas de un grupo de estudiantes en Estadística Descriptiva. •Construya la distribución de frecuencia simple y diga cual es la moda. •Que porcentaje de estudiantes ganó la materia.•Si se requiere que las notas estén entre 4.3 y 4.0. Que porcentaje de ellas no cumple con la regla?•Si para habilitar, se requiere mínimo una nota de 2.0, que porcentaje de estudiantes no puede habilitar?Agrupe en cinco intervalos e interprete un valor de cada columna. Cual es el gráfico adecuado.

Page 28: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.3

• El número de pacientes que llegaron por urgencias a tres I.P.S en una semana se muestra a continuación.

DÍA I.PS 1 I.PS 2 I.P.S 3

1 20 13 8

2 15 14 8

3 16 13 8

4 14 12 8

5 15 13 8

6 18 12 8

Page 29: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.3

• a) Si le pidiesen un informe gráfico de los datos anteriores, Cuál presentaría Usted?. Por qué?. Mire Teoría y ejemplos de gráficos mas abajo.

• Además, se quiere presentar un gráfico que muestre la participación relativa de cada entidad con respecto al total de la demanda.

• Cuál de ellas presenta mayor variabilidad? Porqué?

• Con las medidas de posición diga si la IPS 2 tiene forma de campana. Qué forma tienen los datos de la IPS 3. Por qué?

Page 30: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.3

47 55 43 42 45 45 45 42

45 56 44 41 41 45 55 49

50 45 44 52 45 40 50 49

42 58 42 48 45 40

Los siguientes datos corresponden al número de personas reportadas con enfermedad diarreica aguda, en un brote en una comunidad que ha estado expuesta a cólera por día.

Page 31: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.3

• a). Que porcentaje de los días se reportaron menos de 43 o más de 50 enfermos.

• b). Se tiene la norma que, cuando el número de reportados es mínimo de 50, dicho día se considera anormal. Qué porcentaje de los días son anormales?.

• c). Qué porcentaje se puede afirmar que son normales?• d). Agrupe en cinco intervalos e interprete un valor de cada columna.• e) Cuál gráfico es el adecuado? Mire ejemplos de gráficas mas abajo. Por

qué?

Page 32: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.4

MEDELLIN SANTA FE DE BOGOTAAccidentes Días Accidentes Días

9 5 20 10

11 6 21 12

12 7 22 14

14 6 23 15

16 5 24 14

Las siguientes distribuciones muestran el número de accidentes de tránsito ocurridos en Bogotá y Medellín durante varios días. A) Se le solicita identificar en cuál de ellas se presenta mayor heterogeneidad? Por qué?.

Page 33: Ucn Fundamentos De Estadadistica

II: Ejercicios de Construcción de tablas de frecuencia.4

• B) Para Medellín diga que forma parecen tener los datos y calcule el porcentaje respectivo para una desviación estándar alrededor de la media. Calcule el intervalo.

• C) Se detectó que el auxiliar dejo de anotar 2 accidentes por día, cuál es

en nuevo promedio y cuál el nuevo coeficiente de variabilidad, use propiedades.

• D) Por el contrario en Bogotá, se anotaron 3 accidentes de más, recalcule

las nuevas medidas.

Page 34: Ucn Fundamentos De Estadadistica

III. Representaciones gráficas Con Ejemplos

• Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de información dependerá de la presentación de los datos, siendo la forma gráfica uno de los más rápidos y eficientes, aunque también uno de los que más pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones básicas al realizar las gráficas. Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información.

• Entonces, mencionaremos algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz posible y sin distorsiones:

• El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas al comparar la altura, longitud o posición de las columnas, barras o líneas que representan las frecuencias.

• La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica deben ser iguales.• El tipo de gráfico debe coincidir por sus características con el tipo de información o el objetivo que se persigue al

representarla, de otra manera la representación gráfica se convierte en un instrumento ineficaz, que produce más confusión que otra cosa, innecesario o productor de malinterpretaciones. Por ejemplo, si se desea representar la proporción de población masculina en un país conviene más usar una gráfica de pastel o circular que una gráfica de barras al compararla contra la población femenina; por un lado se puede apreciar dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor.

• Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien delineada, bien coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver más sobre el objetivo de estas herramientas y la Estadística: la transmisión eficiente de la información.

Page 35: Ucn Fundamentos De Estadadistica

Tipos de Representaciones gráficas

El histograma: Para las distribuciones de frecuencias la representación gráfica más común es el histograma. Un ejemplo es el que se presenta a continuación y que representa el número de "visitas" que ha tenido un Centro medico de acuerdo a la hora de la visita.

Page 36: Ucn Fundamentos De Estadadistica

El histograma:

• De esta manera, el histograma está compuesto rectángulos, cuyo número coincide con la cantidad de intervalos considerados, el ancho de la base de cada uno de esos rectángulos es la misma siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuencia de cada intervalo.

• Es importante observar que resulta difícil utilizar este tipo de representación cuando existen intervalos abiertos o cuando los intervalos no son iguales entre sí.

Page 37: Ucn Fundamentos De Estadadistica

Gráfica de columnas. • Para este tipo de gráfica, elaboradas con rectángulos también, se pide que sus bases

sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas entre sí.

• Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una gráfica con varias series, correspondiendo cada una de ellas a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero distinta de las demás. Para este tipo de gráfica, elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas entre sí.

• Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una gráfica con varias series, correspondiendo cada una de ellas a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero distinta de las demás.

Page 38: Ucn Fundamentos De Estadadistica

Ejemplo 1 de Representación en gráfica de columnas

El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos universitarios. Las series (cada una de las calificaciones parciales) están coloreadas con diferente color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los demás. Es interesante observar que la escala horizontal no es continua (es nominal).

Page 39: Ucn Fundamentos De Estadadistica

Ejemplo 2 de Representación en gráfica de columnas

Existe la posibilidad, y si los recursos lo permiten, de representar gráficos compuestos de una manera "tridimensional", es decir, con gráficos que posean no sólo dos ejes, sino tres; y en los que los rectángulos son sustituidos por prismas de base rectangular (ocasionalmente el software en el mercado permite utilizar prismas cuya base son polígonos regulares de más de cuatro lados, pirámides o cilindros). Un ejemplo es el siguiente:

Page 40: Ucn Fundamentos De Estadadistica

Gráfica de barras horizontales

• También es posible realizar gráficas de barras horizontales, los cuales se parecen mucho a las gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambian y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases.

• Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida en estratos como, por ejemplo, son sus edades.

Page 41: Ucn Fundamentos De Estadadistica

Ejemplos de Representaciones gráficas de barras horizontales

El ejemplo que se presenta es la población de un país ficticio llamado "Timbuctulandia":

A este tipo de gráficos en particular se le llama pirámide de edades por su forma. Incluso, cuando se compara la población masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la población de un sexo y el lado derecho para el otro, el resultado es una "pirámide" casi simétrica (dependerá de la población en particular).

Page 42: Ucn Fundamentos De Estadadistica

Representación en gráficas de líneas

• Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la evolución del peso o estatura de una persona a través del tiempo, el desempeño académico de un estudiante a lo largo de su instrucción escolar, las variaciones presentadas en la medición realizada en algún experimento cada segundo o minuto) se pueden utilizar las gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas:

Page 43: Ucn Fundamentos De Estadadistica

Ejemplo1 de Representaciones gráficas de líneas

Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de las graficas de columna  (y de otras más) es posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un individuo).

Page 44: Ucn Fundamentos De Estadadistica

Ejemplo 2 de Representaciones gráficas de líneas

• Otra forma de representación de un uso menos común, y muy parecida a las graficas de líneas, es el polígono de frecuencias. La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra después de la última. El resultado es que se "sujeta" la línea por ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono.

Page 45: Ucn Fundamentos De Estadadistica

Continuación Ejemplo 2 de Representaciones gráficas de líneas

El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigación durante el año de 1990 en cinco países (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

Page 46: Ucn Fundamentos De Estadadistica

Ejemplos de Representaciones gráficas de pastel o circular

Cuando lo que se desea es resaltar las proporciones que representan algunos sub conjuntos con respecto al total, es decir, cuando se está usando Una escala categórica, conviene utilizar una gráfica llamada de pastel o circular.Por ejemplo, para ilustrar la matrícula en licenciatura (en México) por áreas de conocimiento en el año de 1992 se puede usar algo así como sigue (Fuente: ANUIES,1995):

Page 47: Ucn Fundamentos De Estadadistica

Ejemplos de Representaciones gráficas de pastel o circular

De hecho, si se desea resaltar una de las categorías que se presentan, es válido tomar esa "rebanada" de la gráfica y separarla de las demás:

Page 48: Ucn Fundamentos De Estadadistica

Ejemplos de Representaciones gráficas de pictograma

• Actualmente, y mucho en los medios masivos de comunicación, se utilizan gráficos para ilustrar los datos o los resultados de alguna investigación. Regularmente se utilizan dibujos para representar dicha información, y el tamaño o el número de estos dibujos dentro de una gráfica queda determinado por la frecuencia correspondiente. A este tipo de gráfica se le llama pictograma y éstos son dos ejemplos:

Page 49: Ucn Fundamentos De Estadadistica

Ejemplo 1 de Representaciones gráficas en pictograma

Esta Grafica representa la masa de tres planetas de nuestro sistema solar tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y Neptuno tiene más 17 veces más masa que la Tierra).

Page 50: Ucn Fundamentos De Estadadistica

Ejemplo 2 de Representaciones gráficas en pictograma

Esta grafica representa la población de los Estados Unidos (cada hombrecillo representa a dos millones de habitantes).

Page 51: Ucn Fundamentos De Estadadistica

Representaciones gráficas de dispersión. • Cuando se pretende ilustrar la dispersión de las

observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una gráfica de dispersión. Por ejemplo, el ejemplo de la izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

Page 52: Ucn Fundamentos De Estadadistica

Ejemplo 1 de Representación con gráficas de

dispersión.

La dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

Page 53: Ucn Fundamentos De Estadadistica

Ejemplo 2 de Representación con gráficas de

dispersión.

Este es el resultado de comparar el diámetro (en miles de kilómetros) de los planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centímetro cúbico). Es interesante observar que los puntos parecen "seguir" una línea imaginaria que se asemeja a una recta, con excepción de un caso atípico: Mercurio.

Page 54: Ucn Fundamentos De Estadadistica

UTILIDAD DE LAS GRAFICAS ESTADISTICAS

• La utilidad de los gráficas es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismas una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.

• El propósito de una gráfica no es entonces muy diferente del de cualquier otra herramienta estadística: ayudar a la comprensión y comunicación de la evidencia aportada por los datos respecto a una hipótesis en estudio

• La calidad de una gráfica estadística consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que:

• Induzca a pensar en el contenido más que en la apariencia• No distorsione la información proporcionada por los datos• Presente mucha información (números) en poco espacio• Favorezca la comparación de diferentes grupos de datos o de

relaciones entre los mismos (por ejemplo una secuencia temporal)

Page 55: Ucn Fundamentos De Estadadistica

Glosario Fundamentos de Estadística Descriptiva•

La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.

• Las variables pueden ser de dos tipos:• Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).• Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).• Las variables también se pueden clasificar en:• Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una

clase).• Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de

los alumnos de una clase).• Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de

los alumnos de una clase).• Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2,

3....,etc, pero, por ejemplo, nunca podrá ser 3,45).• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser

80,3 km/h, 94,57 km/h...etc.• Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:• Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los

niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.• Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeo

que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

• Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

Page 56: Ucn Fundamentos De Estadadistica

Links en Web de Estadística Descriptiva

• http://www.stat.ucla.edu/index.php• http://www.ine.es/• http://www.educateca.com/manuales_cursos

/empresas_calidad.asp• http://www.aaamatematicas.com/• http://www.aaamatematicas.com/sa/mny.ht

m Economia Dinero