8

Click here to load reader

Presentacion

Embed Size (px)

DESCRIPTION

Presentacion e

Citation preview

Page 1: Presentacion

Presentación de Datos

Page 2: Presentacion

Unidad Estadística Una vez identificada la población y la muestra, se ubica la unidad estadística, o sea el objeto de la medición. La unidad estadística es el elemento del universo que reporta la información (observación) y sobre el cual se realiza un determinado estudio (análisis). Dato Hace referencia a la observación particular, es decir, la información relacionada con las características de cosas existentes que pueden ser recogidos, anotados u observados Variables Es una dimensión o una característica de una unidad de análisis, dimensión que adopta la forma de una clasificación. Una variable se puede representar por un símbolo X, Y, Z, V, x, h etc. que puede tomar un conjunto prefijado de valores; dichas variables pueden ser:

Nominal: a veces conviene extender la noción de variable a entidades no numéricas: es decir que relacionan un carácter, un nombre, una cualidad. Por ejemplo, el color C de un arco iris es una variable que puede tomar los valores rojo, anaranjado, amarillo, verde, azul, violeta y rosado. Puede ser posible sustituir tales variables por entidades numéricas de la siguiente manera: denotando el rojo como 1, el anaranjado como 2 etc.

Ordinal: le asigna valores numéricos a los sujetos, de tal forma que los

valores más altos se le asignan a los individuos que tienen más de la característica que se mide. Esto hace que necesariamente satisfaga la característica de diferenciación pero en adición introduce la posibilidad de ordenamiento.

Por ejemplo, en una competencia ciclística se tiene en cuenta los cinco primeros puestos para la premiación.

Intervalo: en adición a la clasificación y ordenamiento se introduce la posibilidad de establecer el ordenamiento con intervalos iguales.

Por ejemplo, la medición de la temperatura la cual se puede hacer por medio de un termómetro en grados Fahrenheit.

Variable Continua: es la variable que puede tomar cualquier valor entre dos valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm, 1.80.

Variable Discreta: es la variable que solo puede tomar un determinado número de valores enteros. El número N de hijos en una familia puede ser O, 1, 2, 3.

Page 3: Presentacion

1.2 ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN DE FRECUENCIAS La distribución de frecuencias o tabla de frecuencia, es la disposición tabular de los datos por clases junto con las correspondientes frecuencias de clase. Para la elaboración de esta distribución si los datos son cuantitativos, hay que tener en cuenta los siguientes pasos: 1.2.1 Recolección de Datos Es la base para cualquier estudio estadístico, es la toma de datos u observaciones; estos se llevan a cabo mediante la recopilación de los mismos sin ninguna ordenación de acuerdo a lo que se está investigando.

Por ejemplo la empresa “Cuero Lindo” recopiló la información resultante de encuestar 60 establecimientos pequeños, para estudiar sus ventas semanales en miles de pesos, los resultados son:

40 17 26 10 26 21 18 27 16 38 22 33 24 20 28 14 30 25 29 37 28 28 33 22 25 29 29 29 21 32 19 35 23 28 22 15 34 13 16 26 24 20 31 29 18 19 11 23 20 24 28 11 34 39 10 25 17 21 34 18

Después de tener dicha información, se procede a ordenarla; es decir, colocar los datos numéricos en orden creciente o decreciente. Existe un tipo de ordenación y se hacen generalmente en una tabla de distribución de frecuencias. Para ello se debe encontrar inicialmente el rango de la distribución; que es la diferencia entre el mayor y el menor dato obtenido. Así: R = Dm - dm, donde R = rango

Dm = dato mayor dm = dato menor

R= 40 - 10 = 30 1.2.2 Intervalos Al resumir grandes colecciones de datos es útil distribuidos en clases o categorías; en cuanto al número de clases el investigador es autónomo para escoger el número de intervalos para trabajar, sin embargo existe una fórmula que se utiliza como base o guía para indicar la cantidad de intervalos que se van a crear en la tabla de frecuencias. Esta fórmula esta determinada por: m = 1 + 3.33 log n; donde m = número de intervalos m = 1 + 3.33 log 60 = 6.92 n = tamaño de la muestra Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso se toman 6 intervalos, pero se agregan dos más que son: el intervalo menor que

Page 4: Presentacion

el dato menor y el intervalo mayor que el dato mayor; esto cuando se utiliza un programa de computador. 1.2.3 Amplitud El rango nos ayuda a determinar la amplitud o el tamaño de cada clase, siendo esta una constante para cada intervalo. La amplitud indica la distancia que debe tener cada clase. La amplitud se puede determinar como el cociente entre el rango y el número de intervalos. A = R / m; donde A = amplitud A = 30 / 6 = 5 miles de pesos Para formar los intervalos de clase, si es utilizando un programa estadístico, se parte del dato menor 10 y se le suma la amplitud, así, 10 + 5=15. Entonces el primer grupo esta comprendido entre 10 y 15 miles de pesos. El siguiente grupo será: 15 + 5 = 20, donde el intervalo estará entre 15 y 20 miles de pesos. En forma similar se crean los demás intervalos, incluyendo los intervalos menores a 10 miles de pesos y mayores a 40 miles de pesos.

NÚMERO DE CLASES INTERVALOS

- 10

1 10 - 15

2 15 - 20

3 20 - 25

4 25 - 30

5 30 - 35

6 35 - 40

40 -

Otra manera de formar los intervalos de clase es tomar un dato como medida de referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor de la amplitud:

NÚMERO DE INTERVALOS

INTERVALOS

1 5 - 10

2 10 - 15

3 15 - 20

4 20 - 25

5 25 - 30

6 30 - 35

7 35 - 40

Page 5: Presentacion

1.2.4 Frecuencia de Clase o Frecuencia Absoluta Se determina el número de individuos que pertenecen a cada clase. Como cada clase está formada por un intervalo, entonces se debe tomar como un intervalo abierto a izquierda y cerrado a derecha. Esto quiere decir, por ejemplo: que para hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 - 25, van a estar los valores 21, 22, 23, 24 y 25. De igual manera los valores que van a estar entre 25 - 30 son 26, 27, 28, 29 y 30. Teniendo esto en cuenta, podemos utilizar el siguiente cuadro para realizar el conteo:

Intervalos Número de

Establecimientos F

5 - 10 / 2

10 - 15 ///// 5

15 - 20 //////////// 12

20 - 25 ///////////// 14

25 - 30 ////////////// 15

30 - 35 //////// 8

35 - 40 //// 4

TOTAL 60

Esta frecuencia significa; por ejemplo: que 12 establecimientos tienen ventas semanales entre $15000 y $20000; las mayores ventas están entre $25000 y $30000, las menores ventas presentadas son de $10000, etc. 1.2.5 Marca de Clase (X) Es el punto medio del intervalo de clase y se obtiene promediando el limite inferior y superior de cada clase.

Intervalos X

5 - 10 7,5

10 - 15 12,5

15 - 20 17,5

20 - 25 22,5

25 - 30 27,5

30 - 35 32,5

35 - 40 37,5

Miles de pesos; esto quiere decir que el promedio del primer intervalo es de $7500.

Page 6: Presentacion

Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia común entre marcas de clase sucesivas. Por ejemplo: 32,5 - 27,5 = 5 miles de pesos. 1.2.6 Frecuencia Relativa (Fr) Es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje.

F

Fr = n

La frecuencia relativa del primer intervalo es 0.0333. Este valor se obtuvo de la relación entre 2/60 = 0.0333; significa que el 3.33% de los establecimientos tienen ventas menores de $10000. Este porcentaje se obtiene al multiplicar por 100 el resultado obtenido. De igual manera, la frecuencia relativa del segundo intervalo es de 0.0833, que significa que el 8.33% de los establecimientos tienen ventas entre $10000 a $15000. 1.2.7 Frecuencia Acumulada (Fa) Es la acumulación ascendente o descendente (de la primera a la última clase o viceversa) de frecuencias absolutas. La frecuencia acumulada descendente se obtiene de la siguiente manera: La primera frecuencia acumulada corresponde a la primera frecuencia

absoluta.

La segunda acumulada se obtiene sumando las dos primeras absolutas, es decir, 2+5 = 7.

La tercera acumulada se obtiene de sumar 7 + 12 = 19 y así sucesivamente.

La frecuencia acumulada ascendente se obtiene así: se inicia por la frecuencia absoluta del último intervalo; en este caso 4. La siguiente es sumar esta frecuencia acumulada con la anterior: 4+8 = 12. La que sigue sería 4 + 8 = 12 y así sucesivamente.

Intervalos F Fa

5 - 10 2 2 60

10 - 15 5 7 58

15 - 20 12 19 53

20 - 25 14 33 41

25 - 30 15 48 27

30 - 35 8 56 12

Page 7: Presentacion

35 - 40 4 60 4

El significado de este cuadro es el siguiente: si tomamos el tercer grupo descendente, su frecuencia acumulada, significa que 19 establecimientos tienen ventas semanales entre $10000 y $20000 o inferiores a $20000. Y si tomamos el segundo grupo ascendente, quiere decir que 12 establecimientos tienen ventas semanales entre $30000 y $40000 o mayores a $30000. 1.2.8 Frecuencia Relativa Acumulada (Fra) Es la acumulación sucesiva en forma ascendente o descendente de frecuencias relativas. La primera frecuencia relativa acumulada corresponde a la primera frecuencia relativa. La segunda, se obtiene sumando las dos primeras frecuencias relativas, es decir, 0,0333 + 0,0833 = 0,1167 y así sucesivamente. La frecuencia relativa acumulada ascendente se obtiene así: se inicia por la frecuencia relativa del último intervalo; en este caso 0,0667. La siguiente es sumar esta frecuencia acumulada con la anterior 0,0667 + 0,1333 = 0,2 y así sucesivamente.

Intervalo Fr Fra

5 – 10 0.0333 0.0333 1

10 - 15 0.0833 0.1167 0.9666

15 - 20 0.2 0.3167 0.8833

20 - 25 0.2333 0.55 0.6833

25 - 30 0.25 0.8 0.45

30 - 35 0.1333 0.9333 0.2

35 - 40 0.0667 1 0.0667

Si tomamos el grupo 5 descendente su acumulado es de 0.8, cuyo significado es que el 80% de los establecimientos tienen ventas semanales menores a $30000; si tomamos el grupo 4 ascendente su acumulado será del 0,6833, esto significa que el 68.33% de los establecimientos tienen ventas mayores a $20000 mil pesos.

Intervalo F Fr Fa Fra

5 - 10 2 0,0333 2 60 0,0333 1

10 - 15 5 0,0833 7 58 0,1167 0,9666

15 - 20 12 0,2 19 53 0,3167 0,8833

20 - 25 14 0,2333 33 41 0,55 0,6833

25 - 30 15 0,25 48 27 0,8 0,45

30 - 35 8 0,1333 56 12 0,9333 0,2

35 - 40 4 0,0667 60 4 1 0,0667

Total 60 1,00

Page 8: Presentacion

La tabla presenta el resumen de la clasificación de los 60 establecimientos analizados por los investigadores de la empresa Cuero Lindo, esto significa que se ha organizado la información.