26
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD PRIVADA DR. RAFAEL BELLOSO CHACÍN VICERECTORADO DE INVESTIGACIÓN Y POSTGRADO DECANATO DE INVESTIGACIÓN Y POSTGRADO MAESTRÍA EN INFORMÁTICA EDUCATIVA ESTADÍSTICA APLICADA A LA INVESTIGACIÓN Facilitador: Mgs. Mairene Tobón. Maracaibo, Marzo 2013.

Present. Estadistica (B) (1)

Embed Size (px)

DESCRIPTION

estadistica basica

Citation preview

REPÚBLICA BOLIVARIANA DE VENEZUELAUNIVERSIDAD PRIVADA DR. RAFAEL BELLOSO CHACÍN

VICERECTORADO DE INVESTIGACIÓN Y POSTGRADODECANATO DE INVESTIGACIÓN Y POSTGRADO

MAESTRÍA EN INFORMÁTICA EDUCATIVA

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN

Facilitador: Mgs. Mairene Tobón.

Maracaibo, Marzo 2013.

MODA MODA

MEDIANA MEDIANA

MEDIA MEDIA

MEDIDAS DE

TENDENCIA

CENTRAL

ESTADISTICA DESCRIPTIVA

Ejemplo 1.Obtener la moda de los siguientes datos: -3, 3, -2, 0, 3, -1, -2, 4, 5, -2, 0, 1.Respuesta: El valor que mas se repite es: -2

Ejemplo 2.Obtener la moda de los siguientes datos: 6, 2, -1, -5, 3, -3, -2, 5, 0, -4, 4, 1.Respuesta: Ningún valor se repite.

MEDIDAS DE TENDENCIA CENTRAL

MODA MODAEs el valor que más se repite en un grupo de observaciones, es decir, el que tiene el mayor número de frecuencias absolutas. La moda puede ser no única e inclusive no existir.

Permite planificar, organizar y producir para satisfacer las necesidades de la mayoría.

MEDIDAS DE TENDENCIA CENTRAL

MODA MODA

Horas laboradaspor día

FrecuenciaAbsoluta

6 3

7 2

8 5

9 5

10 2

11 1

La mayor frecuencia son 8 y 9 horas diarias de trabajo, por lo tanto existe más de una moda.

Ejemplo 3.

MEDIDAS DE TENDENCIA CENTRAL

MEDIANAMEDIANA

Valores medios o centrales de una distribución, es considerado el valor que divide la distribución por la mitad.

Cálculo de la Mediana para datos no agrupados:

Para obtener el valor de la mediana se deben ordenar los datos en forma ascendente.

Si el número de datos es impar el elige el dato que se encuentra en la mitad.

Si el número de datos es par, la mediana es el promedio de los valores centrales.

MEDIDAS DE TENDENCIA CENTRAL

MEDIANAMEDIANA

Ejemplo 1.Obtener la mediana de los siguientes datos: 4, 7, 1, 9, 2, 5, 6.Respuesta: Ordenando de forma ascendente: 1, 2, 4, 5, 6, 7, 9. La mediana es: 5

Ejemplo 2.Obtener la mediana de los siguientes datos: -3, 5, 18, 4, 11, -6, 9, 10, -1, 2. Respuesta: Ordenando de forma ascendente: -6, -3, -1, 2, 4, 5, 9, 10, 11, 18. Los valores centrales son: 4 y 5 La mediana es: ( 4 + 5 ) / 2 = 4.5

MEDIDAS DE TENDENCIA CENTRAL

Cálculo de la Mediana para datos agrupados:

Li es el límite inferior de la clase donde se encuentra la mediana.

la semisuma de las frecuencias absolutas

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

fi frecuencia absoluta en la clase mediana.

MEDIDAS DE TENDENCIA CENTRAL

MEDIANA PARA DATOS AGRUPADOSMEDIANA PARA DATOS AGRUPADOS

Intervalo FrecuenciaAbsoluta

FrecuenciaAcumulada

45 – 55 6 6

55 – 65 10 16

65 – 75 19 35

75 – 85 11 46

85 - 95 4 50

Posición de la Mediana = N / 2 = 50 / 2 = 25 (Frec. Acumulada)Intervalo de la Mediana 65 - 75

Li = 65 Fi-1 = 16 ai = 10fi = 19 Mediana = 69.737

MEDIDAS DE TENDENCIA CENTRAL

MEDIA MEDIA

Es la medida de tendencia central más utilizada y puede definirse como el promedio aritmético de una distribución.

Expresión de la Media para datos no agrupados.:

n

xx i

Xi: cada una de las mediciones o datos.

n: número total de datos

Ejemplo.Hallar la media aritmética de los siguientes datos: 10, 8, 6, 15, 10, 5.Respuesta: la Media aritmetica es: (10+8+6+15+10+5) / 6 = 9

MEDIDAS DE TENDENCIA CENTRAL

Expresión de la Media para datos agrupados:

Xi: punto medio de cada intervalo de clase.

fi: frecuencia de cada intervalo de clase.

n: número total de intervalos de clase.

N: número total de datos.

Intervalo Marca deClase (Xi)

FrecuenciaAbsoluta (fi)

fi . Xi

45 – 55 50 6 300

55 – 65 60 10 600

65 – 75 70 19 1330

75 – 85 80 11 880

85 - 95 90 4 360

Total 50 3470

Media = 3470 / 50

Media = 69.4

Ejemplo:

MEDIDAS DE POSICIÓN RELATIVA

Una medida de posición relativa permite describir la ubicación de un valor dentro de un conjunto de datos, tomando en cuenta el porcentaje acumulado de casos correspondiente a dicho valor.

MEDIDAS DE

POSICION

RELATIVA

Percentiles.

Deciles.

Cuartiles.

MEDIDAS DE POSICIÓN RELATIVA

Son valores que dividen al conjunto en 100 partes iguales, cada uno dejando por debajo de sí un determinado porcentaje de casos. Existen 99 percentiles y estos se denotan como Pk, donde el subíndice se refiere al porcentaje de casos que están por debajo del percentil.

Entre dos percentiles consecutivos se encuentra el 1% de los casos

Percentiles.

MEDIDAS DE POSICIÓN RELATIVA

Ejemplo 1.Suponga que se aplicó una prueba de resistencia a un grupo de personas mayores de 50 años de edad y se midió el tiempo en minutos que invertían en recorrer 800 metros. Uno de los resultados fue: P30 = 7,63 minutos. Interpretación:

El 30% de las personas tardó 7,63 minutos o menos en recorrer los 800 metros.

Ejemplo 2.En un estudio de ingresos mensuales de la población económicamente activa, revela que el percentil 90 (P90) es 2000 bolivares. Esto significa que aproximadamente el 90% de las personas tienen ingresos que son menores o iguales a 2000 bolivares , y por supuesto, el 10% tiene ingresos mayores o iguales a dicho valor.

MEDIDAS DE POSICIÓN RELATIVA

En un conjunto ordenado de datos, un decil es un valor que divide al conjunto en diez partes iguales. Existen 9 deciles y estos se denotan como D1, D2, D3, D4, D5, D6, D7, D8 y D9. Entre dos deciles consecutivos se encuentra un 10% de los casos

Deciles.

En un conjunto ordenado de datos, un cuartil es un valor que divide al conjunto en cuatro partes iguales. Existen 3 cuartiles y estos se denotan como Q1, Q2 y Q3

Entre dos cuartiles consecutivos se encuentra un 25% de los casos

MEDIDAS DE POSICIÓN RELATIVA

Cuartiles.

En un conjunto ordenado de datos, un cuartil es un valor que divide al conjunto en cuatro partes iguales. Existen 3 cuartiles y estos se denotan como Q1, Q2 y Q3

Entre dos cuartiles consecutivos se encuentra un 25% de los casos

MEDIDAS DE POSICIÓN RELATIVA

Cuartiles.

MEDIDAS DE POSICIÓN RELATIVA

Ejemplo:

En una distribución de estaturas se tiene que: Q1 = 1,70 mtrs.

Interpretación:El 25% de los sujetos tiene una estatura máxima igual a 1,70 metros.

D5 = Q2 = 1,76mtrs.

Interpretación:El 50% de las estaturas de la distribución es menor o igual a 1,76 metros, mientras el 50% restante es superior a 1,76 metros.

Numero de Hijos

FrecuenciaAbsoluta

FrecuenciaAcumulada

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

Ejemplo:Si la siguiente distribución de frecuencias representa el número de hijos de cien familias. Calcular sus cuartiles y deciles.

Q1 = (fa / 4) > 25 → Q1 = 2

Q2 = (fa / 4) > 50 → Q2 = 3

Q3 = (fa / 4) > 75 → Q3 = 4

Q3, significa que el 75% de las familias tienen 4 o menos hijos.

D1 = (fa / 10) > 10 → D1 = 0 D6 = (fa / 10) > 60 → D6 = 3 D2 = (fa / 10) > 20 → D2 = 1 D7 = (fa / 10) > 70 → D7 = 4 D3 = (fa / 10) > 30 → D3 = 2 D8 = (fa / 10) > 80 → D8 = 4 D4 = (fa / 10) > 40 → D4 = 3 D9 = (fa / 10) > 90 → D9 = 5 D5 = (fa / 10) > 50 → D5 = 3

MEDIDAS DE POSICIÓN RELATIVA

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

VARIANZA.

La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto, menor representatividad tendrá la media aritmética. Se denota usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2) y en otros casos por S2, se define como: “el cuadrado medio de las desviaciones con respecto a su media aritmética". La varianza se expresa en las mismas unidades que la variable analizada,pero elevadas al cuadrado.

Calculo de la Varianza para datos agrupados:

Calculo de la Varianza para datos no agrupados:

Xi: cada una de las mediciones o datos. ẋ: media o promedio aritmetico.

N: número total de datos.

Xi: punto medio de cada intervalo de clase. ẋ: media o promedio aritmetico.

fi: frecuencia de cada intervalo de clase.

N: número total de datos.

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

DESVIACION ESTANDAR o TIPICA.

La desviación estándar es una medida estadística de la dispersión de un grupo o población. Una gran desviación estándar indica que la población esta muy dispersa respecto de la media. Una desviación estándar pequeña indica que la población está muy compacta alrededor de la media.

Para calcular la desviación estándar basta con obtener la raíz cuadrada de la varianza. Se denota usualmente por la letra minúscula griega δ (sigma) y en otros casos por S.

Calculo de la Desviacion Estandar para datos no agrupados:

Calculo de la Desviacion Estandar para datos agrupados:

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

(10 – 9.5)2 (10 – 9.5)2 (10 – 9.5)2

Hallar la Desviación Estándar y la Varianza de la siguiente serie de datos: 10, 18, 15, 12, 3, 6, 5, 7

a) Se calcula la Media de los datos Media = (10+18+15+12+3+6+5+7) / 8 = 9.5

a) Calcular la Desviacion Estandar, aplicando:

= (10 – 9.5)2 + (18 – 9.5)2 + (15 – 9.5)2 + (12 – 9.5)2 + (3 – 9.5)2 + (6 – 9.5)2

+ (5 – 9.5)2 + (7 –9.5)2 = 190

= √ (190 / 8) = √ 23.75 → s = 4.873

c) Calcular la Varianza, aplicando: = 23.75

Datos no Agrupados.Datos no Agrupados.

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

Clase Marca de Clase (Xi)

FrecuenciaAbsoluta (fi)

fi . Xi

10 – 15 12.5 2 25

16 – 21 18.5 8 148

22 – 27 24.5 13 318.5

28 – 33 30.5 10 305

34 - 39 36.5 6 219

Total N = 39 ∑ = 1015.5

Datos Agrupados.Datos Agrupados.

Calcular la desviación estándar y la varianza para la siguiente distribución de frecuencias.

a) Determinar la Media para datos agrupados:

= ( 1015.5 / 39 ) = 26.038

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

a) Calcular la Desviacion Estandar, aplicando:

= 2(12.5 – 26.038)2 + 8(18.5 – 26.038)2 + 13(24.5 – 26.038)2 + 10(30.5 – 26.038)2

+ 6(36.5 –26.038)2 = 1707.69

= √ (1707.69 / 39) = √ 43.78 → S = 6.616

c) Calcular la Varianza, aplicando:

= 43.78

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

COEFICIENTE DE VARIACIÓNCOEFICIENTE DE VARIACIÓN

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

Se define como el cociente entre la desviación estándar y el valor absoluto de la media aritmética, se suele expresar en porcentajes:

Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación.

Una distribución tiene ẋ = 140 y σ = 28.28 y otra ẋ = 150 y σ = 24. ¿Cuál de lasdos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

EJEMPLO

MEDIDAS DE DISPERSIÓN Y VARIABILIDAD.

PUNTUACIONES TIPICASPUNTUACIONES TIPICAS

EJEMPLO:

La nota de un estudiante en un examen de Estadistica es de 72, donde la media de la distrubución es 78 y la desviacion estandar de 12, asimismo el estudiante alcanza una puntuación de 48 un una Prueba de Matematica, donde la media es de 51 y la desviación estandar de 6.

Z1 = -0.5 Z2 = -0.5

Según los resultados obtenidos es evidente que las calificaciones obtenidas son equivalentes. Al comparar este alumno con sus compañeros, se obtiene que su ubicación respecto al grupo es la misma tanto en una como en la otra asignatura.

Las puntuaciones tipicas son el resultado de dividir las puntuaciones diferenciales entre la desviación estandar, las puntuaciones tipicas se representan por Z.

Las puntuaciones típicas se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones.