12
UNIVERSIDAD “JOSE CARLOS MARIATEGUI” EDUCA INTERACTIVA 58 TEMA V ESTADIGRAFOS DE DISPERSION Y DISTRIBUCION NORMAL ESTANDAR 1. Estadígrafos de dispersión. Rango, desviación media, varianza y desviación estándar, coeficiente de variación. 2. Distribución normal estándar. OBJETIVOS DE UNIDAD GENERALES. Proporcionar elementos que permitan apreciar y evaluar la forma en que se dispersan los valores originales con respecto a la media y la evaluación de valores con el auxilio de la curva normal ESPECÍFICOS. Al concluir la unidad, el estudiante estará capacitado para calcular, identificar e interpretar los estadígrafos de dispersión. Con el auxilio de la curva normal, el estudiante podrá determinar el rango percentil de cualquier va1or de una distribución de frecuencia normal.

Estadistica

Embed Size (px)

Citation preview

Page 1: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

EDUCA INTERACTIVA

58

TEMA V

ESTADIGRAFOS DE DISPERSION Y DISTRIBUCION NORMAL ESTANDAR

1. Estadígrafos de dispersión. Rango, desviación media, varianza y desviación

estándar, coeficiente de variación. 2. Distribución normal estándar.

OBJETIVOS DE UNIDAD

GENERALES.

Proporcionar elementos que permitan apreciar y evaluar la forma en que se dispersan los valores originales con respecto a la media y la evaluación de valores con el auxilio de la curva normal

ESPECÍFICOS.

Al concluir la unidad, el estudiante estará capacitado para calcular, identificar e interpretar los estadígrafos de dispersión. Con el auxilio de la curva normal, el estudiante podrá determinar el rango percentil de cualquier va1or de una distribución de frecuencia normal.

Page 2: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

59 EDUCA INTERACTIVA

1. MEDIDAS DE DISPERSIÓN

La dispersión se refiere a la variabilidad o amplitud en los datos. Las medidas más importantes de dispersión son:

(1) la desviación media (2) la varianza, y (3) la desviación estándar. Las usaremos para poblaciones y muestras, así como para datos agrupados y no agrupados.

a) La Desviación Media (DM)

Para Datos No Agrupados

DM = NX∑ − µ

para poblaciones

DM = nXX∑ −

para muestras

Donde las barras verticales indican el valor absoluto, o los valores que omiten el signo, con los otros símbolos que tienen el mismo significado.

Para Datos Agrupados

DM = NXf∑ − µ

para poblaciones

DM = n

XXf∑ − para muestras

Donde f se refiere a la frecuencia de cada clase y X a las marcas de clase.

LECCIÓN Nº 11 ESTADIGRAFOS DE DISPERSION

Page 3: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

EDUCA INTERACTIVA

60

b) Varianza

La varianza de población 2σ (la letra griega sigma al cuadrado)

Para Datos No Agrupados

( )2

2

NX∑ −

σ y

( )1

22

−= ∑

nXX

s

Para Datos Agrupados

( )22

NXf∑ −

σ y

( )1

22

−= ∑

nXXf

s

c) Desviación Estándar La desviación de la población σ y la desviación estándar de la muestras s son las raíces cuadradas positivas de sus varianzas respectivas.

Para Datos No Agrupados

( )2

NX∑ −

σ y ( )

1

2

−= ∑

nXX

s

Para Datos Agrupados

( ) 2

NXf∑ −

σ y ( )

1

2

−= ∑

nXXf

s

La desviación estándar es la medida de dispersión (absoluta) más utilizada. Otras medidas (además de la varianza y la desviación media) son el rango.

2. EL COEFICIENTE DE VARIACIÓN (CV)

Mide la dispersión relativa:

µσ

=CV para poblaciones y XsCV = para muestras

Ejemplo 1: La desviación media, varianza, desviación estándar, y el coeficiente de variación para los datos no agrupados dados en la tabla 1 se pueden encontrar por medio de los cálculos correspondientes: Tabla (1) (µ = 7)

Page 4: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

61 EDUCA INTERACTIVA

( )

%2121.0

48.12.21022)(

1022

2.11012

22

22

óCV

puntosNX

cuadradosPuntosNX

PuntosNuX

DM

≅=

≅==−

=

=−

=

==−

=

µσ

µσ

µσ

Cálculos sobre los datos Notas: Tabla (1)

Nota µ µ−X µ−X 2)( µ−X

6 7 6 8 5 7 6 9

10 6

7 7 7 7 7 7 7 7 7 7

-1 0 -1 1 -2 0 -1 2 3

∑ =− 0)(1µX

1 0 1 1 2 0 1 2 3

∑ =− 121µX

1 0 1 1 4 0 1 4 9

∑ =− 22)(1

2µX

Ejemplo 2. La desviación media, la varianza, la desviación estándar, y el coeficiente de Variación para la distribución de frecuencia de los pesos (datos agrupados) dados en la tabla (2) ( X = 20.08).

318.02036.6

==−

= ∑n

XfXDM onzas

1554.0199520.2

1)( 2

2 ≅=−

−=∑

nXXf

s onzas cuadradas

Page 5: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

EDUCA INTERACTIVA

62

3942.01554.0199520.2

1)( 2

≅==−

−= ∑

nXXf

s onzas

,0196.008.20

3942.0≅≅=

ozoz

XsCV o 1.96%

Nótese que en la formula para s2 y s, se usan n-1 en vez de n en el denominador.

De las formulas 2σ ,

σ , s2, y s presentadas en esta sección, se pueden derivar otras para simplificar los cálculos en un grupo grande de datos.

Tabla (2) Cálculos sobre los datos.

Peso onz. Marca de

clase x

Frecuencia F

Media x

X - X X - X ∑ − XfX (X - X )2 2)( XXf −

19.20-19.40 19.50-19.70 19.80-20.00 20.10-20.30 20.40-20.60 20.70-20.90

19.30 19.60 19.90 20.20 20.50 20.80

1 2 8 4 3

∑ == 202nf

20.08 20.08 20.08 20.08 20.08 20.08

-0.78 -0.48 -0.18 0.12 0.42 0.72

0.78 0.48 0.18 0.12 0.42 0.72

0.78 0.96 1.44 0.48 1.26

∑ =− 36.644.1XfX

0.6084 0.2304 0.0324 0.0144 0.1764 0.5184

0.6084 0.4608 0.2592 0.0576 0.5292

∑ =− 9520.2)(0368.1

2XXf

Page 6: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

63 EDUCA INTERACTIVA

1. DISTRIBUCION NORMAL

La distribución normal es muy importante por lo siguiente:

Es la distribución a la que se aproximan la mayoría de los fenómenos: físicos, químicos, biológicos.

Se ha tomado como base en la inferencia estadística paramétrica

Otras distribuciones bajo ciertas circunstancias se pueden aproximar a la

normal

Es la base para definir otras distribuciones de importancia tales como la Chi cuadrada, t de Student y F de Fisher.

2. CARACTERISTICAS DE LA DISTRIBUCION NORMAL

Forma Es una campana simétrica con respecto a su centro. La curva tiene un solo pico; por tanto, es unimodal. La media de una población distribuida normalmente cae en el centro de su

curva normal. Debido a la simetría de la distribución normal de probabilidad, la mediana y la

moda de la distribución se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor.

Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal

Parámetros

Está caracterizada por dos parámetros a).- Parámetro de localización: La media

LECCIÓN Nº 12 DISTRIBUCION NORMAL ESTANDAR

Page 7: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

EDUCA INTERACTIVA

64

b).- Parámetro de forma: La varianza

DISTRIBUCION NORMAL ESTANDAR.

Su fórmula es: Ejemplo: La altura media que alcanza el maíz es de 2.75 m con una desviación estándar de 0.63m. 1. ¿Cuál es la probabilidad o proporción de carrizos con una altura mayor a 3.50m?

2. Si seleccionamos unos carrizos al azar, cuál es la probabilidad que midan entre 2 y 3 m.

3. Cúal es la probabilidad o proporción de carrizos de maíz con altura mayor de 1.75m?

3. AREAS BAJO LA CURVA NORMAL

No importa cuáles sean los valores de la 2σµ y para una distribución de

probabilidad normal, el área total bajo la curva es 1.00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:

Aproximadamente 68% de todos los valores de una población normalmente

distribuida se encuentra dentro de 1± desviación estándar de la media.

Aproximadamente 95.5 % de todos los valores de una población normalmente distribuida se encuentra dentro de 2± desviación estándar de la media.

Zx

=− µσ

P x( . ) . . .> = − =350 0500 0 3830 0117

P x y

Z

Z

( ) . . ..

..

..

..

.

..

= = + =

=−

=−

= −

=−

= =

2 3 0 3830 01517 0 53472 2 75

0 630 75

0 6311904

3 2 750 63

0 250 63

0 3968

P x( . ) . . .> = + =175 0500 0 4429 0 9429

Page 8: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

65 EDUCA INTERACTIVA

Aproximadamente 99.7 % de todos los valores de una población normalmente distribuida se encuentra dentro de 3± desviación estándar de la media.

USO DE LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR Observe en esta tabla la localización de la columna identificada con z. El valor de z está derivado de la formula:

X = valor de la variable aleatoria que nos preocupa =µ media de la distribución de la variable aleatoria

σ = desviación estándar de la distribución Z = número de desviaciones estándar que hay desde x a la media de la distribución Utilizamos Z en lugar del ‘número de desviaciones estándar’ porque las variables aleatorias normalmente distribuidas tienen muchas unidades diferentes de medición: dólares, pulgadas, partes por millón, kilogramos, segundos. Como vamos a utilizar una tabla, la tabla I, hablamos en términos de unidades estándar (que en realidad significa desviaciones estándar), y denotamos a éstas con el símbolo z.

X 2550 == σµ -25 0 25 50 75 100 125 ----------------------------------------- Z = -3 -2 -1 0 1 2 3 La tabla representa las probabilidades o áreas bajo la curva normal calculadas desde

la xµ hasta los valores particulares de interés X. Usando la ecuación de Z, esto corresponde a las probabilidades o áreas bajo la curva normal estandarizada desde la

media ( zµ = 0) hasta los valores transformados de interés Z. Sólo se enumeran entradas positivas de Z en la tabla, puesto que para una distribución simétrica de este tipo con una media de cero, el área que va desde la media hasta +Z (es decir, Z desviaciones estándar por encima de la media) debe ser idéntica al área que va desde la media hasta –Z (es decir, Z desviaciones estándar por debajo de la media). También podemos encontrar la tabla que indica el área bajo la curva normal estándar que corresponde a P(Z < z) para valores de z que van de –3.49 a 3.49.

σµ−x

Page 9: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

EDUCA INTERACTIVA

66

Al usar la tabla observamos que todos los valores Z deben registrarse con hasta dos lugares decimales. Por tanto, nuestro valor de interés particular Z se registra como +.2. para leer el área de probabilidad bajo la curva desde la media hasta Z = +.20, podemos recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor de interés Z. Así pues, nos detenemos en la fila Z = .2. A continuación, leemos esta fila hasta que intersecamos la columna que contiene el lugar de centésimas del valor Z. Por lo tanto, en la tabla, la probabilidad tabulada para Z = 0.20 corresponde a la intersección de la fila Z = .2 con la columna Z = .00 como se muestra. Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.035860.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.075350.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409

Page 10: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

67 EDUCA INTERACTIVA

LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR

Áreas bajo la distribución de probabilidad Normal Estándar entre la media y valores positivos de Z

µ = 0 y σ²=1 Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.035860.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.075350.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.114090.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.151730.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.187930.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.222400.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.254900.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.285240.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.313270.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.338911.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.362141.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.382981.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.401471.3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.417741.4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.431891.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.444081.6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.454491.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.463271.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.470621.9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.476702.0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.481692.1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.485742.2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.488992.3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.491582.4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.493612.5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.495202.6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.496432.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.497362.8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.498072.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.498613.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.499003.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.499293.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.499503.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.499653.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.499763.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.499833.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.499893.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.499923.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.499953.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.499974.0 0.49997 0.49997 0.49997 0.49997 0.49997 0.49997 0.49998 0.49998 0.49998 0.49998

Page 11: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

EDUCA INTERACTIVA

68

1. El estudio de los estadígrafos de dispersión es importante:

a. Porque nos define con más claridad la estadística y sus métodos. b. Porque nos permite tener una información auxiliar para definir el verdadero

comportamiento de los valores que toma la variable. c. Porque nos permite concentrar en un concepto los dispersos temas

estadísticos. d. Porque la dispersión se profundiza a medida que avanza el curso. e. Ninguna de las anteriores.

2. Hallar la desviación media de la información proporcionada en la pregunta (6)

de la autoevaluación de la segunda unidad.

a) 6,36 b) 9,8 c) 12 d) 11,8 e) Ninguna de las anteriores

3. Se tiene la siguiente información sobre el número de docentes por C.E: 12,

14, 16, 18, 20. Calcular la desviación media (DM) y la varianza (S2).

a) DM = 3 b) DM = 3.5 c) DM = 2,4 S2 = 10 S2 = 9 S2 = 8 d) DM = 5 e) Ninguna de las anteriores S2 = 2

4. Calcular la varianza (S2) y la desviación estándar (S) para los daros

proporcionados en la pregunta (6) de la autoevaIuación de la segunda unidad. Ten preseme el numero de datos.

a) S2 = 66,98 b) S2 = 6,7 a) S2 = 32,82 S = 8,18 S = 2,59 S = 5,73 d) S2 = 36 e) Ninguna de las anteriores S = 6

5. Calcular la varianza (S2) y la desviación estándar (S) para la información

proporcionada en la pregunta (6) de la autoevaIuación de la tercera unidad. Fíjate bien en el número de observaciones.

a) S2 = 46,17 b) S2 = 64,71 c) S2 = 71,64 S = 6,79 S = 8,04 S = 8,46 d) S2 = 25 e) Ninguna de las anteriores S = 5

PRUEBA AUTOEVALUATIVA

V UNIDAD

Page 12: Estadistica

UNIVERSIDAD “JOSE CARLOS MARIATEGUI”

69 EDUCA INTERACTIVA

6. Hallar el coeficiente de variación para la distribución planteada en la pregunta (6) de la autoevaluacion de la tercera unidad:

a) CV = 25% b) CV = 49,15% c) CV = 49% d) CV = 22,49% e) Ninguna de las anteriores

7. En una muestra de 100 alumnos, se observa con mucha preocupación que el

calificativo promedio es de 44.3 puntos con una desviación estándar de 16.94. El alumno Vásquez ha obtenido un calificativo de 60. Con ayuda de la curva normal, hallar su rango percentil y además indicar cuántos alumnos están por debajo de él.

a) 32% b) 60% c) 82.38% 32 60 82 d) 52% e) Ninguna de las anteriores 22

8. Con los datos de la pregunta anterior evaluar el calificativo del alumno

Olivares quien ha obtenido la nota de 30, indicar además, debajo de cuántos alumnos está ubicado el referido alumno.

a) 20,05% b) 30% c) 30% 80 70 50 d) 35% e) Ninguna de las anteriores 70

9. Con la información de la pregunta 7 Y 8 de la presente evaluación, hallar qué

tanto por ciento de alumnos están comprendidos entre el calificativo de Vásquez y el de Olivares y a cuántos alumnos equivale este %.

a) 50% b) 63,33% c) 70% 25 62 70 d) 55% e) Ninguna de las anteriores 55

10. El coeficiente de variación se define como:

a. El indicador que mide la variación de las variables. b. La forma en que varía una muestra de otra. c. El indicador que mide el grado de dispersión de los valores respecto a la

media. d. a y b. e. Ninguna de las anteriores.