Upload
jhon-fernandez
View
214
Download
1
Embed Size (px)
Citation preview
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
EDUCA INTERACTIVA
58
TEMA V
ESTADIGRAFOS DE DISPERSION Y DISTRIBUCION NORMAL ESTANDAR
1. Estadígrafos de dispersión. Rango, desviación media, varianza y desviación
estándar, coeficiente de variación. 2. Distribución normal estándar.
OBJETIVOS DE UNIDAD
GENERALES.
Proporcionar elementos que permitan apreciar y evaluar la forma en que se dispersan los valores originales con respecto a la media y la evaluación de valores con el auxilio de la curva normal
ESPECÍFICOS.
Al concluir la unidad, el estudiante estará capacitado para calcular, identificar e interpretar los estadígrafos de dispersión. Con el auxilio de la curva normal, el estudiante podrá determinar el rango percentil de cualquier va1or de una distribución de frecuencia normal.
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
59 EDUCA INTERACTIVA
1. MEDIDAS DE DISPERSIÓN
La dispersión se refiere a la variabilidad o amplitud en los datos. Las medidas más importantes de dispersión son:
(1) la desviación media (2) la varianza, y (3) la desviación estándar. Las usaremos para poblaciones y muestras, así como para datos agrupados y no agrupados.
a) La Desviación Media (DM)
Para Datos No Agrupados
DM = NX∑ − µ
para poblaciones
DM = nXX∑ −
para muestras
Donde las barras verticales indican el valor absoluto, o los valores que omiten el signo, con los otros símbolos que tienen el mismo significado.
Para Datos Agrupados
DM = NXf∑ − µ
para poblaciones
DM = n
XXf∑ − para muestras
Donde f se refiere a la frecuencia de cada clase y X a las marcas de clase.
LECCIÓN Nº 11 ESTADIGRAFOS DE DISPERSION
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
EDUCA INTERACTIVA
60
b) Varianza
La varianza de población 2σ (la letra griega sigma al cuadrado)
Para Datos No Agrupados
( )2
2
NX∑ −
=µ
σ y
( )1
22
−
−= ∑
nXX
s
Para Datos Agrupados
( )22
NXf∑ −
=µ
σ y
( )1
22
−
−= ∑
nXXf
s
c) Desviación Estándar La desviación de la población σ y la desviación estándar de la muestras s son las raíces cuadradas positivas de sus varianzas respectivas.
Para Datos No Agrupados
( )2
NX∑ −
=µ
σ y ( )
1
2
−
−= ∑
nXX
s
Para Datos Agrupados
( ) 2
NXf∑ −
=µ
σ y ( )
1
2
−
−= ∑
nXXf
s
La desviación estándar es la medida de dispersión (absoluta) más utilizada. Otras medidas (además de la varianza y la desviación media) son el rango.
2. EL COEFICIENTE DE VARIACIÓN (CV)
Mide la dispersión relativa:
µσ
=CV para poblaciones y XsCV = para muestras
Ejemplo 1: La desviación media, varianza, desviación estándar, y el coeficiente de variación para los datos no agrupados dados en la tabla 1 se pueden encontrar por medio de los cálculos correspondientes: Tabla (1) (µ = 7)
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
61 EDUCA INTERACTIVA
( )
%2121.0
48.12.21022)(
1022
2.11012
22
22
óCV
puntosNX
cuadradosPuntosNX
PuntosNuX
DM
≅=
≅==−
=
=−
=
==−
=
∑
∑
∑
µσ
µσ
µσ
Cálculos sobre los datos Notas: Tabla (1)
Nota µ µ−X µ−X 2)( µ−X
6 7 6 8 5 7 6 9
10 6
7 7 7 7 7 7 7 7 7 7
-1 0 -1 1 -2 0 -1 2 3
∑ =− 0)(1µX
1 0 1 1 2 0 1 2 3
∑ =− 121µX
1 0 1 1 4 0 1 4 9
∑ =− 22)(1
2µX
Ejemplo 2. La desviación media, la varianza, la desviación estándar, y el coeficiente de Variación para la distribución de frecuencia de los pesos (datos agrupados) dados en la tabla (2) ( X = 20.08).
318.02036.6
==−
= ∑n
XfXDM onzas
1554.0199520.2
1)( 2
2 ≅=−
−=∑
nXXf
s onzas cuadradas
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
EDUCA INTERACTIVA
62
3942.01554.0199520.2
1)( 2
≅==−
−= ∑
nXXf
s onzas
,0196.008.20
3942.0≅≅=
ozoz
XsCV o 1.96%
Nótese que en la formula para s2 y s, se usan n-1 en vez de n en el denominador.
De las formulas 2σ ,
σ , s2, y s presentadas en esta sección, se pueden derivar otras para simplificar los cálculos en un grupo grande de datos.
Tabla (2) Cálculos sobre los datos.
Peso onz. Marca de
clase x
Frecuencia F
Media x
X - X X - X ∑ − XfX (X - X )2 2)( XXf −
19.20-19.40 19.50-19.70 19.80-20.00 20.10-20.30 20.40-20.60 20.70-20.90
19.30 19.60 19.90 20.20 20.50 20.80
1 2 8 4 3
∑ == 202nf
20.08 20.08 20.08 20.08 20.08 20.08
-0.78 -0.48 -0.18 0.12 0.42 0.72
0.78 0.48 0.18 0.12 0.42 0.72
0.78 0.96 1.44 0.48 1.26
∑ =− 36.644.1XfX
0.6084 0.2304 0.0324 0.0144 0.1764 0.5184
0.6084 0.4608 0.2592 0.0576 0.5292
∑ =− 9520.2)(0368.1
2XXf
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
63 EDUCA INTERACTIVA
1. DISTRIBUCION NORMAL
La distribución normal es muy importante por lo siguiente:
Es la distribución a la que se aproximan la mayoría de los fenómenos: físicos, químicos, biológicos.
Se ha tomado como base en la inferencia estadística paramétrica
Otras distribuciones bajo ciertas circunstancias se pueden aproximar a la
normal
Es la base para definir otras distribuciones de importancia tales como la Chi cuadrada, t de Student y F de Fisher.
2. CARACTERISTICAS DE LA DISTRIBUCION NORMAL
Forma Es una campana simétrica con respecto a su centro. La curva tiene un solo pico; por tanto, es unimodal. La media de una población distribuida normalmente cae en el centro de su
curva normal. Debido a la simetría de la distribución normal de probabilidad, la mediana y la
moda de la distribución se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor.
Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal
Parámetros
Está caracterizada por dos parámetros a).- Parámetro de localización: La media
LECCIÓN Nº 12 DISTRIBUCION NORMAL ESTANDAR
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
EDUCA INTERACTIVA
64
b).- Parámetro de forma: La varianza
DISTRIBUCION NORMAL ESTANDAR.
Su fórmula es: Ejemplo: La altura media que alcanza el maíz es de 2.75 m con una desviación estándar de 0.63m. 1. ¿Cuál es la probabilidad o proporción de carrizos con una altura mayor a 3.50m?
2. Si seleccionamos unos carrizos al azar, cuál es la probabilidad que midan entre 2 y 3 m.
3. Cúal es la probabilidad o proporción de carrizos de maíz con altura mayor de 1.75m?
3. AREAS BAJO LA CURVA NORMAL
No importa cuáles sean los valores de la 2σµ y para una distribución de
probabilidad normal, el área total bajo la curva es 1.00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:
Aproximadamente 68% de todos los valores de una población normalmente
distribuida se encuentra dentro de 1± desviación estándar de la media.
Aproximadamente 95.5 % de todos los valores de una población normalmente distribuida se encuentra dentro de 2± desviación estándar de la media.
Zx
=− µσ
P x( . ) . . .> = − =350 0500 0 3830 0117
P x y
Z
Z
( ) . . ..
..
..
..
.
..
= = + =
=−
=−
= −
=−
= =
2 3 0 3830 01517 0 53472 2 75
0 630 75
0 6311904
3 2 750 63
0 250 63
0 3968
P x( . ) . . .> = + =175 0500 0 4429 0 9429
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
65 EDUCA INTERACTIVA
Aproximadamente 99.7 % de todos los valores de una población normalmente distribuida se encuentra dentro de 3± desviación estándar de la media.
USO DE LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR Observe en esta tabla la localización de la columna identificada con z. El valor de z está derivado de la formula:
X = valor de la variable aleatoria que nos preocupa =µ media de la distribución de la variable aleatoria
σ = desviación estándar de la distribución Z = número de desviaciones estándar que hay desde x a la media de la distribución Utilizamos Z en lugar del ‘número de desviaciones estándar’ porque las variables aleatorias normalmente distribuidas tienen muchas unidades diferentes de medición: dólares, pulgadas, partes por millón, kilogramos, segundos. Como vamos a utilizar una tabla, la tabla I, hablamos en términos de unidades estándar (que en realidad significa desviaciones estándar), y denotamos a éstas con el símbolo z.
X 2550 == σµ -25 0 25 50 75 100 125 ----------------------------------------- Z = -3 -2 -1 0 1 2 3 La tabla representa las probabilidades o áreas bajo la curva normal calculadas desde
la xµ hasta los valores particulares de interés X. Usando la ecuación de Z, esto corresponde a las probabilidades o áreas bajo la curva normal estandarizada desde la
media ( zµ = 0) hasta los valores transformados de interés Z. Sólo se enumeran entradas positivas de Z en la tabla, puesto que para una distribución simétrica de este tipo con una media de cero, el área que va desde la media hasta +Z (es decir, Z desviaciones estándar por encima de la media) debe ser idéntica al área que va desde la media hasta –Z (es decir, Z desviaciones estándar por debajo de la media). También podemos encontrar la tabla que indica el área bajo la curva normal estándar que corresponde a P(Z < z) para valores de z que van de –3.49 a 3.49.
σµ−x
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
EDUCA INTERACTIVA
66
Al usar la tabla observamos que todos los valores Z deben registrarse con hasta dos lugares decimales. Por tanto, nuestro valor de interés particular Z se registra como +.2. para leer el área de probabilidad bajo la curva desde la media hasta Z = +.20, podemos recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor de interés Z. Así pues, nos detenemos en la fila Z = .2. A continuación, leemos esta fila hasta que intersecamos la columna que contiene el lugar de centésimas del valor Z. Por lo tanto, en la tabla, la probabilidad tabulada para Z = 0.20 corresponde a la intersección de la fila Z = .2 con la columna Z = .00 como se muestra. Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.035860.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.075350.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
67 EDUCA INTERACTIVA
LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR
Áreas bajo la distribución de probabilidad Normal Estándar entre la media y valores positivos de Z
µ = 0 y σ²=1 Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.035860.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.075350.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.114090.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.151730.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.187930.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.222400.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.254900.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.285240.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.313270.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.338911.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.362141.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.382981.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.401471.3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.417741.4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.431891.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.444081.6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.454491.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.463271.8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.470621.9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.476702.0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.481692.1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.485742.2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.488992.3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.491582.4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.493612.5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.495202.6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.496432.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.497362.8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.498072.9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.498613.0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.499003.1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.499293.2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.499503.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.499653.4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.499763.5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.499833.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.499893.7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.499923.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.499953.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.499974.0 0.49997 0.49997 0.49997 0.49997 0.49997 0.49997 0.49998 0.49998 0.49998 0.49998
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
EDUCA INTERACTIVA
68
1. El estudio de los estadígrafos de dispersión es importante:
a. Porque nos define con más claridad la estadística y sus métodos. b. Porque nos permite tener una información auxiliar para definir el verdadero
comportamiento de los valores que toma la variable. c. Porque nos permite concentrar en un concepto los dispersos temas
estadísticos. d. Porque la dispersión se profundiza a medida que avanza el curso. e. Ninguna de las anteriores.
2. Hallar la desviación media de la información proporcionada en la pregunta (6)
de la autoevaluación de la segunda unidad.
a) 6,36 b) 9,8 c) 12 d) 11,8 e) Ninguna de las anteriores
3. Se tiene la siguiente información sobre el número de docentes por C.E: 12,
14, 16, 18, 20. Calcular la desviación media (DM) y la varianza (S2).
a) DM = 3 b) DM = 3.5 c) DM = 2,4 S2 = 10 S2 = 9 S2 = 8 d) DM = 5 e) Ninguna de las anteriores S2 = 2
4. Calcular la varianza (S2) y la desviación estándar (S) para los daros
proporcionados en la pregunta (6) de la autoevaIuación de la segunda unidad. Ten preseme el numero de datos.
a) S2 = 66,98 b) S2 = 6,7 a) S2 = 32,82 S = 8,18 S = 2,59 S = 5,73 d) S2 = 36 e) Ninguna de las anteriores S = 6
5. Calcular la varianza (S2) y la desviación estándar (S) para la información
proporcionada en la pregunta (6) de la autoevaIuación de la tercera unidad. Fíjate bien en el número de observaciones.
a) S2 = 46,17 b) S2 = 64,71 c) S2 = 71,64 S = 6,79 S = 8,04 S = 8,46 d) S2 = 25 e) Ninguna de las anteriores S = 5
PRUEBA AUTOEVALUATIVA
V UNIDAD
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
69 EDUCA INTERACTIVA
6. Hallar el coeficiente de variación para la distribución planteada en la pregunta (6) de la autoevaluacion de la tercera unidad:
a) CV = 25% b) CV = 49,15% c) CV = 49% d) CV = 22,49% e) Ninguna de las anteriores
7. En una muestra de 100 alumnos, se observa con mucha preocupación que el
calificativo promedio es de 44.3 puntos con una desviación estándar de 16.94. El alumno Vásquez ha obtenido un calificativo de 60. Con ayuda de la curva normal, hallar su rango percentil y además indicar cuántos alumnos están por debajo de él.
a) 32% b) 60% c) 82.38% 32 60 82 d) 52% e) Ninguna de las anteriores 22
8. Con los datos de la pregunta anterior evaluar el calificativo del alumno
Olivares quien ha obtenido la nota de 30, indicar además, debajo de cuántos alumnos está ubicado el referido alumno.
a) 20,05% b) 30% c) 30% 80 70 50 d) 35% e) Ninguna de las anteriores 70
9. Con la información de la pregunta 7 Y 8 de la presente evaluación, hallar qué
tanto por ciento de alumnos están comprendidos entre el calificativo de Vásquez y el de Olivares y a cuántos alumnos equivale este %.
a) 50% b) 63,33% c) 70% 25 62 70 d) 55% e) Ninguna de las anteriores 55
10. El coeficiente de variación se define como:
a. El indicador que mide la variación de las variables. b. La forma en que varía una muestra de otra. c. El indicador que mide el grado de dispersión de los valores respecto a la
media. d. a y b. e. Ninguna de las anteriores.