6

Click here to load reader

02.6 varianza

Embed Size (px)

Citation preview

Page 1: 02.6   varianza

El siguiente material se encuentra en etapa de corrección y no deberáser considerado una versión final.Alejandro D. Zylberberg <[email protected]>Versión Actualizada al: 4 de mayo de 2004

VarianzaVimos que la media o esperanza nos da una idea de qué valor podríamos esperarque asuma una determinada variable aleatoria, si se lleva a cabo el experimento alcual está asociada. Es decir, la media es una medida de posición.Asimismo, vimos que la esperanza no nos proporciona información acerca de si losvalores que puede tomar la variable aleatoria se encuentran cercanos o espaciados.Por eso utilizaremos otra herramienta matemática denominada varianza. La varianzaes una medida de cuánto tienden los valores de una variable aleatoria a alejarse de lamedia de la misma. La varianza es una medida de dispersión.Dada X una variable aleatoria, si su varianza σX

2 existe, vale:

∫∞

∞−

−=−== dxxfxXEXEXVarXXX

)()()))((()( 222 µσ

Vemos que la varianza es la esperanza de los cuadrados de las distancias entre losvalores de la variable y el valor medio de la distribución. Si los valores de X estánmuy dispersos, los E(X)-X tenderán a ser más grandes, y la varianza tiende a sermayor. Observamos también que como las diferencias están al cuadrado, noimporta si son positivas (X a la derecha de la media) o negativas (X a la izquierda dela media). O sea que todas "suman".Operando con la fórmula de arriba se llega a otra fórmula para la varianza, que amenudo resulta más práctica:

222 )()( XEXE

X−=σ

La varianza también presenta la siguiente propiedad:ℜ∈=+ baconabaX

X,)( 222 σσ

Mas adelante en esta misma sección se demuestran las fórmulas y propiedades.

ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/

Page 2: 02.6   varianza

Comentarios

• La varianza es una medida de cuánto tienden los valores de una variable aleatoria aalejarse de la media de la misma. Es decir que si la varianza es chica, la distribuciónse encuentra concentrada alrededor de la media, y si es grande, se encuentra másesparcida, más dispersa.• Como la varianza se define a partir de la media, puede, al igual que esta, no existir.

EjemploVolvamos al ejemplo 5 de la media:

Tenemos la distribución de X e Y, y calculamos sus medias:

∀====

=

xotro

x

x

x

x

xPX

0

62,0

53,0

43,0

32,0

)(

∀====

=

xotro

x

x

x

x

yPY

0

72,0

63,0

33,0

22,0

)(

5,42,0.73,0.63,0.32,0.2)()(

5,42,0.63,0.53,0.42,0.3)()(

=+++==

=+++==

∑∞+

∞−

+∞

∞−

yPyYE

xPxXE

Y

X

Habíamos observado que las medias de X e Y son iguales, a pesar de que Y estámás dispersa que X:

Veamos qué sucede con las varianzas:

1,242,0.73,0.63,0.32,0.2)()(

3,212,0.63,0.53,0.42,0.3)()(

222222

222222

=+++==

=+++==

∑∞+

∞−

+∞

∞−

yPyYE

xPxXE

Y

X

85,35,41,24)()(

05,15,43,21)()(222

222

2

2

=−=−==−=−=

YEYE

XEXE

y

x

σσ

Vemos que la varianza de Y es casi 4 veces mayor que la varianza de X.Esto refleja que las probabilidades de los valores de Y se encuentan más alejados

ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/

Page 3: 02.6   varianza

de la media que los de X.

Desvío estándar

El desvío estándar σX de una variable aleatoria X se define como la raíz cuadradapositiva de su varianza.

2xx σσ =

Unidades

Si X es la longitud de los tornillos fabricados por una máquina, entonces lasunidades de X podrían ser, por ejemplo, cm.A su vez, como la media o esperanza es el valor esperado de X, tiene la mismaforma que X (sea un valor posible realmente o no). Entonces las unidades de E(X)deben ser las mismas que las de X, es decir, cm.

La varianza se puede obtener, por ejemplo, 222 )()( XEXE

X−=σ

, donde se veclaramente que las unidades de la varianza son cm2.Y como el desvío estándar se define como la raíz cuadrada de la varianza, entoncessus unidades vuelven a ser las de X, es decir, cm.

Demostraciones

Comenzaremos por probar que:

22222 )()()()()))((( XEXEdxxfxXEXEXXX

−=−=−= ∫∞

∞−

µσ

Partimos de:)))((( 22 XEXE

X−=σ

Como dada una distribución, su esperanza es una constante, vamos a escribir, porclaridad, µX en vez de E(X).

))(( 22XX

XE µσ −=

Notemos que (X - µX)2 es una función de X. Luego su esperanza vale:

∫∞

∞−

−= dxxfxXXX

)()( 22 µσ

Con lo cual llegamos a la segunda fórmula dada. Ahora desarrollemos el cuadrado:

ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/

Page 4: 02.6   varianza

∫∞

∞−

−+ dxxfxxXXX

)()2( 22 µµ

Abrimos la integral en tres:

∫∫∫∞

∞−

∞−

∞−

−+ dxxfxdxxfdxxfxXXXXX

)(2)()( 22 µµ

Como 2 y µX son constantes, salen de las integrales:

∫∫∫∞

∞−

∞−

∞−

−+ dxxfxdxxfdxxfxXXXXX

)(2)()( 22 µµ

El primer término es, por definición de esperanza de una función, E(X2). En elsegundo término, la integral da uno. La integral del tercer término es por definiciónla esperanza de X, es decir, µX. Queda:

222 2)(XX

XE µµ −+

Con lo cual llegamos a la tercera fórmula dada:222 )()( XEXE

X−=σ

Ahora vamos a demostrar la propiedad:222 )(

XabaX σσ =+

Llamaremos Y = a X + b. Luego por definición de varianza:)))((( 22 YEYE

Y−=σ

Reemplazando Y por a X + b obtenemos:))(()))((()))((( 2222

XbaXaaXEbXaEbaXEbaXEbaXE µσ −=−−+=+−+=

+

Sacando factor común a, y sacándola del cuadrado y de la esperanza, queda:))(())(( 22222

XXbaXXEaXaE µµσ −=−=

+

El segundo factor es por definición la varianza de X. Luego, como queríamosdemostrar:

222 )(X

abaX σσ =+

Puede parecer extraño que la b no aparezca en la varianza de a X + b, pero no lo es.La constante b no tiene ninguna influencia en la varianza porque es una constanteque aparece sumando, y que a lo sumo puede correr la distribución hacia laizquierda o hacia la derecha, es decir, cambiar la posición, pero no la dispersión.Además podemos hacer el comentario de que la varianza de una constante es cero,porque la varianza es una medida de dispersión, y como una constante es un punto,no tiene dispersión. Luego su varianza es cero.

Problemas típicos

ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/

Page 5: 02.6   varianza

1) Halle varianza y el desvío estándar de X, donde X está distribuida según:

∀===−=

=

xotro

x

x

x

x

xPX

0

32,0

23,0

11,0

14,0

)(

Resolución:

9,02,0.33,0.21,0.14,0).1()()( =+++−== ∑+∞

∞−

xPxXE X

5,32,0.33,0.21,0.14,0.)1()()( 222222 =+++−== ∑+∞

∞−

xPxXE X

69,2)()( 222 =−= XEXExσ

2xx σσ =

=1,64

2) La longitud en cm. de las varillas fabricadas por una máquina es lavariable aleatoria X distribuida según:

≤≤≤≤

=

xotro

x

xx

xfX

0

313

110

)(

2

a) ¿Cuál es la varianza de la longitud media de las varillas?b) Si a las varillas se las corta a la mitad y se les agrega una punta de 1cm., ¿Cuál es la varianza de la longitud de las nuevas varillas?

Resolución:

a)583,1

3

1)()(

3

1

1

0

2 =+== ∫∫∫+∞

∞−

dxxdxxxdxxfxXE X

089,33

1)()(

3

1

21

0

2222 =+== ∫∫∫+∞

∞−

dxxdxxxdxxfxXE X

582,0)()( 222 =−= XEXExσ

b) 145,0

2

11

2

1)( 2

2222 2 =

=

+=>=+ xx xabaX σσσσ

3) Si dos máquinas producen piezas cuyas longitudes son variables aleatoriasde igual media, pero la varianza de la longitud de las piezas fabricadas por lamáquina A es mayor que la varianza de las de B, y es importante que todaslas piezas sean lo más parecidas posibles, ¿cuál máquina decidiría comprar?

ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/

Page 6: 02.6   varianza

Resolución:Como la varianza es una medida de la tendencia de los valores de la variable aalejarse de la media, eligiendo la máquina B las piezas fabricadas tenderán a ser delongitudes más parecidas.

A B C A m b e r T e x t C o n v e r t e r T r i a l v e r s i o n , h t t p : / / w w w . t h e b e a t l e s f o r e v e r . c o m / p r o c e s s t e x t /