Est Ad is Tic A

Embed Size (px)

Citation preview

Proyecto

MaTEXEstad stica DescriptivaFco Javier Glez Ortiz

Directorio Tabla de Contenido Inicio Cap tulo

Copyright c 2002 [email protected] Actualizado el: 26 de septiembre de 2003

Versin 2.00 o

Tabla de Contenido1. 2. 3. 4. 5. Introduccin o Tipos de variables Mtodos de Estad e stica Descriptiva bsica a Tablas Grcos a 5.1. Pictogramas 5.2. Diagramas de barras 5.3. Histograma y pol gono acumulativo 6. Estad sticos 6.1. Estad sticos de tendencia central 6.2. Estad sticos de dispersin o 6.3. Estad sticos de posicin o Soluciones a los Ejercicios

Seccin 1: Introduccin o o

3

1. Introduccin oLa Estad stica Descriptiva nace de la necesidad de extraer y resumir la informacin relevante contenida en grandes volmenes de datos. o u Esta necesidad est motivada por la incapacidad de la mente humana a para comprender la informacin contenida en conjuntos grandes de o datos por la mera visin de listados de dichos datos. o

2. Tipos de variablesAtendiendo a su naturaleza, las variables bajo estudio pueden clasicarse segn los siguientes tipos: u Variables cualitativas: Son aquellas que no toman valores numrie cos; por ejemplo, el color de una tela. Variables cuantitativas: Son aquellas que toman valores numrie cos. A su vez, entre stas pueden clasicarse en e Variables cuantitativas discretas: Si solamente pueden tomar valores enteros. Por ejemplo, el nmero de coches prouInd Volver Ver Doc Doc

Seccin 2: Tipos de variables o

4

ducidos en una factor a. Variables cuantitativas continuas: Si pueden tomar cualquier valor dentro de un intervalo de la recta real. Por ejemplo, la resistencia a traccin de una barra de acero. o Dependiendo del tipo de variables que consideremos, pueden variar los mtodos apropiados para su tratamiento. e Desde otro punto de vista, las variables pueden clasicarse atendiendo al nmero de observaciones que se realizan en el mismo indiu viduo. As podemos encontrar: Variables unidimensionales: Si solamente se observa un dato en cada individuo. Por ejemplo, se mide la resistencia de una viga de hormign. o Variables bidimensionales: Si se observan dos datos en cada individuo. Por ejemplo, se mide la resistencia y la deformacin de o una viga de hormign. o El estudio de las variables uni y bidimensionales es propio de la Estad stica Descriptiva bsica. aInd Volver Ver Doc Doc

Seccin 2: Tipos de variables o

5

Cuestin 2.1 Responde a las siguientes cuestiones sobre el tipo de o variable cuando clasicamos a los alumnos de una clase: 1. la variable deporte que practican es: (a) Cualitativa (b) Discreta 2. la variable nmero de hermanos es: u (a) Cualitativa (b) Discreta

(c) continua (c) Continua

3. la variable tiempo que ven la televisin en una semana es: o (a) Cualitativa (b) Discreta (c) Continua 4. la variable peso es: (a) Cualitativa (b) Discreta (c) Continua (c) Continua (c) Continua

5. la variable color de su pelo es: (a) Cualitativa (b) Discreta 6. la variable altura es: (a) Cualitativa (b) Discreta

Ind

Volver Ver

Doc Doc

Seccin 3: Mtodos de Estad o e stica Descriptiva bsica a

6

3. Mtodos de Estad e stica Descriptiva bsica aLa Estad stica Descriptiva bsica se ocupa del estudio de datos a muestrales correspondientes a variables uni y bidimensionales. Para ello se usan los siguientes mtodos: e Tablas: Se construyen a partir de un listado exhaustivo de los datos muestrales. Las tablas pueden usarse con cualquier tipo de variables y permiten realizar un resumen inicial de la informacin contenida en la muestra. o Grcos: Pueden construirse a partir de un listado exhaustivo de a datos, o bien a partir de tablas. Dependiendo del tipo de la variable bajo estudio, puede variar el tipo de grco que convenga a usar. Estad sticos: Un estad stico es, por denicin, cualquier funcin o o de los datos de una muestra cuantitativa. Por tanto, generalmente no tiene sentido hablar de estad sticos cuando la variable observada es cualitativa.Ind Volver Ver Doc Doc

Seccin 4: Tablas o

7

4. TablasLa ventaja fundamental que proporcionan las tablas, frente al listado exhaustivo de los datos, es que facilitan enormemente la comprensin de la informacin contenida en la muestra. o o En la tabla 1 se registran la edad de 132 pasajeros de un avin, que o corresponden a 132 datos sin agrupar.1 18 29 35 42 46 49 54 59 65 76 3 19 29 36 43 46 50 55 60 65 77 6 20 29 36 44 46 50 55 60 66 77 7 23 30 36 44 47 50 55 60 68 78 12 23 31 36 44 47 50 55 61 70 78 13 23 32 36 44 47 51 56 61 71 79 13 24 33 37 45 47 51 56 62 71 79 14 27 33 37 45 47 52 57 63 71 79 14 27 34 37 45 48 52 57 63 71 86 14 28 34 39 45 48 52 58 64 71 88 16 28 34 39 45 49 53 58 64 72 93 17 29 34 40 45 49 53 58 65 73 97

Tabla 1: Las edades ordenadas de 132 pasajeros de un avin o La variable edad es cuantitativa discreta, pero deseamos clasicarInd Volver Ver Doc Doc

Seccin 4: Tablas o

8

a los pasajeros en las categor jvenes si la edad es inferior a 20, as, o adultos entre 20 y 65 y jubilados el resto. Despus de un recuento e diseamos una tabla de frecuencias. n Los datos de la muestra pueden resumirse como se indica:Edad jvenes o adultos jubilados Totales Frecuencia Absoluta 14 93 25 132 Frecuencia Relativa 0,106 0,704 0,190 1

Tabla 2: Clasicacin de los pasajeros por tramos de edad. o

Debe observarse que la frecuencia absoluta fi de cada tramo de edad es, por denicin, el nmero de individuos que cumplen ese trao u mo. La frecuencia relativa hi es, tambin por denicin, la proporcin e o o individuos que cumplen ese tramo y se obtiene dividiendo la correspondiente frecuencia absoluta por el nmero total de datos en la muesu tra (por ejemplo, la frecuencia relativa 0,704 se obtiene dividiendo 93Ind Volver Ver Doc Doc

Seccin 4: Tablas o

9

entre 132); no obstante y a pesar de que no recomendamos esta prctia ca, no es extrao encontrar publicaciones en las que las frecuencias n relativas se expresen en tantos por ciento (en este caso, se escribir a 70.4 % en lugar de 0,704). Al nmero total de datos en la muestra se u le suele designar por la letra n (en este ejemplo, n =132). Ejemplo. 4.1. Con los datos de la tabla 1 confeccionar una tabla de frecuencias absolutas y relativas en 5 clases de longitud 20 aos. n Solucin: Despus de un recuento diseamos la tabla de frecuencias. o e nEdades 0 x < 20 20 x < 40 40 x < 60 60 x < 80 80 x < 100 fi 14 33 50 31 4 n = 132 hi 0,106 0,250 0,379 0,235 0,030 1

que consiste en una distribucin de frecuencias para datos agrupao dos. As por ejemplo la frecuencia absoluta 33 corresponde al nmero u de pasajeros con edad entre 20 y 40, y la frecuencia relativa 0,250Ind Volver Ver Doc Doc

Seccin 4: Tablas o

10

corresponde al cociente entre los 33 y el nmero total de 132. Puede u observarse que la suma de las frecuencias absolutas fi = 132 es el nmero de datos, y la suma de las frecuencias relativas u hi = 1 es siempre la unidad. Conviene formalizar las siguientes deniciones importantes que han aparecido a lo largo de esta seccin: o Denicin 1 (Tama o muestral) El tamao de la muestra es el o n n nmero de items o individuos de los que se han obtenido los datos de u la muestra. El tamao de la muestra suele designarse por la letra n. n Denicin 2 (Clase) Clase es cada intervalo usado para agrupar los o datos de la muestra cuando el nmero de datos diferentes entre s es u muy grande. Es necesario usar clases cuando la variable observada es cuantitativa continua, pero tambin puede serlo cuando es discreta si el nmero de e u datos diferentes es muy grande. Siempre que sea posible deben usarse clases de igual anchura.Ind Volver Ver Doc Doc

Seccin 4: Tablas o

11

Denicin 3 (Marca de clase) Marca de clase es el punto medio o de la clase. Denicin 4 (Frecuencia absoluta) Frecuencia absoluta de un dao to es el nmero de veces que ocurre dicho dato en la muestra. Freu cuencia absoluta de una clase es el nmero de datos de la muestra u que pertenecen a dicha clase. Se indica con fi . Denicin 5 (Frecuencia relativa) Frecuencia relativa de un dato o o una clase es el cociente entre su frecuencia absoluta y el tamao de n la muestra. Se indica con hi . De acuerdo con esta denicin, las frecuencias relativas son proporo ciones y sus valores deben estar en el intervalo cerrado [0, 1]. Aunque las frecuencias relativas se expresan a veces en tanto por ciento, este uso debe considerarse informal.

Ind

Volver Ver

Doc Doc

Seccin 4: Tablas o

12

Cuestin 4.2 Observa la siguiente tabla de frecuencias y responde: oEdades 0 x < 20 20 x < 40 40 x < 60 60 x < 80 80 x < 100 fi 14 33 50 31 4 n = 132 hi 0,106 0,250 0,379 0,235 0,030 1

1. El tamao de la muestra es: n (a) 100 (b) 132 2. La clase con 31 pasajeros es: (a) [20; 40) (b) [40; 60) 3. La marca de clase de [20; 40): (a) 20 (b) 30

(c) Otro valor (c) [60; 80) (c) 40

4. La proporcin de pasajeros de 20 a 40 aos es: o n (a) 33 (b) 0,25 (c) Otro valor

Ind

Volver Ver

Doc Doc

Seccin 4: Tablas o

13

Cuestin 4.3 La tabla siguiente (incompleta) resume las notas obtenio das por 80 alumnos de un instituto en selectividad. ResponderCalicacin o Suspensos Aprobados Notables Sobresalientes fi 20 16 hi 0,375

1. El nmero de Suspensos es: u (a) 20 (b) 30 2. El nmero de Sobresalientes es: u (a) 10 (b) 12 3. La proporcin de Notables es: o (a) 0,20 (b) 0,25

(c) 40 (c) 14 (c) 16

4. La suma de las frecuencias absolutas fi es: (a) 100 (b) 80 (c) Otro valor

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

14

5. Grcos aLos grcos suelen construirse a partir de tablas, pero pueden tama bin construirse a partir de un listado exhaustivo de datos. En genee ral, el tipo de grco usado depende del tipo de la variable observada. a35 30

Numero de familias

Campsa25

81

Petrol 12020 15

Cepsa y

x Oil10 5

0

0

1

2

3 4 5 N o de HIJOS

6

7

8

3

140 120 100 80

Densidad de frecuencias

2.5

2

1.5

601

400.5

20 0 0

0

10

20

30

Edad

40

50

60

70

80

90

100

20

40

60

80

100

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

15

5.1. PictogramasCon el nombre de pictogramas suelen denominarse un conjunto de grcos de aspecto ms o menos atractivo que sirven para transmitir a a de forma sencilla la informacin contenida en una muestra. o2000 Kanguros en el mundo (en miles)

1500

1000

500

Oceania

Africa

Asia

America Europa

Entre los pictogramas pueden incluirse los grcos de sectores. aInd Volver Ver Doc Doc

Seccin 5: Grcos o a

16

Ejemplo. 5.1. En un hipermercado se han producido las siguientes ventas en euros: Juguetes 125, Plantas 175, Discos 250, Alimentacin o 450. Realizar un diagrama de sectores Solucin: Almacenamos la informacin en una tabla o oVariable Juguetes Plantas Discos Alimentacin o fi 125 175 250 450 1000 hi 0,125 0,175 0,250 0,450 1 Angulo 0,125 360o = 45o 0,175 360o = 63o 0,250 360o = 90o 0,450 360o = 162o 360oJuguetes 12.5% Plantas 17.5% 45% Alimentacin

Por ejemplo, para el caso de las Plantas con 175 euros, para hallar el ngulo del a sector 175 = 0,175 0,175 360o = 63o 1000 Anlogamente los dems. a a

25% Discos

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

17

Ejercicio 5.1. Un fabricante de ordenadores vende sus productos en cuatro pa de acuerdo a la tabla. Realiza un diagrama de sectores. sespa s ventas Espaa n 5% Francia 15 % Alemania 15 % Reino Unido 65 %

Ejercicio 5.2. El diagrama de sectores inferior muestra las ventas de empresas de petroleo. Cul es el porcentaje de ventas que tiene a la empresa Campsa?. Si la empresa Oil tiene un 12,5 % del total de ventas, clcula los valores de los ngulos x e y. a a

Campsa 81 Petrol 120 Cepsa y

x Oil

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

18

5.2. Diagramas de barrasLa tabla registra el nmero de hijos de 145 familias, que corresu ponde a una variable cuantitativa discreta :hijos frecuencia 0 31 1 25 2 35 3 2035 30 25 20 15 10 5

4 0

5 16

6 12

7 5

8 1

En el diagramas de barras aparecen en la escala de ordenadas las frecuencias absolutas o relativas con las que ha ocurrido cada dato; estas frecuencias vienen indicadas por barras de longitudes proporcionales a dichas frecuencias; en la escala de abscisas del grco aparecen los a datos. Por ejemplo, con 2 hijos hay 35 familias.

Numero de familias

0

0

1

2

3 4 5 N o de HIJOS

6

7

8

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

19

5.3. Histograma y pol gono acumulativoEl grco usado ms frecuentemente para describir variables cuana a titativas continuas es el histograma. La parte izquierda de la gura 1 muestra el histograma correspondiente a la tabla del ejemplo 4.1. Las frecuencias de los intervalos vienen representadas por rectngulos cua ya altura1 es proporcional a la frecuencia del intervalo. Sin embargo, puesto que la variable es ahora continua, los rectngulos tienen que a aparecer compartiendo sus lados verticales con los rectngulos cona tiguos. Adems, el orden en que aparecen las clases es el natural de a los datos, independientemente de cules sean las respectivas frecuena cias de las clases. En la escala del eje de ordenadas pueden aparecer las frecuencias absolutas o relativas2 . En la escala del eje de abscisas1 En realidad es ms exacto decir que, en los histogramas, el rea de los a a rectngulos debe ser proporcional a la frecuencia del intervalo. Sin embargo, esta a precisin solamente es estrictamente necesaria cuando se usan clases de diferentes o anchuras. 2 Si las clases tuvieran diferentes anchuras, la escala de ordenadas deber mosa trar las frecuencias relativas por unidad de amplitud, que se obtienen dividiendo las frecuencias relativas por las anchuras de las clases.

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a50 45 40 35 30 25 20 15 10 5 0 0 20 40 60 80 100 20 0 0 60 40 100 80 140 120

20

20

40

60

80

100

Figura 1: Histograma (izquierda) y pol gono acumulativo (derecha) para las edades de los pasajeros. El tamao de la muestra es n =132. n pueden aparecer las marcas de clases, los extremos de las clases, o cualquier otra marca que cubra el rango de los datos.

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

21

Ejemplo. 5.2. Es este ejemplo se pide un histograma cuando los datos de las edades se registran en clases de longitud diferente. Solucin: Si hicisemos un histograma con las frecuencias absolutas o e o relativas el grco ser engaoso. Lo correcto es, que la escala de a a n ordenadas debe mostrar la densidad de frecuencias, que se obtienen dividiendo las frecuencias por las anchuras de las clases.Densidad de frecuencias

Edades 0 x < 20 20 x < 40 40 x < 50 50 x < 70 70 x < 100

fi 14 33 26 39 20

densidad 28 : 20 = 0,70 33 : 20 = 1,65 26 : 10 = 2,60 39 : 20 = 1,80 20 : 30 = 0,66

3

2.5

2

1.5

1

0.5

0

10

20

30

Edad

40

50

60

70

80

90

100

Ind

Volver Ver

Doc Doc

Seccin 5: Grcos o a

22

Ejercicio 5.3. En un hospital se han tomado los pesos (en kg) de 50 recin nacidos: e2,8 3,2 3,8 2,5 2,7 3,0 2,6 1,8 3,3 2,9 2,9 3,5 3,0 3,1 2,2 2,4 3,4 2,0 2,6 3,1 2,9 2,8 2,7 3,1 3,0 3,7 1,9 2,6 3,5 2,3 2,1 3,4 2,8 3,1 3,9 3,4 2,5 1,9 3,0 2,9 2,3 3,5 2,9 3,0 2,7 3,1 2,8 2,6 2,9 3,3

Agrupar en 5 intervalos de amplitud 0.5 kg. y dibujar el histograma.

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

23

6. Estad sticosDenicin 6 (Estad o stico) Estad stico es cualquier funcin de los o datos de la muestra. Si los datos de la muestra se designan por x1 , x2 , . . . , xn , cualquier funcin de los datos es un estad o stico. Por tanto, solamente existen estad sticos cuando la variable observada X es cuantitativa. El poder de s ntesis de los estad stico es muy grande, ya que cada estad stico resume el conjunto de todos los datos en un unico valor. En contra partida, la informacin suministrada por cada estad o stico tiene que ser forzosamente menor que la informacin suministrada por toda la o muestra. Dependiendo del tipo de informacin que proporcione un o estad stico puede clasicarse en alguno de los siguientes tipos: 1. Estad sticos de tendencia central o de localizacin. Los ms imo a portantes son la media, la moda y la mediana muestrales. 2. Estad sticos de dispersin. Los ms importantes son la varianza o a y la desviacin t o pica muestrales, aunque tambin puede citarse e el coeciente de variacin. oInd Volver Ver Doc Doc

Seccin 6: Estad o sticos

24

3. Estad sticos de posicin. Los ms importantes son lo cuantiles o a muestrales y sus variantes: deciles, cuartiles y percentiles.

6.1. Estad sticos de tendencia centralLa dimensin de los estad o sticos de tendencia central siempre coincide con la de la variable observada. Por ejemplo, si estuviramos obe servando el peso expresado en kilos de los individuos de una muestra, los estad sticos de localizacin tambin se expresar en kilos. o e an Denicin 7 Media aritmtica La media aritmtica de los datos est dao e e a da por: n xi x1 + x2 + + xn x= = i=1 n n En el caso de que haya datos repetidos la expresin es: o x=n i=1

xi fi

n

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

25

Ejemplo. 6.1. Obtener la nota media de un alumno con las calicaciones:5,7,4 y 2. . Solucin: La nota media es la media aritmtica de las calicaciones, o e es decir 5+7+4+2 18 x= = = 4,5 4 4 Ejemplo. 6.2. En una clase de 10 alumnos se han registrado las siguientes las calicaciones: 6 alumnos un 5, 3 alumnos un 7 y un alumno un 9. Obtener la nota media. Solucin: Como ahora las puntuaciones se repiten,preparamos una o tabla de frecuencias para realizar los clculos, axi 5 7 9 fi 6 3 1 n = 10 xi f i 30 21 9 60

La nota media de la clase es n xi fi 60 x = i=1 = =6 n 10

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

26

Denicin 8 Mediana muestral Se llama mediana muestral M ed a o cualquier valor que deje tantos valores por debajo como encima f r(xi M ed) 0,5, f r(xi M ed) 0,5, donde f r(xi M ed) es la frecuencia relativa de los datos menores o iguales que M ed y f r(xi M ed) es la frecuencia relativa de los datos mayores o iguales que M ed. La mediana siempre existe, pero puede no ser unica. Ejemplo. 6.3. Un alumno ha obtenido las calicaciones:5,7,4,6 y 2. Obtener la nota mediana. Solucin: Ordenamos las calicaciones, es decir o 2, 4, 5, 6, 7 Como hay un nmero impar de datos,la nota que deja la mitad de los u valores por encima y por debajo es el 5. M ed = 5 Ejemplo. 6.4. Un alumno ha obtenido las calicaciones:8,5,7,4,9 y 2. Obtener la nota mediana.Ind Volver Ver Doc Doc

Seccin 6: Estad o sticos

27

Solucin: Ordenamos las calicaciones, es decir o 2, 4, 5, 7, 8, 9 En este caso, como hay un nmero par de datos,cualquier nmero u u entre 5 y 7 se podr tomar como mediana, pero por convenio se toma a el punto medio entre las centrales 5 y 7. Es decir 5+7 =6 M ed = 2 Ejemplo. 6.5. Obtener la mediana para los datos de las edades de los pasajeros que estn en la tabla 1 . a Solucin: Como la mitad de los datos son N/2 = 132/2 = 66 y el o nmero de datos es par, tomamos el valor central entre las edades u que ocupan el lugar 66 y 67, que corresponde a 47 aos. Es decir n M ed = 47 aos. Signica que la mitad de los pasajeros tienen una n edad inferior o igual a 47 aos y la otra mitad una edad superior o n igual a 47 aos. nInd Volver Ver Doc Doc

Seccin 6: Estad o sticos

28

Ejemplo. 6.6. Obtener la mediana para los datos de las edades agrupados por clases como en la tabla del ejemplo 4.1. Solucin: Preparamos la tabla aadiendo las frecuencias acumuladas o n Fi . Edades fi Fi Calculamos la mitad de los datos 0 x < 20 14 14 N/2 = 132/2 = 66. Como hay 47 20 x < 40 33 47 pasajeros hasta 40 aos, y 97 n 40 x < 60 50 97 60 x < 80 31 128 pasajeros hasta 60 aos, la mediana n 80 x < 100 4 132 estar entre 40 y 60. a n = 13297C

66 47A

E D B

x 40

Med

60

Para calcularla se interpola con la proporcin o de tringulos en rojo. a AB BC = AD ED 20 19 20 50 x= = 7,6 x 19 50 M ed = 40 + x = 40 + 7,6 = 47.6 aos n

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

29

Ejemplo. 6.7. En la siguiente distribucin de notas, hallar M e. oxi fi Fi 200 240 57 57 240 280 82 139 280 320 73 212 320 360 31 243 360 400 15 258

Solucin: o La M e deja por debajo el 50 % de los datos, es decir 0,5 258 = 129. Mirando en las frecuencias acumuladas Fi corresponde a la clase 240-280. Interpolamos de acuerdo al grco. a En 280-240=40 puntos se reparten 139 57 = 80 observaciones y en x puntos se reparten 129 57 = 72 observaciones, es decir 40 x 82 72 40 72 x= = 35,12 82129 139

57

x

240

Me 280

M ed = 240 + x = 240 + 35,12 = 275.12 puntos

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

30

Denicin 9 Moda y clase modal La moda muestral es el dato de o mayor frecuencia relativa. La clase modal es la clase que tiene mayor frecuencia relativa por unidad de amplitud. Ejemplo. 6.8. Hallar la moda M o de los puntos obtenidos en un test.xi fi 200 240 57 240 280 82 280 320 73 320 360 31 360 400 15

Solucin: La clase modal corresponde a la de mayor frecuencia (cuano do las clases tienen la misma amplitud). En este caso, 240 280. Se toma como moda la marca de clase. M o = 260 puntos. Ejemplo. 6.9. Hallar la moda en la tabla del ejemplo 4.1. Solucin: La clase modal corresponde a la de mayor frecuencia, [40; 60) o y se toma como moda la marca de clase, M o = 50 aos. n Ejercicio 6.4. Los sueldos en euros en una empresa son: 1 director con 1800 euros ; 3 jefes con 1500; 6 encargados con 900 y 9 operarios con 480. Calcula el sueldo medio, la moda y la mediana.Ind Volver Ver Doc Doc

Seccin 6: Estad o sticos

31

6.2. Estad sticos de dispersin oEjemplo. 6.10. Dos grupos uno de letras y otro de ciencias de 8 alumnos cada uno han realizado un test, obteniendo las siguientes puntuaciones. Compararlos estad sticamenteGrupo A Grupo B 46 10 48 18 49 30 50 50 50 50 51 70 52 82 54 90

Solucin: Resulta que si resumimos estos grupos con las medidas de o centralizacin la media, moda y mediana coinciden. o xA = xB = M oA = M oB = M eA = M eB = 50 Con este ejemplo se aprecia la necesidad de las medidas estad sticas de dispersin o variabilidad, pues el grupo B tiene puntuaciones ms o a dispersas o alejadas respecto de la media. Como muestra el ejemplo anterior se necesitan estad sticos que registren la dispersin o variabilidad de los datos. o

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

32

Denicin 10 Varianza muestral Se llama varianza muestral al eso tad stico denido por: x)2 fi n Operando se obtiene la expresin ms cmoda o a o s2 = s2 =n i=1 n i=1 (xi

x2 fi i x2 n

(1)

Denicin 11 Desviacin t o o pica Se llama desviacin t o pica muestral a la ra cuadrada, s, de la varianza muestral. z Ejemplo. 6.11. Hallar la media, varianza y desviacin t o pica de las notas 3, 5, 7. Solucin: o 3+5+7 x= =5 3 32 + 52 + 72 52 = 2,67 = s = 2,67 = 1,63 s2 = 3Ind Volver Ver Doc Doc

Seccin 6: Estad o sticos

33

Ejemplo. 6.12. Hallar la media,varianza y desviacin t o pica de las edades de la tabla 4.1. Solucin: Preparamos la tabla aadiendo las columnas xi , xi fi y x2 fi . o n iClases 0 x < 20 20 x < 40 40 x < 60 60 x < 80 80 x < 100 xi 10 30 50 70 90 fi 14 33 50 31 4 132 xi f i 140 990 2500 2170 360 6160 x2 f i i 1400 29700 125000 151900 32400 340400

x= s2 = x

xi fi 6160 = = 46,67 n 132

x2 fi 340400 i x2 = 46,672 = 400,7 n 132 sx = 400,7 = 20,02

Para practicar realiza los siguientes ejercicios.Ind Volver Ver Doc Doc

Seccin 6: Estad o sticos

34

Ejercicio 6.5. Hallar la media y la desviacin t o pica de las siguientes distribuciones de datos: (a) 1, 4 ,8 ,9 ,10. (b) 3.2, 4.7 ,5.1 ,5.2 ,6.3 Ejercicio 6.6. Hallar la media y la desviacin t o pica de la siguiente distribucin de datos: oxi fi 3 1 4 5 5 4 7 2 9 3

Ejercicio 6.7. Hallar la media y la desviacin t o pica de la siguiente distribucin de datos: oClases fi 10 20 1 20 30 5 30 40 3 40 50 1

Denicin 12 Coeciente de variacin El coeciente de variacin o o o se dene como el cociente s CV = x supuesto que x = 0.Ind Volver Ver Doc Doc

Seccin 6: Estad o sticos

35

Ejemplo. 6.13. El peso medio de los alumnos de una clase es 58,2 kg y su desviacin t o pica 4.0 kg. Por otra parte la altura media es de 175 cm y su desviacin t o pica es 5,0 cm. Calcula el coeciente de variacin o y compara la dispersin de ambos grupos. o Solucin: Como las variables tienen unidades distintas. Una mide kg o y la otra cm, para comparar la dispersin acudimos al coeciente de o variacin que no tiene unidades. o 4 CVpesos = = 0,0687 58,2 5 CValturas = = 0,0286 175 luego hay ms dispersin en los pesos que en las alturas a o

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

36

6.3. Estad sticos de posicin oEmpecemos por el siguiente ejemplo. Las notas ordenadas de matemticas y de f a sica de una clase de 10 alumnos son: matemticas a f sica 4 2 5 2.5 6 3 7 3.5 7.8 3.8 7.9 4 8.1 4.5 9 5.5 9 6 10 7

En rojo se han puesto las notas obtenidas por el alumno Javier. En que asignatura ha obtenido mejor resultado Javier?. En matemticas, como hay 4 notas iguales o inferiores a un 7, a tenemos que 4/10 = 0,40(40 %) de la clase han obtenido una nota igual o inferior a 7,este es el cuantil 0,4, c0,4 o percentil 40 p40 . En f sica hay 7 notas iguales o inferiores a un 4.5,tenemos que 7/10 = 0,70(70 %) de la clase han obtenido una nota igual o inferior a 4,5,este es el cuantil 0,7, c0,7 o percentil 70 p70 . De todo ello vemos que dentro de su grupo la nota de f sica es mejor que la nota de matemticas, pues ocupa una posicin superior a o dentro del grupo de datos.

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

37

Denicin 13 Cuantil de orden Se llama cuantil muestral de orden o a cualquier valor C que verique las dos desigualdades siguientes f r(xi C ) , para cualquier entre 0 y 1. Por tanto, la mediana es el cuantil muestral C0,5 . Otros cuantiles importantes son los siguientes: Denicin 14 Cuartiles Se llama primer cuartil muestral Q1 al cuano til C0,25 . El segundo cuartil muestral es la mediana. Se llama tercer cuartil muestral Q3 al cuantil C0,75 . Denicin 15 Deciles Se llaman deciles muestrales a los cuantiles o C0,1 , C0,2 , . . . , C0,9 . Denicin 16 Percentiles Se llaman percentiles muestrales a los cuano tiles indicados en porcentaje. As el cuantiles C0,15 es el percentil 15 p15 , etc.Ind Volver Ver Doc Doc

f r(xi C ) 1 ,

Seccin 6: Estad o sticos

38

Ejemplo. 6.14. Hallar los cuartiles Q1 , Q2 de las calicaciones ya ordenadas de un grupo:1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5

Solucin: Con este ejemplo se explica la tcnica para calcular cuantiles o e de datos sin agrupar. Como Q1 deja por debajo el 25 % de los datos, se calcula 0,25 (n + 1) = 0,25 (31) = 7,75 datos y se toma entre el sptimo y el octavo el valor e Q1 = x7 + 0,75(x8 x7 ) = 1 + 0,75(1 1) = 1 Como Q2 = M e deja por debajo el 50 % de los datos,se calcula 0,5 (n + 1) = 0,5 (31) = 15,5 datos y se toma entre el decimoquinto y el decimosexto el valor Q2 = x15 + 0,5(x16 x15 ) = 3 + 0,5(3 3) = 3

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

39

Ejemplo. 6.15. Hallar Q1 , Q3 de la siguiente distribucin de notas, oxi fi Fi 1 7 7 2 15 22 3 41 63 4 52 115 5 104 219 6 69 288 7 26 314 8 13 327 9 19 346 10 14 360

Solucin: o Como Q1 deja por debajo el 25 % de los datos, se calcula 0,25 (n + 1) = 0,25 (361) = 90,25 datos y se toma entre el 90-dato y el 91-dato el valor Q1 = x90 + 0,25(x91 x90 ) = 4 + 0,25(4 4) = 4 Como Q3 deja por debajo el 75 % de los datos, se calcula 0,75 (n + 1) = 0,75 (361) = 270,75 datos y se toma entre el 270-dato y el 271-dato el valor Q3 = x270 + 0,75(x271 x270 ) = 6 + 0,75(6 6) = 6

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

40

Ejemplo. 6.16. Hallar los percentiles p15 , p40 , p80 de la tabla 1. Solucin: o Como p15 deja por debajo el 15 % de los datos, se calcula 0,15 (n + 1) = 0,15 (133) = 19,95 datos y se toma entre el 19-dato y el 20-dato el valor p15 = x19 + 0,95(x20 x19 ) = 24 + 0,95(27 24) = 26.85 Para p40 , 0,40 (n + 1) = 0,40 (133) = 53,20 datos y se toma entre el 53-dato y el 54-dato el valor p40 = x53 + 0,2(x54 x53 ) = 44 + 0,2(44 44) = 44 Para p80 , 0,8 (n + 1) = 0,8 (133) = 106,4 datos y se toma entre el 106-dato y el 107-dato el valor p80 = x106 + 0,4(x107 x106 ) = 64 + 0,4(64 64) = 64

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

41

Ejemplo. 6.17. Obtener el tercer cuartil Q3 para los datos de las edades agrupados por clases como en la tabla 4.1. Solucin: Preparamos la tabla aadiendo las frecuencias acumuladas o n Fi . Edades fi Fi Calculamos el 0,75 de los datos 0 x < 20 14 14 0,75 n = 99. Como hay 97 pasajeros 20 x < 40 33 47 hasta 60 aos, y 128 pasajeros hasta n 40 x < 60 50 97 60 x < 80 31 128 80 aos, el Q3 estar entre 60 y 80. n a80 x < 100 4 n = 132 132

128

C

99 97A

E D B

x 60

Q3

80

Para su clculo se interpola con la proporcin a o de tringulos en rojo. a AB BC = AD ED 20 2 20 31 x= = 1,29 x 2 31 Q3 = 60 + x = 60 + 1,29 = 61.29 aos n

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

42

Denicin 17 Extremos: M o nimo y Mximo Los extremos muestraa les son el menor dato o m nimo y el mayor dato o mximo de la a muestra. A partir de los cuartiles pueden denirse el siguiente estad stico de dispersin: o Denicin 18 Rango intercuart o lico El rango intercuart lico es la diferencia entre el tercer y el primer cuartil, es decir, RIC = C0,75 C0,25 . A partir de los extremos se dene el rango de la muestra: Denicin 19 Rango El rango muestral es la diferencia entre el mxio a mo y el m nimo.

Ind

Volver Ver

Doc Doc

Seccin 6: Estad o sticos

43

Ejercicio 6.8. Un dentista anota el nmero de caries de cada uno de u los 100 nios de un colegio. La informacin se almacena en una tabla: n oNo de caries fi hi 0 25 0.25 1 20 0.2 2 x z 3 15 0.15 4 y 0.05

1. Completa la tabla , hallando x, y, z. 2. Haz un diagrama de sectores. 3. Calcula el nmero medio de caries. u Ejercicio 6.9. Para comprobar la resistencia de unas varillas de nailon se someten 250 varillas a un test de resistencia. Se comprueba si se rompen cuando se aplica una fuerza sobre 5 puntos diferentes de la varilla. El nmero de roturas sufridas por cada varilla aparece en la u tablaNo de roturas No de varillas Ind 0 141 1 62 2 31 3 14 4 1 5 1 Doc Doc

Volver Ver

Seccin 6: Estad o sticos

44

1. Calcula el nmero medio de roturas por varilla y el porcentaje u de varillas que sufren ms de 2 roturas. a 2. Calcula la moda, mediana y varianza de la distribucin. o Ejercicio 6.10. La tabla registra el tiempo en horas que dedicaron 62 personas a ver la televisin un n de semana. oNo horas No de personas [0; 0,5) 10 [0,5; 1,5) 10 [1,5; 2,5) 18 [2,5; 4) 12 [4; 8) 12

1. Dibujar el histograma correspondiente. 2. Calcula la media y la desviacin t o pica.

Ind

Volver Ver

Doc Doc

Indice alfabtico ecoeciente de variacin, 35 o cuantil, 37 cuartil, 38 decil, 38 percentil, 38 desviacin t o pica, 33 frecuencia, 9 absoluta, 9, 12 relativa, 9, 12 grco, 15 a barras, 19 histograma, 20 pictograma, 16 media aritmtica, 25 e 45 mediana, 27 moda, 31 rango, 43 variable, 3 continua, 4 cualtitativa, 3 cuantitativa, 3 discreta, 3 varianza, 33

Soluciones a los Ejercicios

46

Soluciones a los EjerciciosEjercicio 5.1.pa s ventas a ngulos Espaa n 5% 0,05 360o = 18o Francia 15 % 54o5% Espaa Francia 15%

Alemania 15 % 54o

Reino Unido 65 % 234o

Alemania 15% Reino Unido 65%

Ejercicio 5.1Ind Volver Ver Doc Doc

Soluciones a los Ejercicios

47

Ejercicio 5.2. Para la empresa Campsa se tiene que 81o = 0,225 = 22,5 % 360o Como la empresa Oil tiene un 12,5 % del total, x = 0,125 360o = 45o La suma total debe ser 360o , luego y = 114o . Ejercicio 5.2

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

48

Ejercicio 5.3. Entre el valor mximo xmax = 3,9 y el valor m a nimo xmin = 1,8 hay 2.1 kg . Con 5 intervalos de 0.5 se abarca un rango de 2.5. La diferencia de 0.4 se reparte entre ambos extremos, luego empezamos con un valor de 1.6clase [1,6; 2,1) [2,1; 2,6) [2,6; 3,1) [3,1; 3,6) [3,6; 4,1) fi 4 7 22 14 3 5025

20

N de nios

15

10

5

0 1.6

2.1

2.6 Pesos

3.1

3.6

4.1

Ejercicio 5.3

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

49

Ejercicio 6.4. Preparamos una tabla de frecuenciasPuesto operarios encargados jefes director xi 480 900 1500 1800 fi 9 6 3 1 n = 19 xi f i 4320 5400 4500 1800 16020

El sueldo medio es

16020 = 843,16 19 La moda es el sueldo de 480 euros pues el de mayor frecuencia. Para hallar la mediana, como 0,5 (n + 1) = 10 el dcimo sueldo de menor e a mayor corresponde a M e = 900 euros. Ejercicio 6.4 x=

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

50

Ejercicio 6.5(a) x= s2 = 1 + 4 + 8 + 9 + 10 = 6,4 5 11,44 = 3,38

12 + + 102 6,42 = 11,44 = s = 5

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

51

Ejercicio 6.5(b) 3,2 + + 6,3 24,5 = = 4,9 5 5 3,22 + + 6,32 125, 07 s2 = 4,92 = = 1,004 = s = 5 5 x=

1,004 = 1

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

52

Ejercicio 6.6.xi 3 4 5 7 9 fi 1 5 4 2 3 15 xi f i 3 20 20 14 27 84 x2 f i i 9 80 100 98 243 530

x= s2 = x

xi fi 84 = = 5, 6 n 15

x2 fi 530 i x2 = 5, 62 = 3,97 n 15 sx = 3,97 = 1, 99 Ejercicio 6.6

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

53

Ejercicio 6.7.xi 15 25 35 45 fi 1 5 3 1 10 xi f i 15 125 105 45 290 x2 f i i 225 3125 3675 2025 9050

x=

xi fi 290 = = 29 n 10

x2 fi 9050 i s2 = x2 = 292 = 64 x n 10 sx = 64 = 8 Ejercicio 6.7

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

54

Ejercicio 6.8. 1. Como como hi = 1, entonces z = 0,35.Como x = z 100 = 35 y fi = 100 entonces y = 5. ii

2. Tenemos los porcentajes, luego hallamos los ngulos de los sectoa res. 5% 0,25 360o = 90o 25% 15% 0,20 360o = 72o 4 0,35 360o = 126o 3 0 0,15 360o = 54o 2 1 0,05 360o = 18o20% 35%

3. x=

0 25 + 1 20 + + 4 5 = 1,55 100 Ejercicio 6.8

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

55

Ejercicio 6.9. 1.xi 0 1 2 3 4 5 fi 141 62 31 14 1 1 250 xi f i 0 62 62 42 4 5 175 x2 f i i 0 62 124 126 16 25 353

175 = 0,7 250 Con ms de 2 roturas hay a 14 + 1 + 1 = 16 varillas, luego 16 250 100 = 16,4 % x=

2. La moda M o = 0. Como N/2 = 125, la mediana M ed = 0. Para la varianza se tiene x2 fi 353 i 2 Sx = x2 = 0,72 = 0,922 N 250 Ejercicio 6.9

Ind

Volver Ver

Doc Doc

Soluciones a los Ejercicios

56

Ejercicio 6.10.clase [0; 0,5) [0,5; 1,5) [1,5; 2,5) [2,5; 4) [4; 8)20

xi 0,25 1 2 3,25 6

fi 10 10 18 12 12 62

d.f. 20 10 18 8 3

xi f i 2,5 10,0 36,0 39,0 72,0 159,5

x2 f i i 0,625 10,0 72,0 126,75 432,0 641,375

Densidad de frecuencias

x=16

159,5 = 2,57 horas 62

12

2 Sx =

8

4

x2 fi i x2 N 641,375 2,572 = 3,74 = 62 Sx =1,93

0 0

1

2

3

4

5

6

7

8

Ejercicio 6.10

2o E.T.S.Ingenier de Caminos a

Estad stica Aplicada

Estad stica Descriptiva1. El porcentaje de algodn en una tela utilizada para elaborar camisas para hombre se presenta o en la siguiente tabla. Calcular los estad sticos ms importantes y real a cese el histograma de frecuencias. 32.1 33.4 33.8 34.4 34.7 35 35.5 36.8 32.5 33.5 34 34.5 34.7 35.1 35.6 36.8 porcentaje 32.6 32.7 33.6 33.6 34.1 34.1 34.5 34.6 34.7 34.7 35.1 35.1 35.7 35.8 36.8 37.1 de algodn o 32.8 32.9 33.6 33.6 34.1 34.2 34.6 34.6 34.7 34.7 35.2 35.3 35.9 36.2 37.3 37.6 33.1 33.6 34.3 34.6 34.9 35.4 36.4 37.8 33.1 33.8 34.3 34.6 35 35.4 36.6 37.9

(a) Disear la distribucin de frecuencias con un cambio de variable. n o (b) Calcular los estad sticos: media, moda, mediana, Q1 , Q3 , c0.6 , varianza y desviacin t o pica. (c) A partir del diagrama anterior determinar la mediana, el primer cuartil y el tercer cuartil y comprese los resultados con los obtenidos a partir de la distribucin de frecuencias. a o (d) Representar los histogramas de frecuencias absolutas y acumuladas. (e) Representar el diagrama de caja y determinar los valores extremos. 2. La siguiente tabla registra en diferentes horas la temperatura (T) del agua de un r y su o contenido en ox geno disuelto (DO): T 29,57 29,99 30,58 31,00 31,34 31,26 31,17 30,96 30,50 29,99 Se pide: (a) Construir una distribucin conjunta de frecuencias para las dos variables T y DO tomando o 5 intervalos. (b) Dibujar un diagrama de dispersin conjunto de las dos variables. o (c) Hacer un estudio de las distribuciones marginales. (d) Calcular la matriz de varianzas-covarianzas. DO 9,88 12,14 13,66 14,19 14,50 13,72 12,54 11,48 9,92 8,32 T 29,48 29,06 28,81 28,60 28,51 28,51 28,43 28,34 28,34 28,26 DO 6,67 5,29 4,23 3,56 2,98 2,58 2,32 2,14 2,09 2,27 T 28,43 28,64 29,02 29,52 30,07 30,67 31,17 31,55 31,76 31,81 DO 2,90 3,94 5,52 7,83 10,68 12,98 14,26 14,93 14,91 14,61 T 31,68 31,34 31,00 30,79 30,45 30,07 29,69 29,36 29,02 28,76 DO 13,80 12,32 11,00 10,00 8,45 6,48 4,91 3,89 3,21 2,83 T 28,51 28,30 28,09 28,00 28,13 28,30 28,72 29,14 29,74 30,37 DO 2,58 2,41 2,51 2,71 3,48 4,36 5,71 7,91 10,61 12,66

1

2o E.T.S.Ingenier de Caminos a

Estad stica Aplicada

Estad stica Descriptiva3. En diferentes dias se ha observado el nmero de veces que ha sonado la alarma en un servicio u de bomberos, obtenindose los siguientes datos: e {5, 3, 1, 5, 3, 6, 4, 2, 5, 6, 3, 6, 5, 2, 6, 7, 3} Se pide: (a) Obtener la moda, la mediana, Q1 , Q3 y el cuantil 0.40. (b) Obtener la media y la desviacin t o pica. (c) Efectuar un diagrama apropiado. Solucin o (a) Para las medidas de posicin conviene ordenar los datos o {1, 2, 2, 3, 3, 3, 3, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, } La moda corresponde al valor mas repetido, este caso corresponde a los tres valores Mo = 3, 5, 6. Decimos que es multimodal. La mediana acumula el 50% de los datos N = 17. Como 0.5 (N + 1) = 9 Me = 5

El primer cuartile Q1 acumula el 25% de los datos N = 17. Como 0.25 (N + 1) = 4.5 Q1 = 3 + 0.5(3 3) = 3

El tercer cuartile Q3 acumula el 75% de los datos N = 17. Como 0.75 (N + 1) = 13.5 0.40 (N + 1) = 7.2 Q3 = 6 + 0.5(6 6) = 6 c0.40 = 3 + 0.2(4 3) = 3.2

El cuantil c0.40 acumula el 40% de los datos N = 17. Como

(b) Clculo de la media, varianza y la desviacin t a o pica. 72 = 4.235 N 17 Para el cculo de la varianza se aconseja el mtodo abreviado a e x= =2 Sx = n 2 i=1 xi fi n i=1 xi fi

N Sx =

x2 =2 Sx =

354 4.2352 = 2.89 17 2.89 = 1.70

(c) Efectuar un diagrama apropiado.

2

2o E.T.S.Ingenier de Caminos a

Estad stica Aplicada

4

Nmero de avisos

3

2

1

0 1 2 3 4 5 6 7

avisos

3

2o E.T.S.Ingenier de Caminos a 4.

Estad stica Aplicada

El porcentaje de algodn en una tela utilizada para elaborar camisas para hombre se presenta o en la siguiente tabla. Calcular los estad sticos ms importantes y real a cese el histograma de frecuencias. porcentaje 32.6 32.7 33.6 33.6 34.1 34.1 34.5 34.6 34.7 34.7 35.1 35.1 35.7 35.8 36.8 37.1 de algodn o 32.8 32.9 33.6 33.6 34.1 34.2 34.6 34.6 34.7 34.7 35.2 35.3 35.9 36.2 37.3 37.6

32.1 33.4 33.8 34.4 34.7 35 35.5 36.8

32.5 33.5 34 34.5 34.7 35.1 35.6 36.8

33.1 33.6 34.3 34.6 34.9 35.4 36.4 37.8

33.1 33.8 34.3 34.6 35 35.4 36.6 37.9

(a) Disear la distribucin de frecuencias con un cambio de variable. n o (b) Calcular los estad sticos: media, moda, mediana, Q1 , Q3 , c0.6 , varianza y desviacin t o pica. (c) Representar el diagrama de tallo y hojas. (d) A partir del diagrama anterior determinar la mediana, el primer cuartil y el tercer cuartil y comprese los resultados con los obtenidos a partir de la distribucin de frecuencias. a o (e) Representar los histogramas de frecuencias absolutas y acumuladas. (f) Representar el diagrama de caja y determinar los valores extremos. Solucin o (a) Tomamos 7 intervalos de longitud 1. Como xmax xmin = 37.9 32.1 = 5.8 y 7-5.8=1.2, desplazamos el extremo inferior a 32.1-0.6=31.5 y el extremo superior a 37.9+0.6=38.5. Efectuamos el cambio de variable yi = xi 35 para realizar los clculos con la variable y. a Algodn o [31.5, 32.5) [32.5, 33.5) [33.5, 34.5) [34.5, 35.5) [35.5, 36.5) [36.5, 37.5) [37.5, 38.5) xi 32 33 34 35 36 37 38 fi 1 8 16 23 7 6 3 64 Fi 2 10 27 49 55 61 64 yi -3 -2 -1 0 1 2 3 yi fi -3 -16 -16 0 7 12 9 -72 yi fi 9 32 16 0 7 24 27 113

Tabla 1: Distribucin de frecuencias o (b) Clculo de los estad a sticos: yi fi 7 y= = = 0.11 N 64 2 115 yi fi 2 y2 = 0.112 = 1.78 Sy = N 64 4

2o E.T.S.Ingenier de Caminos a x = y + 35 = 34.89 y Sx = Sy = 1.78 = 1.336

Estad stica Aplicada

A continuacin se explica cmo calcular la Moda, y los cuartiles Q1 y Q3 . Con el mismo o o mtodo se hallan los deciles y los cuantiles. Aunque hay frmulas expl e o citas para ello, dichas expresiones se obtienen por interpolacin de los histogramas de frecuencias. Dicha o interpolacin se basa en la comparacin de tringulos semejantes. o o a

23

23

16 7 La Moda Mo, se calcula por interpolacin en el o intervalo modal. Por semejanza de tringulos se a tiene 1x 7 x = x= 23 16 23 7 23 Luego y Mo = 34.5 + x = 34.8

x 34.5 35.5

Figure 1: Cculo de la Moda a

25

16 El primer cuartil Q1 acumula N/4 = 16, luego 34.5 33.5 = 1 16 Q1 33.5 = x 7 Q1 = 33.5 + 7 = 33.94 16

9

x

33.5

Q1

34.5

(c) Grco de tallo y hojas. Obsrvese el diagrama de este tipo que se obtiene a partir del a e paquete estad stico Minitab. Es interesante y fcil de calcular a partir del mismo la Mediana a y los cuartiles Q1 y Q3 . Comparar los resultados, con los obtenidos por interpolacin de la o distribucin de frecuencias en el apartado anterior. o Diagrama de rbol a

5

2o E.T.S.Ingenier de Caminos a

Estad stica Aplicada

48 38,4 El tercer cuartil Q3 acumula 48, luego Q3 = 35.5. El cuantil c0.60 acumula 0.6 N = 38.4, por interpolacin de o los tringulos semejantes de la gura se tiene a 35.5 34.5 = 1 23 c0.60 34.5 = x 13.4 c0.60 = 34.5 + 13.4 = 35.08 23 6 5 6 22 14 6 5

25

x

34.5

c0.6

35.5

32 33 33 34 35 36 37

1 1 6 0 0 2 1

5 1 6 1 0 4 3

6 4 6 1 1 6 6

7 5 6 1 1 8 8

8 6 8 2 1 8 9

9 8 23355666667777779 234456789 8

(d) Con el grco de tallos y hojas, donde los datos estn ordenados y sin agrupar determia a namos: La mediana acumula el 50% de los datos N = 64. Como 0.5 (N + 1) = 32.5 M e = 34.6 + 0.5(34.7 34.6) = 34.65 Q1 = 33.8 + 0.25(0) = 33.8 El primer cuartile Q1 acumula el 25% de los datos N = 64. Como 0.25 (N + 1) = 16.25 El tercer cuartile Q3 acumula el 75% de los datos N = 64. Como (e) A continuacin se muestran los Histogramas de frecuencias absolutas y acumuladas. El leco tor puede detallar sobre los mismos, los poligonos de frecuencias, tanto para las frecuencias absolutas como las acumuladas. (f) Salida de estad sticos con Minitab.Variable Algodon N 64 Minimum 2,100 Mean 34,770 Maximum 37,900 Median 34,650 Q1 33,800 TrMean 34,738 Q3 35,47 StDev 1,351 SE Mean 0,169

0.75 (N + 1) = 48.75

Q3 = 35.4 + 0.75(0.1) = 35.475

(g) Mostramos el diagrama de caja (Boxplot) para el clculo del rango intercuartil. La medida a de variabilidad amplitud intercuartil AIC = Q3 Q1 = 1.67. Si queremos detectar valores extremos en un sentido u otro, se calculan los valores de referencia dados por Q1 1.5 AIC = 31.295 6 Q3 + 1.5 AIC = 37.975

2o E.T.S.Ingenier de Caminos a70

Estad stica Aplicada

Frecuencias acumuladas32 33 34 35 36 37 38

20

60 50 40 30 20 10 0 31,5 32,5 33,5 34,5 35,5 36,5 37,5 38,5

Frecuencias absolutas

10

0

Algodn

Algodn

Figure 2: Histogramas de frecuencias absolutas y acumuladas y apreciamos que en nuestra distribucin no hay valores extremos en ninguno de los sentidos. o La siguiente tabla registra en diferentes horas la temperatura (T) del agua de un r y su o contenido en ox geno disuelto (DO): T 29,57 29,99 30,58 31,00 31,34 31,26 31,17 30,96 30,50 29,99 Se pide: (a) Construir una distribucin conjunta de frecuencias para las dos variables T y DO tomando o 5 intervalos. (b) Dibujar un diagrama de dispersin conjunto de las dos variables. o (c) Hacer un estudio de las distribuciones marginales. (d) Calcular la matriz de varianzas-covarianzas. DO 9,88 12,14 13,66 14,19 14,50 13,72 12,54 11,48 9,92 8,32 T 29,48 29,06 28,81 28,60 28,51 28,51 28,43 28,34 28,34 28,26 DO 6,67 5,29 4,23 3,56 2,98 2,58 2,32 2,14 2,09 2,27 T 28,43 28,64 29,02 29,52 30,07 30,67 31,17 31,55 31,76 31,81 DO 2,90 3,94 5,52 7,83 10,68 12,98 14,26 14,93 14,91 14,61 T 31,68 31,34 31,00 30,79 30,45 30,07 29,69 29,36 29,02 28,76 DO 13,80 12,32 11,00 10,00 8,45 6,48 4,91 3,89 3,21 2,83 T 28,51 28,30 28,09 28,00 28,13 28,30 28,72 29,14 29,74 30,37 DO 2,58 2,41 2,51 2,71 3,48 4,36 5,71 7,91 10,61 12,66

7

2o E.T.S.Ingenier de Caminos a

Estad stica Aplicada

38

Figure 3: Diagrama de Caja. Es un articio que muestra la mediana, los cuartiles y la amplitud, todo en el mismo grco. Muestra que la a mayor parte de los datos es menor que 35.47, y que el 50% de los datos estan comprendidos entre 33.8 y 35.47

37 36 Q3=35.47 35 34 33 32 Me=34.65 Q1=33.8

TDO 27.90-28.70 28.71-29.50 29.51-30.30 30.31-31.10 31.11-31.90

2.00-4.59 15 4 0 0 0 19 fi 15 9 8 9 9 50

Algodn

4.60-7.19 0 4 2 0 0 6

7.20-9.79 0 1 2 1 0 4

9.80-12.39 0 0 4 4 1 9

12.40-15 0 0 0 4 8 12

15 9 8 9 9 50

T 27.90-28.70 28.71-29.50 29.51-30.30 30.31-31.10 31.11-31.90

Estad sticos de T 29.70 T Me T 29.55 T S 1.20 Q1 28.00 Q3 30.83

DO 2.00- 4.59 4.60- 7.19 7.20- 9.79 9.80-12.39 12.40-15.00 Se tiene que relacin: o

gi Estad sticos de DO 19 7.78 DO 6 Me 7.25 DO 4 SDO 4.57 9 Q1 3.15 12 Q3 12.37 50 xi yi = 11806. La matriz de varianzas-covarianzas y coeciente de cor-

8

2o E.T.S.Ingenier de Caminos a19 9 4

Estad stica Aplicada

12

6

31,99

Figure 4: Diagrama bivariado. En la parte superior aparece el histograma de la variable DO y en la parte lateral el histograma de la variable temperatura T

31,1

Temperatura

9

30,38

29,59

28,715

27,9 2,0 4,6 7,2 9,8 12,4 15,0

Contenido en oxgenoLa matriz de varianzas-covarianzas y coeciente de correlacin: o2 ST Cov(T, DO) 2 Cov(T, DO) SDO

=

1.43 5.16 5.16 20.85

rT,DO =

Cov(T, DO) = 0.944 ST SDO

9

Proyecto

MaTEX

Distribuciones BidimensionalesFco Javier Gonzlez Ortiz a

DirectorioTabla de Contenido Inicio Art culo

c 2004 [email protected] D.L.:SA-1415-2004

ISBN: 84-688-8267-4

Tabla de Contenido1. 2. 3. 4. Introduccin o Diagramas de dispersin o Covarianza Coeciente de correlacin o Propiedades del coeciente de correlacin o 5. Rectas de regresin o 5.1. Propiedades de las rectas de regresin o 6. Ejercicios Soluciones a los Ejercicios Soluciones a los Tests

Seccin 1: Introduccin o o

3

1. Introduccin o En el cap tulo de Estad stica Descriptiva el alumno estudi las tcnicas para resumir o e informacin del conjunto de datos para una variable X. o Ahora bien, los datos que tratamos de estudiar pueden incluir valores de varias variables relacionadas entre si. Por ejemplo: en un individuo su altura, su peso y su edad, en un gas su presin, su volumen y su temperatura, o en un veh culo su potencia, su velocidad y su consumo, etc. Por ello en este cap tulo estudiaremos las tcnicas para resumir informacin de la dise o tribucin del conjunto de datos de los que se conocen dos variables X e Y , llamadas diso tribuciones bidimensionales o bivariadas.

Seccin 2: Diagramas de dispersin o o

4

2. Diagramas de dispersin o Al igual que ocurre en el caso unidimensional, tambin es posible hacer grcos de dise a tribuciones de frecuencias bidimensionales. Hay un grco bidimensional especialmente util; ste es el diagrama de dispersin que a e o es simplemente un dibujo cartesiano de la muestra observada. Como ilustracin, la gura proporciona o el diagrama de dispersin de los datos de o la muestra de 33 alumnos donde se han medido su altura X y su peso Y . A la vista del diagrama de dispersin de o la gura parece constatarse que el peso aumenta con la altura.

y

peso

altura

x

Seccin 3: Covarianza o

5

3. Covarianza En las siguientes guras se muestran cuatro diagramas de dispersin. En algunos se apreo cia que los puntos estn ms alineados que en otros, es decir, en algunos de ellos hay mayor a a grado de asociacin lineal. o En el grco a) se aprecia a alto grado de asociacin lino eal, mientras que en b) hay mayor dispersin y muy o poco grado de asociacin lio neal.

y

a)

y

b)

x

x

En el c) hay mucha dispersin y nulo grado de asoo ciacin lineal, mientras que o en d) los puntos casi estn a alineados.

y

c)

y

d)

x

x

Seccin 3: Covarianza o

6

La medida de asociacin lineal ms simple entre dos variables es la covarianza. Viene o a denida porn

(xi x)(yi y) n y si se opera, se obtiene la expresin ms simplicada: o an

Cov(X, Y ) = Sxy =

i=1

(1)

xi yi Sxy =i=1

n

xy

(2)

Veamos un ejemplo de su clculo para dos variables x e y axi 10 30 60 90 120 310 yi 0,5 1,0 3,0 5,0 6,5 16 xi yi 5,0 30,0 180,0 450,0 780,0 1445.0

xi 310 = = 62 n 5 yi 16 = = 3,2 y= n 5 1445 Sxy = x y = 90,6 5 x=

Seccin 4: Coeciente de correlacin o o

7

4. Coeciente de correlacin o El inconveniente de la covarianza como medida de la asociacin lineal entre dos variables o es que depende de las unidades de X e Y , por ello se dene el coeciente de correlacin o entre dos variables rxy , por Sxy rxy = (3) Sx Sy Se dene como el cociente entre la covarianza de X e Y y el producto de las desviaciones t picas.

Propiedades del coeciente de correlacin oEste nmero no tiene dimensiones y su valor est entre u a 1 rxy 1 Los valores extremos 1 y -1 se alcanzan solamente si todos los datos se sitan exactamente sobre una recta. u Si la relacin lineal es muy pequea, el valor de rxy es prxio n o mo a cero.

Seccin 4: Coeciente de correlacin o o

8

Ejemplo 4.1. De un muelle cuelgan pesas, obtenindose los siguientes alargamientos: ePesos (g) Alargamiento (cm) 10 0.5 30 1 60 3 90 5 120 6.5

Calcula e interpreta el coeciente de correlacin entre estas variables. o Solucin: Sea x los pesos e y los alargamientos, oxi 10 30 60 90 120 310 yi 0,5 1,0 3,0 5,0 6,5 16 x2 i2 yi

xi yi x=

310 = 62 5

y=

16 = 3, 2 5

Seccin 4: Coeciente de correlacin o o

9

Ejemplo 4.1. De un muelle cuelgan pesas, obtenindose los siguientes alargamientos: ePesos (g) Alargamiento (cm) 10 0.5 30 1 60 3 90 5 120 6.5

Calcula e interpreta el coeciente de correlacin entre estas variables. o Solucin: Sea x los pesos e y los alargamientos, oxi 10 30 60 90 120 310 yi 0,5 1,0 3,0 5,0 6,5 16 x2 i 100 900 3600 8100 14400 271002 yi

xi yi

310 = 62 5 27100 2 Sx = x2 5 x=

y=

16 = 3, 2 5

Sx = 39, 70

Seccin 4: Coeciente de correlacin o o

10

Ejemplo 4.1. De un muelle cuelgan pesas, obtenindose los siguientes alargamientos: ePesos (g) Alargamiento (cm) 10 0.5 30 1 60 3 90 5 120 6.5

Calcula e interpreta el coeciente de correlacin entre estas variables. o Solucin: Sea x los pesos e y los alargamientos, oxi 10 30 60 90 120 310 yi 0,5 1,0 3,0 5,0 6,5 16 x2 i 100 900 3600 8100 14400 271002 yi 0,25 1,00 9,00 25,00 42,25

xi yi

310 = 62 5 27100 2 Sx = x2 5 77, 50 2 Sy = y2 5 x=

y=

16 = 3, 2 5

Sx = 39, 70 Sy = 2, 29

77,50

Seccin 4: Coeciente de correlacin o o

11

Ejemplo 4.1. De un muelle cuelgan pesas, obtenindose los siguientes alargamientos: ePesos (g) Alargamiento (cm) 10 0.5 30 1 60 3 90 5 120 6.5

Calcula e interpreta el coeciente de correlacin entre estas variables. o Solucin: Sea x los pesos e y los alargamientos, oxi 10 30 60 90 120 310 yi 0,5 1,0 3,0 5,0 6,5 16 x2 i 100 900 3600 8100 14400 271002 yi 0,25 1,00 9,00 25,00 42,25

xi yi 5,0 30,0 180,0 450,0 780,0 1445.0

77,50

310 = 62 5 27100 2 Sx = x2 5 77, 50 2 Sy = y2 5 1445 Sxy = xy 5 x=

y=

16 = 3, 2 5

Sx = 39, 70 Sy = 2, 29 Sxy = 90, 6

rxy =

90, 6 Sxy = = 0, 995 Sx Sy 39, 7 2, 29

El valor de rxy es prximo a uno, luego el grado de asociacin lineal entre el peso y el o o alargamiento es alto.

Seccin 5: Rectas de regresin o o

12

5. Rectas de regresin o Los modelos de regresin provienen de los trabajos de Galton en biolog a nales del o a siglo XIX. Galton estudi la dependencia de la estatura de los hijos (y) respecto a la de sus padres o (x), encontrando lo que denomin regresin a la media. o o Los padres bajos tienen hijos bajos, pero en promedio ms altos que sus padres, y los a padres altos tienen hijos altos, pero en promedio ms bajos que sus padres. a La recta de regresin corresponde a la reco ta yi = a xi + b que mejor se aproxima a los puntos del diagrama de dispersin para la altura X o y el peso Y .

y pesoy

altura

x

x

Seccin 5: Rectas de regresin o o

13

Denominamos recta de regresin a la recta o y = ax + b que mejor se aproxima a la nube de puntos del diagrama de dispersin. o Para hallar a y b se impone el criterio de que las suma de las distancias cuadrticas a 2 di sea m nima, donde para cada valor de xi , di es la diferencia entre el valor observado yi y el valor que predice la recta yi = a xi + b. Como tenemos dos variables, segn se tome x o y como variable independiente, tenemos u dos rectas: Recta de regresin de y sobre x: o ry/x y y = Sxy (x x) 2 Sx (4)d2

y

yi di yi dn

Recta de regresin de x sobre y: o rx/y x x = Sxy (y y) 2 Sy (5)d1

xi

x

Seccin 5: Rectas de regresin o o

14

5.1. Propiedades de las rectas de regresin o a) Las dos rectas de regresin se cortan en el punto de las o medias de las variables (x, y). b) El producto de las pendientes de las rectas es el cuadrado del coeciente de correlacin. o Sxy Sxy 2 = 2 Sx Sy Sxy Sx Sy2 2 = rxy

c) Las rectas de regresin se usan para predecir el valor de una o variable cuando se conoce la otra, y se debe cumplir que el coeciente de correlacin sea prximo a -1 o a 1. o o Test. Responder a las siguientes cuestiones. 1. Si Sxy es positiva, entonces el coeciente de correlacin es: o (a) rxy > 0 (b) rxy < 0 (c) no se puede saber 2. La pendiente de la recta de regresin de y respecto de x es: o Sxy Sxy (a) 2 (b) 2 (c) Ninguna de ellas Sy Sx 3. La pendientes de las rectas de regresin pueden ser de signo contrario. o (a) verdadero (b) falso

Seccin 5: Rectas de regresin o o

15

4. Si las pendientes de las rectas de regresin son iguales. o (a) rxy = 1 (b) Sx = Sy

(c) Ninguna de ellas

Ejemplo 5.1. En el ao 2000 los ingresos de determinadas empresas, en millones de n de empleados en miles, fueIngresos Empleados 5,7 16 3,8 29 1,9 17 1 6 1 9

ey

Determinar el coeciente de correlacin y la recta de regresin de los ingresos respecto de o o los empleados. Solucin: Sea x los empleados e y los ingresos, oxi 16 29 17 6 9 77 yi 5,7 3,8 1,9 1,0 1,0 13,4 x2 i 256 841 289 36 81 15032 yi 32,49 14,44 3,61 1,00 1,00

xi yi 91,2 110,2 32,3 6,0 9,0 248,7

52,54

x = 15,4 1503 2 Sx = x2 5 52,54 2 Sy = y2 5 248,7 Sxy = xy 5

y = 2,68 Sx = 7,96 Sy = 1,82 Sxy = 8,47

rxy =

Sxy = 0,58 Sx Sy

y 2,68 =

8,47 (x 15,4) 63,44

Seccin 6: Ejercicios o

16

6. Ejercicios Ejercicio 1. El ndice de mortalidad y de una muestra de poblacin que consum diariao a mente x cigarrillos aparece en la tabla adjunta, donde se estudiaron siete muestras distintas de poblacin que consum distinto nmero de cigarrillos: o a uNo de cigarrillos (x) Indice de mortalidad (y) 3 0.2 5 0.3 6 0.3 15 0.5 20 0.7 40 1.4 45 1.5

Estudiar la correlacin. Qu o e ndice de mortalidad se podr predecir para un consumidor a de de 32 cigarrillos diarios? Ejercicio 2. La distribucin de edades y presin arterial de 10 personas es: o oEdad (x) Tensin (y) o 30 11,5 28 11,3 35 12,5 42 13,5 51 14,6 42 13 63 16,6 32 12 70 16,9 67 17

a) Calcular el coeciente de correlacin. o b) Estimar la tensin de una persona de 60 aos. o n Ejercicio 3. La tabla siguiente representa una muestra de la que se conocen3

xi yi = 42i=1

Sxy = 24 3 5 b

x y

3 a

Hallar a y b.

Seccin 6: Ejercicios o

17

Ejercicio 4. Se observaron las edades de 5 nios y sus pesos respectivos, obtenindose la n e tabla:Edad en aos (x) n Peso en kg (y) 2 15 4,5 19 6 25 7,2 33 8 34

a) Hallar el coeciente de correlacin y las dos rectas de regresin o o b) Qu peso corresponder a un nio de 5 aos? e a n n c) Qu edad corresponder a un nio de 22 kg? e a n Ejercicio 5. Los ingresos en determinadas empresas en miles de euros y de empleados en miles es el siguiente:Ingresos (x) Empleados (y) 34,2 16 22,8 29 11,4 17 6 6 6 9

a) Estudiar la correlacin entre las variables. o b) Hallar la recta de regresin de los ingresos, en miles de euros, respecto de los empleados, o en miles. Ejercicio 6. Hallar la recta de regresin y respecto de x a partir de: o5 5

xi = 80, 4i=1 5 5 i=1

yi = 775

x2 = 1891, 44 ii=1 i=1

2 yi = 1503 i=1

xi yi = 1492, 2

Soluciones a los Ejercicios

18

Soluciones a los Ejercicios Ejercicio 1. Sea x el no de cigarrillos e y el ndice de mortalidad,xi 3 5 6 15 20 40 45 134 yi 0,2 0,3 0,3 0,5 0,7 1,4 1,5 4,9 x2 i 9 25 36 225 400 1600 2025 43202 yi 0,04 0,09 0,09 0,25 0,49 1,96 2,25

xi yi 0,6 1,5 1,8 7,5 14,0 56,0 67,5 148,9

310 = 19, 143 7 27100 2 Sx = x2 7 77, 50 2 Sy = y2 7 1445 xy Sxy = 7 x=

y=

16 = 0, 700 7

Sx = 15, 83 Sy = 0, 50 Sxy = 7, 871

5,17

rxy =

Sxy = 0, 997 S x Sy Sxy (x x) 2 Sx yx=32 = 1,10 Ejercicio 1

Con la recta de regresin de y sobre x: ry/x y y = o y 0,7 = 7, 871 (x 19,143) 15, 832

Soluciones a los Ejercicios

19

Ejercicio 2. Sea x la edad e y la presin arterial, o460 = 46 10 23420 2 Sx = x2 10 1974, 77 2 Sy = y2 10 6708, 3 Sxy = xy 10 x= y= 138, 9 = 13, 89 10 Sx = 15, 03 Sy = 2, 13 Sxy = 31, 89

rxy =

Sxy = 0, 995 Sx Sy

Con la recta de regresin de y sobre x: ry/x y y = o y 13, 89 =

Sxy (x x) 2 Sx

31, 89 (x 46) 15, 032 Para una edad de x = 60 aos el modelo lineal predice una presin arterial de: n o yx=60 = 15, 86 Ejercicio 2

Soluciones a los Ejercicios3

20

Ejercicio 3. Comoi=1

xi yi = 42

Siendo x = 4

3 a + 3 4 + 5 b = 42 3 a + 5 b = 30 3+a+b y= , sustituyendo en la expresin de la covarianza o 3 Sxy =3 i=1

xi yi xy =2 3 42 3+a+b 4 =2a+b=6 3 3 Resolviendo las dos ecuaciones con a y b: a=0 b=6 Ejercicio 3

Soluciones a los Ejercicios

21

Ejercicio 4. Sea x la edad en aos e y el peso en kg, nxi 2,0 4,5 6,0 7,2 8,0 27,7 yi 15 19 25 33 34 126 x2 i 4,00 20,25 36,00 51,84 64,00 176,092 yi 225 361 625 1089 1156

xi yi 30,0 85,5 150,0 237,6 272,0 775,1

3456

27, 7 = 5, 54 5 176, 09 2 x2 Sx = 5 3456 2 Sy = y2 5 775, 1 Sxy = xy 5 x= y 25, 2 = 15, 412 (x 5, 54) 2, 132 15, 412 x 5, 54 = (y 25, 2) 7, 492

y=

126 = 25, 2 5

Sx = 2, 13 Sy = 7, 49 Sxy = 15, 412

rxy

Sxy = = 0, 967 Sx Sy

Para un nio de 5 aos obtenemos y(x=5) = 23, 36 kg. n n Para un nio de 22 kg obtenemos x(y=22) = 4, 66 aos. n n Ejercicio 4

Soluciones a los Ejercicios

22

Ejercicio 5. Sean x los ingresos en miles de euros e y empleados en miles, Realizamos, como en ejercicios anteriores,, el clculo de los estad a sticos:80, 4 = 16, 08 5 1891, 44 2 Sx = x2 5 1503 2 Sy = y2 5 1492, 2 Sxy = xy 5 x= rxy = Sxy = 0, 583 Sx Sy y= 77 = 15, 4 5

Sx = 10, 94 Sy = 7, 96 Sxy = 50, 808 50, 808 (y 15, 4) 7, 962

x 16, 08 =

Siendo el coeciente de correlacin tan bajo no ser conveniente utilizar la recta de regresin o a o para realizar predicciones. Ejercicio 5

Soluciones a los Ejercicios

23

Ejercicio 6.80, 4 77 = 16, 08 y= = 15, 4 5 5 1891, 44 2 Sx = 10, 94 Sx = x2 5 1503 2 Sy = Sy = 7, 96 y2 5 1492, 2 Sxy = xy Sxy = 50, 808 5 50, 808 (x 16, 08) y 15, 4 = 10, 942 x=

Ejercicio 6

Soluciones a los Tests

24

Soluciones a los Tests Sxy Sx Sy al ser las desviaciones Sx y Sy siempre positivas, el coeciente de correlacin y la covarianza o Final del Test tienen el mismo signo. rxy = Solucin al Test: Como o

Soluciones a los Tests

25

Solucin al Test: Las pendientes de las rectas de regresin son respectivamente, o o Sxy Sxy 2 2 Sx Sy luego, ambas sern positivas o negativas, ya que ambas tienen el mismo signo que la covara ianza. Final del Test

Soluciones a los Tests

26

Solucin al Test: Si las pendientes de las rectas de regresin son iguales, entonces o o Sxy Sxy 2 2 = 2 = Sx = Sy 2 Sx Sy y como las desviaciones t picas son positivas se tiene que son iguales Sx = Sy Final del Test

ESTAD ISTICAPROBABILIDADAlberto Luce o n Francisco J. Gonzlez a

Directorio Tabla de Contenido Inicio Art culo

Copyright c 2003 [email protected] Actualizado el: 11 de marzo de 2003

Versin 2.00 o

Tabla de Contenido2. Probabilidad 2.1. Probabilidad Condicionada Soluciones a los Ejercicios

Seccin 2: Probabilidad o

3

2. ProbabilidadEjercicio 11. Describir el espacio muestral de las siguientes experiencias aleatorias: a). E1 = {Lanzamiento de un dado y anotamos el resultado}. b). c). d). e). E2 = {Lanzamiento tres dados y sumamos las puntuaciones}. E3 = {La duracin de una lmpara hasta que se funde}. o a E4 = {La resistencia a rotura de unos tubos de aluminio}. E5 = {Nmero de piezas defectuosas de un lote de 5000}. u

f). E6 = {Lanzamiento de dos monedas}. Ejercicio 12. Sean A y B sucesos con P (A) = a, P (B) = b y P (A B) = c. Expresar las probabilidades siguientes en funcin de a, b y c. o P (A B)Toc

P (A B)

P (A B)Volver

P (A B)Doc Doc

Seccin 2: Probabilidad o

4

Ejercicio 13. Sabiendo que P (A) = 0,2, P (B) = P (C) = 0,2 y P (A B) = P (A C) = P (B C) = 0,1 y P (A B C) = 0,05. Calcular la probabilidad de P (A B C). Ejercicio 14. El problema de Galileo. Un pr ncipe italiano pregunt en o una ocasin al famoso f o sico Galileo, por qu cuando se lanzan tres e dados, se obtiene con ms frecuencia la suma 10 que la suma 9, aunque a se puedan obtener de seis maneras distintas cada una? Ejercicio 15. Una urna contiene dos bolas blancas y tres bolas rojas. Efectuadas dos extracciones sucesivas, determinar la probabilidad de extraer una bola blanca y, a continuacin, una bola roja: o a). Cuando habiendo extra la primera bola sta es devuelta a la do e urna para realizar la segunda extraccin. o b). Cuando habiendo extra la primera bola sta no es devuelta do e a la urna para realizar la segunda extraccin. o

Ejercicio 16. Se extrae una carta de una baraja de 40 cartas. Comprobar cuales de los siguientes pares de sucesos son independientes:Toc Volver Doc Doc

Seccin 2: Probabilidad o

5

a). A = {rey} B = {espadas} b). c). A = {f iguras} B = {espadas} A = {rey} B = {f iguras}

Ejercicio 17. De una baraja de 40 cartas se extrae una al azar y se mira. Se repite esta operacin 4 veces. Tenemos que apostar a que la o 1a es copa, la 2a es oro, la 3a es bastos y la 4a es espadas. Si nos dejan elegir entre reponer o no la carta extra da, qu elegiremos? e Ejercicio 18. El problema del caballero de la Mer. Se considera gee neralmente 1654 como el ao del nacimiento de la teor de probabilin a dades: el caballero de la Mer, lsofo y hombre de letras en la corte e o de Luis XIV, propuso dos problemas al clebre matemtico Blaise e a Pascal; a). Qu es ms probable, obtener al menos un seis en cuatro lanzae a mientos de un dado, u obtener al menos un doble seis al lanzar 24 veces dos dados?Toc Volver Doc Doc

Seccin 2: Probabilidad o

6

b).

Se lanza una moneda varias veces. Por cada 1 obtenido, A recibe un punto, y por cada 0, se adjudica un punto B. Gana la apuesta el primero que obtenga 5 puntos. Al cabo de siete jugadas, A tiene 4 puntos y B tiene 3. En este momento se interrumpe el juego. Cmo repartir la apuesta de la manera ms o a equitativa? Las propuestas de Mer dieron lugar a un intercame bio de correspondencia entre Pascal y Fermat, del que nacieron los fundamentos de la teor de probabilidades. a

Ejercicio 19. El problema de las uvas pasas. Cuntas uvas pasas a se deben mezclar con 500 gramos de harina para tener una certeza del 99 % de que un bollo de 50 gramos contenga al menos una pasa? (Engel, Probabilidad y Estad stica, Mestral, 1988). Ejercicio 20. En una habitacin hay una reunin de n personas. o o Cul es la probabilidad de que el cumpleaos de al menos dos pera n sonas sea el mismo d a? Ejercicio 21. Demostrar que si dos sucesos A y B son independientes, tambin lo son los sucesos complementarios de A y B. eToc Volver Doc Doc

Seccin 2: Probabilidad o

7

Ejercicio 22. Demostrar: P (A|B) > P (A) = P (B|A) > P (B) Ejercicio 23. Sean dos sucesos A y B, donde P (A) = 0,5 y P (A B) = 0,8. Asignar el valor de P (B) para que: a). A y B sean incompatibles. b). A y B sean independientes.

Ejercicio 24. Indicar en cada caso si los sucesos A y B son incompatibles o independientes: a). P (A) = 0,2, P (B) = 0,4 y P (A B) = 0,6. b). c). P (A) = 0,3, P (B) = 0,5 y P (A B) = 0,65. P (A) = 0,4, P (B) = 0,5 y P (A B) = 0,7.

Ejercicio 25. Una urna contiene 5 bolas blancas y 3 negras. Tres jugadores A, B y C extraen una bola sin devolucin en este mismo orden. oToc Volver Doc Doc

Seccin 2: Probabilidad o

8

Gana el primer jugador que saca una blanca. Calcular la probabilidad de que gane C.

2.1. Probabilidad CondicionadaEjercicio 26. Supongamos que tenemos 10 urnas: 5 de ellas son de tipo U1 y contienen 3 blancas y 3 negras, 3 de ellas son de tipo U2 y contienen 4 blancas y 2 negras, y el resto son de tipo U3 y contienen 1 blanca y 5 negras. Se pide: a). Probabilidad de que una bola extra al azar de una de las 10 da urnas sea blanca. b). c). Probabilidad de que habiendo salido una bola negra, proceda de una urna del tipo U2 . Sabiendo que ha salido una bola negra, de qu tipo de urna es e ms probable que haya salido? a

Ejercicio 27. Alarma Falsa. En cierto lugar se ha instalado un dispositivo de alarma. Si hay peligro, el dispositivo se pone en funcionaToc Volver Doc Doc

Seccin 2: Probabilidad o

9

miento el 99 % de las ocasiones. Por otra parte, la probabilidad de que se dispare la alarma espontneamente es del 0,5 %, y la probabilidad a de que una noche haya un intento de robo es 0,1 %. Si una noche determinada se oye la alarma, cul es la probabilidad de que sea falsa a (no haya peligro)? Ejercicio 28. Una persona tiene dos negocios en funcionamiento, A y B. El primer negocio tiene prdidas en el 25 % de los balances, e mientras que el 2o , donde la perspectiva de benecio es menor, tiene prdidas slo en el 5 % de los casos. Se supone que el conjunto de e o operaciones es anlogo en ambos negocios. Si, analizando el resultado a econmico de una de las operaciones, se observan prdidas, cul es o e a la probabilidad de que dicha operacin correspondiese al negocio B? o Ejercicio 29. Para la eleccin de las personas de un jurado se dispoo nen de dos urnas. En la 1a hay 10 papeletas con nombres de 6 hombres y 4 de mujeres, en la 2a hay 5 papeletas con nombres de 2 hombres y 3 de mujeres. Alguien cambia una papeleta de la 1a urna a la 2a e inmediatamente despus se extrae al azar una papeleta de la 2a urna e que resulta ser nombre de mujer. Cul es la probabilidad de que la aToc Volver Doc Doc

Seccin 2: Probabilidad o

10

papeleta cambiada contenga un nombre de mujer? Ejercicio 30. Considrese tres cartas: una con las dos caras negras, e otra con ambas caras blancas y la tercera con una blanca y la otra negra. Se elige una carta al azar y se coloca sobre la mesa. La cara superior resulta negra, cul es la probabilidad de que la cara oculta a sea blanca? Ejercicio 31. Una fbrica de ladrillos suministra estos a buen precio a pero el 10 % de ellos son defectuosos. Con objeto de mejorar la calidad del producto se someten los ladrillos a un ensayo no destructivo antes de su venta. Este ensayo da como buenos el 99 % de los que son buenos y da por malos el 98 % de los que son malos. a). Determinar la probabilidad de que un ladrillo en mal estado supere el proceso de control de calidad. b). c). Determinar la probabilidad de aceptar como bueno un ladrillo cualquiera. Determinar la probabilidad de que un ladrillo, que ha sido aceptado, est en malas condiciones eVolver Doc Doc

Toc

Seccin 2: Probabilidad o

11

d).

Si el coste estimado por cada ladrillo fabricado en malas condiciones es C euros. Determinar el precio mximo que debe paa garse por ensayo no destructivo para que este sea rentable.

Ejercicio 32. Los almacenes A, B y C, que estn dirigidos por la a misma persona, tienen 50, 75 y 100 empleados, y, respectivamente, el 50 %, 60 % y 70 % de ellos son mujeres. El hecho de que una persona sea despedida del trabajo es igualmente probable entre todos los empleados, independientemente del sexo. Se despide un empleado, que resulta ser mujer. Cul es la probabilidad de que trabajara en el a almacn C? e Ejercicio 33. Dos proveedores A y B entregan la misma mercanc a a un fabricante, que guarda todas las existencias de esta mercanc a en un mismo lugar. Los antecedentes demuestran que el 5 % de la mercanc entregada por A es defectuosa y que el 9 % lo es de B. A a entrega 4 veces ms que B. Si se saca una pieza y no es defectuosa, a cul es la probabilidad de que la haya fabricado A? a Ejercicio 34. Se disea un dispositivo de frenado para evitar que un nToc Volver Doc Doc

Seccin 2: Probabilidad o

12

automvil patine en el que incluye un sistema electrnico e hidralio o u co. El sistema completo puede descomponerse en tres subsistemas en serie que operan de manera independiente: un sistema electrnico, un o sistema hidralico y un sistema mecnico. En un frenado particular, u a las probabilidades de estas unidades funcionen son aproximadamente 0,995, 0,993 y 0,994, respectivamente. Calcular la probabilidad de que sistema frene. Ejercicio 35. El volumen de produccin diario en tres plantas difeo rentes de una fbrica es de 500 unidades en la 1a , 1000 en la 2a y 2000 a en la 3a planta. Sabiendo que el porcentaje de unidades defectuosas producidas en las plantas es de 1 %, 0,8 % y 2 %, respectivamente, determinar la probabilidad de que: a). Extra una unidad al azar, resulte no defectuosa. da b). Habiendo sido extra una unidad defectuosa, haya sido proda ducida en la primera planta.

Ejercicio 36. Tres imprentas realizan trabajos para la ocina de publicaciones de la Universidad de Cantabria. La ocina de publicacionesToc Volver Doc Doc

Seccin 2: Probabilidad o

13

no negocia una multa contractual por trabajos atrasados, y los datos siguientes reejan una gran experiencia con estas imprentas. imprenta i 1 2 3 fraccin o de contratos 0,2 0,3 0,5 fraccin de tiempo o con retraso 0,2 0,5 0,3

Un departamento observa que un pedido tiene ms de un mes de a retraso. Cul es la probabilidad de que el contrato se haya otorgado a a la imprenta 3? Ejercicio 37. Una compaia de aviones dispone de 20 pilotos y 15 n auxiliares de vuelo. Si en cada vuelo viajan como equipo responsable, dos pilotos y tres auxiliares. Se pide: a). De cuntos equipos distintos dispone la compaia para los vuea n los?Toc Volver Doc Doc

Seccin 2: Probabilidad o

14

b).

El piloto RX34 tiene a su mujer como auxiliar de vuelo. Si tomamos un vuelo al azar, cul es la probabilidad de que vaya el a matrimonio en el personal de vuelo? Si elegimos un vuelo al azar, cul es la probabilidad de que a vaya RX34 o su mujer en el personal de vuelo?

c).

Ejercicio 38. Una fbrica dispone de 20 transportistas, 45 empleados a de mantenimiento y 5 ingenieros supervisores. La contratacin de todo o el personal se divide en ja y temporal. De los transportistas 8 son jos; de los empleados de mantenimiento 35 son jos y de los ingenieros 3 son jos. Si elegimos una persona al azar: a). Cul es la probabilidad de que tenga un contrato temporal? a b). c). Cul es la probabilidad de que tenga un contrato temporal y a no sea ingeniero? Si elegimos una persona que tiene contrato jo, cul es la proa babilidad de que sea un transportista?Volver Doc Doc

Toc

Soluciones a los Ejercicios

15

Soluciones a los EjerciciosEjercicio 11. a). 1 = {1, 2, 3, 4, 5, 6} b). c). d). e). 2 = {3, 4, 5, . . . , 18} 3 = {t > 0/t R} 4 = {r (Rmin , Rmax )} 5 = {0, 1, 2, . . . , 5000}

f). 6 = {(C, C); (C, X); (X, C); (X, X)} Ejercicio 11

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

16

Ejercicio 12. a). P (A B) = 1 P (A B) = 1 c b). c). d). P (A B) = P [B (A B))] = P (B) P (A B) = b c P (A B) = P (A) + p(B) P (A B) = 1 a + c P (A B) = P (A B) = 1 P (A B) = 1 a b + c Ejercicio 12

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

17

Ejercicio 13. P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C) = = 0,2 + 0,2 + 0,2 3 0,1 + 0,05 = 0,35 Ejercicio 13

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

18

Ejercicio 14. Suman 9 6-2-1 6 casos 5-3-1 6 casos 5-2-2 3 casos 4-4-1 3 casos 4-3-2 6 casos 3-3-3 1 caso Total 25 caso P (sumen 9) = 25 = 0,116 63 Suman 10 6-2-2 3 casos 5-4-1 6 casos 5-3-2 6 casos 4-4-2 3 casos 4-3-3 3 casos 3-6-1 6 casos Total 27 casos P (sumen 10) = 27 = 0, 125 63 Ejercicio 14

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

19

Ejercicio 15. a). P (BR) = b). P (BR) = 2 3 6 = 5 5 25 2 3 6 = 5 4 20 Ejercicio 15

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

20

Ejercicio 16. a). Sean A = {rey} B = {espadas}, son independientes pues, P (A|B) = b). P (A B) 1 1 = = P (A) = P (B) 10 10

Sean A = {f iguras} B = {espadas}, son independientes pues, P (A|B) = P (A B) 3 12 = = P (A) = P (B) 10 40

c).

Sean A = {rey} B = {f iguras}, no son independientes pues, P (A|B) = P (A B) 4 4 = = P (A) = P (B) 12 40 Ejercicio 16

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

21

Ejercicio 17. Sea el suceso A = {C O B E}, a). Con reposicin o P (A) = b). Sin reposicin o P (A) = 10 10 10 10 40 39 38 37 10 10 10 10 40 40 40 40

Elegiremos lo ms probable, que corresponde al segundo caso, sin a reposicin. o Ejercicio 17

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

22

Ejercicio 18. a). Sea el suceso S = {al menos un seis en cuatro lanzamientos de un dado} luego S = {ningn seis en cuatro lanzamientos de un dado} u Como P (S) = Sea el suceso T = {al menos un doble seis en 24 lanzamientos de dos dado} luego T = {ningn doble seis en 24 lanzamientos de dos dado} u Como P (T ) =Toc

5 6

4

= 0, 48225

P (S) = 0, 51775

35 36

24

= 0, 5086

P (T ) = 0, 4914Volver Doc Doc

Soluciones a los Ejercicios

23

b).

El reparto equitativo corresponde a repartir lo apostado proporcionalmente a las espectativas que tiene cada jugador de ganar a partir de la interrupcin de la partida. Es decir,a A le falta un o 1y a B dos 0s. Se puede dar Gana A si 1 01 Luego 1 1 3 1 + = P (B) = 2 4 4 4 Con lo cual deben repartir lo apostado en razn de 3 a 1. Si o hubiesen apostado 120 unidades, 90 para A y 30 para B. P (A) = Ejercicio 18 Gana B si 00

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

24

Ejercicio 19. Sea el suceso S = {al menos una pasa en un bollo de 50 g.} y S = {ninguna pasa en un bollo de 50 g.} Como los 500 g. corresponden a 10 bollos de 50 g., la experiencia consiste en elegir aleatoriamente un bollo de entre 10. La probabilidad de que un bollo cualquiera no sea elegido en n intentos, es P (S) = Si exigimos que P (S) = 1 P (S) = 1 1 10n

1 10

n

0,99 = n 44 Ejercicio 19

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

25

Ejercicio 20. Sea el suceso An = {al menos dos personas entre n que han nacido el mismo d a} y por tanto An = {ninguna persona de las n ha nacido el mismo d que otra} a 365 364 363 (365 n + 1) 365n Veamos la solucin para algunos valores de n o P (An ) = n 5 10 15 20 P (An ) 0,0271 0,1169 0,2231 0,3791 n 23 32 40 50 P (An ) 0,5073 0,7533 0,8912 0,9704 Ejercicio 20

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

26

Ejercicio 21. Sean A y B, independientes, P (A|B) = P (B), entonces P (B|A) = 1 P (B|A) = 1 P (B) = P (B) De (1) A y B son independientes. P (A|B) = 1 P (A|B) = 1 P (A) = P (A) De (2) A y B son independientes. P (A|B) = 1 P (A|B) = 1 P (A) = P (A) De (3) A y B son independientes. Ejercicio 21 (3) (1) (2)

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

27

Ejercicio 22. Sean A y B, con P (A) > 0 y P (B) > 0, entonces P (A B) = P (A|B) p(B) = P (B|A) p(A) = P (A|B) P (B|A) = >1 P (A) P (B) Ejercicio 22

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

28

Ejercicio 23. a). Incompatibles luego P (A B) = 0, y P (A B) = P (A) + p(B) P (A B) = P (B) = 0,3 b). Independientes luego P (A B) = P (A) P (B), y P (A B) = P (A) + P (B) P (A B) = P (B) = 0,6 Ejercicio 23

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

29

Ejercicio 24. a). Incompatibles, pues P (A B) = P (A) + P (B) P (A B) = P (A B) = 0 b). Independientes, pues P (A B) = P (A) + P (B) P (A B) = P (A B) = 0,15 = P (A) P (B)

c).

Independientes, pues P (A B) = P (A) + P (B) P (A B) = P (A B) = 0,2 = P (A) P (B) Ejercicio 24

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

30

Ejercicio 25.

Las probabilidades respectivas de ganar de cada jugador son: 5 3 2 1 36 P (GA ) = + = 8 8 7 6 56 3 5 15 P (GB ) = = 8 7 56 3 2 5 5 P (GC ) = = 8 7 6 56 Ejercicio 25Toc Volver Doc Doc

Soluciones a los Ejercicios

31

Ejercicio 26. Sea Ui el suceso se elige la urna de tipo Ui , B el suceso se extrae bola blanca y N el suceso se extrae bola negra a). P (B) = P (B|U1 ) P (U1 ) + P (B|U2 ) P (U2 ) + P (B|U3 ) P (U3 ) 3 5 4 3 1 2 29 = + + = 6 10 6 10 6 10 60

b). P (U2 |N ) = P (N |U2 )P (U2 ) P (N |U1 )P (U1 ) + P (N |U2 )P (U2 ) + P (N |U3 )P (U3 ) 2 3 6 6 10 = 3 5 2 3 5 2 31 + + 6 10 6 10 6 10

=

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

32

c).

Anlogamente se tiene a 15 7 P (U3 |N ) = 31 31 luego es ms probable que haya salido de la urna de tipo U1 . a P (U1 |N ) = Ejercicio 26

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

33

Ejercicio 27. Sea R el suceso hay peligroy A el suceso suena la alarma. Los datos son P (A|R) = 0,99 P (A|R) = 0,005 P (R) = 0,001 Se pide P (A|R) P (R) p(A|R) P (R) + p(A|R) P (R) 0,005 0,999 = = 0,83 0,99 0,001 + 0,005 0,999 Es decir, una alarma de alta ecacia con un ndice de peligrosidad por noche del orden del 0,001 lleva a que la mayor de los avisos de las a alarmas sean falsas. Ejercicio 27 P (R|A) =

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

34

Ejercicio 28. Denotamos por A el suceso {operacin con el negocio o A} y anlogamnete para B. Sea D el suceso {tener prdidas}. Se sabe a e que P (A) = P (B) = 1/2 , P (D|A) = 0,25 y P (D|B) = 0,05 entonces P (B|D) = = P (D|B) P (B) P (D|A) P (A) + P (D|B) P (B) 0,05 0,5 1 = 0,25 0,5 + 0,25 0,5 6 Ejercicio 28

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

35

Ejercicio 29. Cuando se pase una papeleta de la urna U1 a la urna U2 , sta quedara, si se pasa nombre de hombre como UH = {3 h, 3 m},con e P (UH ) = 6/10, y si se pasa nombre de mujer como UM = {2 h, 4 m},con P (UM ) = 4/10. La probabilidad pedida es: P (UM |M ) = = P (M |UM ) P (UM ) P (M |UM ) P (UM ) + P (M |UH ) P (UH ) 2 4 16 3 10 4 1 6 = 34 2 3 10 + 2 10 Ejercicio 29

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

36

Ejercicio 30.

P (C3 |N ) =

P (N |C3 ) P (C3 ) p(N |C1 ) P (C1 ) + p(N |C2 ) P (C2 ) + p(N |C3 ) p(C3 ) 1 1 2 3 P (C3 |N ) = 1 1 1 1 = 3 2 3 +0 3 +1 3 Ejercicio 30

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

37

Ejercicio 31. Sea D el suceso ladrillo en mal estado y + el suceso un ladrillo supera el control. a). P (+|D) = 0,02 b). P (+) = P (+|D)P (D)+P (+|D)P (D) = 0,020,1+0,990,9 = 0,893 P (D|+) = P (D +) 0,02 0,1 = = 0, 0022 P (+) 0,893

c). d).

De N ladrillos fabricados, el coste asociado a los ladrillos + y D viene dado por C P (+ D) N = 0,098 C N , luego el precio mximo pmax N < 0,098 C N y por tanto pmax < 0,098 C a Ejercicio 31

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

38

Ejercicio 32. Sea M el suceso se despide una mujer P (C|M ) = P (M |C) P (C) P (M |A) P (A) + P (M |B) P (B) + P (M |C) P (C) 100 0,7 225 = 0,5 75 100 50 0,5 + 0,6 + 0,7 225 225 225 Ejercicio 32

=

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

39

Ejercicio 33.

P (A|D)

= =

P (D|A) P (A) P (D|A) P (A) + P (D|B) P (B) 0,95 0,8 = 0,806 0,95 0,8 + 0,91 0,2 Ejercicio 33

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

40

Ejercicio 34. Al estar en serie y ser independientes el sistema frena si lo hacen los tres, es decir P (f rene) = 0,995 0,993 0,994 = 0,98 Ejercicio 34

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

41

Ejercicio 35. Sean los sucesos Pi = {pieza fabricada por la planta i} 1 2 4 P (P1 ) = P (P2 ) = P (P3 ) = 7 7 7 y D = {def ectuosa} con P (D|P1 ) = 0,01i=3

P (D|P2 ) = 0,008

P (D|P1 ) = 0,02

a). P (D) =i=1

P (D|Pi )P (Pi ) = 0,015, luego P (D) = 0,985

b). P (P1 |D) = P (D|P1 )P (P1 ) = 0,094 P (D) Ejercicio 35

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

42

Ejercicio 36. Sea R el suceso un pedido tiene ms de un mes de a retraso y sea Ii el suceso contrato se haya otorgado a la imprenta i P (I3 |R) = = P (R|I3 ) P (I3 ) P (R|I1 ) P (I1 ) + P (R|I2 ) P (I2 ) + P (R|I3 ) P (I3 ) 0,3 0,5 15 = 0,2 0,2 + 0,5 0,3 + 0,3 0,5 34 Ejercicio 36

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

43

Ejercicio 37. a). Nmero de equipos posibles u b). 20 2 15 3 = 86450

Sea el suceso R = {viaje el marido} y sea M = {viaje la mujer} P (R M ) =19 1 14 2

86450

= 0,14

c). P (R M ) = P (R) + P (M ) P (R M ) = =19 1 15 3 20 2 14 2

86450 0, 28

+

86450

0,14

Ejercicio 37

Toc

Volver

Doc

Doc

Soluciones a los Ejercicios

44

Ejercicio 38. Si diseamos una tabla de doble entrada se obtienen n las probabilidades con facilidad: Empleado Transporte Mantenimiento Ingeniero Fijo 8 35 3 46 Temporal 12 10 2 24 20 45 5 70

a). P (T ) = b). c).

24 70 22 70 8 46 Ejercicio 38

P (T I) = P (T r|F ) =

Indice general

Indice general 1. Teor de la Probabilidad a 1.1. Medida de Probabilidad . . . . . . . . . . . . . . . . . . . 1.2. Asignacin de Probabilidades . . . . . . . . . . . . . . . . o 1.2.1. Conteo: Conceptos Fundamentales de Combinatoria 1.3. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . 1.3.1. Dependencia e Independencia . . . . . . . . . . . . 1.4. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . 1.5. Redes Probabil sticas . . . . . . . . . . . . . . . . . . . . . 1.5.1. Sistemas Inteligentes . . . . . . . . . . . . . . . . . 1.5.2. Sistemas Inteligentes Probabil sticos . . . . . . . . . 1.5.3. Redes Bayesianas . . . . . . . . . . . . . . . . . . . 1.5.4. Razonamiento Probabil stico. Inferencia . . . . . . 1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

I

1 1 2 4 6 6 7 10 11 12 15 16 16

i

CAP ITULO 1 Teor de la Probabilidad a

1.1. Medida de ProbabilidadPara medir la incertidumbre existente en un experimento aleatorio1 dado, se parte de un espacio muestral M en el que se incluyen todos los posibles resultados individuales del experimento (sucesos elementales); es decir, el conjunto muestral es un conjunto exhaustivo (contiene todas las posibles ocurrencias) y mtuamente exclusivo (no pueden darse dos ocurrencias a u la vez). Una vez denido el espacio muestral, el objetivo consiste en asignar a todo suceso compuesto A M un nmero real que mida el grado u de incertidumbre sobre su ocurrencia. Para obtener medidas con signicado matemtico claro y prctico, se imponen ciertas propiedades intuitivas que a a denen una clase de medidas que se conocen como medidas de probabilidad. Denicin 1.1 Medida de Probabilidad. Una funcin p que proyecta los o o subconjuntos A M en el intervalo [0, 1] se llama medida de probabilidad si satisface los siguientes axiomas2 : Axioma 1 (Normalizacin): p(M) = 1. oUn experimento se denomina aleatorio cuando puede dar resultados distintos al realizarse en las mismas condiciones (por ejemplo, lanzar un dado al aire y observar el nmero resultante). 2 Formalmente, una medida de probabilidad se dene sobre una -lgebra del espacio a muestral, que es una coleccin de subconjuntos que es cerrada para los operadores de unin o o = M\A (por tanto, tambin para intersecciones AB = A B). AB y complementario A e Sin embargo, optamos por una denicin menos rigurosa y ms intuitiva para introducir o a este concepto.1

1

2

1. TEORA DE LA PROBABILIDAD I

Axioma 2 (Aditividad): Para cualquier sucesin innita, A1 , A2 , . . ., o de subconjuntos disjuntos de M, se cumple la igualdad

pi=1

Ai =i=1

p (Ai ).

(1.1)

El Axioma 1 establece que, independientemente de nuestro grado de certeza, ocurrir un elemento del espacio muestral M (es decir, el conjunto M es a exhaustivo). El Axioma 2 es una frmula de agregacin que se usa para o o calcular la probabilidad de la unin de subconjuntos disjuntos. Establece que o la incertidumbre de un cierto subconjunto es la suma de las incertidumbres de sus partes (disjuntas). Ntese que esta propiedad tambin se cumple para o e sucesiones nitas. De los axiomas anteriores pueden deducirse propiedades muy interesantes de la probabilidad. Por ejemplo: Complementariedad: La probabilidad de un suceso y la de su com plementario suman uno, p(A) + p(A) = 1. Normalizacin: La evidencia asociada a una ausencia completa de o informacin es cero, p() = 0. Su demostracin es sencilla: o o 1 = p(M) = p(M ) = p(M) + p() p() = 0. Acotacin: La probabilidad de cualquier suceso es menor o igual que o la unidad, p(A) 1, para A M. Monotonicidad: La evidencia de la pertenencia de un elemento a un conjunto debe ser al menos la evidencia de cualquiera de sus subconjuntos. Si