5
REGRESION Y CORRELACION LINEAL 1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. a) Hallar la ecuación de la recta de regresión de la edad sobre el peso. b) ¿Cuál sería el peso aproximado de un niño de seis años? x i y i x i ·y i x i 2 y i 2 2 14 4 196 28 3 20 9 400 60 5 32 25 1 024 160 7 42 49 1 764 294 8 44 64 1 936 352 2 5 15 2 151 5 320 894 2. Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla: Nº de clientes (X) 8 7 6 4 2 1 Distancia (Y) 15 19 25 23 34 40 a) Calcular el coeficiente de correlación lineal . b) Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar? c) Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe situarse? x i y i x i ·y i x i 2 y i 2 8 15 120 64 225 7 19 133 49 361 6 25 150 36 625 4 23 92 16 529 2 34 68 4 1 156 1 40 40 1 1 600 2 8 15 6 603 17 0 4 496 Correlación negativa muy fuerte .

Problemas Resueltos de Regresion y Correlacion Lineal

Embed Size (px)

DESCRIPTION

problemas

Citation preview

REGRESION Y CORRELACION LINEAL

1. Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos.a) Hallar la ecuacin de la recta de regresin de la edad sobre el peso.b) Cul sera el peso aproximado de un nio de seis aos?xiyixiyixi2yi2

214419628

320940060

532251 024160

742491 764294

844641 936352

251521515 320894

2. Un centro comercial sabe en funcin de la distancia, en kilmetros, a la que se site de un ncleo de poblacin, acuden los clientes, en cientos, que figuran en la tabla:N de clientes (X)876421

Distancia (Y)151925233440

a) Calcular el coeficiente decorrelacin lineal.b) Si el centro comercial se sita a 2 km, cuntos clientes puede esperar?c) Si desea recibir a 500 clientes, a qu distancia del ncleo de poblacin debe situarse?xiyixiyixi2yi2

81512064225

71913349361

62515036625

4239216529

2346841 156

1404011 600

281566031704 496

Correlacin negativa muy fuerte.

3. Las notas de cinco alumnos en Matemticas y Qumica son:Matemticas64853. 5

Qumica6. 54. 5754

Determinar lasrectas de regresiny calcular la nota esperada en Qumica para un alumno que tiene 7.5 en Matemticas.xiyixiyixi2yi2

66. 53642. 2539

44. 51620. 2518

87644956

55252525

3. 5412. 251614

26. 527153. 25152. 5152

4. Un conjunto de datos bidimensionales (X, Y) tienecoeficiente de correlacinr = -0.9, siendo las medias de las distribuciones marginales= 1, = 2. Se sabe que una de las cuatro ecuaciones siguientes corresponde a larecta de regresinde Y sobre X:y = -x + 23x - y = 12x + y = 4y = x + 1Seleccionar razonadamente estarecta.Como elcoeficiente de correlacin lineal es negativo, lapendientede larecta tambin sernegativa, por tanto descartamos la 2 y 4.Un punto de la recta ha de ser (,), es decir, (1, 2).2 - 1 + 22 . 1 + 2 = 4La recta pedida es:2x + y = 4.

5. Las estaturas y pesos de 10 jugadores de futbol de un equipo son:Estatura (X)186189190192193193198201203205

Pesos (Y)85858690879193103100101

Calcular:a) Larecta de regresinde Y sobre X.b) Elcoeficiente de correlacin.c) El peso estimado de un jugador que mide 208 cm.xiyixi2yi2xiyi

1868534 5967 22515 810

1898535 7217 22516 065

1908636 1007 39616 340

1929036 8648 10017 280

1938737 2497 56916 791

1939137 2498 28117563

1989339 2048 64918 414

20110340 40110 60920 703

20310041 20910 00020 300

20510142 02510 20120 705

1 950921380 61885 255179 971

Correlacin positiva muy fuerte. 6. A partir de los siguientes datos referentes a horas trabajadas en un taller (x), y a unidades producidas (y), determinar larecta de regresinde Y sobre X, elcoeficiente de correlacin lineale interpretalo.Horas (X)807983847860828579848062

Produccin (Y)300302315330300250300340315330310240

xiyixiyixi2yi2

803006 40090 00024 000

793026 24191 20423 858

833156 88999 22526 145

843307 056108 90027 720

783006 08490 00023 400

602503 60062 50015 000

823006 72490 00024 600

853407 225115 60028 900

793156 24199 22524 885

843307 056108 90027 720

803106 40096 10024 800

622403 84457 60014 880

9363 63273 7601 109 254285 908

Correlacin positiva muy fuerte7. Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas que dedican diariamente a dormir y ver la televisin. La clasificacin de las respuestas ha permitido elaborar la siente tabla:N de horas dormidas (X)678910

N de horas de televisin (Y)43321

Frecuencias absolutas (fi)31620101

Se pide:a) Calcular elcoeficiente de correlacin.b) Determinar la ecuacin de larecta de regresinde Y sobre X.c) Si una persona duerme ocho horas y media, cunto cabe esperar que vea la televisin?xiyifixi fixi2 fiyi fiyi2 fixi yi fi

64318108124872

731611278448144336

8320160128060180480

9210908102040180

1011101001110

5039030821414131078

Es unacorrelacin negativa y fuerte.

8. Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de tiempo tomados para n = 25 servicios se muestran a continuacin:X ServiciosY Tiempo(Xi-X)*(Yi-Y)(Xi-X)^2(Yi-Y)^2YestError

29.95119.07667238.9376364.153310.91990.9408

824.451.0998720.057621.002128.336215.1022

1131.757.4994727.61767.383237.044328.0292

1035.0010.5022723.097635.607534.14160.7369

825.020.9630720.057616.102628.336210.9969

416.8651.61267217.9776148.177116.72530.0181

214.3891.43347238.9376214.704510.919911.9721

29.60121.26067238.9376377.633710.91991.7422

924.35-3.5589280.577621.928631.238947.4563

827.500.3678720.05762.349528.33620.6991

417.0850.67987217.9776142.869416.72530.1258

1137.0021.9894727.617663.476337.04430.0020

1241.9548.56867214.1376166.854139.94704.0121

211.66108.40627238.9376301.814210.91990.5477

421.6531.30307217.977654.505716.725324.2523

417.8947.24547217.9776124.162016.72531.3564

2069.00470.014272138.29761,597.377163.168634.0052

110.30135.62547252.4176350.91788.01725.2111

1034.9310.3790723.097634.777034.14160.6216

1546.59118.68667245.6976308.255348.65514.2646

1544.88107.12707245.6976251.133748.655114.2512

1654.12194.67667260.2176629.367651.55786.5649

1756.63241.75147276.7376761.605454.46054.7068

622.1315.4622725.017647.648622.53070.1606

521.1525.54027210.497662.138519.62802.3164

206725.822,027.7132698.56006,105.9447220.0926

SxySxxSyy = SSTSSE

X promedioY Promedio

SxySxxSyy

Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de cuadrados siguientes se muestran a continuacin:Sxy = 2027.71Sxx = 698.56Syy = 6105.94Las ecuaciones para el clculo manual son las siguientes:

= 2.902704421

= 5.114515575Las sumas de cuadrados son:

6,105.9447

220.0926

5,885.8521El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a continuacin:

= 0.9639El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada por la regresin.

= 0.9816El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r = 0 indicara correlacin nula.El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica para afirmar que el tiempo de atencin esta relacionado con el nmero de servicios atendidos.