Upload
luis-bruno
View
115
Download
5
Embed Size (px)
DESCRIPTION
problemas
Citation preview
REGRESION Y CORRELACION LINEAL
1. Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos.a) Hallar la ecuacin de la recta de regresin de la edad sobre el peso.b) Cul sera el peso aproximado de un nio de seis aos?xiyixiyixi2yi2
214419628
320940060
532251 024160
742491 764294
844641 936352
251521515 320894
2. Un centro comercial sabe en funcin de la distancia, en kilmetros, a la que se site de un ncleo de poblacin, acuden los clientes, en cientos, que figuran en la tabla:N de clientes (X)876421
Distancia (Y)151925233440
a) Calcular el coeficiente decorrelacin lineal.b) Si el centro comercial se sita a 2 km, cuntos clientes puede esperar?c) Si desea recibir a 500 clientes, a qu distancia del ncleo de poblacin debe situarse?xiyixiyixi2yi2
81512064225
71913349361
62515036625
4239216529
2346841 156
1404011 600
281566031704 496
Correlacin negativa muy fuerte.
3. Las notas de cinco alumnos en Matemticas y Qumica son:Matemticas64853. 5
Qumica6. 54. 5754
Determinar lasrectas de regresiny calcular la nota esperada en Qumica para un alumno que tiene 7.5 en Matemticas.xiyixiyixi2yi2
66. 53642. 2539
44. 51620. 2518
87644956
55252525
3. 5412. 251614
26. 527153. 25152. 5152
4. Un conjunto de datos bidimensionales (X, Y) tienecoeficiente de correlacinr = -0.9, siendo las medias de las distribuciones marginales= 1, = 2. Se sabe que una de las cuatro ecuaciones siguientes corresponde a larecta de regresinde Y sobre X:y = -x + 23x - y = 12x + y = 4y = x + 1Seleccionar razonadamente estarecta.Como elcoeficiente de correlacin lineal es negativo, lapendientede larecta tambin sernegativa, por tanto descartamos la 2 y 4.Un punto de la recta ha de ser (,), es decir, (1, 2).2 - 1 + 22 . 1 + 2 = 4La recta pedida es:2x + y = 4.
5. Las estaturas y pesos de 10 jugadores de futbol de un equipo son:Estatura (X)186189190192193193198201203205
Pesos (Y)85858690879193103100101
Calcular:a) Larecta de regresinde Y sobre X.b) Elcoeficiente de correlacin.c) El peso estimado de un jugador que mide 208 cm.xiyixi2yi2xiyi
1868534 5967 22515 810
1898535 7217 22516 065
1908636 1007 39616 340
1929036 8648 10017 280
1938737 2497 56916 791
1939137 2498 28117563
1989339 2048 64918 414
20110340 40110 60920 703
20310041 20910 00020 300
20510142 02510 20120 705
1 950921380 61885 255179 971
Correlacin positiva muy fuerte. 6. A partir de los siguientes datos referentes a horas trabajadas en un taller (x), y a unidades producidas (y), determinar larecta de regresinde Y sobre X, elcoeficiente de correlacin lineale interpretalo.Horas (X)807983847860828579848062
Produccin (Y)300302315330300250300340315330310240
xiyixiyixi2yi2
803006 40090 00024 000
793026 24191 20423 858
833156 88999 22526 145
843307 056108 90027 720
783006 08490 00023 400
602503 60062 50015 000
823006 72490 00024 600
853407 225115 60028 900
793156 24199 22524 885
843307 056108 90027 720
803106 40096 10024 800
622403 84457 60014 880
9363 63273 7601 109 254285 908
Correlacin positiva muy fuerte7. Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas que dedican diariamente a dormir y ver la televisin. La clasificacin de las respuestas ha permitido elaborar la siente tabla:N de horas dormidas (X)678910
N de horas de televisin (Y)43321
Frecuencias absolutas (fi)31620101
Se pide:a) Calcular elcoeficiente de correlacin.b) Determinar la ecuacin de larecta de regresinde Y sobre X.c) Si una persona duerme ocho horas y media, cunto cabe esperar que vea la televisin?xiyifixi fixi2 fiyi fiyi2 fixi yi fi
64318108124872
731611278448144336
8320160128060180480
9210908102040180
1011101001110
5039030821414131078
Es unacorrelacin negativa y fuerte.
8. Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de tiempo tomados para n = 25 servicios se muestran a continuacin:X ServiciosY Tiempo(Xi-X)*(Yi-Y)(Xi-X)^2(Yi-Y)^2YestError
29.95119.07667238.9376364.153310.91990.9408
824.451.0998720.057621.002128.336215.1022
1131.757.4994727.61767.383237.044328.0292
1035.0010.5022723.097635.607534.14160.7369
825.020.9630720.057616.102628.336210.9969
416.8651.61267217.9776148.177116.72530.0181
214.3891.43347238.9376214.704510.919911.9721
29.60121.26067238.9376377.633710.91991.7422
924.35-3.5589280.577621.928631.238947.4563
827.500.3678720.05762.349528.33620.6991
417.0850.67987217.9776142.869416.72530.1258
1137.0021.9894727.617663.476337.04430.0020
1241.9548.56867214.1376166.854139.94704.0121
211.66108.40627238.9376301.814210.91990.5477
421.6531.30307217.977654.505716.725324.2523
417.8947.24547217.9776124.162016.72531.3564
2069.00470.014272138.29761,597.377163.168634.0052
110.30135.62547252.4176350.91788.01725.2111
1034.9310.3790723.097634.777034.14160.6216
1546.59118.68667245.6976308.255348.65514.2646
1544.88107.12707245.6976251.133748.655114.2512
1654.12194.67667260.2176629.367651.55786.5649
1756.63241.75147276.7376761.605454.46054.7068
622.1315.4622725.017647.648622.53070.1606
521.1525.54027210.497662.138519.62802.3164
206725.822,027.7132698.56006,105.9447220.0926
SxySxxSyy = SSTSSE
X promedioY Promedio
SxySxxSyy
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de cuadrados siguientes se muestran a continuacin:Sxy = 2027.71Sxx = 698.56Syy = 6105.94Las ecuaciones para el clculo manual son las siguientes:
= 2.902704421
= 5.114515575Las sumas de cuadrados son:
6,105.9447
220.0926
5,885.8521El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a continuacin:
= 0.9639El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada por la regresin.
= 0.9816El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r = 0 indicara correlacin nula.El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica para afirmar que el tiempo de atencin esta relacionado con el nmero de servicios atendidos.