33
UNIVERSID FACULT ESCUELA PR MÉTODO PROB DAD NACIONAL DEL ALTIPL TAD DE INGENIERÍA AGRÍCOLA ROFESIONAL DE INGENIERÍA AGRÍCO OS ESTADÍSTICOS PARA L INVESTIGACIÓN BLEMAS RESUELTOS POR: EDUARDO FLORES CONDORI EDUARDO LUIS FLORES QUISPE PUNO – PERÚ 2011 LANO A OLA LA

MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN · PDF fileuniversidad nacional del altiplano facultad de ingenierÍa agrÍcola escuela profesional de ingenierÍa agrÍcola mÉtodos

Embed Size (px)

Citation preview

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERÍA AGRÍCOLA

ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA

MÉTODOS ESTADÍSTICOS PARA LA

PROBLEMAS RESUELTOS

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERÍA AGRÍCOLA

ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA

MÉTODOS ESTADÍSTICOS PARA LA

INVESTIGACIÓN

PROBLEMAS RESUELTOS

POR:

EDUARDO FLORES CONDORI

EDUARDO LUIS FLORES QUISPE

PUNO – PERÚ

2011

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERÍA AGRÍCOLA

ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA

MÉTODOS ESTADÍSTICOS PARA LA

SUMATORIA

Al presentarse la suma de una secuencia numérica, en donde destaquemos cierta

secuencia u orden en los sumandos que se van a sumar, podemos esa suma

abreviarla bajo un signo, el que denominaremos sumatoria.

Tenemos por lo tanto que la sumatoria, ∑=

n

mkka es una forma de expresar la

suma de los términos de una sucesión, términos que se obtienen dando a la

variable k valores enteros comprendidos entre dos límites escritos en la

parte superior del símbolo ∑ de sumatoria

Identificación,

∑=

n

iix

1

Ejemplos:

n

n

ii

ii

xxxxxx

xxxxxx

+++++=

++++=

=

=

.....43211

54321

5

1

Exprese las siguientes sumas mediante el símbolo sumatoria. a) S=12 + 22 + 32 + 42 + .... + n2 b) S= 1.2 + 2.3 + 3.4 + ..... + n(n+1)

c) n

nS

2...

2

3

2

2

2

132

++++=

d) n

nS

2...

2

3

2

2

2

132

++++=

d) 1432 ....321 +++++= n nS

Signo sumatoria

Valor donde termina la sumatoria

Término a sumar

Valor por el cual comienza la suma

SUMATORIA-PROPIEDADES

1. La sumatoria de la suma de dos o más términos, es igual a la suma de las sumatorias separadas de los términos.

( ) ∑∑ ∑== =

+=+n

ii

n

i

n

iiii yxyx

11 1

2. La sumatoria de la diferencia de dos o más términos es igual a la diferencia de las sumatorias separadas de los términos.

( ) ∑∑∑===

−=−n

ii

n

ii

n

iii yxyx

111

3. La sumatoria de una constante multiplicada por una variable es igual a la constante multiplicada por la sumatoria de la variable.

∑∑==

=n

ii

n

ii xaxa

11

..

4. La sumatoria de una constante es igual a la constante multiplicada por el número que indique los límites de la sumatoria.

anan

x

.1

=∑=

En la práctica frecuentemente se comenten algunos errores, los cuales los

cuales mencionaremos para que no se incurra en ellos.

� Es falso el tomar a

2

11

2

= ∑∑==

n

i

n

i

xx ya que son valores completamente diferentes

� Otro error se comete es decir que ∑ ∑∑= ==

=n

i

n

ii

n

iiii yxyx

1 11

. ya que son términos diferentes.

EJERCICIOS.

1.—Escribe los términos de cada una de las siguientes sumatorias.

( )

( )

4 52

1 1 1

42

1 1

) ( 2) ) ) 6

) 4 ) 4

n

i i i i ii i i

N

K i iK i

a X b f X c U U

d Y e X Y

= = =

= =

+ +

∑ ∑ ∑

∑ ∑

2.-- Dadas dos variables X e Y toman los valores X1= 2, X2= -5, X3= 4, X4= -8 y Y1= -3, Y2=-8,

Y3=10, Y4= 6. Calcula :

( )

4 4 4 4 42 2

1 1 1 1 1

4 4 42

1 1 1 1

) b) c) d) e)

) . g) . h) ( )

i i i i i ii i i i i

n

i i i i i i i ii i i i

a X Y X Y X Y

f X Y X Y X Y X Y

= = = = =

= = = =

+ −

∑ ∑ ∑ ∑ ∑

∑ ∑ ∑ ∑

3.—Si 6 6

2

1 1

4 y 10i ii i

X X= =

= − =∑ ∑ , Halle:

6 6 62

1 1 1

) (2 3) b) ( 1) c) ( 5)i i i ii i i

a X X X X= = =

+ − −∑ ∑ ∑

4.—Dos variables U y V toman los valores U1= 3, U2= -2, U3= 5 y V1= -4, V2= -1, V3= 6,

respectivamente. Calcule:

( ) ( )23 3 3 3

2

1 1 1 1 1

3 n2 2 2 i

i1 1 i=1

) b) U +3 4 c) d)

U) f) ( 2 2) g)

V

n

i i i i i i ii i i i i

n

i i i ii i

a U V V V U V

e U V U V

= = = = =

= =

− +

∑ ∑ ∑ ∑ ∑

∑ ∑ ∑

5.—Dado 4 4 4

1 1 1

7 3 y 5i i i ii i i

X Y X Y= = =

= = − =∑ ∑ ∑ Halle:

( ) ( )4 4

1 1

) (2 5 ) b) 3 2 1i i i ii i

a X Y X Y= =

+ − +∑ ∑

6.-- Desarrolle las siguientes sumatorias.

( ) ( )

( ) ( ) ( ) ( ) =+=−+==+=−

=+=−====

∑∑∑∑∑

∑∑∑∑∑∑

=====

======

2

1

2

1

4

0

7

1

3

1

2

3

1

3

1

3

1

5

1

23

1

4

1

) 62) 5) 42) 20)

) ) 3) ) .) )

jj

iiii

i

i

ii

iii

j

jjj

mi

i

xiii

ii

jAykzyxjxixhxfg

yxfyxmedxcxfbxa

SUMATORIA----EJERCICIOS

Desarrolle las siguientes sumatorias

( )

( )

( )

( )∑

−=

=

=

−=

=

=

=

+

+

+

4

3

2

6

0

5

2

3

3

7

3

4

1

1

5

0

3)

2

13)

5)

12)

42)

12)

)

k

k

k

k

k

k

K

k

k

kg

kf

ke

kd

kc

kb

ka

( )( )

( )( )

( )( )

( )

( )

( )

−=

−=

−=

−=

−=

−=

=

−+−

−++

−+

−+

−+

+−

3

2

2

2

3

23

4

1

2

5

3

3

6

2

5

1

8

3

12

953)

353)

73)

)

43)

14)

21)

k

k

k

k

k

k

k

k

kkm

kkkll

kkl

kkk

kkj

kki

kkh

( )

( )( )

( )( )

( )

( )

( )

( )∑

−=

+

=

=

=

−=

=

=

+

+

+

−+

−−

1

2

2

3

4

2

1

3

4

0

4

2

9

0

5

0

32)

7)

1)

5)

13)

1220)

1)

n

k

n

k

n

k

k

k

k

k

k

k

k

ks

kr

kq

kp

ko

kn

Desarrolle las siguientes sumatorias

( ) ( ) ( )

( ) ( )( )

( ) ( )( )

( )( )

( )( ) =−+

+++==

=+

=+

+−=+

−=+=+

+=−=+

∑∑ ∑∑

∑∑∑∑

∑∑∑∑

=

+

−== ==

==−==

=

==

=

m

k

n

kk

n

k

m

k

k

n

kk

kn

k

k

k

n

k

kxk

k

k

k

n

k

kxN

K

kkll

k

kklkk

kSenj

kSenki

kk

kh

kkgkLgf

k

ee

kdkcSenkxebKa

3

1

22

3

0 1

32

1

4

11

2

2

2

04

1

6

1

45

0

2

20

2

1212

1)

1

43) )

4)

2)

21

21)

1

1) 1)

1

)1()

32) 32) ) 1)

ππ

HOJA DE EJERCICIOS Nº 1

1. El valor de dos (2) variables X e Y, de una población es de 50 y 70 respectivamente. i. ¿Cuál es la razón entre X e Y?

ii. ¿Cuál es la proporción de cada variable? iii. ¿Cuál es el porcentaje de cada variable?

2. En una población de 240 datos y de dos variables X e Y el porcentaje de X [P(X) ] es de 35%.

i. ¿Cuál es valor de cada variable? ii. ¿Cuál es la proporción de cada variable? iii. ¿Cuál es la razón entre X e Y?

3. En una población de tres (3) variables X, Y y Z el valor de cada una de ellas es: 60, 40 y 80 respectivamente.

i. Halle la razón entre X e Y; entre Z y X y entre Y y Z. ii. Halle la proporción de cada variable. iii. Halle el porcentaje de cada variable.

4. En una población de cinco (5) variables el valor de cada una de ellas es: X1 = 150; X2 = 200; X3 = 180; X4 = 160 y X5 = 300. i. Calcule la razón entre: X3 y X1; X4 y X2 y X5 y X1

ii. Verificar que la suma de las proporciones es igual a uno (1) iii. Calcule el porcentaje de cada variable.

5. En una población de dos (2) variables X e Y la razón entre X e Y es de 5 a 3 y el total de ellas es 240.

i. Halle el valor de cada variable. ii. Calcule la proporción de cada variable.

iii. Calcule el porcentaje de cada variable.

6. En una población de tres (3) variables X, Y y Z, la razón entre X y Z es de 5 a 9 y la proporción de Y es 0,3, sí el total de la población es de 720.

i. ¿Cuál es el valor de cada variable? ii. Halle la razón entre X e Y, entre Z e Y.

iii. ¿Cuál es la proporción de cada variable? iv. ¿Cuál es el porcentaje de cada variable?

7. Dada la siguiente tabla i 1 2 3 4 5 6 7 8

X i 3 5 7 8 0 9 1 4

Y i 5 7 2 9 3 0 6 3

8. Hallar el valor de las siguientes sumatorias:

∑∑

==

=

=

+

+

+

6

2ii

28

2i

2ii

6

2ii

4

1iii

)4X.2()YX()i

)4X.2()e

)YX3()a

=−+

=

=

+

7

3i1i1i

6

2i

23

2i

8

1iii

)YX()j

)YX()f

)YX()b

=+−

=

=

+

7

4i

21i1i

7

2ii

25

2iii

)YX()k

1X)g

Y.X)c

=

=

+

4

1i

2i

7

3i

2i

2i

3X)h

)YX()d

9. Expresar en forma de sumatoria las siguientes expresiones:

( ) ( ) ( )( ) ( ) ( ) ( )7x47x47x47x4)e

ycxycxycx)c

xxxx)a

3333

050403

3321

++++++++++++

+++

( ) 6xxxxx)f

5xxxxx)d

xxxxx)b

222222

65432

25

24

23

22

21

+++++

+++++++++

10. Sabiendo que: n

XX

n

iii∑

== y n

YY

n

ii∑

== 1 . Demostrar que:

( )

( )

( )

( ) ( )

( )

−=

=−−−

=−

−=−

−=−

−=−−

∑ ∑∑

∑∑

∑∑

∑ ∑∑ ∑

=

=

=

=

=

=

=

=

=

= =

= =

n

1i

2

i2

i

n

1ii

00i

n

1ii

n

1i

2n

1ii

i

n

1i

2

i

n

1i

2n

1ii

i

n

1i

2

i

n

1i

n

1i

n

1i

n

1iii

iiii

Yn

1Y

1n

1

1n

YY

)F

0XX.nXX)E

0XX)D

n

X

XXX)C

n

Y

YYY)B

n

Y.X

Y.X)YY(),XX( A)

PROBLEMAS DE APLICACIÓN

(APLICACIONES: EXCEL SAS Y MINITAB)

1. Dada la serie histórica de descargas medias (m3/s) del rio Huancané, para el periodo 1959-2008. Calcule las frecuencias absolutas, relativa, acumulada, función de densidad y función acumulada.

año Q=m3/s año Q=m3/s año Q=m3/s año Q=m3/s año Q=m3/s

1959 25.00 1969 17,00 1979 24,00 1989 19,00 1999 23,00

1960 20,00 1970 11,00 1980 21,00 1990 29,00 2000 10,00

1961 13,00 1971 14,00 1981 18,00 1991 24,00 2001 14,00

1962 26,00 1972 28,00 1982 20,00 1992 23,00 2002 23,00

1963 29,00 1973 28,00 1983 19,00 1993 24,00 2003 21,00

1964 22,00 1974 21,00 1984 17,00 1994 15,00 2004 27,00

1965 29,00 1975 16,00 1985 21,00 1995 27,00 2005 27,00

1966 20,00 1976 7,00 1986 17,00 1996 19,00 2006 28,00

1967 19,00 1977 28,00 1987 21,00 1997 26,00 2007 26,00

1968 26,00 1978 9,00 1988 8,00 1998 23,00 2008 19,00 Solución problema 1

Número de intervalos de clase

m = 7

min = 7

max = 29

Ancho = 3

m xi <=xi+1 o frec. Relat. frec. Re. Acu.

1 7 10 4 0.08 0.08

2 10 13 2 0.04 0.12

3 13 16 4 0.08 0.2

4 16 20 12 0.24 0.44

5 20 23 10 0.2 0.64

6 23 26 8 0.16 0.8

7 26 29 10 0.2 1

Total = 50 1

4

2

4

12

10

8

10

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7

Fre

cue

nci

a a

bso

luta

Intervalo de clase

Histograma de frecuencia absoluta

0.08

0.04

0.08

0.24

0.2

0.16

0.2

0

0.05

0.1

0.15

0.2

0.25

0.3

1 2 3 4 5 6 7

Fre

cue

nci

a r

ela

tiv

a

Intervalo de clase

Histograma de frecuencia relativa

0.080.12

0.2

0.44

0.64

0.8

1

0

0.2

0.4

0.6

0.8

1

1.2

1 2 3 4 5 6 7

Fre

cue

nci

a r

ela

tiv

a a

cum

ula

da

Intervalo de clase

Histograma de frecuencia relativa acumulada

2. Dado los datos de precipitación anual, en mm. De la Estación Ayaviri, para el periodo 1959-2008. Calcular su media, varianza, desviación estándar, coeficiente de variación, coeficiente de sesgo y coeficiente de curtosis.

año pp (mm) año

pp (mm) año

pp (mm) año

pp (mm) año

pp (mm)

1959 650.00 1969 158,00 1979 139,00 1989 155,00 1999 239,00

1960 752,00 1970 81,00 1980 686,00 1990 601,00 2000 512,00

1961 536,00 1971 793,00 1981 531,00 1991 149,00 2001 97,00

1962 777,00 1972 635,00 1982 105,00 1992 485,00 2002 370,00

1963 127,00 1973 279,00 1983 369,00 1993 193,00 2003 545,00

1964 505,00 1974 251,00 1984 519,00 1994 724,00 2004 751,00

1965 499,00 1975 354,00 1985 515,00 1995 404,00 2005 460,00

1966 552,00 1976 494,00 1986 316,00 1996 514,00 2006 798,00

1967 701,00 1977 770,00 1987 79,00 1997 608,00 2007 124,00

1968 156,00 1978 726,00 1988 211,00 1998 75,00 2008 416,00

Solución problema 2

Media 429.72

Varianza 54181.88

Desvest 232.77

CV 54.17

Coef Sesgo -0.06

Curtosis -1.29

3. Los gastos máximos anuales registrados en la estación hidrométrica Las Perlas en el Coatzacoalas se muestran en la tabla siguiente: a) ¿Cuál es la probabilidad de que, en un año cualquiera, el gasto sea mayor o igual a 7500

m3/s? b) Se planea construir cerca de este sitio un bordo para protección contra inundaciones.

¿Cual debe ser el gasto de diseño si se desea que el periodo de retorno sea de 60 años? Supóngase que los datos de la tabla siguen una distribución normal. Resolver usando las funciones de distribución: Distribución Lognormal Distribución Pearson III o Gamma de tres parámetros, y Distribución Gumbel

año m3/s año m3/s año m3/s año m3/s año m3/s 1954 2500 1959 2070 1964 2489 1969 5971 1974 5565 1955 3220 1960 3682 1965 2350 1970 4744 1975 3130 1956 2246 1961 4240 1966 3706 1971 6000 1976 2414 1957 1804 1962 2367 1967 2675 1972 4060 1977 1796 1958 2737 1963 7061 1968 6267 1973 6900 1978 7430

Solución a) Distribución Normal

Media 3886.16

Desvest 1825.91

x 7500

Z 1.9792

F(x)=P(X<7500)= 0.9761

P(X>7500) 0.0239

P(X>x) 0.0167 P(X<x) 0.9833 F(z) 0.9833 z = 2.1280 x (gasto de diseño m3/s) = 7771.7717

b) Distribución Lognormal

P(X>x) 0.0167 P(X<x) 0.9833 F(z) 0.9833 z = 2.1280 ln(x) = 9.1221 x = 9155.0451

Distribución Pearson III

Gamma 0.6778

bheta1 8.7057

alpha1 618.8364

delta1 -1501.2647

P(X>x) 0.0167

gl 17

2y 31.6415

y 15.8208

x 8289.2060 Distribución Gumbel

alpha 0.00059773

beta 2997.96706

T 60

x 9833.7448

4. Dada la serie histórica de descargas medias (m3/s) del rio Huancané, para el periodo 1959-2008. Realizar las pruebas de bondad de ajustes de Chi-cuadrado (X2 ) y Smirnov-Kolmogorov, para ver si se ajustan a una distribución normal.

AÑO Q=m3/s AÑO Q=m3/s AÑO Q=m3/s AÑO Q=m3/s AÑO Q=m3/s

1959 28.00 1969 17,00 1979 24,00 1989 14,00 1999 23,00

1960 21,00 1970 11,00 1980 21,00 1990 29,00 2000 10,00

1961 13,00 1971 14,00 1981 18,00 1991 24,00 2001 14,00

1962 28,00 1972 28,00 1982 20,00 1992 23,00 2002 23,00

1963 29,00 1973 28,00 1983 19,00 1993 24,00 2003 25,00

1964 23,00 1974 21,00 1984 16,00 1994 15,00 2004 27,00

1965 29,00 1975 16,00 1985 21,00 1995 27,00 2005 17,00

1966 20,00 1976 7,00 1986 7,00 1996 19,00 2006 28,00

1967 19,00 1977 28,00 1987 21,00 1997 26,00 2007 26,00

1968 26,00 1978 9,00 1988 8,00 1998 23,00 2008 16,00

5. Se desea saber si en una cierta región el gasto máximo medio anual, el área de la cuenca y la altura media de precipitación máxima en 24 horas se pueden correlacionar linealmente, y que tan bueno es el ajuste. Los datos se presentan en la tabla siguiente:

Estación Meteorológic

a

Y=gasto máx. medio anual

102 m3/s

X1=área de la cuenca, 103 km2

X2=altura media de pp. máx.

En 24 h. cm 1 45.2 1.23 2.9 2 9.1 5.25 1.8 3 48.3 8.55 2.2 4 35.8 7.99 1.1 5 74.9 7.36 3.9 6 26.7 5.78 2.7 7 12.1 5.98 2.5 8 6.8 8.11 2.3 9 69.7 2.23 2.8 10 57.0 6.77 1.1 11 33.7 7.02 2.1 12 71.4 3.04 3.9 13 88.2 6.78 3.2 14 26.6 1.23 3.3 15 16.0 2.22 2.7

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.4618

Coeficiente de determinación R^2 0.2132

R^2 ajustado 0.0821

Error típico 25.0735

Observaciones 15.0000

F. de V. GL SC CM Fc Valor crít de F Regresión 2 2044.4866 1022.243 1.6260 0.2372

Residuos 12 7544.1667 628.6806

Total 14 9588.6533

Coeficientes Error típico Estadístico t Probabilidad

Intercepción -11.5288 32.9915 -0.3494 0.7328

Variable X 1 2.2847 2.8637 0.7978 0.4405

Variable X 2 15.9144 8.8250 1.8033 0.0965

Y = - 11.5288 + 2.2847 X1 + 15.9144 X2

PROGRAMA DE SAS 9.2

data regresion; input X1 X2 Y; CARDS; 1.23 2.9 45.2 5.25 1.8 9.1 8.55 2.2 48.3 7.99 1.1 35.8 7.36 3.9 74.9 5.78 2.7 26.7 5.98 2.5 12.1 8.11 2.3 6.8 2.23 2.8 69.7 6.77 1.1 57 7.02 2.1 33.7 3.04 3.9 71.4 6.78 3.2 88.2 1.23 3.3 26.6 2.22 2.7 16 PROC PRINT; PROC REG; MODEL Y=X1 X2; PROC GLM; PROC PLOT; RUN;

Obs X1 X2 Y

1 1.23 2.9 45.2

2 5.25 1.8 9.1

3 8.55 2.2 48.3

4 7.99 1.1 35.8

5 7.36 3.9 74.9

6 5.78 2.7 26.7

7 5.98 2.5 12.1

8 8.11 2.3 6.8

9 2.23 2.8 69.7

10 6.77 1.1 57.0

11 7.02 2.1 33.7

12 3.04 3.9 71.4

13 6.78 3.2 88.2

14 1.23 3.3 26.6

15 2.22 2.7 16.0

The REG Procedure

Model: MODEL1

Dependent Variable: Y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 2044.48663 1022.24332 1.63 0.2372

Error 12 7544.16670 628.68056

Corrected Total 14 9588.65333

Root MSE 25.07350 R-Square 0.2132

Dependent Mean 41.43333 Adj R-Sq 0.0821

Coeff Var 60.51529

Parameter Estimates

Parameter Standard

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 -11.52882 32.99154 -0.35 0.7328

X1 1 2.28473 2.86373 0.80 0.4405

X2 1 15.91441 8.82500 1.80 0.0965

Y = - 11.5288 + 2.2847 X1 + 15.9144 X2

6. Se realizaron siete (07) pruebas de la resistencia a la compresión en cuatro muestras de

concreto. La fuerza que fractura cada muestra de forma cilíndrica, medida en kilogramos, está dada en la siguiente tabla:

Muestras

Pruebas m1 m2 m3 m4

Prueba 1 45 42 43 48

Prueba 2 90 100 102 104

Prueba 3 40 45 56 58

Prueba 4 89 25 98 25

Prueba 5 105 125 87 103

Prueba 6 111 121 120 109

Prueba 7 80 85 86 88

Pruebe con un nivel de significancia de 0.01 si estas muestras son diferentes en su resistencia a la compresión, y efectuar la prueba de rango múltiple de Duncan a la probabilidad de 0.01.

SOLUCIONARIO MANUAL

1) Hipótesis H0: µi=0

Ha:µi≠ 0 2) Nivel de significación

α = 0.05 y 0.01

3) Estadística de Prueba Fc=(CMtratam/CMerror)

4) Regla de decisión Si Fc ≤ F0.05, no se rechaza la Ho. Se representa (NS) Si F0.05< Fc < F0.01, se rechaza la H0, representando con un asterisco (*) Si Fc > F0.01; se rechaza la H0, representándose por dos asteriscos (**)

5) Cálculos

a) ������ � �������� �� =�..

�� =

�����

��= 177603.571

b) ������� = ∑ ∑ �����

��� ��� −

"..#

×�= $45'� + ⋯ + $88'� −177603.571

= 202998.000 − 177603.571 = 25394.42857

c) ������. =∑ �.

��23

�−

�..�

��=

$3�4'�5⋯5$��6'�

�− ��

= 36���. ��47�

d) ������ = ∑ ∑ �8��

8�3��3 −

�.�

�= �7�6�. ��47� −19424.42857

=5970.0000 6) Análisis de varianza

Cuadro 44. Análisis de varianza de los resultados

F.de V. GL SC CM Fc Ft Pr>F Niv. Sig. Pruebas 6 19424.42857 3237.40476 11.3878559 2.57 1.109E-05 ** Error 21 5970.00000 284.285714

Total 27 25394.42857

C.V. = 21.1705 %

SOLUCIONARIO CON EL PAQUETE DEL SISTEMA PARA EL ANA LISIS ESTADISTICO

data trabajo; input x$ y@@; datalines; p1 45 p2 90 p3 40 p4 89 p5 105 p6 111 p7 80 p1 42 p2 100 p3 45 p4 25 p5 125 p6 121 p7 85 p1 43 p2 102 p3 56 p4 98 p5 87 p6 120 p7 86 p148 p2 104 p3 58 p4 25 p5 103 p6 109 p7 88

proc print ; proc anova ; class x; model y=x; means x/duncan alpha=0.01 ; run ;

RESULTADOS UTILIZANDO EL SAS

Obs x y

1 p1 45

2 p2 90

3 p3 40

4 p4 89

5 p5 105

6 p6 111

7 p7 80

8 p1 42

9 p2 100

10 p3 45

11 p4 25

12 p5 125

13 p6 121

14 p7 85

15 p1 43

16 p2 102

17 p3 56

18 p4 98

19 p5 87

20 p6 120

21 p7 86

22 p1 48

23 p2 104

24 p3 58

25 p4 25

26 p5 103

27 p6 109

28 p7 88

The ANOVA Procedure

Class Level Information

Class Levels Values

x 7 p1 p2 p3 p4 p5 p6 p7

Number of observations 28

The ANOVA Procedure

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 6 19424.42857 3237.40476 11.39 <.0001

Error 21 5970.00000 284.28571

Corrected Total 27 25394.42857

R-Square Coeff Var Root MSE y Mean

0.764909 21.17048 16.86077 79.64286

Source DF Anova SS Mean Square F Value Pr > F

x 6 19424.42857 3237.40476 11.39 <.0001

The ANOVA Procedure

Duncan's Multiple Range Test for y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise

error rate.

Alpha 0.01

Error Degrees of Freedom 21

Error Mean Square 284.2857

Number of Means 2 3 4 5 6 7

Critical Range 33.76 35.21 36.17 36.87 37.41 37.85

Means with the same letter are not significantly different.

Duncan Grouping Mean N x

A 115.25 4 p6

A 105.00 4 p5

A 99.00 4 p2

B A 84.75 4 p7

B C 59.25 4 p4

B C 49.75 4 p3

C 44.50 4 p1

7. Se diseñó un experimento para estudiar el rendimiento de seis (06) detergentes diferentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especialmente diseñado para 24 cargas de lavado distribuidas en cuatro (04) modelos de lavadoras:

Detergente Lavad 1 Lavad 2 Lavad 3 Lavad 4

Detergente A 100 102 101 104

Detergente B 25 46 52 55

Detergente C 45 58 62 66

Detergente D 47 50 63 65

Detergente E 49 54 68 67

Detergente F 99 95 98 99

Considerando los detergentes como tratamientos y las lavadoras como bloques, efectuar el análisis de variancia y su prueba con un nivel de significación de 0.05 si existen diferencias entre los detergentes y entre las lavadoras. Además, efectuar la prueba de Rango Múltiple de Tukey a la probabilidad de 0.05.

Cuadro 45. Análisis de varianza

F. de V. GL SC CM Fc Ft Sig bloque 3 849.5000 283.166667 8.78490176 tratamiento 5 11506.8333 2301.36667 71.3971044 error 15 483.5000 32.2333333 total 23 12839.8333

SOLUCIONARIO UTILIZANDO EL SISTEMA PARA ANALISIS ES TADISTICO (SAS) RESULTADO UTILIZANDO EL SAS

data detergente; input lavadoras detergente rdto; cards; 1 1 100 1 2 25 1 3 45 1 4 47 1 5 49 1 6 99 2 1 102 2 2 46 2 3 58 2 4 50 2 5 54 2 6 95 3 1 101 3 2 52 3 3 62 3 4 63

3 5 68 3 6 98 4 1 104 4 2 55 4 3 66 4 4 65 4 5 67 4 6 99 proc print ; proc anova ; class lavadoras detergente; model rdto= lavadoras detergente; means detergente/tukey alpha =0.05 ; run ;

Obs lavadoras detergente rdto

1 1 1 100

2 1 2 25

3 1 3 45

4 1 4 47

5 1 5 49

6 1 6 99

7 2 1 102

8 2 2 46

9 2 3 58

10 2 4 50

11 2 5 54

12 2 6 95

13 3 1 101

14 3 2 52

15 3 3 62

16 3 4 63

17 3 5 68

18 3 6 98

19 4 1 104

20 4 2 55

21 4 3 66

22 4 4 65

23 4 5 67

24 4 6 99

The ANOVA Procedure

Class Level Information

Class Levels Values

lavadoras 4 1 2 3 4

detergente 6 1 2 3 4 5 6

Number of observations 24

The ANOVA Procedure

Dependent Variable: rdto

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 8 12356.33333 1544.54167 47.92 <.0001

Error 15 483.50000 32.23333

Corrected Total 23 12839.83333

R-Square Coeff Var Root MSE rdto Mean

0.962344 8.159196 5.677441 69.58333

Source DF Anova SS Mean Square F Value Pr > F

lavadoras 3 849.50000 283.16667 8.78 0.0013

detergente 5 11506.83333 2301.36667 71.40 <.0001

Tukey's Studentized Range (HSD) Test for rdto

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.05

Error Degrees of Freedom 15

Error Mean Square 32.23333

Critical Value of Studentized Range 4.59474

Minimum Significant Difference 13.043

Means with the same letter are not significantly different.

Tukey Grouping Mean N detergente

A 101.750 4 1

A 97.750 4 6

B 59.500 4 5

B 57.750 4 3

C B 56.250 4 4

C 44.500 4 2

8. Evaluar el sistema de riego por exudación utilizando cuatro variedades de melón, bajo modalidad de siembra, SIMPLE HILERA. Se desea probar el comportamiento de tres variedades híbridas de melón y uno estándar:

V1 : Híbrido Mission V3 : Híbrido Topfligth.

V2 : Híbrido Mark. V4 : Híbrido Hales Best Jumbo.

Hipótesis : Ho : Efecto de variedades de melón en estudio es nulo.

H1 : Al menos dos variedades tienen efectos distintos.

Datos: Rendimiento en Kg. por parcela.

C1 C2 C3 C4

F1 36V1 50 V2 43 V3 35 V4

F2 29 V4 53 V3 41 V2 63 V1

F3 37 V2 41 V4 41 V1 63 V3

F4 38 V3 40 V1 35 V4 41 V2

F. de V. GL SC CM Fc Ft sig.

Hilera 3 170.75 56.92 1.3445 Columna 3 552.75 184.25 4.3524

Tratamiento 3 430.25 143.417 3.3878 Error 6 254.0000 42.3333

Total 15 1407.7500

SOLUCIONARIO APLICANDO EL SAS DISEÑO DE CUADRADO LA TINO

DATA OCHO; INPUT FILA COLUMNA TRAT $ RDTO; CARDS; 1 1 V1 36 1 2 V2 50 1 3 V3 43 1 4 V4 35 2 1 V4 29 2 2 V3 53 2 3 V2 41 2 4 V1 63 3 1 V2 37 3 2 V4 41 3 3 V1 41 3 4 V3 63 4 1 V3 38 4 2 V1 40 4 3 V4 35 4 4 V2 41 PROC PRINT; PROC ANOVA; CLASS FILA COLUMNA TRAT; MODEL RDTO= FILA COLUMNA TRAT; MEANS FILA COLUMNA TRAT/DUNCAN; RUN;

RESULTADOS UTILIZANDO EL SAS

Obs FILA COLUMNA TRAT RDTO

1 1 1 V1 36

2 1 2 V2 50

3 1 3 V3 43

4 1 4 V4 35

5 2 1 V4 29

6 2 2 V3 53

7 2 3 V2 41

8 2 4 V1 63

9 3 1 V2 37

10 3 2 V4 41

11 3 3 V1 41

12 3 4 V3 63

13 4 1 V3 38

14 4 2 V1 40

15 4 3 V4 35

16 4 4 V2 41

The ANOVA Procedure

Class Level Information

Class Levels Values

FILA 4 1 2 3 4

COLUMNA 4 1 2 3 4

TRAT 4 V1 V2 V3 V4

Number of observations 16

The ANOVA Procedure

Dependent Variable: RDTO

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 9 1153.750000 128.194444 3.03 0.0954

Error 6 254.000000 42.333333

Corrected Total 15 1407.750000

R-Square Coeff Var Root MSE RDTO Mean

0.819570 15.17529 6.506407 42.87500

Source DF Anova SS Mean Square F Value Pr > F

FILA 3 170.7500000 56.9166667 1.34 0.3456

COLUMNA 3 552.7500000 184.2500000 4.35 0.0596

TRAT 3 430.2500000 143.4166667 3.39 0.0949

Duncan's Multiple Range Test for RDTO

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise

error rate.

Alpha 0.05

Error Degrees of Freedom 6

Error Mean Square 42.33333

Number of Means 2 3 4

Critical Range 11.26 11.67 11.87

Means with the same letter are not significantly different.

Duncan Grouping Mean N FILA

A 46.500 4 2

A 45.500 4 3

A 41.000 4 1

A 38.500 4 4

The ANOVA Procedure

Duncan's Multiple Range Test for RDTO

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise

error rate.

Alpha 0.05

Error Degrees of Freedom 6

Error Mean Square 42.33333

Number of Means 2 3 4

Critical Range 11.26 11.67 11.87

Means with the same letter are not significantly different.

Duncan Grouping Mean N COLUMNA

A 50.500 4 4

B A 46.000 4 2

B A 40.000 4 3

B 35.000 4 1

The ANOVA Procedure

Duncan's Multiple Range Test for RDTO

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise

error rate.

Alpha 0.05

Error Degrees of Freedom 6

Error Mean Square 42.33333

Number of Means 2 3 4

Critical Range 11.26 11.67 11.87

Means with the same letter are not significantly different.

Duncan Grouping Mean N TRAT

A 49.250 4 V3

B A 45.000 4 V1

B A 42.250 4 V2

B 35.000 4 V4

9. Supóngase que se efectúan dos repeticiones del experimento de soldadura, empleando el cuadrado latino, los resultados que señalan el número de libras fuerza de tensión requerida para separar los puntos soldados, fueron como se indica a continuación:

REPETICIÓN I

Fundentes

F1 F2 F3 F4

A 20.0 B 17.5 C 14.0 D 14.0

D 24.0 A 21.0 B 18.0 C 14.1

C 12.0 D 18.0 A 23.0 B 19.0

B 20.0 C 15.0 D 13.0 A 22.0

REPETICIÓN II

Fundentes

F1 F2 F3 F4

C 12.0 D 10.0 A 24.2 B 22.1

B 19.5 C 13.0 D 10.5 A 22.3

A 23.5 B 17.2 C 20.4 D 14.0

D 11.0 A 22.2 B 20.5 C 14.5

Analice el experimento como un cuadrado latino y pruébese con un nivel de significancia de 0.05 si existen diferencias en los métodos (A, B, C y D), en los operadores (filas), los fundentes (columnas) y, entre las producciones. Utilizar la prueba de rango múltiple de Tukey α = 0.01, si es que es significativo. F. de V. GL SC CM Fc Sig Pr > F repetición 1 1.8528125 1.8528 0.181683 NS 0.6742 hilera 3 12.1609375 4.0536 0.3974922 NS 0.7562 columna 3 7.2009375 2.4003 0.2353697 NS 0.8707 tratamiento 3 365.545937 121.85 11.948229 ** 0.0001 error 21 214.159062 10.198 Total 31 600.919688

SOLUCIONARIO MEDIANTE EL SAS data fundente; input repet hilera columna trat$ rdto; cards; 1 1 1 A 20 1 1 2 B 17.5 1 1 3 C 14 1 1 4 D 14 1 2 1 D 24 1 2 2 A 21 1 2 3 B 18 1 2 4 C 14.1

1 3 1 C 12 1 3 2 D 18 1 3 3 A 23 1 3 4 B 19 1 4 1 B 20 1 4 2 C 15 1 4 3 D 13 1 4 4 A 22 2 1 1 C 12 2 1 2 D 10 2 1 3 A 24.2 2 1 4 B 22.1 2 2 1 B 19.5 2 2 2 C 13 2 2 3 D 10.5 2 2 4 A 22.3 2 3 1 A 23.5 2 3 2 B 17.2 2 3 3 C 20.4 2 3 4 D 14 2 4 1 D 11 2 4 2 A 22.2 2 4 3 B 20.5 2 4 4 C 14.5 PROC PRINT; PROC ANOVA; CLASS REPET HILERA COLUMNA TRAT; MODEL RDTO= REPET HILERA COLUMNA TRAT; MEANS HILERA COLUMNA TRAT/TUKEY ALPHA=0.01; RUN;

RESULTADOS DEL PROGRAMA DE SAS

Obs repet hilera columna trat rdto

1 1 1 1 A 20.0

2 1 1 2 B 17.5

3 1 1 3 C 14.0

4 1 1 4 D 14.0

5 1 2 1 D 24.0

6 1 2 2 A 21.0

7 1 2 3 B 18.0

8 1 2 4 C 14.1

9 1 3 1 C 12.0

10 1 3 2 D 18.0

11 1 3 3 A 23.0

12 1 3 4 B 19.0

13 1 4 1 B 20.0

14 1 4 2 C 15.0

15 1 4 3 D 13.0

16 1 4 4 A 22.0

17 2 1 1 C 12.0

18 2 1 2 D 10.0

19 2 1 3 A 24.2

20 2 1 4 B 22.1

21 2 2 1 B 19.5

22 2 2 2 C 13.0

23 2 2 3 D 10.5

24 2 2 4 A 22.3

25 2 3 1 A 23.5

26 2 3 2 B 17.2

27 2 3 3 C 20.4

28 2 3 4 D 14.0

29 2 4 1 D 11.0

30 2 4 2 A 22.2

31 2 4 3 B 20.5

32 2 4 4 C 14.5

The ANOVA Procedure

Class Level Information

Class Levels Values

repet 2 1 2

hilera 4 1 2 3 4

columna 4 1 2 3 4

trat 4 A B C D

Number of observations 32

Dependent Variable: rdto

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 10 386.7606250 38.6760625 3.79 0.0048

Error 21 214.1590625 10.1980506

Corrected Total 31 600.9196875

R-Square Coeff Var Root MSE rdto Mean

0.643615 18.19947 3.193439 17.54688

Source DF Anova SS Mean Square F Value Pr > F

repet 1 1.8528125 1.8528125 0.18 0.6743

hilera 3 12.1609375 4.0536458 0.40 0.7562

columna 3 7.2009375 2.4003125 0.24 0.8707

trat 3 365.5459375 121.8486458 11.95 <.0001

Tukey's Studentized Range (HSD) Test for rdto

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.01

Error Degrees of Freedom 21

Error Mean Square 10.19805

Critical Value of Studentized Range 4.98557

Minimum Significant Difference 5.629

Means with the same letter are not significantly different.

Tukey Grouping Mean N hilera

A 18.388 8 3

A 17.800 8 2

A 17.275 8 4

A 16.725 8 1

Tukey's Studentized Range (HSD) Test for rdto

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.01

Error Degrees of Freedom 21

Error Mean Square 10.19805

Critical Value of Studentized Range 4.98557

Minimum Significant Difference 5.629

Means with the same letter are not significantly different.

Tukey Grouping Mean N columna

A 17.950 8 3

A 17.750 8 4

A 17.750 8 1

A 16.738 8 2

Tukey's Studentized Range (HSD) Test for rdto

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.01

Error Degrees of Freedom 21

Error Mean Square 10.19805

Critical Value of Studentized Range 4.98557

Minimum Significant Difference 5.629

Means with the same letter are not significantly different.

Tukey Grouping Mean N trat

A 22.275 8 A

B A 19.225 8 B

B 14.375 8 C

B 14.313 8 D 10. Se desea determinar los efectos de la temperatura de la caldera (1600 y 1900 °F) y del

ancho del horno (4, 8 y 12 pulgadas) para el experimento; supóngase que cinco repeticiones de ese experimento dan los siguientes tiempos requeridos para la producción del coque (en horas):

A A(4) Pulgadas A(8) Pulgadas A(12) Pulgadas

T T1=1600 T2=1900 T1=1600 T2=1900 T1=1600 T2=1900

I 12.5 8.2 17.1 5.2 17.8 7.6

II 14.0 9.3 16.9 4.6 15.6 9.1

III 12.7 6.4 17.5 8.8 17.8 7.9

IV 13.5 7.8 17.3 5.9 16.8 8.1

V 14.4 10.7 20.2 8.3 22.4 10.2

Explíquese un análisis de variancia basado en este experimento con dos factores y pruébese la significancia de los efectos factoriales, empleando un nivel de significancia de 0.05. Aplicar la prueba de Duncan α = 0.05, si es que es significativo al nivel de ANOVA. RESULTADO UTILIZANDO EL PAQUETE DE SISTEMA DE ANALI SIS ESTADISTICO

data flores; input ancho temp hr; cards; 1 1 12.5 1 1 14 1 1 12.7 1 1 13.5 1 1 14.4 1 2 8.2 1 2 9.3 1 2 6.4 1 2 7.8 1 2 10.7 2 1 17.1 2 1 16.9 2 1 17.5 2 1 17.3 2 1 20.2 2 2 5.2

2 2 4.6 2 2 8.8 2 2 5.9 2 2 8.3 3 1 17.8 3 1 15.6 3 1 17.8 3 1 16.8 3 1 22.4 3 2 7.6 3 2 9.1 3 2 7.9 3 2 8.1 3 2 10.2 proc print; proc anova; class ancho temp; model hr=ancho temp ancho*temp; means ancho temp ancho*temp/duncan; run ;

RESULTADORESULTADORESULTADORESULTADO

Obs ancho temp hr

1 1 1 12.5

2 1 1 14.0

3 1 1 12.7

4 1 1 13.5

5 1 1 14.4

6 1 2 8.2

7 1 2 9.3

8 1 2 6.4

9 1 2 7.8

10 1 2 10.7

11 2 1 17.1

12 2 1 16.9

13 2 1 17.5

14 2 1 17.3

15 2 1 20.2

16 2 2 5.2

17 2 2 4.6

18 2 2 8.8

19 2 2 5.9

20 2 2 8.3

21 3 1 17.8

22 3 1 15.6

23 3 1 17.8

24 3 1 16.8

25 3 1 22.4

26 3 2 7.6

27 3 2 9.1

28 3 2 7.9

29 3 2 8.1

30 3 2 10.2

The ANOVA Procedure

Class Level Information

Class Levels Values

ancho 3 1 2 3

temp 2 1 2

Number of observations 30

The ANOVA Procedure

Dependent Variable: hr

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 5 630.8106667 126.1621333 45.97 <.0001

Error 24 65.8640000 2.7443333

Corrected Total 29 696.6746667

R-Square Coeff Var Root MSE hr Mean

0.905459 13.63085 1.656603 12.15333

Source DF Anova SS Mean Square F Value Pr > F

ancho 2 28.3326667 14.1663333 5.16 0.0137

temp 1 549.5520000 549.5520000 200.25 <.0001

ancho*temp 2 52.9260000 26.4630000 9.64 0.0008

The ANOVA Procedure

Duncan's Multiple Range Test for hr

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise

error rate.

Alpha 0.05

Error Degrees of Freedom 24

Error Mean Square 2.744333

Number of Means 2 3

Critical Range 1.529 1.606

Means with the same letter are not significantly different.

Duncan Grouping Mean N ancho

A 13.3300 10 3

B A 12.1800 10 2

B 10.9500 10 1

Duncan's Multiple Range Test for hr

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise

error rate.

Alpha 0.05

Error Degrees of Freedom 24

Error Mean Square 2.744333

Number of Means 2

Critical Range 1.248

Means with the same letter are not significantly different.

Duncan Grouping Mean N temp

A 16.4333 15 1

B 7.8733 15 2

The ANOVA Procedure

Level of Level of --------------hr-------------

ancho temp N Mean Std Dev

1 1 5 13.4200000 0.81670068

1 2 5 8.4800000 1.61771444

2 1 5 17.8000000 1.36014705

2 2 5 6.5600000 1.88228584

3 1 5 18.0800000 2.57914715

3 2 5 8.5800000 1.06630202 11. En un centro de investigación en trigo, se llevó a cabo un experimento para estudiar 06

variedades (A, B, C, D, E y F), y debido a la conformación del terreno, se utilizó el diseño de cuadrado latino, el rendimiento del trigo expresado en Kg/parcela.

A 21 B 20 C 12 D 23 E 16 F 30

B 22 C 16 D 21 E 18 F 29 A 14

C 16 D 20 E 20 F 31 A 13 B 24

D 28 E 21 F 32 A 12 B 26 C 18

E 20 F 33 A 13 B 28 C 15 D 27

F 31 A 16 B 27 C 14 D 25 E 23

Efectuar el análisis de variancia correspondiente y efectuar la prueba de significancia de Tukey a la probabilidad de 0.05

SOLUCIONARIO CON EL SISTEMA DE ANALISIS ESTADISTICO

DATA LATINO; INPUT HILERA COLUMNA TRATAM$ RDTO; CARDS; 1 1 A 21 1 2 B 20 1 3 C 12 1 4 D 23 1 5 E 16 1 6 F 30 2 1 B 22 2 2 C 16 2 3 D 21 2 4 E 18 2 5 F 29 2 6 A 14 3 1 C 16 3 2 D 20 3 3 E 20 3 4 F 31 3 5 A 13 3 6 B 24 4 1 D 28 4 2 E 21 4 3 F 32 4 4 A 12 4 5 B 26 4 6 C 18 5 1 E 20 5 2 F 33 5 3 A 13 5 4 B 28 5 5 C 15 5 6 D 27 6 1 F 31 6 2 A 16 6 3 B 27 6 4 C 14 6 5 D 25 6 6 E 23 PROC PRINT; PROC ANOVA; CLASS HILERA COLUMNA TRATAM; MODEL RDTO=HILERA COLUMNA TRATAM; MEANS HILERA COLUMNA TRATAM/TUKEY; RUN;

RESULTADO MEDIANTE EL RESULTADO MEDIANTE EL RESULTADO MEDIANTE EL RESULTADO MEDIANTE EL ANALISIS ESTADISTICOANALISIS ESTADISTICOANALISIS ESTADISTICOANALISIS ESTADISTICO Obs HILERA COLUMNA TRATAM RDTO

1 1 1 A 21

2 1 2 B 20

3 1 3 C 12

4 1 4 D 23

5 1 5 E 16

6 1 6 F 30

7 2 1 B 22

8 2 2 C 16

9 2 3 D 21

10 2 4 E 18

11 2 5 F 29

12 2 6 A 14

13 3 1 C 16

14 3 2 D 20

15 3 3 E 20

16 3 4 F 31

17 3 5 A 13

18 3 6 B 24

19 4 1 D 28

20 4 2 E 21

21 4 3 F 32

22 4 4 A 12

23 4 5 B 26

24 4 6 C 18

25 5 1 E 20

26 5 2 F 33

27 5 3 A 13

28 5 4 B 28

29 5 5 C 15

30 5 6 D 27

31 6 1 F 31

32 6 2 A 16

33 6 3 B 27

34 6 4 C 14

35 6 5 D 25

36 6 6 E 23

The ANOVA Procedure

Class Level Information

Class Levels Values

HILERA 6 1 2 3 4 5 6

COLUMNA 6 1 2 3 4 5 6

TRATAM 6 A B C D E F

Number of observations 36

The ANOVA Procedure

Dependent Variable: RDTO

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 15 1244.750000 82.983333 12.74 <.0001

Error 20 130.222222 6.511111

Corrected Total 35 1374.972222

R-Square Coeff Var Root MSE RDTO Mean

0.905291 11.85300 2.551688 21.52778

Source DF Anova SS Mean Square F Value Pr > F

HILERA 5 52.805556 10.561111 1.62 0.1999

COLUMNA 5 31.472222 6.294444 0.97 0.4615

TRATAM 5 1160.472222 232.094444 35.65 <.0001

Tukey's Studentized Range (HSD) Test for RDTO

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.05

Error Degrees of Freedom 20.00

Error Mean Square 6.51

Critical Value of Studentized Range 4.44

Minimum Significant Difference 4.63

Means with the same letter are not significantly different.

Tukey Grouping Mean N HILERA

A 22.833 6 4

A 22.667 6 5

A 22.667 6 6

A 20.667 6 3

A 20.333 6 1

A 20.000 6 2

Tukey's Studentized Range (HSD) Test for RDTO

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.05

Error Degrees of Freedom 20.00

Error Mean Square 6.51

Critical Value of Studentized Range 4.44

Minimum Significant Difference 4.6307

Means with the same letter are not significantly different.

Tukey Grouping Mean N COLUMNA

A 23.000 6 1

A 22.667 6 6

A 21.000 6 4

A 21.000 6 2

A 20.833 6 3

A 20.667 6 5

Tukey's Studentized Range (HSD) Test for RDTO

NOTE: This test controls the Type I experimentwise error rate, but it generally has a

higher Type II

error rate than REGWQ.

Alpha 0.05

Error Degrees of Freedom 20.00

Error Mean Square 6.51

Critical Value of Studentized Range 4.44

Minimum Significant Difference 4.63

Means with the same letter are not significantly different.

Tukey Grouping Mean N TRATAM

A 31.000 6 F

B 24.500 6 B

C B 24.000 6 D

C D 19.667 6 E

E D 15.167 6 C

E 14.833 6 A 12. Aplicando la regresión lineal múltiple, se desea saber si en una cierta región el gasto

máximo medio anual, el área de la cuenca y la altura media de la precipitación máxima en 24 horas se pueden correlacionar linealmente, y que tan bueno es el ajuste. Los datos se presentan en la tabla siguiente:

Estación Y = gasto máximo medio anual, 102m3/s

X1 = área de la cuenca, 103km2

X2 = altura media de precipitación máximo. en 24 h. cm

1

2

3

4

5

6

7

8

9

10

20.5

8.5

85.5

105.0

24.8

3.8

1.8

18.0

85.5

105.0

1.25

0.87

5.69

8.27

1.62

0.18

0.15

1.40

8.27

1.62

1.7

2.1

1.9

1.9

2.1

2.4

3.2

2.7

2.1

2.4

data regresion; input X1 X2 Y; CARDS; 20.5 1.25 1.7 8.5 0.87 2.1 85.5 5.69 1.9 105 8.27 1.9 24.8 1.62 2.1 3.8 0.18 2.4 1.8 0.15 3.2 18 1.4 2.7 85.5 8.27 2.1 105 1.62 2.4 PROC PRINT; PROC REG; MODEL Y= X1 X2; RUN;

Obs X1 X2 Y

1 20.5 1.25 1.7

2 8.5 0.87 2.1

3 85.5 5.69 1.9

4 105.0 8.27 1.9

5 24.8 1.62 2.1

6 3.8 0.18 2.4

7 1.8 0.15 3.2

8 18.0 1.40 2.7

9 85.5 8.27 2.1

10 105.0 1.62 2.4

The REG Procedure

Model: MODEL1

Dependent Variable: Y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 0.40973 0.20487 1.06 0.3967

Error 7 1.35527 0.19361

Corrected Total 9 1.76500

Root MSE 0.44001 R

Dependent Mean 2.25000 Adj R

Coeff Var 19.55605

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 2.45361

X1 1

X2 1 -

13. Se desea estimar los gastos en alimentación de una familia proporcionan las variables regresoras miembros de la familia”. Para ello se recogecuyos resultados son los de la tabla adjuntaEfectuar el análisis de regresión múltiple.

Gasto (Y)

Regression Analysis: Y versus X1, X2 The regression equation is

Y =

Predictor Coef SE Coef T P VIFConstant X1 1.50326 X2 8.121 1.984

S = 7.64694 R

Analysis of Variance Source DF SS MS Regresión 2 Residual Error 12 701.7 58.5Total 14 14548.9

Root MSE 0.44001 R-Square 0.2321

Dependent Mean 2.25000 Adj R-Sq 0.0128

Coeff Var 19.55605

Parameter Estimates

Parameter Standard

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 2.45361 0.20877 11.75 <.0001

-0.00064324 0.00542 -0.12 0.9088

-0.05939 0.07355 -0.

Se desea estimar los gastos en alimentación de una familia en base a laproporcionan las variables regresoras X1 =“ingresos mensuales” y Xmiembros de la familia”. Para ello se recoge una muestra aleatoria simple de 15 familias

son los de la tabla adjunta (El gasto e ingreso está dado en miles de soles). Efectuar el análisis de regresión múltiple.

Gasto (Y) Ingreso (X1) Tamaño (X2) 35 21 3 31 11 4 32 9 5 46 16 4 125 62 4 44 23 3 52 18 6 29 10 5 129 89 3 35 24 2 35 12 4 78 47 3 43 35 2 47 29 3 38 14 4

Regression Analysis: Y versus X1, X2

The regression equation is

Y = - 18.6 + 1.50 X1 + 8.12 X2

Predictor Coef SE Coef T P VIFConstant -18.601 8.917 -2.09 0.059 X1 1.50326 0.09837 15.28 0.000 1.2X2 8.121 1.984 4.09 0.001 1.2

S = 7.64694 R-Sq = 95.2% R-Sq(adj) = 94.4%

Analysis of Variance

Source DF SS MS F PRegresión 2 13847.2 6923.6 118.40 0.000Residual Error 12 701.7 58.5 Total 14 14548.9

SOLUCIONARIO CON SAS

Obs X1 X2 Y

Square 0.2321

Sq 0.0128

Variable DF Estimate Error t Value Pr > |t|

0.20877 11.75 <.0001

0.12 0.9088

en base a la información que “ingresos mensuales” y X2 =“número de una muestra aleatoria simple de 15 familias

(El gasto e ingreso está dado en miles de soles).

Predictor Coef SE Coef T P VIF

0.000 1.2 0.001 1.2

Sq(adj) = 94.4%

F P 118.40 0.000

1 21 3 35

2 11 4 31

3 9 5 32

4 16 4 46

5 62 4 125

6 23 3 44

7 18 6 52

8 10 5 29

9 89 3 129

10 24 2 35

11 12 4 35

12 47 3 78

13 35 2 43

14 29 3 47

15 14 4 38

The REG Procedure

Model: MODEL1

Dependent Variable: Y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 13847 6923.61222 118.40 <.0001

Error 12 701.70890 58.47574

Corrected Total 14 14549

Root MSE 7.64694 R-Square 0.9518

Dependent Mean 53.26667 Adj R-Sq 0.9437

Coeff Var 14.35596

Parameter Estimates

Parameter Standard

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 -18.60147 8.91730 -2.09 0.0590

X1 1 1.50326 0.09837 15.28 <.0001

X2 1 8.12097 1.98364 4.09 .. 0.0015

Y = - 18.60147 + 1.50326 X1 + 8.12097 X2

NOTA

LOS AUTORES DEL TEXTO DE: METODOS ESTADISTICOS PARA LA INVESTIGACION ESTAN TRABAJANDO PARA EDITAR UN TEXTO QUE SERA DE MUCHA UTILIDAD PARA LOS ESTUDIANTES DE PREGRADO Y POST GRADO DE LA UNIVERSIDAD NACIONAL DEL ALTIPLANO DE PUNO. Dr. Eduardo Flores Condori Dr.(c) M.SC. Eduardo Luis Flores Quispe